Articles

Évolution moléculaire : exemple de la FSH chez les mammifères

Afin de faire une étude originale, il faut posséder les logiciels Anagène et Evolmol.

L’exemple choisi ici est celui de la FSH chez les mammifères.

Cette hormone est une glycoprotéine composée de deux sous-unités α et β.

Dans l’espèce humaine la chaîne α comprend 92 acides aminés et est codée par un gène situé sur le chromosome 6.
La chaîne β a 111 acides aminés et son gène est sur le chromosome 11.

La chaîne α est identique pour quatre hormones glycoprotéiques humaines : HCG, FSH, LH, TSH.
Ces hormones ne diffèrent donc que par leur chaîne β.

Rechercher des séquences sur Internet et les formater

Sur le site NCBI (National Center for Biotechnology Information) par exemple, on pourra trouver la séquence d’une protéine ou d’un acide nucléique pour des espèces différentes.

Dans l’exemple de la FSH, il faut rechercher successivement les deux sous-unités dans la catégorie "proteins" en tapant, dans le rectangle du moteur de recherche, follicle stimulating hormone beta subunit et follicle stimulating hormone alpha subunit.
De nombreuses molécules de mammifères sont disponibles sous la forme de précurseur, de longueur un peu plus importante que la chaîne de l’hormone.

Afin de rechercher l’évolution de la molécule entière, il faut sélectionner les espèces pour lesquelles on dispose des séquences des deux sous-unités. Huit espèces ont été sélectionnées dont Trichosurus vulpecula, le phalanger-renard qui est un marsupial.

Afin de formater rapidement ces données pour les ouvrir dans Anagène, télécharger au préalable le modèle clear_ncbi.dot (clic droit : enregistrer sous...). Placer ce modèle pour Word 97 dans le sous dossier Modèles de Microsoft Office se trouvant dans Program Files.
Ouvrir un document à partir de ce modèle en choisissant Fichier puis Nouveau, sélectionner clear_ncbi.dot.

La séquence originale disponible sur le site ncbi se présente sous la forme suivante :

1 mdyyrkyaai flvtlsvflh vlhsapdvqd cpectlqenp ffsqpgapil qcmgccfsra
61 yptplrskkt mlvqknvtse stccvaksyn rvtvmggfkv enhtachcst cyyhks

La macro du modèle va enlever tous les chiffres, tous les espaces et mettre les lettres en majuscule.
Pour chacune des espèces, la séquence sera copiée sur le site NCBI et collée dans le document "clear_ncbi". Toutes les séquences peuvent être copiées avant d’exécuter la macro, elles seront séparées par une ligne afin de les retrouver sans erreur.

Pour le traitement des données dans Anagène, ne pas dépasser 10 molécules, l’alignement avec discontinuités ne pourrait pas se faire.
Exécuter la macro contenue dans le document en ouvrant Outils puis Macro... et Macros, choisir clear_ncbi et Exécuter.

Traitement des données dans Anagène

Le fichier modèle.edi téléchargeable va permettre de construire un fichier qui sera lu par Anagène. Attention toute faute de syntaxe empêchera l’ouverture du fichier, il faut donc suivre scrupuleusement les instructions que ce fichier contient. Il est en lecture seule, il faut enregistrer le travail sous un autre nom.

Les séquences préalablement mises en forme, seront collées dans le modèle et ordonnées dans le sens décroissant de leur longueur.
Enregistrer ensuite ce fichier au format texte dans le dossier Sauve d’Anagène. Dans l’explorateur changer l’extension .txt en .edi.

Dans le logiciel Anagène, cliquer sur le menu Fichier puis Ouvrir et sélectionner le fichier de travail .edi précédent. Sélectionner toutes les séquences et faire une comparaison en choisissant Alignement avec discontinuités.

Dans la fenêtre de comparaison, la ligne pointée est celle du traitement. Choisir Afficher les informations sur la ligne pointée. On aura alors la longueur de la chaîne de référence et le nombre d’acides aminés ou nucléotides identiques à cette référence pour chacune des autres séquences. Par soustraction, on aura le nombre de différences. Ces informations constitueront la première colonne de la matrice de distance.

Supprimer la première séquence, afin de prendre la seconde comme référence et remplir la deuxième colonne de la matrice. Recommencer l’opération jusqu’à la dernière séquence.

Écrire la matrice dans un traitement de texte sous la forme suivante :

Attention de ne pas mettre de tabulations mais des espaces. Aucune ligne vide ne doit apparaître au-dessous de la matrice.

La première ligne commence par # ce qui permet à Evolmol de l’interpréter comme un commentaire. La police "Courrier New" (police à chasse fixe) a été choisi pour bon alignement des chiffres.
Enregistrer ce fichier au format texte dans le dossier contenant le logiciel Evolmol. Dans l’explorateur, remplacer l’extension .txt par .mat.
Télécharger le fichier .edi et le fichier .mat de la FSH, les deux chaînes mises bout à bout.

Tracer l’arbre

Dans Evolmol, choisir Calcul d’un arbre puis Choix d’un fichier contenant une matrice. Sélectionner le fichier concerné et valider ce choix. Opter pour Calcul de l’arbre et écriture dans un fichier et valider. Evolmol a alors écrit un fichier portant le même nom que la matrice et portant l’extension .arb.

Revenir au menu précédent par la touche Echap et choisir Visualisation de l’arbre puis Choix d’un fichier contenant un arbre, choisir le fichier .arb concerné, valider deux fois puis sélectionner visualisation de l’arbre, valider.

Une fois l’arbre obtenu, il faudra le "raciner" sur l’espèce la plus ancienne et éventuellement faire quelques "pivots" pour la présentation.

Dans l’exemple choisi, l’arbre obtenu en mettant bout à bout les deux chaînes de la FSH est le suivant :

Télécharger la molécule de FSH.

Contact
Haut de page