TD2 Bioanalyse
From silico.biotoul.fr
OBJECTIFS DU TP
Savoir faire et interpréter un dotplot pour comparer rapidement 2 séquences Comprendre les différences entre les méthodes d'alignement : local et global, semi-global Confronter les résultats d'alignement aux annotations
Pour tous les exercices, nous utiliserons la suite "EMBOSS". Cette suite logicielle est disponible sur plusieurs serveurs. Nous utiliserons la version mise à disposition par la Genopole de Toulouse sur ce site
EXERCICE 1 : comparaison de 2 séquences d'ADN
Nous allons utiliser deux logiciels pour effectuer les dotplot.
- dotpath permet de dessiner un dotplot avec une taille de mot fixée.
- dotmatcher permet de filtrer les fenêtres avec un seuil.
Récupérez les deux séquences Xlev_Rhodop1 et Xlev_Rhodop2.seq
1/ Essayer le logiciel dotpath avec la taille de fenêtre par défaut et en sélectionnant l'option 'Display the overlapping matches'. Essayer avec d'autres tailles de fenêtre.
2/ En déselectionnant l'option 'Display the overlapping matches', vous demandez au logiciel de ne conserver que les fenêtres non chevauchantes. Observez le résultat avec 4 comme taille de fenêtre.
3/ Essayer le logiciel dotmatcher avec les paramètres par défaut. Faites varier le paramètre de seuil jusqu'à retrouver le résulat obtenu avec dotpath. Que constatez-vous ?
En fait la première séquence correspond à celle du gène de la rhodopsine chez Xenopus laevis et la seconde à celle de son ARNm. Combien le gène compte-t-il d'exons ?
4/ Réaliser maintenant un alignement global de ces 2 séquences avec needle (paramètres par défaut) : proposez un découpage en exons/introns de la séquence Xlev_Rhodop1.
5/ Comparer ce découpage avec l'annotation de la séquence en la recherchant sur le site du NCBI
EXERCICE 2 : un cas d'école pour comparer alignement local et global
Voici 2 séquences, au format FASTA :
>prot1
MVMEYLVLEKRLKRLREVLEKRQKDLIVFADNVKNEHNFSAIVRTCDAVGVLYLYYYHAE GKKAKINEGITQGSHKWVFIEKVDNPVQKLLEFKNRGFQIVATWLSKESVNFREVDYTKP TVLVVGNELQGVSPEIVEIADKKIVIPMYGMAQSLNVSVATGIILYEAQRQREEKGMYSR PSLSEEEIQKILKKWAYEDVIKERKRTLSTS
>prot2
MVMEYLVLEKRLKRLREVLEKRQKDLIVFADNVKNEHNFSAIVRTCDAVATWLSKESVNF REVDYTKPTVLVVGNELQGVSPEIVEIAVGVLYLYYYHAEGKKAKINEGI
1/ Faire un dotplot de ces 2 séquences avec dotmatcher : qu'observez-vous ?
2/ Faire un alignement semi-global avec needle : combien y a-t-il de gaps ? A quoi correspond le pourcentage de similarité ? Quels sont les paramètres de calcul du score ? Modifiez-les et regardez en quoi l'alignement change.
3/ Faire un alignement local avec matcher : qu'observez-vous ? Demandez à voir d'autres alignements (number of alternative matches). Puis modifier les paramètres de calcul du score Comparez et expliquez les différences obtenues entre une méthode d'alignement global (needle) et une méthode d'alignement local (matcher). Quelles conclusions sur les 2 séquences ?