silico.biotoul.fr
 

TD2 Genome Selection Plantes

From silico.biotoul.fr

Revision as of 12:28, 28 September 2016 by Gaulin (Talk | contribs)
Jump to: navigation, search

Contents

Objectifs

Ce TD a pour but d'apprendre a comparer des séquences deux a deux via différentes methodes (matrice de point, alignement global et local)

Exercice 1 : Comparaison de 2 séquences avec une matrice de point (dot plot)

  • Rechercher les 2 séquences enregistrées sous les numéros d'accession P10415 et Q64373
  • Que pouvez vous dire sur ces 2 séquences ?
  • Comparer les séquences deux à deux, en utilisant une matrice de point (dotplot).

Les logiciels sont disponibles dans la suite EMBOSS.

Utiliser DOTPATH qui permet de dessiner un dotplot avec une taille de mot fixée.
Que pouvez-vous conclure ?

Exercice 2: Comparaison de 2 séquences par alignement global et local

Nous allons continuer la comparaison entre nos 2 séquences en utilisant des méthodologies d'alignement permettant d'évaluer la significativité de l'alignement

  • Faites un alignement global (de bout à bout) entre les 2 séquences avec Needle disponible sur EMBOSS
Qu'observez vous ?
Combien y a-t-il de gaps ? A quoi correspondent-ils ?
A quoi correspond le pourcentage de similarité ?
Quels sont les paramètres de calcul du score ?
Votre alignement est-il significatif ?
  • Faites un alignement local avec Matcher disponible sur EMBOSS
Qu'observez-vous ?
Demandez à voir d'autres alignements.
Sont-ils significatifs ?

Exercice 3 : Comparaison de plusieurs séquences par alignement multiple

  • Réalisez un Blast avec P10415 sur la banque SwissProt
  • Sélectionner un ensemble de séquences pour réaliser l'alignement multiple (une dizaine).

ATTENTION: si vous voulez faire ressortir des zones conservées versus des zones peu ou pas conservées au cours de l'évolution, il faut construire un échantillon dans lequel vous prendrez en compte des séquences proches mais aussi des séquences éloignées. Ne pas oublier d'inclure la protéine d'intérêt P10415

Les séquences doivent être extraites au format FASTA. Pour cela, dans la page de réponse de BlastP, cocher les séquences que vous voulez conserver puis à la fin de la page, cliquer sur Get selected sequences. Dans la nouvelle page, choisir dans le menu Display FASTA (text). Sauvegarder les séquences dans un fichier texte.

  • Réaliser l'alignement multiple en utilisant le programme Clustal (Clustal Omega) sur le serveur d'Expasy d'Expasy . Sauvegarder cet alignement sur votre disque (sur la page de réponse, aller à Result files (text), cliquer sur le lien CLUSTALW, sauvegarder la page).

Analyser l'alignement en repérant notamment les régions conservées.