silico.biotoul.fr
 

Bioanalyse TD Comparaison de deux sequences

From silico.biotoul.fr

Revision as of 09:41, 22 February 2012 by Gaulin (Talk | contribs)
Jump to: navigation, search

Contents

TP Comparaison de Séquence

Cette séance est inspirée d'un TP de Jean-Stéphane Varré Lill).

Introduction

Les logiciels que nous allons utiliser sont majoritairement issus de la suite EMBOSS (EMBOSS homepage). Ils sont installés sur plusieurs serveurs dont celui de l'institut Pasteur Institut Pasteur, celui de la Génopole de Toulouse et de Lille. Ces logiciels possèdent tous la même interfaçe, pour chacun d'entre-eux vous devez saisir:

  • votre email (ici on se contentera de mettre 'a') (sauf sur le site toulousain)
  • vos données (le plus souvent au format FASTA)
  • les paramètres du programme

En cliquant sur le nom du programme (en haut à gauche) vous aurez des informations sur ce qu'il fait et sur les paramètres.

Pour chacun des logiciels, il existe deux interfaçes, l'une simple, l'autre dite avancée. Dans la version simple, seuls quelques paramètres peuvent être modifiés, les autres étant choisis par défaut.

Vous devrez stocker des séquences et des résultats dans des fichiers. Pour ce faire, vous aurez simplement à enregistrer ces fichiers grâce aux menus de Netscape.


Ci-dessous une sélection des sites Internet qui vous seront également nécessaires au cours des séances:

  • Génopôle Toulouse
  • EBI European Bioinformatics Institute (EMBL, GB)
  • NCBI National Center for Biotechnology Information (NIH, USA)
  • Expasy Expert Protein Analysis System (Swiss Institute of Bioinformatics, Suisse)
  • PBIL Pôle Bio-Informatique Lyonnais (CNRS, Lyon)
  • Institut Pasteur

Recherches avec le dotplot et les outils d'alignement

Exercice 1

Nous allons utiliser deux logiciels pour effectuer les dotplot.

  • dotpath permet de dessiner un dotplot avec une taille de mot fixée.
  • dotmatcher permet de filtrer les fenêtres avec un seuil.

Récupérez les deux séquences Xlev_Rhodop1.seq et Xlev_Rhodop2.seq. ""1°)""Essayer le logiciel dotpath avec la taille de fenêtre par défaut et en sélectionnant l'option 'Display the overlapping matches'. Essayer avec d'autres tailles de fenêtre. ""2°)""En déselectionnant l'option 'Display the overlapping matches', vous demandez au logiciel de ne conserver que les fenêtres non chevauchantes. Observez le résultat avec 4 comme taille de fenêtre. ""3°)""Essayer le logiciel dotmatcher avec les paramètres par défaut. Faites varier le paramètre de seuil jusqu'à retrouver le résulat obtenu avec dotpath.

Que constatez-vous? En fait la première séquence correspond à celle du gène de la rhodopsine chez Xenopus laevis et la seconde à celle de son ARNm. Combien le gène compte-t-il d'exons?

Nous allons utiliser 2 logiciels d'alignement:

  • stretcher fournit un alignement global entre deux séquences.
  • water fournit un alignement local entre deux séquences.

""1°)""Testez ces deux logiciels avec les deux séquences précédentes en fixant comme pénalité d'ouverture de gap 10 et comme pénalité d'extension de gap 0.5 (0,5 pour strecher). Quelle(s) différence(s) observez-vous? ""2°)""A l'aide des alignements obtenus, proposez un découpage en exons/introns de la séquence Xlev_Rhodop1.seq. ""3°)""Récupérez l'entrée EMBL correspondant à cette séquence. Pour cela allez sur le site de l'EBI