silico.biotoul.fr
 

Bioanalyse TD Banques et Manipulation de Sequences

From silico.biotoul.fr

(Difference between revisions)
Jump to: navigation, search
m
m
Line 46: Line 46:
* A ce stade, vous avez sûrement remarqué sur la fiche de NP_000624 la mention de l'entrée P10415 d'UniProt/SwissProt. Retournez sur le site de l'Expasy pour consulter la fiche de cette protéine.
* A ce stade, vous avez sûrement remarqué sur la fiche de NP_000624 la mention de l'entrée P10415 d'UniProt/SwissProt. Retournez sur le site de l'Expasy pour consulter la fiche de cette protéine.
: Parcourez la section ''General annotation (Comments)'' ; celle-ci correspond à l'annotation ajoutée par les experts.
: Parcourez la section ''General annotation (Comments)'' ; celle-ci correspond à l'annotation ajoutée par les experts.
 +
: Comparez ces annotations à celles trouvées dans la section suivante ''Gene Ontology'', par exemple en ce qui concerne sa fonction. Quelle mesure de qualité est associée aux annotations GO ? Suivre une des références croisées vers GO (par exemple anti-apoptosis) pour apprécier la structure hiérarchique de ce vocabulaire.
: Comparez ces annotations à celles trouvées dans la section suivante ''Gene Ontology'', par exemple en ce qui concerne sa fonction. Quelle mesure de qualité est associée aux annotations GO ? Suivre une des références croisées vers GO (par exemple anti-apoptosis) pour apprécier la structure hiérarchique de ce vocabulaire.
 +
 +
: Intéressez vous ensuite à la partie ''Sequence annotation (Features)'' et comparez les annotations à vos propres études menées précédemment.

Revision as of 10:00, 8 March 2011

Banques et manipulations de séquences

Ci-dessous une sélection des sites Internet qui vous seront nécessaires au cours des TD :

  • Génopôle Toulouse
  • EBI European Bioinformatics Institute (EMBL, GB)
  • NCBI National Center for Biotechnology Information (NIH, USA)
  • Expasy Expert Protein Analysis System (Swiss Institute of Bioinformatics, Suisse)
  • PBIL Pôle Bio-Informatique Lyonnais (CNRS, Lyon)
  • Institut Pasteur

Contexte scientifique : vous venez d'arriver dans une équipe de recherche travaillant sur le gène BCL2 humain, impliqué dans différents cancers. Une analyse fonctionnelle de BCL2 doit être réalisée chez la souris afin de mieux comprendre le rôle de la protéine codée par BCL2. Pour cela, il est nécessaire de disposer d'un anticoprs dirigé contre un domaine de BCL2 et donc de produire ce domaine de manière hétérologue dans Escherichia coli, afin ensuite d'immuniser des lapins.

Recherche dans les banques

Dans un premier temps, il est nécessaire de récupérer les séquences humaines codées par BCL2.

  • Sur le site du NCBI, recherchez les protéines codées par le gène BCL2.
Combien en avez-vous ? Sélectionnez celles qui proviennent du génome humain.
Vérifier que ceux sont toutes des BCL2 et non des protéines associées à BCL2. Pour cela, parcourez quelques entrées et l'endroit dans la fiche où le nom BCL2 apparaît.
La page de recherche avancée (Advanced search) permet d'affiner votre requête. Exploiter au mieux les critères de recherche à votre disposition en utilisant la recherche dans certains champs des fiches pour ne rechercher que les protéines humaines codées par le gène BCL2. Remarque : le bouton Preview permet de vérifier combien de fiches seront retournées par la requête.
  • Restreindre la recherche à la banque RefSeq (utiliser l'onglet limits).
Vous devriez maintenant avoir 2 isoformes NP_000624 et NP_000648.
  • A l'aide des programmes de comparaison et d'alignement de séquences de la suite EMBOSS, comparez les séquences protéiques des 2 isoformes. Quelles sont vos conclusions ?

Analyse d'une séquence protéique

Afin d'appréhender l'organisation structurale et la localisation cellulaire de BCL2, une analyse fin des séquences protéiques est nécessaire.

  • Allez sur le site d'Expasy. Qu'est-ce que le serveur Expasy ?
Parcourez les outils disponibles à votre disposition, soit dans le menu Tools, soit à partir de la liste complète accessible depuis le lien full list dans la section Tools and Software de la page d'accueil.
  • Etudiez maintenant la plus longue des deux séquences trouvées précédemment.
Trouvez un ou des programmes pour calculer le poids moléculaire et le point isoélectrique de la protéine.
Utilisez ScanProsite, InterPro Scan (lien vers l'EBI) ou SMART (lien vers SMART) pour chercher si elle contient des domaines connus. Analyser les domaines identifiés et notez leur position.
Avec le programme TopPred (cochez la case pour obtenir une image), recherchez si la protéine contient des domaines membranaires.
Effectuer une prédiction de structures secondaires avec le programme GOR.
  • Synthétisez les différentes informations et résultats que vous avez obtenus et comparez-les avec les annotations présentes dans la fiche de la séquence.
  • A ce stade, vous avez sûrement remarqué sur la fiche de NP_000624 la mention de l'entrée P10415 d'UniProt/SwissProt. Retournez sur le site de l'Expasy pour consulter la fiche de cette protéine.
Parcourez la section General annotation (Comments) ; celle-ci correspond à l'annotation ajoutée par les experts.
Comparez ces annotations à celles trouvées dans la section suivante Gene Ontology, par exemple en ce qui concerne sa fonction. Quelle mesure de qualité est associée aux annotations GO ? Suivre une des références croisées vers GO (par exemple anti-apoptosis) pour apprécier la structure hiérarchique de ce vocabulaire.
Intéressez vous ensuite à la partie Sequence annotation (Features) et comparez les annotations à vos propres études menées précédemment.