silico.biotoul.fr
 

TP1 Bioanalyse

From silico.biotoul.fr

Revision as of 16:00, 6 January 2021 by Gaulin (Talk | contribs)
(diff) ← Older revision | Current revision (diff) | Newer revision → (diff)
Jump to: navigation, search

OBJECTIFS

 - Etre capable de retrouver une séquence dont on connait le numéro d'accession dans sa banque
 - Savoir comment s'organisent les fiches des séquences, et où y chercher les informations
 - Etre capable de trouver une ou des séquences à l'aide de mots clés ciblant des champs spécifiques
 - Naviguer entre les banques, changer de format, télécharger des séquences
 - Utiliser quelques outils de bioanalyse pour répondre à une question biologique

EXERCICE 1 : Accéder à une séquence prédéfinie dans les banques

1/ Aller sur le site d' UniProt : chercher la séquence P01308.

  • De quelle protéine s'agit-il ? chez quel organisme ?
  • Quelle est la taille de cette séquence ?
  • Que sont les "VARIANT" ?
  • Y a-t-il des preuves expérimentales de l'existence de cette protéine ?
  • Est-elle dans UniProt-trEMBL ou UniProt-SwissProt ?
  • Dans quels processus intervient cette protéine ? Cliquer sur des liens de la GO et regarder Ancestor Chart
  • Regarder dans 'Cross-references' : combien de liens vers des séquences génomiques ? Combien vers des ARNm ?

Cliquer sur AY138590 > puis à droite View > EMBL : combien d'exons composent ce gène ? combien constituent la séquence codante ?


Faire afficher le format UniProtKB en cliquant sur Format => Text en haut de la page

2/ Sur le site du NCBI : chercher (via ENTREZ) la même séquence.

  • Quels sont les résultats ?
  • Cliquer sur Protein : la séquence est ici au format GenPept
  • Revenez aux résultats et cliquer sur Gene : regarder l'entrée INS, en particulier la partie NCBI Reference Sequences : combien de variants d'épissage ? et dans Related Sequences : combien d'ARNm ?
  • Regarder la séquence génomique RefSeq NG_007114 (format Genbank) : combien d'exons composent ce gène ? combien constituent la séquence codante ?