silico.biotoul.fr
 

TD1 Bioanalyse

From silico.biotoul.fr

Revision as of 08:42, 10 September 2016 by Gaulin (Talk | contribs)
Jump to: navigation, search

OBJECTIFS DU TP

   Etre capable de retrouver une séquence dont on connait le numéro d'accession dans sa banque
   Savoir comment s'organisent les fiches des séquences, et où y chercher les informations
   Etre capable de trouver une ou des séquences à l'aide de mots clés ciblant des champs spécifiques
   Naviguer entre les banques, changer de format, télécharger des séquences

EXERCICE 1 : Accéder à une séquence prédéfinie dans les banques

1/ Aller sur le site d'UniProt : chercher la séquence P01308.

  • De quelle protéine s'agit-il ? chez quel organisme ?
  • Quelle est la taille de cette séquence ?
  • Que sont les "VARIANT" ?
  • Y a-t-il des preuves expérimentales de l'existence de cette protéine ?
  • Est-elle dans UniProt-trEMBL ou UniProt-SwissProt ?
  • Dans quels processus intervient cette protéine ? Cliquer sur des liens de la GO et aller voir l'onglet Ancestor Chart

Faire afficher le format UniProtKB en cliquant sur Format => Text en haut de la page

2/ Sur le site du NCBI : chercher (via Entrez) la même séquence.

  • Quels sont les résultats ?
  • Cliquer sur Protein : la séquence est ici au format GenPept
  • Revenez aux résultats et cliquer sur Gene : regarder l'entrée INS, en particulier la partie NCBI Reference Sequences : combien de variants d'épissage ? et dans Related Sequences : combien d'ARNm ?
  • Regarder la séquence génomique RefSeq NG_007114 (format Genbank) : combien d'exons composent ce gène ? combien interrompent la séquence codante ?