TD1 Bioanalyse
From silico.biotoul.fr
OBJECTIFS DU TP
Etre capable de retrouver une séquence dont on connait le numéro d'accession dans sa banque Savoir comment s'organisent les fiches des séquences, et où y chercher les informations Etre capable de trouver une ou des séquences à l'aide de mots clés ciblant des champs spécifiques Naviguer entre les banques, changer de format, télécharger des séquences
EXERCICE 1 : Accéder à une séquence prédéfinie dans les banques
1/ Aller sur le site d'UniProt : chercher la séquence P01308.
- De quelle protéine s'agit-il ? chez quel organisme ?
- Quelle est la taille de cette séquence ?
- Que sont les "VARIANT" ?
- Y a-t-il des preuves expérimentales de l'existence de cette protéine ?
- Est-elle dans UniProt-trEMBL ou UniProt-SwissProt ?
- Dans quels processus intervient cette protéine ? Cliquer sur des liens de la GO et aller voir l'onglet Ancestor Chart
Faire afficher le format UniProtKB en cliquant sur Format => Text en haut de la page
2/ Sur le site du NCBI : chercher (via Entrez) la même séquence.
- Quels sont les résultats ?
- Cliquer sur Protein : la séquence est ici au format GenPept
- Revenez aux résultats et cliquer sur Gene : regarder l'entrée INS, en particulier la partie NCBI Reference Sequences : combien de variants d'épissage ? et dans Related Sequences : combien d'ARNm ?
- Regarder la séquence génomique RefSeq NG_007114 (format Genbank) : combien d'exons composent ce gène ? combien interrompent la séquence codante ?