Examen intermédiaire
From silico.biotoul.fr
Contents |
Instructions
Commencez par créer un fichier texte sur le bureau (Open-Office ou Bloc Note) s'intitulant par "NOM_prenom" (exemple GAULIN_Elodie.rtf) Ce fichier comportera vos réponses à l'examen, il devra être :
- adressé par mail à l'adresse suivante gaulin@lrsv.ups-tlse.fr - conservé sur votre bureau dans un répertoire intitulé "Harmonisation Connaissances"
!! ATTENTION !! Tout manquement à cette règle sera sanctionné à hauteur de 2 points sur la note finale.
!! CONSEILS!!
Envoyez 5 minutes avant la fin de l’examen votre fichier de réponse :
- mettez-vous en copie du mail afin de garder une trace de votre travail
- laissez l’ordinateur allumé pour vérifier la présence du fichier dans le répertoire "Harmonisation Connaissances"
Vous êtes responsables de l’envoi du fichier en fin d’examen. Etant donné qu’il est facile d’antidater un fichier ainsi que son envoi, tout fichier non reçu en fin de séance recevra une note de 0/20.
Ressources
Vous trouverez ci-dessous une sélection des sites Internet qui vous seront nécessaires pour l'examen:
- Génopôle Toulouse
- EBI European Bioinformatics Institute (EMBL, GB)
- NCBI National Center for Biotechnology Information (NIH, USA)
- Expasy Expert Protein Analysis System (Swiss Institute of Bioinformatics, Suisse)
- PBIL Pôle Bio-Informatique Lyonnais (CNRS, Lyon)
- Institut Pasteur
- Protein Data Bank (PDB)
- EMBOSS.
Exercice 1
A partir de la séquence P01308, répondez aux questions suivantes
- 1.1. de quel type de séquence s'agit-il ?
- 1.2. a quel organisme appartient cette séquence ?
- 1.3. dans quelle base de données cette séquence est-elle déposée ?
- 1.4. a quoi correspond le numéro BAA03852.1 ?
- 1.5.existe-t-il des domaines référencés dans PFAM pour cette séquence ? Si oui, indiquez les positions et le numéro d'accesion
Exercice 2
Vous allez comparer les 2 séquences protéiques ci-desous, par utilisation d'une matrice de point, d'un alignement global et local
>prot1
MVMEYLVLEKRLKRLREVLEKRQKDLIVFADNVKNEHNFSAIVRTCDAVGVLYLYYYHAEGKKAKINEGITQGSHKWVFIEKVDNPVQKLLEFKNRGFQIVATWLSKES
VNFREVDYTKPTVLVVGNELQGVSPEIVEIADKKIVIPMYGMAQSLNVSVATGIILYEAQRQREEKGMYSRPSLSEEEIQKILKKWAYEDVIKERKRTLSTS
>prot2
MVMEYLVLEKRLKRLREVLEKRQKDLIVFADNVKNEHNFSAIVRTCDAVATWLSKESVNFREVDYTKPTVLVVGNELQGVSPEIVEIAVGVLYLYYYHAEGKKAKINEGI
- 2.1. interprétez les résultats obtenus par utilisation d'une matrice de point
- 2.2. combien de gaps observez-vous lors d'un alignement global ?
- 2.2. a quoi correspond le pourcentage de similarité ?
- 2.3. pourquoi les résultats sont différents entre l'alignement local et global ?
- 2.4. que pouvez vous conclure sur ces 2 séquences suite a cette analyse ?
Exercice 3
En utilisant la séquence ci-dessous, répondez aux questions
>Sequence1
TGTGAATATATCAATTTCCGCAATAAATTTCCTGTCATATAGTGAATTCAATCTCGCAAACGCGAACCGA
ACAATAAGAAGCACAACATCACGAGGAATCACCATGGCTAACTACTTCAATACACTGAATCTGCGCCAGC
AGCTGGCACAGCTGGGCAAATGTCGCTTTATGGGCCGCGATGAATTCGCCGATGGCGCGAGCTACCTTCA
GGGTAAAAAAGTAGTCATCGTCGGCTGTGGCGCACAGGGTCTGAACCAGGGCCTGAACATGCGTGATTCT
GGTCTCGATATCTCCTACGCTCTGCGTAAAGAAGCGATTGCCGAGAAGCGCGCGTCCTGGCGTAAAGCGA
CCGAAAATGGTTTTAAAGTGGGTACTTACGAAGAACTGATCCCACAGGCGGATCTGGTGATTAACCTGAC
GCCGGACAAGCAGCACTCTGATGTAGTGCGCACCGTACAGCCACTGATGAAAGACGGCGCGGCGCTGGGC
TACTCGCACGGTTTCAACATCGTCGAAGTGGGCGAGCAGATCCGTAAAGATATCACCGTAGTGATGGTTG
CGCCGAAATGCCCAGGCACCGAAGTGCGTGAAGAGTACAAACGTGGGTTCGGCGTACCGACGCTGATTGC
CGTTCACCCGGAAAACGATCCGAAAGGCGAAGGCATGGCGATTGCCAAAGCCTGGGCGGCTGCAACCGGT
GGTCACCGTGCGGGTGTGCTGGAATCGTCCTTCGTTGCGGAAGTGAAATCTGACCTGATGGGCGAGCAAA
CCATCCTGTGCGGTATGTTGCAGGCTGGCTCTCTGCTGTGCTTCGACAAGCTGGTGGAAGAAGGTACCGA
TCCAGCATACGCAGAAAAACTGATTCAGTTCGGTTGGGAAACCATCACCGAAGCACTGAAACAGGGCGGC
ATCACCCTGATGATGGACCGTCTCTCTAACCCGGCGAAACTGCGTGCTTATGCGCTTTCTGAACAGCTGA
AAGAGATCATGGCACCCCTGTTCCAGAAACATATGGACGACATCATCTCCGGCGAATTCTCTTCCGGTAT
GATGGCGGACTGGGCCAACGATGATAAGAAACTGCTGACCTGGCGTGAAGAGACCGGCAAAACCGCGTTT
GAAACCGCGCCGCAGTATGAAGGCAAAATCGGCGAGCAGGAGTACTTCGATAAAGGCGTACTGATGATTG
CGATGGTGAAAGCGGGCGTTGAACTGGCGTTCGAAACCATGGTCGATTCCGGCATCATTGAAGAGTCTGC
ATATTATGAATCACTGCACGAGCTGCCGCTGATTGCCAACACCATCGCCCGTAAGCGTCTGTACGAAATG
AACGTGGTTATCTCTGATACCGCTGAGTACGGTAACTATCTGTTCTCTTACGCTTGTGTGCCGTTGCTGA
AACCGTTTATGGCAGAGCTGCAACCGGGCGACCTGGGTAAAGCTATTCCGGAAGGCGCGGTAGATAACGG
GCAACTGCGTGATGTGAACGAAGCGATTCGCAGCCATGCGATTGAGCAGGTAGGTAAGAAACTGCGCGGC
TATATGACAGATATGAAACGTATTGCTGTTGCGGGTTAAGTGCGCGCTGATGCCCTCACCCCGACTCTCC
CACAGGGAGAGGGAGAAAACACTCAAGCCTTCTCCTGGAGAAGGCCTTGC
- 3.1. indiquez a quel organisme appartient cette séquence
- 3.2. indiquez si cette séquence est codante. Justifiez votre démarche
Exercice 4
A partir de la séquence ci-dessous, répondez aux questions:
>prot3
MVLLVDDEARIAEIVQFLLRDQGFLVDTVSDAPHGRHLFEESGAVPHIML
LDFGLPDLSGMQILKIIKQKGMTRDVPALLVTAKGTEVDAAEGLDMGADD
YVLTPKPFSPKELMARIRAVLRRLSNYVFANPEHNEKEIEFGLLRMNFGS
VHLFVNQSPIQLTTTEWFTKFLCMLSLNSGKPFNHDQLLNRVGGEHRHPD
- 4.1. quelle est la fonction putative de cette séquence
- 4.2. définissez une signature (pattern) représentative de la famille protéique.
!!! Faites un copier-coller de l'alignement utilisé dans votre fichier de réponse a l'examen!!!
- 4.3. le pattern ci-dessous est-il représentatif de la famille protéique ? Justifiez votre réponse.
[GST]-[DEN]-x-[MFP]-T-[LIV]-G-[HNT]-[LIVM]