Examen intermédiaire
From silico.biotoul.fr
Line 46: | Line 46: | ||
VNFREVDYTKPTVLVVGNELQGVSPEIVEIADKKIVIPMYGMAQSLNVSVATGIILYEAQRQREEKGMYSRPSLSEEEIQKILKKWAYEDVIKERKRTLSTS | VNFREVDYTKPTVLVVGNELQGVSPEIVEIADKKIVIPMYGMAQSLNVSVATGIILYEAQRQREEKGMYSRPSLSEEEIQKILKKWAYEDVIKERKRTLSTS | ||
<br/> | <br/> | ||
+ | |||
>prot2<br/> | >prot2<br/> | ||
MVMEYLVLEKRLKRLREVLEKRQKDLIVFADNVKNEHNFSAIVRTCDAVATWLSKESVNFREVDYTKPTVLVVGNELQGVSPEIVEIAVGVLYLYYYHAEGKKAKINEGI | MVMEYLVLEKRLKRLREVLEKRQKDLIVFADNVKNEHNFSAIVRTCDAVATWLSKESVNFREVDYTKPTVLVVGNELQGVSPEIVEIAVGVLYLYYYHAEGKKAKINEGI | ||
Line 93: | Line 94: | ||
A partir de la séquence ci-dessous, répondez aux questions: | A partir de la séquence ci-dessous, répondez aux questions: | ||
- | > | + | >prot3 <br/> |
MVLLVDDEARIAEIVQFLLRDQGFLVDTVSDAPHGRHLFEESGAVPHIML | MVLLVDDEARIAEIVQFLLRDQGFLVDTVSDAPHGRHLFEESGAVPHIML | ||
LDFGLPDLSGMQILKIIKQKGMTRDVPALLVTAKGTEVDAAEGLDMGADD | LDFGLPDLSGMQILKIIKQKGMTRDVPALLVTAKGTEVDAAEGLDMGADD | ||
YVLTPKPFSPKELMARIRAVLRRLSNYVFANPEHNEKEIEFGLLRMNFGS | YVLTPKPFSPKELMARIRAVLRRLSNYVFANPEHNEKEIEFGLLRMNFGS | ||
- | VHLFVNQSPIQLTTTEWFTKFLCMLSLNSGKPFNHDQLLNRVGGEHRHPD | + | VHLFVNQSPIQLTTTEWFTKFLCMLSLNSGKPFNHDQLLNRVGGEHRHPD<br/> |
* quelle est la fonction putative de cette séquence | * quelle est la fonction putative de cette séquence |
Revision as of 16:13, 9 December 2011
Contents |
Instructions
Commencez par créer un fichier texte sur le bureau (Open-Office ou Bloc Note) s'intitulant par "NOM_prenom" (exemple GAULIN_Elodie.rtf) Ce fichier comportera vos réponses à l'examen, il devra être :
- adressé par mail à l'adresse suivante gaulin@lrsv.ups-tlse.fr - conservé sur votre bureau dans un répertoire intitulé "Harmonisation Connaissances"
!! ATTENTION !! Tout manquement à cette règle sera sanctionné à hauteur de 2 points sur la note finale.
!! CONSEILS!!
Envoyez 5 minutes avant la fin de l’examen votre fichier de réponse :
- mettez-vous en copie du mail afin de garder une trace de votre travail
- laissez l’ordinateur allumé pour vérifier la présence du fichier dans le répertoire "Harmonisation Connaissances"
Vous êtes responsables de l’envoi du fichier en fin d’examen. Etant donné qu’il est facile d’antidater un fichier ainsi que son envoi, tout fichier non reçu en fin de séance recevra une note de 0/20.
Ressources
Vous trouverez ci-dessous une sélection des sites Internet qui vous seront nécessaires pour l'examen:
- Génopôle Toulouse
- EBI European Bioinformatics Institute (EMBL, GB)
- NCBI National Center for Biotechnology Information (NIH, USA)
- Expasy Expert Protein Analysis System (Swiss Institute of Bioinformatics, Suisse)
- PBIL Pôle Bio-Informatique Lyonnais (CNRS, Lyon)
- Institut Pasteur
- Protein Data Bank (PDB)
- EMBOSS.
Exercice 1
A partir de la séquence P01308, répondez aux questions suivantes
- de quel type de séquence s'agit-il ?
- a quel organisme appartient cette séquence ?
- dans quelle base de données cette séquence est-elle déposée ?
- a quoi correspond le numéro BAA03852.1 ?
- existe-t-il des domaines référencés dans PFAM pour cette séquence ? Si oui, indiquez les positions et le numéro d'accesion
Exercice 2
Vous allez comparer les 2 séquences protéiques ci-desous, par utilisation d'une matrice de point, d'un alignement global et local
>prot1
MVMEYLVLEKRLKRLREVLEKRQKDLIVFADNVKNEHNFSAIVRTCDAVGVLYLYYYHAEGKKAKINEGITQGSHKWVFIEKVDNPVQKLLEFKNRGFQIVATWLSKES
VNFREVDYTKPTVLVVGNELQGVSPEIVEIADKKIVIPMYGMAQSLNVSVATGIILYEAQRQREEKGMYSRPSLSEEEIQKILKKWAYEDVIKERKRTLSTS
>prot2
MVMEYLVLEKRLKRLREVLEKRQKDLIVFADNVKNEHNFSAIVRTCDAVATWLSKESVNFREVDYTKPTVLVVGNELQGVSPEIVEIAVGVLYLYYYHAEGKKAKINEGI
- interprétez les résultats obtenus par utilisation d'une matrice de point
- combien de gaps observez-vous lors d'un alignement global ?
- a quoi correspond le pourcentage de similarité ?
- pourquoi les résultats sont différents entre l'alignement local et global ?
- que pouvez vous conclure sur ces 2 séquences suite a cette analyse ?
Exercice 3
En utilisant la séquence ci-dessous, répondez aux questions
>Sequence1
TGTGAATATATCAATTTCCGCAATAAATTTCCTGTCATATAGTGAATTCAATCTCGCAAACGCGAACCGA
ACAATAAGAAGCACAACATCACGAGGAATCACCATGGCTAACTACTTCAATACACTGAATCTGCGCCAGC
AGCTGGCACAGCTGGGCAAATGTCGCTTTATGGGCCGCGATGAATTCGCCGATGGCGCGAGCTACCTTCA
GGGTAAAAAAGTAGTCATCGTCGGCTGTGGCGCACAGGGTCTGAACCAGGGCCTGAACATGCGTGATTCT
GGTCTCGATATCTCCTACGCTCTGCGTAAAGAAGCGATTGCCGAGAAGCGCGCGTCCTGGCGTAAAGCGA
CCGAAAATGGTTTTAAAGTGGGTACTTACGAAGAACTGATCCCACAGGCGGATCTGGTGATTAACCTGAC
GCCGGACAAGCAGCACTCTGATGTAGTGCGCACCGTACAGCCACTGATGAAAGACGGCGCGGCGCTGGGC
TACTCGCACGGTTTCAACATCGTCGAAGTGGGCGAGCAGATCCGTAAAGATATCACCGTAGTGATGGTTG
CGCCGAAATGCCCAGGCACCGAAGTGCGTGAAGAGTACAAACGTGGGTTCGGCGTACCGACGCTGATTGC
CGTTCACCCGGAAAACGATCCGAAAGGCGAAGGCATGGCGATTGCCAAAGCCTGGGCGGCTGCAACCGGT
GGTCACCGTGCGGGTGTGCTGGAATCGTCCTTCGTTGCGGAAGTGAAATCTGACCTGATGGGCGAGCAAA
CCATCCTGTGCGGTATGTTGCAGGCTGGCTCTCTGCTGTGCTTCGACAAGCTGGTGGAAGAAGGTACCGA
TCCAGCATACGCAGAAAAACTGATTCAGTTCGGTTGGGAAACCATCACCGAAGCACTGAAACAGGGCGGC
ATCACCCTGATGATGGACCGTCTCTCTAACCCGGCGAAACTGCGTGCTTATGCGCTTTCTGAACAGCTGA
AAGAGATCATGGCACCCCTGTTCCAGAAACATATGGACGACATCATCTCCGGCGAATTCTCTTCCGGTAT
GATGGCGGACTGGGCCAACGATGATAAGAAACTGCTGACCTGGCGTGAAGAGACCGGCAAAACCGCGTTT
GAAACCGCGCCGCAGTATGAAGGCAAAATCGGCGAGCAGGAGTACTTCGATAAAGGCGTACTGATGATTG
CGATGGTGAAAGCGGGCGTTGAACTGGCGTTCGAAACCATGGTCGATTCCGGCATCATTGAAGAGTCTGC
ATATTATGAATCACTGCACGAGCTGCCGCTGATTGCCAACACCATCGCCCGTAAGCGTCTGTACGAAATG
AACGTGGTTATCTCTGATACCGCTGAGTACGGTAACTATCTGTTCTCTTACGCTTGTGTGCCGTTGCTGA
AACCGTTTATGGCAGAGCTGCAACCGGGCGACCTGGGTAAAGCTATTCCGGAAGGCGCGGTAGATAACGG
GCAACTGCGTGATGTGAACGAAGCGATTCGCAGCCATGCGATTGAGCAGGTAGGTAAGAAACTGCGCGGC
TATATGACAGATATGAAACGTATTGCTGTTGCGGGTTAAGTGCGCGCTGATGCCCTCACCCCGACTCTCC
CACAGGGAGAGGGAGAAAACACTCAAGCCTTCTCCTGGAGAAGGCCTTGC
- indiquez a quel organisme appartient cette séquence
- indiquez si cette séquence est codante. Justifiez votre démarche
Exercice 4
A partir de la séquence ci-dessous, répondez aux questions:
>prot3
MVLLVDDEARIAEIVQFLLRDQGFLVDTVSDAPHGRHLFEESGAVPHIML
LDFGLPDLSGMQILKIIKQKGMTRDVPALLVTAKGTEVDAAEGLDMGADD
YVLTPKPFSPKELMARIRAVLRRLSNYVFANPEHNEKEIEFGLLRMNFGS
VHLFVNQSPIQLTTTEWFTKFLCMLSLNSGKPFNHDQLLNRVGGEHRHPD
- quelle est la fonction putative de cette séquence
- définissez une signature (pattern) représentative de la famille protéique. Vous présenterez sur le fichier réponse a l'examen, l'alignement multiple utilisé.
- le pattern ci-dessous est-il représentatif de la famille protéique ?
G-A-[ILV]-X-D
- rechercher l'ensemble des séquences qui possède ce pattern avec ScanProsite sur ExPASy.
Combien de séquences obtenez-vous ?
Un laboratoire souhaite travailler sur la protéine LON de Pseudomonas aeruginosa (pathogène humain) et de Pseudomonas syringae (pathogène plante). Des données expérimentales sont disponibles uniquement pour l'homologue présent chez la bactérie Escherichia coli (Numéro d'accesion P0A9M0).
Question1.1
En lisant la fiche de P0A9M0, répondez aux questions suivantes:
- dans quelle banque cette séquence est-elle déposée ?
- est-ce une protéine sécrétée ? justifiez
- indiquez le nombre de structure(s) obtenue(s) pour cette protéine. Comment avez-vous obtenu cette information ?
- expliquer de façon détaillée la fonction de cette protéine. Préciser sa localisation cellulaire ainsi que les conditions de son induction. Où avez-vous trouvé ces informations ?
- des domaines ont-ils été identifiés sur cette protéine ? Lesquels ?
- que veut dire le champ "FT" ?
Afin de caractériser les homologues LON d'Escherichia coli chez P. aeruginosa et P. fluorescens dont les génomes sont séquencés, des analyses bioinformatiques ont été réalisées.
Question1.2
- proposez une démarche pour identifiez les séquences similaires a LON d'E. coli