silico.biotoul.fr
 

TD2 Genome Selection Plantes

From silico.biotoul.fr

(Difference between revisions)
Jump to: navigation, search
(Exercice 3 : Comparaison de plusieurs séquences par alignement multiple)
(Exercice 3 : Analyses des plantes exprimant la construction)
 
(125 intermediate revisions not shown)
Line 1: Line 1:
-
'''== RAPPEL / Controle Continu, Mercedi 13 Decembre 13h30 en U1 MATHIS ==
 
-
 
-
 
'''
'''
==Objectifs==
==Objectifs==
-
Ce TD a pour but d'apprendre a comparer des séquences deux a deux via différentes methodes (matrice de point, alignement global et local), à definir des signatures protéqiues après utilisation d'alignement multiple, a mettre en application votre savoir-faire !
+
Ce TD a pour but de vous familiariser avec les méthodes de comparaison de séquences biologiques, la recherche de séquences similaires (BLAST), la recherche d'ORF dans une séquence et de mettre en application votre savoir-faire.
-
== '''CONTROLE CONTINU MERCREDI 13 DECEMBRE 13h30-15h30 en U1 MATHIS'''==
+
Quelques liens utiles:
 +
*[https://www.ncbi.nlm.nih.gov/ NCBI]
-
== Exercice 1 : Comparaison de 2 séquences avec une matrice de point (dot plot) ==
+
*[http://www.ebi.ac.uk/ EBI - European Bioinformatics Institute]
-
* Rechercher les 2 séquences enregistrées sous les numéros d'accession P10415 et Q64373
+
==Contexte==
-
* Que pouvez vous dire sur ces 2 séquences ?
+
-
* Comparer les séquences deux à deux, en utilisant une matrice de point (dotplot).
+
-
Les logiciels sont disponibles dans la suite EMBOSS [http://bioinfo.genotoul.fr/ de la Genopole de Toulouse] ou du centre de [http://www.bioinformatics.nl/emboss-explorer/  Bioinformatique des Pays Bas]
+
-
:Utiliser '''DOTPATH''' qui permet de dessiner un '''dotplot''' avec une taille de mot fixée.
+
-
:Que pouvez-vous conclure ?
+
-
== Exercice 2: Comparaison de 2 séquences par alignement global et local : Cas d'Ecole==
+
Nous resterons dans le contexte scientifique du précédent TD s'intéressant aux chitinases afin de définir si ces enzymes pourraient avoir un intérêt dans des approches de biotechnologie végétale.
 +
On s'intéressera ici à identifier une séquence nucléique de chitinase afin de l'introgresser dans un génome végétal sous contrôle de séquences régulatrices adaptées et d'évaluer si cette approche pourrait permettre de favoriser la protection des plantes lors d'une infection microbienne.
-
Voici 2 séquences, au format FASTA :
+
== Exercice 1 : Recherche d'ORF sur un ARNm ==
-
>prot1
+
Le criblage d'une banque d'ADNc de l'oomycète a permis très probablement d'identifier la séquence nucléique correspondant à la protéine 'chitinase GH19' travaillée au cours du précédent TD. Il faut maintenant de vérifier si cette séquence code effectivement pour la protéine 'chitinase-GH19' afin de pouvoir l'insérer sous contrôle de séquences régulatrices adaptées au sein d'une plante d'intérêt.
-
MVMEYLVLEKRLKRLREVLEKRQKDLIVFADNVKNEHNFSAIVRTCDAVGVLYLYYYHAE GKKAKINEGITQGSHKWVFIEKVDNPVQKLLEFKNRGFQIVATWLSKESVNFREVDYTKP TVLVVGNELQGVSPEIVEIADKKIVIPMYGMAQSLNVSVATGIILYEAQRQREEKGMYSR PSLSEEEIQKILKKWAYEDVIKERKRTLSTS
+
La séquence obtenue après criblage de la banque d'ADNc est disponible ci-dessous
 +
<br><br>
 +
>Oom_cDNA
-
>prot2
+
ACAACATATCCAGTCACTATGGGGCCCGTCGACCTGCAGACTGGCTGTGTATAAGGGAGC
 +
CTGACATTTATATTCCCCAGAACATCAGGTTAATGGCGTTTTTGATGTCATTTTCGCGGT
 +
GGCTGAGATCAGCCACTTCTTCCCCGATAACGGAGACCGGCACACTGGCCATATCGGTGG
 +
TCATCATGCGCCAGCTTTCATCCCCGATATGCACCACCGGGTAAAGTTCACGCAAGCAAG
 +
CAGCCAAATCAGCCTATCAACCCAAGTCAGCCATGAAATTCGTCGGGGTTATCGCGTCAA
 +
GTCTTCTGGTTGTGCCTTCTGCGGTCTCTGGTGACGCTGATAGCTCGAGTTTCGCTCGCT
 +
TCTTCGATCAGGATCGTTTCCAGGAGGTTTTCCCGGACGCTGTGGAGCTCTACAACTTCA
 +
ACGGTCTTGTGGATGCGGCCAGCAAGTACAGCGAATTCGCTAATACGGGCAACGACGACA
 +
ATGACAAGCGTGAGCTGGCAGCGTTCCTGGCTCAAACAGCTCACGAGTGCGACAGCTTCA
 +
AGGCCGCGGAAGAGTACGCCCGTGACACCTACTCGGTGTGGCAGTACTGCGACAACGCCA
 +
CCTACACGTGTGCCCCCGGTCGCCGTTACCACGGCCGTGGCCCCATTCAGCTCTCATGGA
 +
ACTACAATTACTACAATGCTGGCGAAGCTCTGGGCATTGATCTCTTAAACAACCCGGACA
 +
TCGTCGCGACAGACACGACGGTGACGTGGATGACTGCGCTTTGGTACTGGATGACTCCGC
 +
ATGGCGGCCGTGTGATCCACGACATCGTCGCCGGTGAGAACGGATTCGCTCAATCCACCG
 +
ATATCATCAACGGTGGTCTGGAGTGCGGTCCGGACGCTCCCAACACGTCGAACGAGCAAC
 +
AACGTATCACGTACTTCACCAAGATGTGCGAGGCTCTGGGCGTGGAGCCTCTGGGCGCCA
 +
CCTCGTGCAACGCCTAGAGTGGGTATGCATCAAAACAAGTTTTACAAAGTAGTGAATAAG
 +
CAAAAAAGACTTTGCTTGTATTTGTGGCAGCTCCCCTTAAACGCCAGCTTTCATCCCCGA
 +
TATGCACCACCGGGTAAAGTTCACGAAGGGCGAGGAGGATAACATGGCCATCATCAAGGA
 +
GTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGA
 +
GGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAA
 +
GGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAA
 +
GGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGG
 +
CTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGA
 +
CTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCC
 +
CTCCGACGGCCCCGTAATGCAGAAGAAGACTATGGGCTGGGAGGCCTCCTCCGAGCGGAT
 +
GTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGG
 +
CGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCC
 +
CGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCAT
 +
CGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTA
 +
CAAGTAA
-
MVMEYLVLEKRLKRLREVLEKRQKDLIVFADNVKNEHNFSAIVRTCDAVATWLSKESVNF REVDYTKPTVLVVGNELQGVSPEIVEIAVGVLYLYYYHAEGKKAKINEGI
 
-
*Faites un dotplot de ces 2 séquences : qu'observez-vous ?
+
<br>
 +
Afin d'identifier si cette séquence a une similitude avec des séquences déjà répertoriées, nous allons utiliser l'outil BLAST (Basic Local Alignement Search Tool) sur le site du [http://www.ncbi.nlm.nih.gov/ NCBI] (colonne de droite :Popular resources => BLAST => Nucleotide BLAST)
 +
<br>
 +
''!! Avant de lancer votre BLAST, choisissez l'option 'somewhat similar # MEGABLAST (bas de page du BLASTn)'
 +
''
 +
<br>
 +
* La séquence d'ADNc obtenue est -elle similaire à des séquences référencées dans les banques de données ?
 +
* A partir de quel organisme a donc été réalisé la banque d'ADNc?
 +
* Quel est le numéro d'accession de la séquence protéique codée par la séquence ayant une similarité avec votre ADNc ?  
-
* Faites un alignement '''global''' (de bout à bout) entre les 2 séquences avec '''Stretcher''' disponible sur EMBOSS
+
<!--
-
:Qu'observez vous ?
+
Sortie du blastN
-
:Combien y a-t-il de gaps ? A quoi correspondent-ils ?<br/>
+
Phytophthora infestans clone MY-17-E-12 acidic chitinase mRNA, complete cds Phytophthora infestans 1496 1496 45% 0.0 100.00% 858 AF424684.1 codant pour AAN31509  234 aa
-
:A quoi correspond le pourcentage de similarité ? <br/>
+
-->
-
:Quels sont les paramètres de calcul du score ? <br/>
+
-
:Votre alignement est-il significatif ?
+
-
* Faites un alignement local avec '''Matcher''' disponible sur EMBOSS.
 
-
'''''NB:''' dans 'alternative matches' indiquez 10, de façon a visualiser 10 alignements locaux''
 
-
:Qu'observez-vous ? <br/>
 
-
:Regardez les autres alignements locaux. Sont-il significatifs ? <br/>
 
-
'''''NB''': si vous avez besoin de convertir vos séquences au Format Fasta un petit outil bien utile  :[https://www-bimas.cit.nih.gov/cgi-bin/molbio/sequence_conversion ReadSeq]''
+
<br>
 +
Maintenant que vous avez vérifié la qualité et nature de votre séquence ADNc, il est nécessaire d'identifier le cadre de lecture ouvert (ORF). Pour cela, nous allons prédire les différentes ORF possible sur votre séquence en travaillant sur les différents cadre de lecture.  
-
== Exercice 3 : Comparaison de plusieurs séquences par alignement multiple ==
+
Pour cela nous allons utiliser l'outil '''ORFfinder''' disponible au au [http://www.ncbi.nlm.nih.gov/ NCBI]. (colonne de gauche > Resources List > Classement par ordre alpahabétique)
-
L'idée maintenant est de comparer plusieurs séquences similaires entre elles, afin par exemple d'en définir les liens évolutifs ou d'identifier des 'zones' (motifs/domaines) conservés pouvant décrire la famille protéique
+
<br>
 +
''Dans les paramètres d'ORFfinder, indiquer 300nt comme taille minimale des ORFs (=100 acide aminés).
-
* Dans la banque de données UniProt/SwissProt, identifiez les séquences protéiques "THAP" de l'homme, la souris, le poulet et le zebrafish. Eliminez les séquences isoformes 2 et 3.
+
* Interprétez le graphique obtenu
-
* Récupérez l'ensemble des séquences dans un fichier au format Fasta
+
* Quelle ORF vous paraît être la plus probable ? Pourquoi ?
-
* Réalisez un alignement de l'ensemble des séquences (=alignement multiple) en utilsant Clustal Omega disponible a [https://www.ebi.ac.uk/ l'EBI] (>Services)
+
* Comment pouvez-vous le vérifier ?
-
* Trouvez-vous des 'zones similaires' (=domaines) à l'ensemble de ces séquences. Pour en faciliter la détécetion vous pouvez visualiser votre alignement multiple dans Mview disponible a l'EBI (>Services)
+
* Utilisez dans ORF Finder, l'option '''BLASTp''' contre la banque de données 'nr (non redundant protein sequences)' et identifiez si l'ORF sélectionnée est la plus probable.  
-
NB: pour cela copier-coller votre résulat d'alignement multiple dans Mview ou ouvrier le fichier d'alignement de Clustal dans Mview
+
Notez la position de l'ORF (taille, codon start, codon stop, taille attendue de la protéine)''
-
2. Aligner ces séquences avec ClustalW en utilisant Result Options (choisir l'alignement "SLOW" et ordre "ALIGNED")
+
<!--
-
Regarder l'alignement.
+
-
On pourra utiliser Boxshade sur le site de Pasteur (Alignements et comparaisons de séquences => Affichage d'alignements => BOXSHADE)
+
-
Que pensez-vous de cet alignement ?
+
-
Quels sont les résidus caractéristiques de la famille ?
+
-
Le motif  'AVPTIF' marque la fin du domaine : le trouvez-vous sur toutes les séquences ?
+
-
3. En revenant à la page de résultats de SRS supprimer la séquence qui n'est pas alignée avec les autres.
+
-
Refaites l'alignement avec ClustalW puis Boxshade.
+
-
Que constatez-vous par rapport à l'alignement précédent ?
+
-
4. Revenez à la page de ClustalW : passer le paramètre de création de gap à 6.
+
SeOqom = cloning GW vector::sequencechitinase::GFP ORF, donc dans ORF finder ORF1= GFP ORF2= chitinase
-
Refaites l'alignement avec ClustalW puis Boxshade.
+
ORF1 + 2 1082 1807 726 | 241
 +
ORF2 + 3 273 977 705 | 234
-
5. Regarder l'alignement avec WebLOGO.
 
 +
>tr|Q8H6Y7|Q8H6Y7_PHYIN Acidic chitinase OS=Phytophthora infestans OX=4787 PE=2 SV=1
 +
MKFVGVIASSLLVVPSAVSGDADSSSFARFFDQDRFQEVFPDAVELYNFNGLVDAASKYS
 +
EFANTGNDDNDKRELAAFLAQTAHECDSFKAAEEYARDTYSVWQYCDNATYTCAPGRRYH
 +
GRGPIQLSWNYNYYNAGEALGIDLLNNPDIVATDTTVTWMTALWYWMTPHGGRVIHDIVA
 +
GENGFAQSTDIINGGLECGPDAPNTSNEQQRITYFTKMCEALGVEPLGATSCNA
 +
>AF424684.1 Phytophthora infestans clone MY-17-E-12 acidic chitinase mRNA, complete cds
 +
CAAGCAAGCAGCCAAATCAGCCTATCAACCCAAGTCAGCCATGAAATTCGTCGGGGTTATCGCGTCAAGT
 +
CTTCTGGTTGTGCCTTCTGCGGTCTCTGGTGACGCTGATAGCTCGAGTTTCGCTCGCTTCTTCGATCAGG
 +
ATCGTTTCCAGGAGGTTTTCCCGGACGCTGTGGAGCTCTACAACTTCAACGGTCTTGTGGATGCGGCCAG
 +
CAAGTACAGCGAATTCGCTAATACGGGCAACGACGACAATGACAAGCGTGAGCTGGCAGCGTTCCTGGCT
 +
CAAACAGCTCACGAGTGCGACAGCTTCAAGGCCGCGGAAGAGTACGCCCGTGACACCTACTCGGTGTGGC
 +
AGTACTGCGACAACGCCACCTACACGTGTGCCCCCGGTCGCCGTTACCACGGCCGTGGCCCCATTCAGCT
 +
CTCATGGAACTACAATTACTACAATGCTGGCGAAGCTCTGGGCATTGATCTCTTAAACAACCCGGACATC
 +
GTCGCGACAGACACGACGGTGACGTGGATGACTGCGCTTTGGTACTGGATGACTCCGCATGGCGGCCGTG
 +
TGATCCACGACATCGTCGCCGGTGAGAACGGATTCGCTCAATCCACCGATATCATCAACGGTGGTCTGGA
 +
GTGCGGTCCGGACGCTCCCAACACGTCGAACGAGCAACAACGTATCACGTACTTCACCAAGATGTGCGAG
 +
GCTCTGGGCGTGGAGCCTCTGGGCGCCACCTCGTGCAACGCCTAGAGTGGGTATGCATCAAAACAAGTTT
 +
TACAAAGTAGTGAATAAGCAAAAAAGACTTTGCTTGTATTTGTGGCAGCTCCCCTTAAAAAAAAAAAAAA
 +
AAAAAAAAAAAAAAAAAA
 +
-->
 +
== Exercice 2 : Définition d'amorces PCR ==
 +
Vos analyses précédentes indiquent que votre séquence est correcte, il faut maintenant amplifier la phase ouverte de lecture (ORF) afin de l'insérer dans un vecteur sous contrôle de séquences régulatrices qui permettront son expression après transformation des plantes d'intérêt.
-
L'idée maintenant est de comparer plusieurs séquences similaires entre elles, afin par exemple d'en définir les liens évolutifs.  
+
Il faut donc définir des amorces pour faire une PCR.
-
* Réalisez un Blast avec O95376 sur la banque SwissProt
 
-
* Sélectionner un ensemble de séquences pour réaliser l'alignement multiple (une dizaine).
+
A partir de votre séquence d'ADNc, faites une recherche d’amorces PCR avec le programme '''Primer3''' disponible [https://primer3.ut.ee/ ici]. <br>
-
'''''ATTENTION:''' si vous voulez faire ressortir des zones conservées versus des zones peu ou pas conservées au cours de l'évolution, il faut construire un échantillon dans lequel vous prendrez en compte des séquences proches mais aussi des séquences éloignées.
+
<br>
-
''Ne pas oublier  d'inclure la protéine d'intérêt P10415''
+
* Quel est le cahier des charges par défaut de la définition d'amorces PCR avec Primer 3 ?
-
''
+
* Obtenez vous un couple d'amorces (primers) PCR dans la zone d'intérêt ?
 +
* Pouvez-vous identifiez un couple de primers avec un Tm=55°C comme optimal (min 52, max 60) dans votre zone d'intéret ?
-
Les séquences doivent être extraites au format FASTA. Sauvegarder les séquences dans un fichier 'texte'. <br/>
+
<br>
 +
Vous disposez au laboratoire du couple d'amorces ci-dessous, est-il adapté à votre expérience ?
-
*Sur le site de l'EBI utiliser [http://www.ebi.ac.uk/Tools/msa/mafft/ '''MAFFT'''] pour construire un alignement multiple (dans Services => Proteins => MAFFT, choisir Output format : Clustal) : regarder l'alignement, et garder cette page ouverte ! <br>
+
sens :   AATCAGCCTATCAACCCAAG <br/>
 +
reverse: TGTTTTGATGCATACCCACT <br/>
-
* Visualiser l'alignement avec Mview (toujours à l'EBI) : regarder l'alignement. Où sont les parties conservées ? Voyez-vous apparaitre des groupes de séquences ?
+
<!--
 +
Le couple de primers ne fonctionne qu'avec Tm=55°C comme optimal (min 52, max 60)  
-
*Construire une signature PROSITE à partir de votre alignement (n'utilisez pas le LOGO, sinon vous ne voyez pas précisément les zones de gap)
+
''Paramétrez le programme pour sélectionner au mieux la zone que vous voulez amplifier (= '''la phase ouverte de lecture''') en conservant les paramètres par défaut du logiciel <br>
-
    Pour vous aider, voici la début d'une signature (ou ''pattern'') : '''Q-L-x(3)-P-x(6)-[FY]-x(2)-V-x(3)-[LVF]-[FGD]-x(2,8)-[GPS]'''
+
''Il faudra définir la zone que vous voulez amplifier dans Targets. Le programme demande : ''position_début'', ''longueur_de_la_zone''.<br>
 +
''Exemple: Targets : 40,180 <=> on veut amplifier depuis la position 40 jusqu'à la position 220 (40+180)''''''
 +
-->
-
Vous avez probablement quelque chose d'approchant dans votre alignement, traduisant que :<br>
+
== Exercice 3 : Analyses des plantes exprimant la construction  ==
-
:Q-L : il n'y a que les acides aminés Q puis L dans 2 colonnes successives de l'alignement <br>
+
Trois plantes génétiquement modifiées et possédant la construction précédente ont été obtenues (Trans1, Trans2 et Trans3).
-
:x(3) : 3 colonnes avec des acides aminés variables <br>
+
Il faut maintenant évaluer si la construction 'chitinase' présente un avantage pour la plante. <br>
-
:[FY] : dans cette colonne seuls les acides aminés F ou Y sont présents <br>
+
Deux expériences ont été réalisés avec avec le champignon phytopathogène ''Fusarium solani'' et le champignon opportuniste ''Candida albicans''.
-
:x(2,8) : zone avec un gap. Entre 2 et 8 résidus (acides aminés) quelconques, suivant les séquences <br>
+
-
*Tester votre signature sur [http://prosite.expasy.org/scanprosite/ '''ScanProsite'''] (choisir l'option 2) contre SwissProt ou trEMBL (plus long !) <br>
+
Les résultats des différentes expériences sont présentés  [[File:ResultsCHN2.jpg|800px|]]
-
= Mise en application...=
+
* Quel était l'objectif de l'expérience de la figure 1 ?
 +
* Interprétez la figure 1
 +
* Quel contrôle est manquant dans la Figure 1 ?
 +
* Comment pouvez-vous expliquez les résultats obtenus ?
-
Au laboratoire, vous êtes amenés a travailler sur la séquence ci-dessous:
+
* Quelle hypothèse a conduit à mener l'expérience de la figure 2 ?
-
<!--
+
* Interprétez la figure 2
-
>prot
+
-
IGNLKDLNILYLHSNGFTGRIPREMSNLTLANLTDLDLSGNQLTGKIPRDFAALLLVLLEKKIENITCDS
+
-
MKLLSKTFLILTLTFFFFGIALAKQSFEPEIEALKSFKNGISNDPLGVLSDWTIIGSLRHCNWTGITCDS
+
-
TGHVVSVSLLEKQLEGVLSPAIANLTYLQVLDLTSNSFTGKIPAEIGKLTELNQLILYLNYFSGSIPSGI
+
-
WELKNIFYLDLRNNLLSGDVPEEICKTSSLVLIGFDYNNLTGKIPECLGDLVHLQMFVAAGNHLTGSIPV
+
-
SIGTLANLTDLDLSGNQLTGKIPRDFGNLLNLQSLVLTENLLEGDIPAEIGNCSSLVQLELYDNQLTGKI
+
-
PAELGNLVQLQALRIYKNKLTSSIPSSLFRLTQLTHLGLSENHLVGPISEEIGFLESLEVLTLHSNNFTG
+
-
EFPQSITNLRNLTVLTVGFNNISGELPADLGLLTNLRNLSAHDNLLTGPIPSSISNCTGLKLLDLSHNQM
+
-
TGEIPRGFGRMNLTFISIGRNHFTGEIPDDIFNCSNLETLSVADNNLTGTLKPLIGKLQKLRILQVSYNS
+
-
LTGPIPREIGNLKDLNILYLHSNGFTGRIPREMSNLTLLQGLRMYSNDLEGPIPEEMFDMKLLSVLDLSN
+
-
NKFSGQIPALFSKLESLTYLSLQGNKFNGSIPASLKSLSLLNTFDISDNLLTGTIPGELLASLKNMQLYL
+
-
NFSNNLLTGTIPKELGKLEMVQEIDLSNNLFSGSIPRSLQACKNVFTLDFSQNNLSGHIPDEVFQGMDMI
+
-
ISLNLSRNSFSGEIPQSFGNMTHLVSLDLSSNNLTGEIPESLANLSTLKHLKLASNNLKGHVPESGVFKN
+
-
INASDLMGNTDLCGSKKPLKPCTIKQKSSHFSKRTRVILIILGSAAALLLVLLLVLILTCCKKKEKKIEN
+
-
SSESSLPDLDSALKLKRFEPKELEQATDSFNSANIIGSSSLSTVYKGQLEDGTVIAVKVLNLKEFSAESD
+
-
KWFYTEAKTLSQLKHRNLVKILGFAWESGKTKALVLPFMENGNLEDTIHGSAAPIGSLLEKIDLCVHIAS
+
-
GIDYLHSGYGFPIVHCDLKPANILLDSDRVAHVSDFGTARILGFREDGSTTASTSAFEGTIGYLAPEFAY
+
-
MRKVTTKADVFSFGIIMMELMTKQRPTSLNDEDSQDMTLRQLVEKSIGNGRKGMVRVLDMELGDSIVSLK
+
-
QEEAIEDFLKLCLFCTSSRPEDRPDMNEILTHLMKLRGKANSFREDRNEDREV
+
-
 
+
-
FLS2 A. thaliana, recepteur LRR-kinase >gi|15237426|ref|NP_199445.1| LRR receptor-like serine/threonine-protein kinase FLS2 [Arabidopsis thaliana] -->
+
-
 
+
-
>seq1
+
-
 
+
-
attggcaacctgaaagatctgaacattctgtatctgcatagcaacggctttaccggccgc
+
-
attccgcgcgaaatgagcaacctgaccctggcgaacctgaccgatctggatctgagcggc
+
-
aaccagctgaccggcaaaattccgcgcgattttgcggcgctgctgctggtgctgctggaa
+
-
aaaaaaattgaaaacattacctgcgatagcatgaaactgctgagcaaaacctttctgatt
+
-
ctgaccctgaccttttttttttttggcattgcgctggcgaaacagagctttgaaccggaa
+
-
attgaagcgctgaaaagctttaaaaacggcattagcaacgatccgctgggcgtgctgagc
+
-
gattggaccattattggcagcctgcgccattgcaactggaccggcattacctgcgatagc
+
-
accggccatgtggtgagcgtgagcctgctggaaaaacagctggaaggcgtgctgagcccg
+
-
gcgattgcgaacctgacctatctgcaggtgctggatctgaccagcaacagctttaccggc
+
-
aaaattccggcggaaattggcaaactgaccgaactgaaccagctgattctgtatctgaac
+
-
tattttagcggcagcattccgagcggcatttgggaactgaaaaacattttttatctggat
+
-
ctgcgcaacaacctgctgagcggcgatgtgccggaagaaatttgcaaaaccagcagcctg
+
-
gtgctgattggctttgattataacaacctgaccggcaaaattccggaatgcctgggcgat
+
-
ctggtgcatctgcagatgtttgtggcggcgggcaaccatctgaccggcagcattccggtg
+
-
agcattggcaccctggcgaacctgaccgatctggatctgagcggcaaccagctgaccggc
+
-
aaaattccgcgcgattttggcaacctgctgaacctgcagagcctggtgctgaccgaaaac
+
-
ctgctggaaggcgatattccggcggaaattggcaactgcagcagcctggtgcagctggaa
+
-
ctgtatgataaccagctgaccggcaaaattccggcggaactgggcaacctggtgcagctg
+
-
caggcgctgcgcatttataaaaacaaactgaccagcagcattccgagcagcctgtttcgc
+
-
ctgacccagctgacccatctgggcctgagcgaaaaccatctggtgggcccgattagcgaa
+
-
gaaattggctttctggaaagcctggaagtgctgaccctgcatagcaacaactttaccggc
+
-
gaatttccgcagagcattaccaacctgcgcaacctgaccgtgctgaccgtgggctttaac
+
-
aacattagcggcgaactgccggcggatctgggcctgctgaccaacctgcgcaacctgagc
+
-
gcgcatgataacctgctgaccggcccgattccgagcagcattagcaactgcaccggcctg
+
-
aaactgctggatctgagccataaccagatgaccggcgaaattccgcgcggctttggccgc
+
-
atgaacctgacctttattagcattggccgcaaccattttaccggcgaaattccggatgat
+
-
atttttaactgcagcaacctggaaaccctgagcgtggcggataacaacctgaccggcacc
+
-
ctgaaaccgctgattggcaaactgcagaaactgcgcattctgcaggtgagctataacagc
+
-
ctgaccggcccgattccgcgcgaaattggcaacctgaaagatctgaacattctgtatctg
+
-
catagcaacggctttaccggccgcattccgcgcgaaatgagcaacctgaccctgctgcag
+
-
ggcctgcgcatgtatagcaacgatctggaaggcccgattccggaagaaatgtttgatatg
+
-
aaactgctgagcgtgctggatctgagcaacaacaaatttagcggccagattccggcgctg
+
-
tttagcaaactggaaagcctgacctatctgagcctgcagggcaacaaatttaacggcagc
+
-
attccggcgagcctgaaaagcctgagcctgctgaacacctttgatattagcgataacctg
+
-
ctgaccggcaccattccgggcgaactgctggcgagcctgaaaaacatgcagctgtatctg
+
-
aactttagcaacaacctgctgaccggcaccattccgaaagaactgggcaaactggaaatg
+
-
gtgcaggaaattgatctgagcaacaacctgtttagcggcagcattccgcgcagcctgcag
+
-
gcgtgcaaaaacgtgtttaccctggattttagccagaacaacctgagcggccatattccg
+
-
gatgaagtgtttcagggcatggatatgattattagcctgaacctgagccgcaacagcttt
+
-
agcggcgaaattccgcagagctttggcaacatgacccatctggtgagcctggatctgagc
+
-
agcaacaacctgaccggcgaaattccggaaagcctggcgaacctgagcaccctgaaacat
+
-
ctgaaactggcgagcaacaacctgaaaggccatgtgccggaaagcggcgtgtttaaaaac
+
-
attaacgcgagcgatctgatgggcaacaccgatctgtgcggcagcaaaaaaccgctgaaa
+
-
ccgtgcaccattaaacagaaaagcagccattttagcaaacgcacccgcgtgattctgatt
+
-
attctgggcagcgcggcggcgctgctgctggtgctgctgctggtgctgattctgacctgc
+
-
tgcaaaaaaaaagaaaaaaaaattgaaaacagcagcgaaagcagcctgccggatctggat
+
-
agcgcgctgaaactgaaacgctttgaaccgaaagaactggaacaggcgaccgatagcttt
+
-
aacagcgcgaacattattggcagcagcagcctgagcaccgtgtataaaggccagctggaa
+
-
gatggcaccgtgattgcggtgaaagtgctgaacctgaaagaatttagcgcggaaagcgat
+
-
aaatggttttataccgaagcgaaaaccctgagccagctgaaacatcgcaacctggtgaaa
+
-
attctgggctttgcgtgggaaagcggcaaaaccaaagcgctggtgctgccgtttatggaa
+
-
aacggcaacctggaagataccattcatggcagcgcggcgccgattggcagcctgctggaa
+
-
aaaattgatctgtgcgtgcatattgcgagcggcattgattatctgcatagcggctatggc
+
-
tttccgattgtgcattgcgatctgaaaccggcgaacattctgctggatagcgatcgcgtg
+
-
gcgcatgtgagcgattttggcaccgcgcgcattctgggctttcgcgaagatggcagcacc
+
-
accgcgagcaccagcgcgtttgaaggcaccattggctatctggcgccggaatttgcgtat
+
-
atgcgcaaagtgaccaccaaagcggatgtgtttagctttggcattattatgatggaactg
+
-
atgaccaaacagcgcccgaccagcctgaacgatgaagatagccaggatatgaccctgcgc
+
-
cagctggtggaaaaaagcattggcaacggccgcaaaggcatggtgcgcgtgctggatatg
+
-
gaactgggcgatagcattgtgagcctgaaacaggaagaagcgattgaagattttctgaaa
+
-
ctgtgcctgttttgcaccagcagccgcccggaagatcgcccggatatgaacgaaattctg
+
-
acccatctgatgaaactgcgcggcaaagcgaacagctttcgcgaagatcgcaacgaagat
+
-
cgcgaagtg
+
-
'''
+
-
Répondez aux questions suivantes:'''
+
-
* a quel organisme appartient cette séquence ?
+
-
* cette séquence est-elle codante ?
+
-
* quelle est le numéro d'accession de cette protéine, de l'ARNm, du gène ?
+
-
* existe-il des orthologues a cette protéine ?
+
-
* que veut dire db_xref=CDD:173623 sur la fiche GenPept?
+
-
* quelle est la fonction putative de cette protéine ?
+
-
* exite-t-il des domaines conservés dans cette protéine?
+
-
Sauvegardez la séquence de l'ARNm et du gène au format fasta
+
** Conclure quant à l'intérêt des CHN dans des applications de biotechnologie végétale
-
+
-
* sans tenir compte des informations disponibles dans la fiche GenPept, identifiez le nombre d'introns/exons dans le gène codant cette protéine... peut etre par Dot Plot...
+

Current revision as of 19:25, 7 December 2022

Contents

Objectifs

Ce TD a pour but de vous familiariser avec les méthodes de comparaison de séquences biologiques, la recherche de séquences similaires (BLAST), la recherche d'ORF dans une séquence et de mettre en application votre savoir-faire.

Quelques liens utiles:

Contexte

Nous resterons dans le contexte scientifique du précédent TD s'intéressant aux chitinases afin de définir si ces enzymes pourraient avoir un intérêt dans des approches de biotechnologie végétale. On s'intéressera ici à identifier une séquence nucléique de chitinase afin de l'introgresser dans un génome végétal sous contrôle de séquences régulatrices adaptées et d'évaluer si cette approche pourrait permettre de favoriser la protection des plantes lors d'une infection microbienne.

Exercice 1 : Recherche d'ORF sur un ARNm

Le criblage d'une banque d'ADNc de l'oomycète a permis très probablement d'identifier la séquence nucléique correspondant à la protéine 'chitinase GH19' travaillée au cours du précédent TD. Il faut maintenant de vérifier si cette séquence code effectivement pour la protéine 'chitinase-GH19' afin de pouvoir l'insérer sous contrôle de séquences régulatrices adaptées au sein d'une plante d'intérêt.

La séquence obtenue après criblage de la banque d'ADNc est disponible ci-dessous

>Oom_cDNA

ACAACATATCCAGTCACTATGGGGCCCGTCGACCTGCAGACTGGCTGTGTATAAGGGAGC CTGACATTTATATTCCCCAGAACATCAGGTTAATGGCGTTTTTGATGTCATTTTCGCGGT GGCTGAGATCAGCCACTTCTTCCCCGATAACGGAGACCGGCACACTGGCCATATCGGTGG TCATCATGCGCCAGCTTTCATCCCCGATATGCACCACCGGGTAAAGTTCACGCAAGCAAG CAGCCAAATCAGCCTATCAACCCAAGTCAGCCATGAAATTCGTCGGGGTTATCGCGTCAA GTCTTCTGGTTGTGCCTTCTGCGGTCTCTGGTGACGCTGATAGCTCGAGTTTCGCTCGCT TCTTCGATCAGGATCGTTTCCAGGAGGTTTTCCCGGACGCTGTGGAGCTCTACAACTTCA ACGGTCTTGTGGATGCGGCCAGCAAGTACAGCGAATTCGCTAATACGGGCAACGACGACA ATGACAAGCGTGAGCTGGCAGCGTTCCTGGCTCAAACAGCTCACGAGTGCGACAGCTTCA AGGCCGCGGAAGAGTACGCCCGTGACACCTACTCGGTGTGGCAGTACTGCGACAACGCCA CCTACACGTGTGCCCCCGGTCGCCGTTACCACGGCCGTGGCCCCATTCAGCTCTCATGGA ACTACAATTACTACAATGCTGGCGAAGCTCTGGGCATTGATCTCTTAAACAACCCGGACA TCGTCGCGACAGACACGACGGTGACGTGGATGACTGCGCTTTGGTACTGGATGACTCCGC ATGGCGGCCGTGTGATCCACGACATCGTCGCCGGTGAGAACGGATTCGCTCAATCCACCG ATATCATCAACGGTGGTCTGGAGTGCGGTCCGGACGCTCCCAACACGTCGAACGAGCAAC AACGTATCACGTACTTCACCAAGATGTGCGAGGCTCTGGGCGTGGAGCCTCTGGGCGCCA CCTCGTGCAACGCCTAGAGTGGGTATGCATCAAAACAAGTTTTACAAAGTAGTGAATAAG CAAAAAAGACTTTGCTTGTATTTGTGGCAGCTCCCCTTAAACGCCAGCTTTCATCCCCGA TATGCACCACCGGGTAAAGTTCACGAAGGGCGAGGAGGATAACATGGCCATCATCAAGGA GTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGA GGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAA GGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAA GGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGG CTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGA CTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCC CTCCGACGGCCCCGTAATGCAGAAGAAGACTATGGGCTGGGAGGCCTCCTCCGAGCGGAT GTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGG CGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCC CGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCAT CGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTA CAAGTAA



Afin d'identifier si cette séquence a une similitude avec des séquences déjà répertoriées, nous allons utiliser l'outil BLAST (Basic Local Alignement Search Tool) sur le site du NCBI (colonne de droite :Popular resources => BLAST => Nucleotide BLAST)
!! Avant de lancer votre BLAST, choisissez l'option 'somewhat similar # MEGABLAST (bas de page du BLASTn)'

  • La séquence d'ADNc obtenue est -elle similaire à des séquences référencées dans les banques de données ?
  • A partir de quel organisme a donc été réalisé la banque d'ADNc?
  • Quel est le numéro d'accession de la séquence protéique codée par la séquence ayant une similarité avec votre ADNc ?



Maintenant que vous avez vérifié la qualité et nature de votre séquence ADNc, il est nécessaire d'identifier le cadre de lecture ouvert (ORF). Pour cela, nous allons prédire les différentes ORF possible sur votre séquence en travaillant sur les différents cadre de lecture.

Pour cela nous allons utiliser l'outil ORFfinder disponible au au NCBI. (colonne de gauche > Resources List > Classement par ordre alpahabétique)


Dans les paramètres d'ORFfinder, indiquer 300nt comme taille minimale des ORFs (=100 acide aminés).

  • Interprétez le graphique obtenu
  • Quelle ORF vous paraît être la plus probable ? Pourquoi ?
  • Comment pouvez-vous le vérifier ?
  • Utilisez dans ORF Finder, l'option BLASTp contre la banque de données 'nr (non redundant protein sequences)' et identifiez si l'ORF sélectionnée est la plus probable.

Notez la position de l'ORF (taille, codon start, codon stop, taille attendue de la protéine)



Exercice 2 : Définition d'amorces PCR

Vos analyses précédentes indiquent que votre séquence est correcte, il faut maintenant amplifier la phase ouverte de lecture (ORF) afin de l'insérer dans un vecteur sous contrôle de séquences régulatrices qui permettront son expression après transformation des plantes d'intérêt.

Il faut donc définir des amorces pour faire une PCR.


A partir de votre séquence d'ADNc, faites une recherche d’amorces PCR avec le programme Primer3 disponible ici.

  • Quel est le cahier des charges par défaut de la définition d'amorces PCR avec Primer 3 ?
  • Obtenez vous un couple d'amorces (primers) PCR dans la zone d'intérêt ?
  • Pouvez-vous identifiez un couple de primers avec un Tm=55°C comme optimal (min 52, max 60) dans votre zone d'intéret ?


Vous disposez au laboratoire du couple d'amorces ci-dessous, est-il adapté à votre expérience ?

sens : AATCAGCCTATCAACCCAAG
reverse: TGTTTTGATGCATACCCACT


Exercice 3 : Analyses des plantes exprimant la construction

Trois plantes génétiquement modifiées et possédant la construction précédente ont été obtenues (Trans1, Trans2 et Trans3). Il faut maintenant évaluer si la construction 'chitinase' présente un avantage pour la plante.
Deux expériences ont été réalisés avec avec le champignon phytopathogène Fusarium solani et le champignon opportuniste Candida albicans.

Les résultats des différentes expériences sont présentés

  • Quel était l'objectif de l'expérience de la figure 1 ?
  • Interprétez la figure 1
  • Quel contrôle est manquant dans la Figure 1 ?
  • Comment pouvez-vous expliquez les résultats obtenus ?
  • Quelle hypothèse a conduit à mener l'expérience de la figure 2 ?
  • Interprétez la figure 2
    • Conclure quant à l'intérêt des CHN dans des applications de biotechnologie végétale