silico.biotoul.fr
 

TD1 Genome Selection Plantes

From silico.biotoul.fr

(Difference between revisions)
Jump to: navigation, search
(Exercice 4 : Comparaison de plusieurs séquences par alignement multiple)
(Exercice 5 : Comparaison de plusieurs séquences par alignement multiple)
 
(42 intermediate revisions not shown)
Line 1: Line 1:
==Objectifs==
==Objectifs==
-
Ce TD a pour but de vous familiariser avec la recherche d'informations scientifiques disponibles dans les banques de données biologiques (Database) et des outils permettant de comparer des séquences pour définir leur lien d'homologie
+
Ce TD a pour but de vous familiariser avec la recherche d'informations scientifiques disponibles dans les banques de données biologiques (Database) et des outils permettant d'analyser ces séquences nucléiques et/ou protéiques
Globalement les informations sont regroupées dans 2 centres :  
Globalement les informations sont regroupées dans 2 centres :  
Line 9: Line 9:
'''1/''' Aller sur le site de [http://www.ebi.ac.uk/ EBI - European Bioinformatics Institute]'''  
'''1/''' Aller sur le site de [http://www.ebi.ac.uk/ EBI - European Bioinformatics Institute]'''  
-
* rechercher Uniprot (DataResources>SeeAllDataResources>Uniprot), qu'est ce que Uniprot ?
+
* rechercher Uniprot (DataResources>Browse EMBL WebService (en bas page droite)>AvailableDataBases(colonne gauche)>Uniprot), qu'est ce que Uniprot ?
* combien de séquences sont référencées dans TrEMBL ?
* combien de séquences sont référencées dans TrEMBL ?
* combien de séquences sont référencées dans Uniprot/swissProt ?
* combien de séquences sont référencées dans Uniprot/swissProt ?
Line 74: Line 74:
HAILRLDLAGRDLTDHSSSILTERGYSQTTTAEREIVRDMKEKVSYIALDYEQELETSKTAAAVEKSFELPDGQVITIGVERFRCPEVLFQPSMIGMENPGIHETTYNSI
HAILRLDLAGRDLTDHSSSILTERGYSQTTTAEREIVRDMKEKVSYIALDYEQELETSKTAAAVEKSFELPDGQVITIGVERFRCPEVLFQPSMIGMENPGIHETTYNSI
-
* Afin de savoir si cette séquence est répertoriée dans les bases de données faites un BLAST au [https://blast.ncbi.nlm.nih.gov/Blast.cgi NCBI] ou auprès de [https://www.ebi.ac.uk/services l'EBI].
+
* Afin de savoir si cette séquence est répertoriée dans les bases de données faites un BLAST au [https://blast.ncbi.nlm.nih.gov/Blast.cgi NCBI].
* Quel type de 'Blast' choisissez-vous ? Faites un Blast contre la banque de données UniprotKB/SwissProt
* Quel type de 'Blast' choisissez-vous ? Faites un Blast contre la banque de données UniprotKB/SwissProt
* A quoi correspond la E-value ?
* A quoi correspond la E-value ?
Line 101: Line 101:
* Sur quel brin cette séquence inconnue présente-elle une homologie ?
* Sur quel brin cette séquence inconnue présente-elle une homologie ?
* Que représente les signes '--------' rencontrés sur certaines séquences ?
* Que représente les signes '--------' rencontrés sur certaines séquences ?
 +
 +
 +
== Exercice 3 : Recherche d'ORF dans une séquence nucléique ==
 +
 +
Il existe des outils pour déterminer les phases ouvertes de lecture (OpenReadingFrame ORF) dans une séquence nucléique.
 +
Vous disposez [[Media:Clone_BCL2.txt| , en cliquant sur ce lien]], d'une séquence 'BCL2' issue du séquençage d'un fragment nucléique humain. 
 +
Vous allez vérifier que ce fragment est codant en recherchant les cadres ouverts de lecture présents, et en identifiant l'ORF la plus probable.
 +
 +
Utilisez le programme '''ORF Finder''' au [http://www.ncbi.nlm.nih.gov/ NCBI] pour effectuer la recherche de séquence codante (ALLResources>Resources List A-Z>ORFfinder (colonne gauche).
 +
  Paramétrez le logiciel avec : Minimal ORF length (nt): 300  / ORF start codon to use: ATG
 +
* Interprétez le graphique et les résultats obtenus.
 +
* Quelle est la position de l'ORF la plus probable ?
 +
 +
 +
Afin de valider votre hypothèse quant à l'ORF la plus probable, il est nécessaire d'aller identifier dans les banques de données si cette ORF code pour la protéine Bcl2. Pour cela vous allez réaliser un BlastP
 +
* Dans ORF Finder, utilisez l'option Blastp sur la banque ''Uniprot/swissProt''. Que concluez-vous ?
 +
* Quel est le numéro d'accession de la protéine BCL2 dans Uniprot/SwissProt ?
 +
 +
== Exercice 4 : Analyse d'une séquence protéique, recherche de domaines fonctionnels ==
 +
 +
Afin d'appréhender l'organisation structurale et la localisation cellulaire de la protéine BCL2, vous allez recherchez les domaines 'fonctionnels' prédits sur la séquence ainsi que des motifs pouvant indiquer la localisation subcellulaire de la protéine
 +
 +
Sur le site de l'EMBL, utiliser le logiciel d"'analyse de séquence protéique '''InterPro Scan 5''' pour chercher la séquence protéique BCL2 contient des domaines fonctionnels connus.
 +
* Notez les positions des domaines PFAM identifiés sur BCL2
 +
* BCL2 présente-t-elle des régions pouvant suggérer sa localistion subcellulaire ?
 +
 +
''NB: Gardez à l'écran le résultat InterProScan pour la suite du TP''
 +
 +
Ouvez la fiche correspondant à la protéine BCL2 dans Uniprot
 +
 +
* Cette séquence a t elle été vérifié manuellement par un annonateur expert ?
 +
 +
* Comparez les annotations de la fiche à celles trouvées avec votre analyse InterproScan 5
== ''Mise en Application'' ==
== ''Mise en Application'' ==
Line 209: Line 242:
-->
-->
-
== Exercice 3: Comparaison de 2 séquences par alignement global et local : Cas d'Ecole==
+
<!--
-
 
+
-
Les logiciels utilisés pour la comparaison de séquences deux à deux sont disponibles dans la suite EMBOSS [http://bioinfo.genotoul.fr/ de la Genopole de Toulouse] ou du centre de [http://www.bioinformatics.nl/emboss-explorer/  Bioinformatique des Pays Bas]
+
-
 
+
-
 
+
-
Voici 2 séquences, au format FASTA :
+
-
 
+
-
>prot1
+
-
 
+
-
MVMEYLVLEKRLKRLREVLEKRQKDLIVFADNVKNEHNFSAIVRTCDAVGVLYLYYYHAE GKKAKINEGITQGSHKWVFIEKVDNPVQKLLEFKNRGFQIVATWLSKESVNFREVDYTKP TVLVVGNELQGVSPEIVEIADKKIVIPMYGMAQSLNVSVATGIILYEAQRQREEKGMYSR PSLSEEEIQKILKKWAYEDVIKERKRTLSTS
+
-
 
+
-
>prot2
+
-
 
+
-
MVMEYLVLEKRLKRLREVLEKRQKDLIVFADNVKNEHNFSAIVRTCDAVATWLSKESVNF REVDYTKPTVLVVGNELQGVSPEIVEIAVGVLYLYYYHAEGKKAKINEGI
+
-
 
+
-
 
+
-
* Faites une matrice de point (Dot plot), pour comparer vos 2 séquences et obtenir un aperçu de la similarité entre les 2 séquences.
+
-
Utilisez l'outil '''DOTMATCHER''' disponible sur EMBOSS en gardant les paramètres par défaut, et qui permet de visualiser des diagnonales de 'similarité'
+
-
:Que pouvez-vous conclure ?
+
-
 
+
-
 
+
-
 
+
-
* Faites un alignement '''global''' pour comparer de bout à bout (du premier jusqu'au dernier résidu) vos 2 séquences
+
-
Utilisez l'outil d'alignement global ''Stretcher''' disponible sur EMBOSS en gardant les paramètres par défaut
+
-
:Qu'observez vous ?
+
-
:Combien y a-t-il de gaps ? A quoi correspondent-ils ?<br/>
+
-
:A quoi correspond le pourcentage de similarité ? <br/>
+
-
:Quels sont les paramètres de calcul du score ? <br/>
+
-
:Votre alignement est-il significatif ?
+
-
 
+
-
 
+
-
* Faites un alignement '''local''' pour comparer vos 2 séquences et identifier les régions similaires
+
-
Utilisez l'outil d'alignement local '''Matcher''' disponible sur EMBOSS. <br/>
+
-
'''''NB:''' dans 'alternative matches' indiquez 10, de façon a visualiser 10 alignements locaux''
+
-
:Qu'observez-vous ? <br/>
+
-
:Regardez les autres alignements locaux. Sont-il significatifs ? <br/>
+
-
 
+
-
'''''NB''': si vous avez besoin de convertir vos séquences au Format Fasta un petit outil bien utile  :[https://www-bimas.cit.nih.gov/cgi-bin/molbio/sequence_conversion ReadSeq]''
+
-
 
+
-
== Exercice 4 : Comparaison de plusieurs séquences par alignement multiple ==
+
== Exercice 5 : Comparaison de plusieurs séquences par alignement multiple ==
L'idée maintenant est de comparer plusieurs séquences similaires entre elles, afin par exemple d'identifier des 'zones' (domaines/motifs) conservés pouvant décrire une famille protéique
L'idée maintenant est de comparer plusieurs séquences similaires entre elles, afin par exemple d'identifier des 'zones' (domaines/motifs) conservés pouvant décrire une famille protéique
Line 259: Line 254:
Pour cela utilisez le logiciel '''Clustal Omega''' disponible a [https://www.ebi.ac.uk/ l'EBI] (>DataResources)
Pour cela utilisez le logiciel '''Clustal Omega''' disponible a [https://www.ebi.ac.uk/ l'EBI] (>DataResources)
:Qu'observez-vous ?
:Qu'observez-vous ?
-
 
* Trouvez-vous des 'zones similaires' (=domaines) à l'ensemble de ces séquences.  
* Trouvez-vous des 'zones similaires' (=domaines) à l'ensemble de ces séquences.  
Line 275: Line 269:
     x(2,8) : zone avec un gap. Entre 2 et 8 résidus (acides aminés) quelconques, suivant les séquences <br>
     x(2,8) : zone avec un gap. Entre 2 et 8 résidus (acides aminés) quelconques, suivant les séquences <br>
-
*Tester la spécificité de votre signature sur [http://prosite.expasy.org/scanprosite/ '''ScanProsite'''] (choisir l'option 2) contre SwissProt  
+
*Tester la spécificité de votre signature sur [http://prosite.expasy.org/scanprosite/ '''ScanProsite'''] (choisir l'option 2) contre SwissProt
-
:Qu'observez-vous, sachant que 45 séquences protéiques de la famille THAP sont disponibles dans la banque de données SwissProt ?
+
 
-
:Que pensez-vous de la signature suivante C-x(4)-C-x(9,15)-[FL]-x(2)-[FL]-P-x(8,9)-W ?
+
-->

Current revision as of 11:13, 10 November 2021

Contents

Objectifs

Ce TD a pour but de vous familiariser avec la recherche d'informations scientifiques disponibles dans les banques de données biologiques (Database) et des outils permettant d'analyser ces séquences nucléiques et/ou protéiques

Globalement les informations sont regroupées dans 2 centres :

  • NCBI National Center for Biotechnology Information (NIH, USA)
  • EBI European Bioinformatics Institute (EMBL, GB)

Exercice 1 : Recherche dans les banques de données par numéro d'accession ou mots clés (EBI & NCBI)

1/ Aller sur le site de EBI - European Bioinformatics Institute

  • rechercher Uniprot (DataResources>Browse EMBL WebService (en bas page droite)>AvailableDataBases(colonne gauche)>Uniprot), qu'est ce que Uniprot ?
  • combien de séquences sont référencées dans TrEMBL ?
  • combien de séquences sont référencées dans Uniprot/swissProt ?


2/Sur le site d' UniProt : chercher la séquence dont le numéro d'accession est P01308.

  • de quelle protéine s'agit-il ? chez quel organisme ?
  • quelle est la taille de cette séquence ?
  • y a-t-il des preuves expérimentales de l'existence de cette protéine ?
  • est-elle dans UniProt-trEMBL ou UniProt-SwissProt ?
  • afficher la fiche au format UniprotKb. Particularité du format de la la fiche ? (en haut de la page>Format>text)


3/Aller sur le site du NCBI: identifiez

  • toutes les séquences de l'oomycète Phytophthora (parasite de la pomme de terre), combien sont-elles ?
  • les séquences protéiques de Phytophthora parasitica pouvant interagir avec la cellulose

Pour cela sur le site du NCBI sélectionnez les banques "protéines", puis dans la barre de requête il est possible de combiner plusieurs termes à l'aide des opérateurs booléens (AND, OR, NOT) puis l'option Advanced (sous la barre de requête) et le bouton Preview, en précisant les champs, Organism, Title... à l'aide de l'outil Search builder et conjuguer vos requêtes. L'historique de vos requêtes est visible.

On s'intéresse maintenant à la séquence dont le numéro d'accession est CAA65843

Regardez la fiche de la séquence correspondante :

  • comment s'organise cette fiche ? (format GenPept # UniprotKb)
  • quel est le nom de cette protéine ?
  • quel le nombre d'acides aminés constituant cette protéine ?
  • dans quel journal scientifique les travaux concernant cette protéine ont-ils été publiés ?
  • sous quel numéro cette publication est-elle référencée dans PubMed ?


On s'intéresse maintenant aux références croisées, notées "db_xref" sur la fiche

  • à quoi correspondent les différents liens croisées :

- db_xref="InterPro:IPR000177" - db_xref="InterPro:IPR000254" - db_xref="UniProtKB/TrEMBL:O42830

  • quels domaines protéiques sont présents dans la protéine ?
  • définissez l'architecture de cette protéine
  • affichez votre séquence protéique au format FASTA (haute de page>FASTA). Qu'est ce que le format FASTA ?


Exercice 2 : Recherche dans les banques via une séquence (protéique ou nucléique): l'outil BLAST

Ci-dessous une séquence protéique inconnue au format FASTA

>sequence_proteique_inconnue
HAILRLDLAGRDLTDHSSSILTERGYSQTTTAEREIVRDMKEKVSYIALDYEQELETSKTAAAVEKSFELPDGQVITIGVERFRCPEVLFQPSMIGMENPGIHETTYNSI

  • Afin de savoir si cette séquence est répertoriée dans les bases de données faites un BLAST au NCBI.
  • Quel type de 'Blast' choisissez-vous ? Faites un Blast contre la banque de données UniprotKB/SwissProt
  • A quoi correspond la E-value ?

Regardez un alignement entre votre séquence requête appelée QUERY et la séquence présentant une homologie et répertoriée dans les banques de données (SUBJECT)

  • Qu'indique les signe '+' et ' rien ' dans la ligne intermédiaire de l'alignement ?
  • Votre séquence QUERY présente-elle des similarités avec d'autres séquences ? Si oui, sur quelle partie ?


Ci-dessous une séquence nucléique inconnue au format FASTA

>sequence_nucleique_inconnue

GGCAACTTCAACTGGGGCCGGGTGGTTGCCCTTTTCTACTTTGCTAGCAAACTGGTGCTCAAGGCCCTGTGCACTAAAGTGCCCGAGCTGATCAG AACCATCATGGGCTGGACACTGGACTTCCTCCGGGAGCGGCTGCTTGTCTGGATCCAAGACCAGGGTGGC TGGGATGGCCTCCTTTCCTACTTCGGGACCCCCACATGGCAGACAGTGACCATCTTTGTGGCTGGAGTCC TCACTGCCTCACTCACCATCTGGAAGAAGATGGGCTGAGGCTTCCTGCTGCCTTGGACTGTGTCTTTTCT TCATAAATTATGACATTTTTCCTGGGATGAATGGGGAACGGGGAAAGGCATTTTCCCCGTGAGGGCCGCACGTCTGCTCTTACTTTTGTAATT ATTGGGAGGGGTGGGAATGGTGGCCTGGGGGAGGTGCCAATAAACCTCAGGTCCA

  • Quelle est la nature (ADN, ARN..) de cette séquence ?
  • Est-elle répertoriée dans les bases de données ?
  • Présente-elle des similarités avec d'autres séquences ?

Visualisez un alignement entre votre séquence QUERY et une séquence répertoriée dans la base de donnée

  • Sur quel brin cette séquence inconnue présente-elle une homologie ?
  • Que représente les signes '--------' rencontrés sur certaines séquences ?


Exercice 3 : Recherche d'ORF dans une séquence nucléique

Il existe des outils pour déterminer les phases ouvertes de lecture (OpenReadingFrame ORF) dans une séquence nucléique. Vous disposez , en cliquant sur ce lien, d'une séquence 'BCL2' issue du séquençage d'un fragment nucléique humain. Vous allez vérifier que ce fragment est codant en recherchant les cadres ouverts de lecture présents, et en identifiant l'ORF la plus probable.

Utilisez le programme ORF Finder au NCBI pour effectuer la recherche de séquence codante (ALLResources>Resources List A-Z>ORFfinder (colonne gauche).

 Paramétrez le logiciel avec : Minimal ORF length (nt): 300  / ORF start codon to use: ATG 
  • Interprétez le graphique et les résultats obtenus.
  • Quelle est la position de l'ORF la plus probable ?


Afin de valider votre hypothèse quant à l'ORF la plus probable, il est nécessaire d'aller identifier dans les banques de données si cette ORF code pour la protéine Bcl2. Pour cela vous allez réaliser un BlastP

  • Dans ORF Finder, utilisez l'option Blastp sur la banque Uniprot/swissProt. Que concluez-vous ?
  • Quel est le numéro d'accession de la protéine BCL2 dans Uniprot/SwissProt ?

Exercice 4 : Analyse d'une séquence protéique, recherche de domaines fonctionnels

Afin d'appréhender l'organisation structurale et la localisation cellulaire de la protéine BCL2, vous allez recherchez les domaines 'fonctionnels' prédits sur la séquence ainsi que des motifs pouvant indiquer la localisation subcellulaire de la protéine

Sur le site de l'EMBL, utiliser le logiciel d"'analyse de séquence protéique InterPro Scan 5 pour chercher la séquence protéique BCL2 contient des domaines fonctionnels connus.

  • Notez les positions des domaines PFAM identifiés sur BCL2
  • BCL2 présente-t-elle des régions pouvant suggérer sa localistion subcellulaire ?

NB: Gardez à l'écran le résultat InterProScan pour la suite du TP

Ouvez la fiche correspondant à la protéine BCL2 dans Uniprot

  • Cette séquence a t elle été vérifié manuellement par un annonateur expert ?
  • Comparez les annotations de la fiche à celles trouvées avec votre analyse InterproScan 5

Mise en Application

Vous diposez de la séquence ci-dessous

>seq1

attggcaacctgaaagatctgaacattctgtatctgcatagcaacggctttaccggccgc attccgcgcgaaatgagcaacctgaccctggcgaacctgaccgatctggatctgagcggc aaccagctgaccggcaaaattccgcgcgattttgcggcgctgctgctggtgctgctggaa aaaaaaattgaaaacattacctgcgatagcatgaaactgctgagcaaaacctttctgatt ctgaccctgaccttttttttttttggcattgcgctggcgaaacagagctttgaaccggaa attgaagcgctgaaaagctttaaaaacggcattagcaacgatccgctgggcgtgctgagc gattggaccattattggcagcctgcgccattgcaactggaccggcattacctgcgatagc accggccatgtggtgagcgtgagcctgctggaaaaacagctggaaggcgtgctgagcccg gcgattgcgaacctgacctatctgcaggtgctggatctgaccagcaacagctttaccggc aaaattccggcggaaattggcaaactgaccgaactgaaccagctgattctgtatctgaac tattttagcggcagcattccgagcggcatttgggaactgaaaaacattttttatctggat ctgcgcaacaacctgctgagcggcgatgtgccggaagaaatttgcaaaaccagcagcctg gtgctgattggctttgattataacaacctgaccggcaaaattccggaatgcctgggcgat ctggtgcatctgcagatgtttgtggcggcgggcaaccatctgaccggcagcattccggtg agcattggcaccctggcgaacctgaccgatctggatctgagcggcaaccagctgaccggc aaaattccgcgcgattttggcaacctgctgaacctgcagagcctggtgctgaccgaaaac ctgctggaaggcgatattccggcggaaattggcaactgcagcagcctggtgcagctggaa ctgtatgataaccagctgaccggcaaaattccggcggaactgggcaacctggtgcagctg caggcgctgcgcatttataaaaacaaactgaccagcagcattccgagcagcctgtttcgc ctgacccagctgacccatctgggcctgagcgaaaaccatctggtgggcccgattagcgaa gaaattggctttctggaaagcctggaagtgctgaccctgcatagcaacaactttaccggc gaatttccgcagagcattaccaacctgcgcaacctgaccgtgctgaccgtgggctttaac aacattagcggcgaactgccggcggatctgggcctgctgaccaacctgcgcaacctgagc gcgcatgataacctgctgaccggcccgattccgagcagcattagcaactgcaccggcctg aaactgctggatctgagccataaccagatgaccggcgaaattccgcgcggctttggccgc atgaacctgacctttattagcattggccgcaaccattttaccggcgaaattccggatgat atttttaactgcagcaacctggaaaccctgagcgtggcggataacaacctgaccggcacc ctgaaaccgctgattggcaaactgcagaaactgcgcattctgcaggtgagctataacagc ctgaccggcccgattccgcgcgaaattggcaacctgaaagatctgaacattctgtatctg catagcaacggctttaccggccgcattccgcgcgaaatgagcaacctgaccctgctgcag ggcctgcgcatgtatagcaacgatctggaaggcccgattccggaagaaatgtttgatatg aaactgctgagcgtgctggatctgagcaacaacaaatttagcggccagattccggcgctg tttagcaaactggaaagcctgacctatctgagcctgcagggcaacaaatttaacggcagc attccggcgagcctgaaaagcctgagcctgctgaacacctttgatattagcgataacctg ctgaccggcaccattccgggcgaactgctggcgagcctgaaaaacatgcagctgtatctg aactttagcaacaacctgctgaccggcaccattccgaaagaactgggcaaactggaaatg gtgcaggaaattgatctgagcaacaacctgtttagcggcagcattccgcgcagcctgcag gcgtgcaaaaacgtgtttaccctggattttagccagaacaacctgagcggccatattccg gatgaagtgtttcagggcatggatatgattattagcctgaacctgagccgcaacagcttt agcggcgaaattccgcagagctttggcaacatgacccatctggtgagcctggatctgagc agcaacaacctgaccggcgaaattccggaaagcctggcgaacctgagcaccctgaaacat ctgaaactggcgagcaacaacctgaaaggccatgtgccggaaagcggcgtgtttaaaaac attaacgcgagcgatctgatgggcaacaccgatctgtgcggcagcaaaaaaccgctgaaa ccgtgcaccattaaacagaaaagcagccattttagcaaacgcacccgcgtgattctgatt attctgggcagcgcggcggcgctgctgctggtgctgctgctggtgctgattctgacctgc tgcaaaaaaaaagaaaaaaaaattgaaaacagcagcgaaagcagcctgccggatctggat agcgcgctgaaactgaaacgctttgaaccgaaagaactggaacaggcgaccgatagcttt aacagcgcgaacattattggcagcagcagcctgagcaccgtgtataaaggccagctggaa gatggcaccgtgattgcggtgaaagtgctgaacctgaaagaatttagcgcggaaagcgat aaatggttttataccgaagcgaaaaccctgagccagctgaaacatcgcaacctggtgaaa attctgggctttgcgtgggaaagcggcaaaaccaaagcgctggtgctgccgtttatggaa aacggcaacctggaagataccattcatggcagcgcggcgccgattggcagcctgctggaa aaaattgatctgtgcgtgcatattgcgagcggcattgattatctgcatagcggctatggc tttccgattgtgcattgcgatctgaaaccggcgaacattctgctggatagcgatcgcgtg gcgcatgtgagcgattttggcaccgcgcgcattctgggctttcgcgaagatggcagcacc accgcgagcaccagcgcgtttgaaggcaccattggctatctggcgccggaatttgcgtat atgcgcaaagtgaccaccaaagcggatgtgtttagctttggcattattatgatggaactg atgaccaaacagcgcccgaccagcctgaacgatgaagatagccaggatatgaccctgcgc cagctggtggaaaaaagcattggcaacggccgcaaaggcatggtgcgcgtgctggatatg gaactgggcgatagcattgtgagcctgaaacaggaagaagcgattgaagattttctgaaa ctgtgcctgttttgcaccagcagccgcccggaagatcgcccggatatgaacgaaattctg acccatctgatgaaactgcgcggcaaagcgaacagctttcgcgaagatcgcaacgaagat cgcgaagtg


Répondez aux questions suivantes:

  • A quel organisme appartient cette séquence ?
  • cette séquence est-elle codante ?
  • quelle est le numéro d'accession de cette protéine, de l'ARNm, du gène ?
  • quelle est la fonction putative de cette protéine ?