silico.biotoul.fr
 

Bioanalyse TD Interrogation des banques de donnees

From silico.biotoul.fr

(Difference between revisions)
Jump to: navigation, search
m (Created page with '=Tutorial d'Initiation à la BioAnalyse= ==Introduction== Ce TD a pour but de vous familiariser avec la recherche d'informations scientifiques disponibles dans les banques de do…')
m
Line 41: Line 41:
* quel est la fonction du domaine "IPR00254" ? est-il spécifique des oomycètes/champignons ou tout autre espèce ?
* quel est la fonction du domaine "IPR00254" ? est-il spécifique des oomycètes/champignons ou tout autre espèce ?
* ce domaine est-il référencé dans d'autres banques de domaine ? Si oui, lesquelles et sous quelle nomenclature ?
* ce domaine est-il référencé dans d'autres banques de domaine ? Si oui, lesquelles et sous quelle nomenclature ?
 +
 +
'''2°)''' Sur le serveur de l'EBI, trouvez '''SRS'''
 +
 +
2 types de recherche possible dans SRS, "Quick Search " et "Search"
 +
 +
<u>Identifiez :</u>
 +
* en utilisant Quick Search, les séquences PROTEIQUES de Phytophthora
 +
* en utilisant les onglets de SRS (Library Page puis Query Form puis Results), les séquences de Phytophthora codant des éliciteurs présentant une activité lectine, contenues dans la banque Uniprot/TrEMBL uniquement
 +
 +
<u>On s'intéresse maintenant à O42830</u>
 +
* ouvrir la fiche TrEMBL de O42830 (Colonne Accession). Que constatez-vous par rapport à la fiche GenPept ?
 +
* à quoi correspond le lien GO:0030248 ?
 +
 +
== Exercice 2 : Recherche dans les banques via l'utilisation d'une séquence connue ==
 +
 +
'''1°)''' Récupérez la séquence Q6Q475
 +
* de quelle type de séquence s'agit-il ?
 +
* à quel organisme appartient-elle ?
 +
* quelle est la fonction de Q6Q475 ?
 +
* dans quelle banque cette séquence est-elle déposée ?
 +
 +
== Exercice 3 : Interrogation de banques spécialisées par utilisation de mots clés ou séquences connues ==
 +
 +
'''1°)''' Allez sur le site de la banque spécialisée [http://cogeme.ex.ac.uk/ COGEME] 
 +
* a quel type de banque appartient COGEME ?
 +
* trouvez le nombre de séquences correspondant à des endoglucanases du champignon pathogène du riz, Magnaporthe grisea
 +
* qu'est ce qu'un contig ?
 +
* de combien d'EST est constituée le contig MagCon[10456a] ?
 +
* afficher au format FASTA l'ensemble des endoglucanases de M. grisea
 +
 +
'''2°)''' Allez sur le site du [http://www.jcvi.org/ JCVI]
 +
* qu'est-ce que le JCVI ?
 +
* quelles banques de séquences concernant les végétaux sont hébergées au JCVI ?
 +
* identifiez les séquences de riz codant des glycosyl hydrolases ?

Revision as of 14:12, 20 January 2011

Contents

Tutorial d'Initiation à la BioAnalyse

Introduction

Ce TD a pour but de vous familiariser avec la recherche d'informations scientifiques disponibles dans les banques de données bibliographiques, biologiques ou encore de séquences.

Ci-dessous une sélection des sites Internet qui vous seront nécessaires au cours des TD:

  • Génopôle Toulouse
  • EBI European Bioinformatics Institute (EMBL, GB)
  • NCBI National Center for Biotechnology Information (NIH, USA)
  • Expasy Expert Protein Analysis System (Swiss Institute of Bioinformatics, Suisse)
  • PBIL Pôle Bio-Informatique Lyonnais (CNRS, Lyon)
  • Institut Pasteur

Exercice 1 : Recherche dans les banques via l'utilisation de mots clés

Deux outils pour la recherche de Séquences

  • SRS (Sequence Retrieval System): sur le site EBI Databases~Databases Browsing~SRS
  • Entrez : sur le site du NCBI entrer directement la recherche dans la boite de recherche en haut de page, ou bien http://www.ncbi.nlm.nih.gov/Entrez/

NB: Lorsque plusieurs termes sont recherchés, il est possible de les combiner à l'aide des opérateurs booléens (AND, OR, NOT)

1°) Sur le serveur du NCBI, identifiez:

  • toutes les séquences de l'oomycète Phytophthora (parasite de la pomme de terre), combien sont-elles ?
  • les séquences protéiques de Phytophthora parasitica correspondant à des éliciteurs (molécules capables d'induire les réponses immunitaires chez les végétaux).

Pour cela utiliser soit directement ENTREZ, soit sur le site du NCBI sélectionnez les banques "protéines", puis l'option Advanced search et le bouton Preview, en précisant les champs, Organism, Title... à l'aide de l'outil Search builder et conjuguer vos requêtes. L'historique de vos requêtes est disponible dans la section History.

NB : L'utilisation de * permet de chercher une famille de mots. Par exemple, avec elicit*, vous pourrez trouver elicitor, elicitate, elicitin...

On s'intéresse maintenant à la séquence dont le numéro d'accession est CAA65843

Regardez la fiche de la séquence correspondante :

  • comment s'organise cette fiche ?
  • quel est le nom de cette protéine ?
  • dans quel journal scientifique les travaux concernant cette protéine ont-ils été publiés ?
  • sous quel numéro cette publication est-elle référencée dans PubMed ?
  • de combien d'acides aminés est composée cette protéine ?
  • cette protéine est-elle sécrétée ?

On s'intéresse maintenant aux références croisées, notées "db_xref" sur la fiche

  • à quoi correspondent ces différentes références croisées ?
  • quels domaines sont présent dans la protéine ?
  • quel est la fonction du domaine "IPR00254" ? est-il spécifique des oomycètes/champignons ou tout autre espèce ?
  • ce domaine est-il référencé dans d'autres banques de domaine ? Si oui, lesquelles et sous quelle nomenclature ?

2°) Sur le serveur de l'EBI, trouvez SRS

2 types de recherche possible dans SRS, "Quick Search " et "Search"

Identifiez :

  • en utilisant Quick Search, les séquences PROTEIQUES de Phytophthora
  • en utilisant les onglets de SRS (Library Page puis Query Form puis Results), les séquences de Phytophthora codant des éliciteurs présentant une activité lectine, contenues dans la banque Uniprot/TrEMBL uniquement

On s'intéresse maintenant à O42830

  • ouvrir la fiche TrEMBL de O42830 (Colonne Accession). Que constatez-vous par rapport à la fiche GenPept ?
  • à quoi correspond le lien GO:0030248 ?

Exercice 2 : Recherche dans les banques via l'utilisation d'une séquence connue

1°) Récupérez la séquence Q6Q475

  • de quelle type de séquence s'agit-il ?
  • à quel organisme appartient-elle ?
  • quelle est la fonction de Q6Q475 ?
  • dans quelle banque cette séquence est-elle déposée ?

Exercice 3 : Interrogation de banques spécialisées par utilisation de mots clés ou séquences connues

1°) Allez sur le site de la banque spécialisée COGEME

  • a quel type de banque appartient COGEME ?
  • trouvez le nombre de séquences correspondant à des endoglucanases du champignon pathogène du riz, Magnaporthe grisea
  • qu'est ce qu'un contig ?
  • de combien d'EST est constituée le contig MagCon[10456a] ?
  • afficher au format FASTA l'ensemble des endoglucanases de M. grisea

2°) Allez sur le site du JCVI

  • qu'est-ce que le JCVI ?
  • quelles banques de séquences concernant les végétaux sont hébergées au JCVI ?
  • identifiez les séquences de riz codant des glycosyl hydrolases ?