silico.biotoul.fr
 

M2BBS - IDH

From silico.biotoul.fr

Revision as of 14:38, 18 September 2014 by Barriot (Talk | contribs)
Jump to: navigation, search

Contents

BioMart

Premier pas avec BioMart : Utilisation de l'interface Web

Allez sur le site de l'EBI, puis sur BioMart pour interroger UniProt.

A partir du formulaire (dataset, filters et attributes) et du bouton count, estimer la taille du protéome de Escherichia coli K12, Bacillus subtilis 168 et Pseudomonas aeruginosa PAO1.

Ensuite, faites une requête pour obtenir tous les attributs 'Protein' ainsi que 'Gene Ontology'.

Puis :

  • Essayer différents filtres (ayant des termes GO, ou autre).
  • Sélectionner certains attributs.
  • Utiliser la fonctionnalité count puis results.
  • A quoi peuvent servir les boutons XML et Perl ?

Installation locale

  • Aller sur le site de BioMart pour récupérer la dernière version.
  • Suivre le manuel utilisateur : Quick start pour mettre à disposition un jeu de données distant depuis votre serveur.

Ajout de sources locales et édition de liens

  • Télécharger le jeu de données gene (à la fin de cette page).
  • Créer une base de données MySql pour héberger les tables gene et strain, avec le schéma suivant :
    • gene(strain, gene, num, protein, start, end, function, uniprot)
    • strain(strain, taxonomy_id, name, species)
  • Alimenter ces tables avec les données téléchargées
  • Ajouter le dataset gene à votre serveur BioMart et créer un Access point correspondant
  • Ajouter un lien entre gene et strain
  • Ajouter un lien entre gene.uniprot et le jeu de données distant unimart

Services Web

  • Suivre l'exemple donné dans la documentation pour effectuer une requête sur votre instance BioMart afin de récupérer un jeu de données depuis un script python ou perl

Autres sources de données

  • Répartissez-vous le reste des données disponibles en fin de page (sauf BioCyc, donc GO, profils phylogénétiques, String, et transcriptome) pour créer les tables correspondantes, faire le lien avec gene sur le type de données que vous aurez choisi, puis faire le lien avec les types de données hébergés par les instances de vos collègues.

Annexes

Données et scripts