silico.biotoul.fr
 

M2BBS - IDH

From silico.biotoul.fr

(Difference between revisions)
Jump to: navigation, search
m (Installation locale)
m (Installation locale)
Line 20: Line 20:
== Installation locale ==
== Installation locale ==
Aller sur le site de BioMart pour récupérer la dernière version. Pour cela, vous aurez besoin de <tt>git</tt> et <tt>ant</tt> (à installer avec <tt>yum</tt> donc s'ils ne sont pas déjà présents sur le système).
Aller sur le site de BioMart pour récupérer la dernière version. Pour cela, vous aurez besoin de <tt>git</tt> et <tt>ant</tt> (à installer avec <tt>yum</tt> donc s'ils ne sont pas déjà présents sur le système).
 +
 +
La suite correspond essentiellement à des extraits du manuel utilisateur (section Quick start, etc.) pour mettre à disposition des jeux de données distant depuis votre serveur. Vous n'hésiterez donc pas à vous y référer pour plus de détails. Le travail à réaliser :
La suite correspond essentiellement à des extraits du manuel utilisateur (section Quick start, etc.) pour mettre à disposition des jeux de données distant depuis votre serveur. Vous n'hésiterez donc pas à vous y référer pour plus de détails. Le travail à réaliser :
Line 26: Line 28:
* intégration d'une source de données locale (MySQL) et édition de lien avec la source de données précédente
* intégration d'une source de données locale (MySQL) et édition de lien avec la source de données précédente
* utilisation à partir de l'interface Web et à partir d'un client de services Web (script python)
* utilisation à partir de l'interface Web et à partir d'un client de services Web (script python)
 +
 +
Installation de git and ant :
 +
yum list git ant
 +
 +
Récupération de BioMart avec git :
 +
git clone https://github.com/biomart/BioMart.git --branch 0.9.0
 +
 +
Compilation
 +
cd BioMart
 +
ant
 +
# build successful ! (on vous le souhaite)
 +
 +
== Intégration d'une source de données distante ==
 +
Prise en main rapide :
 +
 +
Lancer mart configurator et dans l'onglet <i>Source</i>, cliquer sur 'Add source'. Garder les paramètres par défaut pour accéder à l'étape 'choose source' où vous sélectionnerez unimart/uniprot.
 +
 +
Ajouter ensuite un <i>add access point</i>, garder les paramètres par défaut, et démarrer le serveur. Si tout va bien, l'interface de BioMart devrait s'ouvrir sous la forme d'une page Web dans le navigateur. A partir de là, vous pouvez accéder au <i>datasets</i> proposés.
 +
 +
Essayer de récupérer les mêmes informations que précédemment (bacteria; coli/... ; accession gene; go id; go name).
 +
 +
Démarrerou arrêter le serveur à partir de la ligne de commande :
 +
Save as... ..../unimart_uniprot.xml
 +
cd BioMart
 +
./dist/scripts/biomart-server.sh start
 +
./dist/scripts/biomart-server.sh stop
 +
 +
Il est aussi possible de changer différents paramètres comme par exemple le port utilisé par le serveur dans dist/biomart.properties (puis http.port = 9000 ou http.host = localhost).
 +
 +
== Intégration d'une source de données locale ==
== Ajout de sources locales et édition de liens ==
== Ajout de sources locales et édition de liens ==

Revision as of 15:36, 18 September 2014

Contents

BioMart

Premier pas avec BioMart : Utilisation de l'interface Web

Allez sur le site de l'EBI, puis sur BioMart pour interroger UniProt.

A partir du formulaire (dataset, filters et attributes) et du bouton count, estimer la taille du protéome de Escherichia coli K12, Bacillus subtilis 168 et Pseudomonas aeruginosa PAO1.

Ensuite, faites une requête pour obtenir tous les attributs 'Protein' ainsi que 'Gene Ontology'.

Puis :

  • Essayer différents filtres (ayant des termes GO, ou autre).
  • Sélectionner certains attributs.
  • Utiliser la fonctionnalité count puis results.
  • A quoi peuvent servir les boutons XML et Perl ?

Installation locale

Aller sur le site de BioMart pour récupérer la dernière version. Pour cela, vous aurez besoin de git et ant (à installer avec yum donc s'ils ne sont pas déjà présents sur le système).


La suite correspond essentiellement à des extraits du manuel utilisateur (section Quick start, etc.) pour mettre à disposition des jeux de données distant depuis votre serveur. Vous n'hésiterez donc pas à vous y référer pour plus de détails. Le travail à réaliser :

  • compilation du serveur avec ant
  • intégration d'une source de données distante au serveur, configuration de point d'accès et lancement du serveur
  • intégration d'une source de données locale (MySQL) et édition de lien avec la source de données précédente
  • utilisation à partir de l'interface Web et à partir d'un client de services Web (script python)

Installation de git and ant :

yum list git ant

Récupération de BioMart avec git :

git clone https://github.com/biomart/BioMart.git --branch 0.9.0 

Compilation

cd BioMart
ant
# build successful ! (on vous le souhaite)

Intégration d'une source de données distante

Prise en main rapide :

Lancer mart configurator et dans l'onglet Source, cliquer sur 'Add source'. Garder les paramètres par défaut pour accéder à l'étape 'choose source' où vous sélectionnerez unimart/uniprot.

Ajouter ensuite un add access point, garder les paramètres par défaut, et démarrer le serveur. Si tout va bien, l'interface de BioMart devrait s'ouvrir sous la forme d'une page Web dans le navigateur. A partir de là, vous pouvez accéder au datasets proposés.

Essayer de récupérer les mêmes informations que précédemment (bacteria; coli/... ; accession gene; go id; go name).

Démarrerou arrêter le serveur à partir de la ligne de commande :

Save as... ..../unimart_uniprot.xml
cd BioMart
./dist/scripts/biomart-server.sh start
./dist/scripts/biomart-server.sh stop

Il est aussi possible de changer différents paramètres comme par exemple le port utilisé par le serveur dans dist/biomart.properties (puis http.port = 9000 ou http.host = localhost).

Intégration d'une source de données locale

Ajout de sources locales et édition de liens

  • Télécharger le jeu de données gene (à la fin de cette page).
  • Créer une base de données MySql pour héberger les tables gene et strain, avec le schéma suivant :
    • gene(strain, gene, num, protein, start, end, function, uniprot)
    • strain(strain, taxonomy_id, name, species)
  • Alimenter ces tables avec les données téléchargées
  • Ajouter le dataset gene à votre serveur BioMart et créer un Access point correspondant
  • Ajouter un lien entre gene et strain
  • Ajouter un lien entre gene.uniprot et le jeu de données distant unimart

Services Web

  • Suivre l'exemple donné dans la documentation pour effectuer une requête sur votre instance BioMart afin de récupérer un jeu de données depuis un script python ou perl

Autres sources de données

  • Répartissez-vous le reste des données disponibles en fin de page (sauf BioCyc, donc GO, profils phylogénétiques, String, et transcriptome) pour créer les tables correspondantes, faire le lien avec gene sur le type de données que vous aurez choisi, puis faire le lien avec les types de données hébergés par les instances de vos collègues.

Annexes

Données et scripts