Revision as of 17:49, 18 September 2016

Enrichment analysis

Dans cette partie, il s'agit d'analyser un groupe de gènes en le confrontant à des groupes de gènes obtenus selon différentes fonctions de regroupement.

La fonction de regroupement proposée est l'appartenance à une même voie métabolique dans la banque de données BioCyc. Ainsi, pour chaque pathway, un groupe de gène est formé.

Le script python search_enriched_sets.py permet de charger ces ensembles de gènes pré-formés EcolA.biocyc.sets et de chercher les plus similaires à un groupe de gènes d'intérêts. Essayez-le avec ALAS ARGS ASNS ASPS CYSS GLTX GLYQ GLYS HISS ILES par exemple pour vous faire une idée de son fonctionnement.

Remarque : le script python utilise le module scipy.

root> pip install scipy

Comparez les résultats avec ceux obtenus en recherchant parmi les ensembles formés des gènes annotés avec le même terme de la Gene Ontology (EcolA.go.sets). Que constatez-vous ?

Travail à réaliser :

Analyser le code source du script search_enriched_sets.py
Pour chaque pathway biocyc, proposer le term GO le plus représentatif
Visualisation des résultats avec REVIGO

Prise en main de la librairie R/Bioconductor R-STRINGdb

Sites et documentation :

STRING : http://string-db.org/
R-STRINGdb : https://bioconductor.org/packages/release/bioc/html/STRINGdb.html
R-STRINGdb Vignette et Man

Travail à réaliser :

Installer la librairie (si nécessaire)
Retrouver l'espèce Escherichia coli K12 MG1655, quel est son identifiant taxonomique/STRINGdb ?
Quelle est la différence entre STRINGdb core et STRINGdb periphery ?
Télécharger tout le graphe pour E. coli K12 pour un seuil de 400. A quoi correspond ce seuil ? combien d'interactions obtenez-vous ?
Afficher le sous graphe pour les groupe de gènes ALAS ARGS ASNS ASPS CYSS GLTX GLYQ GLYS HISS ILES. A quoi correspond la p-valeur affichée ?
Télécharger les annotations associées à chaque sommet.

Intégration dans une base de données orientée graphes

Sites et documentations :

Installation (cf. https://neo4j.com/docs/operations-manual/current/deployment/#linux-installation)

Données et scripts

enrichment analysis
R-STRINGdb tutoriel

@@ Line 32: / Line 32: @@
 * Afficher le sous graphe pour les groupe de gènes <tt>ALAS ARGS ASNS ASPS CYSS GLTX GLYQ GLYS HISS ILES</tt>. A quoi correspond la p-valeur affichée ?
 * Télécharger les annotations associées à chaque sommet.
+= Intégration dans une base de données orientée graphes =
+Sites et documentations :
+* https://neo4j.com/
+* https://neo4j.com/developer/get-started/
+Installation (cf. https://neo4j.com/docs/operations-manual/current/deployment/#linux-installation)
 = Données et scripts =

M2BBS - IDH

From silico.biotoul.fr

Revision as of 17:49, 18 September 2016

Contents

Enrichment analysis

Prise en main de la librairie R/Bioconductor R-STRINGdb

Intégration dans une base de données orientée graphes

Données et scripts