M2BBS - IDH
From silico.biotoul.fr
m |
m (→Prise en main de la librairie R/Bioconductor STRINGdb) |
||
Line 18: | Line 18: | ||
<!-- * Modifier le script pour utiliser une autre mesure d'enrichissement et comparer les résultats obtenus (ex: χ<sup>2</sup> d'indépendance). (Travail à réaliser <u>en dehors de cette séance</u>) --> | <!-- * Modifier le script pour utiliser une autre mesure d'enrichissement et comparer les résultats obtenus (ex: χ<sup>2</sup> d'indépendance). (Travail à réaliser <u>en dehors de cette séance</u>) --> | ||
- | =Prise en main de la librairie R/Bioconductor | + | =Prise en main de la librairie R/Bioconductor RSTRINGdb= |
+ | |||
+ | Sites et documentation : | ||
+ | * STRING : http://string-db.org/ | ||
+ | * RSTRINGdb : https://bioconductor.org/packages/release/bioc/html/STRINGdb.html | ||
+ | * RSTRINGdb [[Media:RSTRINGdb.Vignette.pdf|Vignette]] et [[Media:RSTRINGdb.man.pdf|Man]] | ||
Travail à réaliser : | Travail à réaliser : | ||
Line 27: | Line 32: | ||
* Afficher le sous graphe pour les groupe de gènes <tt>ALAS ARGS ASNS ASPS CYSS GLTX GLYQ GLYS HISS ILES</tt>. A quoi correspond la p-valeur affichée ? | * Afficher le sous graphe pour les groupe de gènes <tt>ALAS ARGS ASNS ASPS CYSS GLTX GLYQ GLYS HISS ILES</tt>. A quoi correspond la p-valeur affichée ? | ||
* Télécharger les annotations associées à chaque sommet. | * Télécharger les annotations associées à chaque sommet. | ||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
- | |||
= Données et scripts = | = Données et scripts = |
Revision as of 17:14, 18 September 2016
Enrichment analysis
Dans cette partie, il s'agit d'analyser un groupe de gènes en le confrontant à des groupes de gènes obtenus selon différentes fonctions de regroupement.
La fonction de regroupement proposée est l'appartenance à une même voie métabolique dans la banque de données BioCyc. Ainsi, pour chaque pathway, un groupe de gène est formé.
Le script python search_enriched_sets.py permet de charger ces ensembles de gènes pré-formés EcolA.biocyc.sets et de chercher les plus similaires à un groupe de gènes d'intérêts. Essayez-le avec ALAS ARGS ASNS ASPS CYSS GLTX GLYQ GLYS HISS ILES par exemple pour vous faire une idée de son fonctionnement.
Remarque : le script python utilise le module scipy.
root> pip install scipy
Comparez les résultats avec ceux obtenus en recherchant parmi les ensembles formés des gènes annotés avec le même terme de la Gene Ontology (EcolA.go.sets). Que constatez-vous ?
Travail à réaliser :
- Analyser le code source du script search_enriched_sets.py
- Pour chaque pathway biocyc, proposer le term GO le plus représentatif
- Visualisation des résultats avec REVIGO
Prise en main de la librairie R/Bioconductor RSTRINGdb
Sites et documentation :
- STRING : http://string-db.org/
- RSTRINGdb : https://bioconductor.org/packages/release/bioc/html/STRINGdb.html
- RSTRINGdb Vignette et Man
Travail à réaliser :
- Installer la librairie (si nécessaire)
- Retrouver l'espèce Escherichia coli K12 MG1655, quel est son identifiant taxonomique/STRINGdb ?
- Quelle est la différence entre STRINGdb core et STRINGdb periphery ?
- Télécharger tout le graphe pour E. coli K12 pour un seuil de 400. A quoi correspond ce seuil ? combien d'interactions obtenez-vous ?
- Afficher le sous graphe pour les groupe de gènes ALAS ARGS ASNS ASPS CYSS GLTX GLYQ GLYS HISS ILES. A quoi correspond la p-valeur affichée ?
- Télécharger les annotations associées à chaque sommet.
Données et scripts
- enrichment analysis