silico.biotoul.fr
 

InfoBio TD transcriptome

From silico.biotoul.fr

(Difference between revisions)
Jump to: navigation, search
m (Created page with '== Récupération des données à partir d'un entrepôt de données de transcriptome == Il existe plusieurs entrepôts de données pour les données de transcriptome. Les princi…')
m
Line 1: Line 1:
 +
== Aperçu de la séance ==
 +
* Récupération d'un jeu de données brutes
 +
* Premier pas avec le logiciel R
 +
* Chargement des données d'expression
 +
* Filtrage et normalisation
 +
* Identification des gènes différentiellement exprimés (au moins 5x)
 +
* Analyse de la liste de gènes obtenue
 +
== Récupération des données à partir d'un entrepôt de données de transcriptome ==
== Récupération des données à partir d'un entrepôt de données de transcriptome ==
-
Il existe plusieurs entrepôts de données pour les données de transcriptome. Les principaux sont [http://www.ncbi.nlm.nih.gov/geo/ Gene Expression Omnibus] (GEO) du NCBI, [http://www.ebi.ac.uk/arrayexpress/ ArrayExpress] de l'EBI, ainsi que le [http://smd.stanford.edu/ Stanford Microarray Database] (SMD). A partir de GEO du NCBI, '''retrouvez les données associées à la publication [http://gut.bmj.com/content/62/3/452.long Affo et al. 2014]'''.
+
Il existe plusieurs entrepôts de données pour les données de transcriptome. Les principaux sont [http://www.ncbi.nlm.nih.gov/geo/ Gene Expression Omnibus] (GEO) du NCBI, [http://www.ebi.ac.uk/arrayexpress/ ArrayExpress] de l'EBI, ainsi que le [http://smd.stanford.edu/ Stanford Microarray Database] (SMD).  
 +
 
 +
''Combien d'hybridations sont disponibles sur la banque GEO ? Pour combien de puces différentes ?''
 +
 
 +
Au cours de cette séance, nous allons analyser les données telles que fournies par le logiciel d'analyse d'image. Il s'agit de séries d'hybridations obtenues dans le cadre d'une étude d'hépatites sévères liées à la consommation d'alcool. Commencez par lire le résumé de la publication associée ; son identifiant PubMed est le 22637703.
 +
 
 +
''Combien d'hybridations ont été utilisées dans cette étude ? Combien de gènes différentiellement exprimés (>x5 fois) ont été identifiés ?''
 +
 
 +
A partir de GEO du NCBI, retrouvez et téléchargez la totalité des données associées à la publication (il s'agit de la série GSE28619). Ensuite, décompressez le fichier (avec les commandes tar/gunzip sous linux par exemple).
 +
 
 +
''Avec quelle version de microarray ont été obtenues les données ? Combien y a-t-il de spots sur la puce ? Combien d'hybridations sont disponibles pour cette version de microarray ? Regroupées en combien de séries d'hybridations ?''
 +
 
 +
 
 +
 
 +
 
 +
 
 +
 
 +
 
 +
 
 +
 
 +
 
 +
 
 +
 
-
Vous devriez trouver la série [http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE28619 GSE28619]. '''Lisez la page décrivant les données, puis téléchargez les données brutes (GSM709348..GSM709369) dans un répertoire que vous aurez créé pour vos analyses. Ensuite, décompressez ce fichier''' (soit avec les commandes tar/gunzip sous linux, soit avec un logiciel de compression/décompression tel que [http://www.7-zip.org/ 7-Zip] installé sur votre poste de travail.
+
== Références et données ==
 +
* [http://gut.bmj.com/content/62/3/452.long Affo ''et al., 2013'']
 +
* [http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE28619 GSE28619]
 +
* [[silico:enseignement/L3-Info/transcriptome/GSE28619_RAW.tar|GSE28619_RAW.tar]]

Revision as of 15:21, 21 February 2014

Aperçu de la séance

  • Récupération d'un jeu de données brutes
  • Premier pas avec le logiciel R
  • Chargement des données d'expression
  • Filtrage et normalisation
  • Identification des gènes différentiellement exprimés (au moins 5x)
  • Analyse de la liste de gènes obtenue

Récupération des données à partir d'un entrepôt de données de transcriptome

Il existe plusieurs entrepôts de données pour les données de transcriptome. Les principaux sont Gene Expression Omnibus (GEO) du NCBI, ArrayExpress de l'EBI, ainsi que le Stanford Microarray Database (SMD).

Combien d'hybridations sont disponibles sur la banque GEO ? Pour combien de puces différentes ?

Au cours de cette séance, nous allons analyser les données telles que fournies par le logiciel d'analyse d'image. Il s'agit de séries d'hybridations obtenues dans le cadre d'une étude d'hépatites sévères liées à la consommation d'alcool. Commencez par lire le résumé de la publication associée ; son identifiant PubMed est le 22637703.

Combien d'hybridations ont été utilisées dans cette étude ? Combien de gènes différentiellement exprimés (>x5 fois) ont été identifiés ?

A partir de GEO du NCBI, retrouvez et téléchargez la totalité des données associées à la publication (il s'agit de la série GSE28619). Ensuite, décompressez le fichier (avec les commandes tar/gunzip sous linux par exemple).

Avec quelle version de microarray ont été obtenues les données ? Combien y a-t-il de spots sur la puce ? Combien d'hybridations sont disponibles pour cette version de microarray ? Regroupées en combien de séries d'hybridations ?







Références et données