M1 MABS TDB TD Transcriptome - Clustering
From silico.biotoul.fr
m (→Analyse de transcriptome de souches de Pseudomonas aeruginosa ayant infecté des patients atteints de mucoviscidose) |
m (→Normalisation) |
||
Line 8: | Line 8: | ||
== Normalisation == | == Normalisation == | ||
- | Le format est celui d'Affymetrix (fichiers CEL). Nous utiliserons donc la librarie <tt>affy</tt> de R/Bioconductor. | + | Le format est celui d'Affymetrix (fichiers .CEL). Nous utiliserons donc la librarie <tt>affy</tt> de R/Bioconductor. |
- | Après avoir désarchivé les données dans un répertoire, changer le répertoire courant dans R pour se placer dans | + | Après avoir désarchivé les données dans un répertoire, changer le répertoire courant dans R pour se placer dans le répertoire contenant les fichiers .CEL. L'ensemble des données contenues dans les fichiers GSMxxx.CEL est chargé sous R avec les commandes suivantes : |
<source lang="rsplus"> | <source lang="rsplus"> | ||
# chargement de la librairie | # chargement de la librairie |
Revision as of 18:57, 23 October 2011
Contents |
Analyse de transcriptome de souches de Pseudomonas aeruginosa ayant infecté des patients atteints de mucoviscidose
Etude basée sur la publicaton de Lei Yang et al. Bacterial adaptation during chronic infection revealed by independent component analysis of transcriptomic data.
Récupération des données
Récupérer les données relatives à cette publication sur GEO. Pour cela, il vous faudra retrouver dans la publication les références du jeu de données qu'ils ont utilisé.
Normalisation
Le format est celui d'Affymetrix (fichiers .CEL). Nous utiliserons donc la librarie affy de R/Bioconductor.
Après avoir désarchivé les données dans un répertoire, changer le répertoire courant dans R pour se placer dans le répertoire contenant les fichiers .CEL. L'ensemble des données contenues dans les fichiers GSMxxx.CEL est chargé sous R avec les commandes suivantes :
# chargement de la librairie library(affy) raw=ReadAffy()
En effet, par défaut, la fonction ReadAffy() charge tous les fichiers .CEL du répertoire courant.
On peut s'assurer du besoin de normaliser avec une boite à moustache :
boxplot(raw)
Pour la normalisation, nous utiliserons la fonction rma() (Robust Multiarray Averaging) de la librairie affy :
raw.rma=rma(raw)
L'objet raw.rma est de type ExpressionSet et contient l'ensemble des données normalisées. Nous nous intéresserons uniquement aux intensités que nous récupérons avec la commande suivante :
rma.expr=exprs(raw.rma)
Pour plus d'information sur le type ExpressionSet vous pouvez consulter l'aide :
?ExpressionSet