silico.biotoul.fr
 

M1 MABS TDB TD Transcriptome - Clustering

From silico.biotoul.fr

(Difference between revisions)
Jump to: navigation, search
m (Normalisation)
m (Analyse de transcriptome de souches de Pseudomonas aeruginosa ayant infecté des patients atteints de mucoviscidose)
Line 38: Line 38:
?ExpressionSet
?ExpressionSet
</source>
</source>
 +
 +
Le résultat de la normalisation peut aussi se visualiser avec une boite à moustache :
 +
<source lang="rsplus">
 +
par(mfrow=c(2,1))
 +
boxplot(raw)
 +
boxplot(rma.expr)
 +
</source>
 +
 +
== Données annexes sur les hybridations ==
 +
Afin de plus facilement analyser les données, les informations de la publication concernant le stade ou phénotype (early, late, mucoid) des bactéries a été compilé dans le fichier suivant :
 +
{| border="1" cellspacing="0"
 +
|+ Table 1 : Contenu du fichier [[Media:GSE31227_chips_info.txt|chips_info.txt]].
 +
|-
 +
! FileName !! Experience !! color
 +
|-
 +
|  GSM774085_CF30-1979a.CEL || CF30.1979.late || red
 +
|-
 +
| GSM774086_CF30-1979b.CEL || CF30.1979.late || red
 +
|-
 +
| GSM774086_CF30-1979c.CEL || CF30.1979.late || red
 +
|-
 +
| GSM774088_CF43-1973a.CEL || CF43.1973.early || green
 +
|-
 +
| ... || ... || ...
 +
|}
 +
 +
'''Charger ces données dans un objet que l'on appellera <tt>info</tt>.'''
 +
 +
== Clustering des profils ==
= Analyse d'un compendium de données de transcriptome de levure ''Saccharomyces cerevisiae'' =
= Analyse d'un compendium de données de transcriptome de levure ''Saccharomyces cerevisiae'' =

Revision as of 19:12, 23 October 2011

Contents

Analyse de transcriptome de souches de Pseudomonas aeruginosa ayant infecté des patients atteints de mucoviscidose

Etude basée sur la publicaton de Lei Yang et al. Bacterial adaptation during chronic infection revealed by independent component analysis of transcriptomic data.

Récupération des données

Récupérer les données relatives à cette publication sur GEO. Pour cela, il vous faudra retrouver dans la publication les références du jeu de données qu'ils ont utilisé.

Normalisation

Le format est celui d'Affymetrix (fichiers .CEL). Nous utiliserons donc la librarie affy de R/Bioconductor.

Après avoir désarchivé les données dans un répertoire, changer le répertoire courant dans R pour se placer dans le répertoire contenant les fichiers .CEL. L'ensemble des données contenues dans les fichiers GSMxxx.CEL est chargé sous R avec les commandes suivantes :

# chargement de la librairie
library(affy)
raw=ReadAffy()

En effet, par défaut, la fonction ReadAffy() charge tous les fichiers .CEL du répertoire courant.

On peut s'assurer du besoin de normaliser avec une boite à moustache :

boxplot(raw)

Pour la normalisation, nous utiliserons la fonction rma() (Robust Multiarray Averaging) de la librairie affy :

raw.rma=rma(raw)

L'objet raw.rma est de type ExpressionSet et contient l'ensemble des données normalisées. Nous nous intéresserons uniquement aux intensités que nous récupérons avec la commande suivante :

rma.expr=exprs(raw.rma)

Pour plus d'information sur le type ExpressionSet vous pouvez consulter l'aide :

?ExpressionSet

Le résultat de la normalisation peut aussi se visualiser avec une boite à moustache :

par(mfrow=c(2,1))
boxplot(raw)
boxplot(rma.expr)

Données annexes sur les hybridations

Afin de plus facilement analyser les données, les informations de la publication concernant le stade ou phénotype (early, late, mucoid) des bactéries a été compilé dans le fichier suivant :

Table 1 : Contenu du fichier chips_info.txt.
FileName Experience color
GSM774085_CF30-1979a.CEL CF30.1979.late red
GSM774086_CF30-1979b.CEL CF30.1979.late red
GSM774086_CF30-1979c.CEL CF30.1979.late red
GSM774088_CF43-1973a.CEL CF43.1973.early green
... ... ...

Charger ces données dans un objet que l'on appellera info.

Clustering des profils

Analyse d'un compendium de données de transcriptome de levure Saccharomyces cerevisiae