silico.biotoul.fr
 

InfoBio TD Ecoli Outbreak

From silico.biotoul.fr

(Difference between revisions)
Jump to: navigation, search
m (Created page with 'En 2011, une souche pathogène d'''Escherichia coli'' a été la cause d'un grand nombre d'intoxications alimentaires, notamment en Allemagne, une partie d'entre elles ayant caus…')
m
Line 6: Line 6:
Une analyse phylogénomique a permis d'identifier la souche la plus proche : ''Escherichia coli'' 55989. (cf. sur le site [http://patricbrc.org/portal/portal/patric/Phylogeny?cType=taxon&cId=561 PATRIC] la phylogénie des E. coli).
Une analyse phylogénomique a permis d'identifier la souche la plus proche : ''Escherichia coli'' 55989. (cf. sur le site [http://patricbrc.org/portal/portal/patric/Phylogeny?cType=taxon&cId=561 PATRIC] la phylogénie des E. coli).
 +
 +
1. Récupérer au format FASTA les génomes des souches LB226692 et 55989.
 +
 +
2. A l'aide du logiciel [http://asap.ahabs.wisc.edu/software/mauve/overview.html MAUVE] (préinstallé sur vos machines), réalisez l'alignement des génomes de ces 2 souches et identifiez visuellement des régions uniques à l'une ou l'autre souche.
 +
 +
3. A l'aide des fichiers de sorties de MAUVE, il va vous falloir extraire les régions non-alignées de la souche LB226692. Vous trouverez dans la documentation les [http://asap.ahabs.wisc.edu/mauve-aligner/mauve-user-guide/mauve-output-file-formats.html formats] des différents fichier de sortie. Si vous inspectez le fichier FASTA du génome de LB226692, vous vous apercevrez qu'il peut être compliqué d'extraire une région d'un génome lorsque le séquençage ne permet pas d'obtenir la séquence complète du chromosome.

Revision as of 13:31, 28 February 2012

En 2011, une souche pathogène d'Escherichia coli a été la cause d'un grand nombre d'intoxications alimentaires, notamment en Allemagne, une partie d'entre elles ayant causé la mort de la personne infectée.

Vers la fin mai 2011, un institut allemand - le RKI - a remarqué le nombre inhabituel d'infections (Hemolytic Uremic Syndrome & bloody diarrhea). Des prélèvements effectués sur les patients ont conduit au séquençage de la souche responsable : O104-H4 str. LB226692 (accession AFOB02).

Le but de cette séance est de comparer le génome de cette souche avec sa parente la plus proche, d'identifier les régions acquises par cette souche et d'y rechercher les gènes pouvant expliquer le phénotype des patients.

Une analyse phylogénomique a permis d'identifier la souche la plus proche : Escherichia coli 55989. (cf. sur le site PATRIC la phylogénie des E. coli).

1. Récupérer au format FASTA les génomes des souches LB226692 et 55989.

2. A l'aide du logiciel MAUVE (préinstallé sur vos machines), réalisez l'alignement des génomes de ces 2 souches et identifiez visuellement des régions uniques à l'une ou l'autre souche.

3. A l'aide des fichiers de sorties de MAUVE, il va vous falloir extraire les régions non-alignées de la souche LB226692. Vous trouverez dans la documentation les formats des différents fichier de sortie. Si vous inspectez le fichier FASTA du génome de LB226692, vous vous apercevrez qu'il peut être compliqué d'extraire une région d'un génome lorsque le séquençage ne permet pas d'obtenir la séquence complète du chromosome.