silico.biotoul.fr
 

InfoBio TD Ecoli Outbreak

From silico.biotoul.fr

(Difference between revisions)
Jump to: navigation, search
m
m
Line 1: Line 1:
En 2011, une souche pathogène d'''Escherichia coli'' a été la cause d'un grand nombre d'intoxications alimentaires, notamment en Allemagne, une partie d'entre elles ayant causé la mort de la personne infectée.
En 2011, une souche pathogène d'''Escherichia coli'' a été la cause d'un grand nombre d'intoxications alimentaires, notamment en Allemagne, une partie d'entre elles ayant causé la mort de la personne infectée.
-
Vers la fin mai 2011, un institut allemand - le RKI - a remarqué le nombre inhabituel d'infections (Hemolytic Uremic Syndrome & bloody diarrhea). Des prélèvements effectués sur les patients ont conduit au séquençage de la souche responsable : O104-H4 str. LB226692 (accession AFOB02).
+
Vers la fin mai 2011, un institut allemand - le RKI - a remarqué le nombre inhabituel d'infections ([http://www.ncbi.nlm.nih.gov/pubmedhealth/PMH0001539/ Hemolytic Uremic Syndrome] & bloody diarrhea). Des prélèvements effectués sur les patients ont conduit au séquençage de la souche responsable : O104-H4 str. LB226692 (accession AFOB02).
Le but de cette séance est de comparer le génome de cette souche avec sa parente la plus proche, d'identifier les régions acquises par cette souche et d'y rechercher les gènes pouvant expliquer le phénotype des patients.
Le but de cette séance est de comparer le génome de cette souche avec sa parente la plus proche, d'identifier les régions acquises par cette souche et d'y rechercher les gènes pouvant expliquer le phénotype des patients.
Line 20: Line 20:
* Organism: Escherichia coli O157:H7 (Les symptômes des patients ressemblant fortement à ceux des souches O157:H7, vous commencerez par restreindre la recherche aux protéines de ces souches).
* Organism: Escherichia coli O157:H7 (Les symptômes des patients ressemblant fortement à ceux des souches O157:H7, vous commencerez par restreindre la recherche aux protéines de ces souches).
-
= References =
+
= Références =
* http://www.ncbi.nlm.nih.gov/pubmed/21799941
* http://www.ncbi.nlm.nih.gov/pubmed/21799941
* http://en.wikipedia.org/wiki/Escherichia_coli_O104:H4
* http://en.wikipedia.org/wiki/Escherichia_coli_O104:H4
* http://en.wikipedia.org/wiki/Shiga_toxin
* http://en.wikipedia.org/wiki/Shiga_toxin
 +
* http://www.ncbi.nlm.nih.gov/nuccore/CU928145
 +
* http://patricbrc.org/portal/portal/patric/Genome?cType=genome&cId=200960
 +
* http://www.ncbi.nlm.nih.gov/nuccore/AFOB00000000
 +
* http://www.ncbi.nlm.nih.gov/Traces/wgs/?val=AFOB02
 +
* [[File:AFOB02.fasta]]
 +
* [[File:O104-H4-55989.fasta]]
 +
* [[File:AFOB02.4921150..5096945.fasta]]
 +
* [[File:AFOB02.5113362..5157314.fasta]]
 +
* [[File:AFOB02.5298577..5370584.fasta]]
 +
* [[File:AFOB02.5376672..5455500.fasta]]

Revision as of 14:07, 28 February 2012

En 2011, une souche pathogène d'Escherichia coli a été la cause d'un grand nombre d'intoxications alimentaires, notamment en Allemagne, une partie d'entre elles ayant causé la mort de la personne infectée.

Vers la fin mai 2011, un institut allemand - le RKI - a remarqué le nombre inhabituel d'infections (Hemolytic Uremic Syndrome & bloody diarrhea). Des prélèvements effectués sur les patients ont conduit au séquençage de la souche responsable : O104-H4 str. LB226692 (accession AFOB02).

Le but de cette séance est de comparer le génome de cette souche avec sa parente la plus proche, d'identifier les régions acquises par cette souche et d'y rechercher les gènes pouvant expliquer le phénotype des patients.

Une analyse phylogénomique a permis d'identifier la souche la plus proche : Escherichia coli 55989. (cf. sur le site PATRIC la phylogénie des E. coli).

1. Récupérer au format FASTA les génomes des souches LB226692 et 55989.

2. A l'aide du logiciel MAUVE (préinstallé sur vos machines), réalisez l'alignement des génomes de ces 2 souches et identifiez visuellement des régions uniques à l'une ou l'autre souche.

3. A l'aide des fichiers de sorties de MAUVE, il va vous falloir extraire les régions non-alignées de la souche LB226692. Vous trouverez dans la documentation les formats des différents fichier de sortie. Si vous inspectez le fichier FASTA du génome de LB226692, vous vous apercevrez qu'il peut être compliqué d'extraire une région d'un génome lorsque le séquençage ne permet pas d'obtenir la séquence complète du chromosome. Vous y arriverez plus facilement à l'aide du fichier alignment_file produit par MAUVE et en utilisant BioPerl (objet Bio::AlignIO).

4. Une fois les régions spécifiques à LB226692 de taille supérieure à 300 nucléotides extraites au format FASTA, utilisez l'interface Web du programme BLAST (recherche de séquences par similarité de séquences) que vous trouverez au NCBI (utilisez pour tenter d'identifier des régions codant pour des protéines pouvant expliquer le caractère pathogène de cette souche.

Paramètres pour BLAST :

  • Utiliser blastX (traduit votre séquence nucléique dans les 6 phases pour rechercher dans une banque de séquences protéiques)
  • Database: nr
  • Organism: Escherichia coli O157:H7 (Les symptômes des patients ressemblant fortement à ceux des souches O157:H7, vous commencerez par restreindre la recherche aux protéines de ces souches).

Références