silico.biotoul.fr
 

Atelier Phylogénomique Prokka

From silico.biotoul.fr

Revision as of 10:11, 30 November 2022 by Quentin (Talk | contribs)
(diff) ← Older revision | Current revision (diff) | Newer revision → (diff)
Jump to: navigation, search

Contents

Liens

Introduction

Les réplicons des génomes sont annotés avec le logiciel prokka.

SG MSK

Question 1.1:
Pourquoi pensez-vous qu'il soit nécessaire d'annoter les génomes téléchargés du NCBI?
Quelles sont les annotations réalisées par Prokka?
Quels sont les logiciels utilisés pour réaliser ces annotations ?

Exemple d'utilisation

Nous allons créer un répertoire pour les résultats de prokka et chercher la dernière version disponible de prokka sur le serveur.

mkdir -p ~/work/Prochlorococcus/prokka
 
search_module prokka
srun --pty bash
module load bioinfo/prokka-1.14.5
prokka  /home/formation/public_html/M2_Phylogenomique/data/Prochlorococcus/DNA/Aaaa.fas  --outdir ~/work/Prochlorococcus/prokka/Aaaa --compliant --addgenes --prefix Aaaa  --locustag Aaaa.g --genus Prochlorococcus --species 'Prochlorococcus marinus subsp. marinus' --strain CCMP1375 --kingdom Bacteria --cpus 2

À la fin du programme, déconnectez-vous du nœud (exit) pour revenir au frontal genologin2.

Le programme génère plusieurs fichiers pour chaque réplicon (~/work/Prochlorococcus/prokka/Aaaa), dont:

N'oubliez pas de synchroniser les répertoires de genotoul et de votre poste de travail.

rsync --archive --itemize-changes --stats -h -e ssh <user>@genologin.toulouse.inra.fr:/home/<user>/work/Prochlorococcus work

Automatisation des annotations prokka sur l'ensemble des génomes

Les informations sur les génomes sont disponibles dans le fichier : species_strain_names.txt. Ce fichier est lu par le script Perl prokka_loop.pl pour compléter les paramètres de prokka pour chaque génome (--prefix, --locustag, --genus, --species, --strain and --kingdom).

Le script prokka_loop.pl doit être lancé sur le serveur genologin. Il distribue prokka sur les noeuds avec sbatch.

cd ~/work/Prochlorococcus
~/work/scripts/prokka_loop.pl --sample Prochlorococcus
 
squeue -l -u $USER

Une fois les jobs terminés, vérifiez que les fichiers de sortie de prokka existent et ne sont pas vides.

ls -l ~/work/Prochlorococcus/prokka/Aaa*/*.txt

Les fichiers avec le suffixe .err renferment la sortie standard de prokka. Si tout s'est bien passé, vous pouvez supprimer les fichiers .err et .sh.

Question 1.2:
Comparez le nombre de gènes obtenus avec ceux reportés dans la publication (Table 1) et commentez les différences observées.
Comment faire pour comparer les annotations de prokka avec celles des fichiers GenBank?
Pensez-vous que prokka soit la meilleure méthode d'annotation? 
Comment pourriez-vous faire pour évaluer les performances des différentes méthodes d'annotation des génomes?

Visualisation des annotations

Nous pouvons utiliser le logiciel art (Artemis) pour visualiser les annotations des génomes (fichiers .gbk).

Il est fortement recommandé d'utiliser ce logiciel en local sur votre poste de travail.