silico.biotoul.fr
 

Atelier Phylogénomique Prokka

From silico.biotoul.fr

(Difference between revisions)
Jump to: navigation, search
m (Automatisation des annotations prokka sur l'ensemble des génomes)
m (Visualisation des annotations)
 
Line 69: Line 69:
</pre>
</pre>
-->
-->
 +
 +
----
 +
*[http://silico.biotoul.fr/p/Atelier_Phylog%C3%A9nomique#Prokka Atelier de Phylogénomique Prokka]

Current revision as of 16:20, 15 October 2021

Contents

Liens

Introduction

Les réplicons des génomes sont annotés avec le logiciel prokka.

prokka files.

Question 1.1:
Pourquoi pensez-vous qu'il soit nécessaire d'annoter les génomes téléchargés du NCBI?
Quelles sont les annotations réalisées par Prokka?
Quels sont les logiciels utilisés pour réaliser ces annotations ?

Exemple d'utilisation

Nous allons créer un répertoire pour les résultats de prokka et chercher la dernière version disponible de prokka sur le serveur.

mkdir -p ~/work/Prochlorococcus/prokka

search_module prokka
srun --pty bash
module load bioinfo/prokka-1.14.5
prokka  /home/formation/public_html/M2_Phylogenomique/data/Prochlorococcus/DNA/Aaaa.fas  --outdir ~/work/Prochlorococcus/prokka/Aaaa --compliant --addgenes --prefix Aaaa  --locustag Aaaa.g --genus Prochlorococcus --species 'Prochlorococcus marinus subsp. marinus' --strain CCMP1375 --kingdom Bacteria --cpus 2

Le programme génère plusieurs fichiers pour chaque réplicon (~/work/Prochlorococcus/prokka/Aaaa), dont:

Automatisation des annotations prokka sur l'ensemble des génomes

Les informations sur les génomes sont disponibles dans le fichier : species_strain_names.txt. Ce fichier est lu par le script Perl prokka_loop.pl pour compléter les paramètres de prokka pour chaque génome (--prefix, --locustag, --genus, --species, --strain and --kingdom).

Le script prokka_loop.pl doit être lancé sur le serveur genologin. Il distribue prokka sur les noeuds avec sbatch.

cd ~/work/Prochlorococcus
~/work/scripts/prokka_loop.pl --sample Prochlorococcus

squeue -l -u $USER

Une fois les jobs terminés, vérifiez que les fichiers de sortie de prokka existent et ne sont pas vides.

ls -l ~/work/Prochlorococcus/prokka/Aaa*/*.faa

Les fichiers avec le suffixe .err renferment la sortie standard de prokka. Si tout s'est bien passé, vous pouvez supprimer les fichiers .err et .sh.

Question 1.2:
Comparez le nombre de gènes obtenus avec ceux reportés dans la publication (Table 1) et commentez les différences observées.
Comment faire pour comparer les annotations de prokka avec celles des fichiers GenBank?
Pensez-vous que prokka soit la meilleure méthode d'annotation? 
Comment pourriez-vous faire pour évaluer les performances des différentes méthodes d'annotation des génomes?

Visualisation des annotations

Nous pouvons utiliser le logiciel art (Artemis) pour visualiser les annotations des génomes:

Il est fortement recommandé d'utiliser ce logiciel en local sur votre poste de travail.