Atelier Phylogénomique Blast
From silico.biotoul.fr
(Difference between revisions)
m (→Boucle sur les génomes) |
m |
||
(One intermediate revision not shown) | |||
Line 28: | Line 28: | ||
MSK | MSK | ||
+ | <!-- | ||
<syntaxhighlight lang="bash"> | <syntaxhighlight lang="bash"> | ||
for i in ~/work/Prochlorococcus/peptide/*.faa; | for i in ~/work/Prochlorococcus/peptide/*.faa; | ||
Line 43: | Line 44: | ||
ll /home/yquentin/work/Prochlorococcus/peptide/*.faa.* | ll /home/yquentin/work/Prochlorococcus/peptide/*.faa.* | ||
</pre> | </pre> | ||
+ | --> | ||
<!-- | <!-- | ||
====Intra genomes==== | ====Intra genomes==== | ||
Line 80: | Line 82: | ||
MSK | MSK | ||
+ | <!-- | ||
<syntaxhighlight lang="bash"> | <syntaxhighlight lang="bash"> | ||
evalue=1e-5 | evalue=1e-5 | ||
Line 99: | Line 102: | ||
<pre style="color:blue;white-space: pre-wrap;white-space: -moz-pre-wrap;white-space: -pre-wrap;white-space: -o-pre-wrap"> | <pre style="color:blue;white-space: pre-wrap;white-space: -moz-pre-wrap;white-space: -pre-wrap;white-space: -o-pre-wrap"> | ||
sarray -J mkdb -o %j.out -e %j.err -t 01:00:00 --cpus-per-task=1 blast_allall.sh | sarray -J mkdb -o %j.out -e %j.err -t 01:00:00 --cpus-per-task=1 blast_allall.sh | ||
- | squeue -l -u | + | squeue -l -u $USER |
</pre> | </pre> | ||
+ | --> | ||
<!-- | <!-- | ||
Pour les blastp inter génomes, nous allons utiliser un script similaire au précédent, mais avec une double boucle (sur -query et -db). | Pour les blastp inter génomes, nous allons utiliser un script similaire au précédent, mais avec une double boucle (sur -query et -db). | ||
Line 107: | Line 111: | ||
~/work/scripts/blastp_inter.pl | ~/work/scripts/blastp_inter.pl | ||
- | squeue -l -u | + | squeue -l -u $USER |
ls BlastP | wc -l | ls BlastP | wc -l |
Revision as of 10:20, 26 November 2021
Contents |
Liens
Préliminaires
Question 1.5: Selon vous qu'est-ce qui guide le choix du type de séquences à utiliser dans les comparaisons (peptides ou nucléotidiques)?
Blast All-All
Nous allons utiliser NCBI_Blast+.
Nous allons copier les fichiers peptides dans un répertoire de travail:
mkdir -p ~/work/Prochlorococcus/peptide cp ~/work/Prochlorococcus/prokka/Aaa*/*.faa ~/work/Prochlorococcus/peptide/. ls -l ~/work/Prochlorococcus/peptide
make blast database
Exemple:
search_module blast module load bioinfo/ncbi-blast-2.7.1+ srun -n1 -l makeblastdb -in Aaaa.faa -dbtype prot
Vous allez procéder comme précédemment, avec un script donné à sarray, pour réaliser le makeblastdb sur tous les fichiers.
MSK
Paire de genomes
mkdir -p ~/work/Prochlorococcus/BlastP
Exemple :
module load bioinfo/ncbi-blast-2.7.1+ srun -n1 -l blastp -query ~/work/Prochlorococcus/peptide/Aaaa.faa -db ~/work/Prochlorococcus/peptide/Aaaa.faa -seg yes -dbsize 100000000 -evalue 1e-5 -outfmt 6 -num_threads 1 -out ~/work/Prochlorococcus/BlastP/Aaaa_Aaaa.tab
Question 1.6: Explicitez et justifiez les paramètres de blast utilisés dans votre script.
Boucle sur les génomes
Utilisez sarray pour réaliser les blast en toutes les paires de génomes.
MSK vérifiez que les fichiers de sorties de blast sont présents et non vides.
Question 1.7: Combien de fichiers attendez-vous?