Atelier Phylogénomique Blast
From silico.biotoul.fr
(Difference between revisions)
m (→Blast All-All) |
m (→Boucle sur les génomes) |
||
(4 intermediate revisions not shown) | |||
Line 19: | Line 19: | ||
====make blast database==== | ====make blast database==== | ||
Exemple: | Exemple: | ||
- | < | + | <source lang='bash'> |
search_module blast | search_module blast | ||
module load bioinfo/ncbi-blast-2.7.1+ | module load bioinfo/ncbi-blast-2.7.1+ | ||
srun -n1 -l makeblastdb -in Aaaa.faa -dbtype prot | srun -n1 -l makeblastdb -in Aaaa.faa -dbtype prot | ||
- | </ | + | </source> |
Vous allez procéder comme précédemment, avec un script donné à ''sarray'', pour réaliser le makeblastdb sur tous les fichiers. | Vous allez procéder comme précédemment, avec un script donné à ''sarray'', pour réaliser le makeblastdb sur tous les fichiers. | ||
MSK | MSK | ||
- | |||
<syntaxhighlight lang="bash"> | <syntaxhighlight lang="bash"> | ||
for i in ~/work/Prochlorococcus/peptide/*.faa; | for i in ~/work/Prochlorococcus/peptide/*.faa; | ||
Line 38: | Line 37: | ||
</syntaxhighlight> | </syntaxhighlight> | ||
- | < | + | <source lang='bash'>sarray -J mkdb -o %j.out -e %j.err -t 01:00:00 --cpus-per-task=1 makeblastdb.sh |
- | sarray -J mkdb -o %j.out -e %j.err -t 01:00:00 --cpus-per-task=1 makeblastdb.sh | + | |
squeue -l -u $USER | squeue -l -u $USER | ||
ll /home/yquentin/work/Prochlorococcus/peptide/*.faa.* | ll /home/yquentin/work/Prochlorococcus/peptide/*.faa.* | ||
- | </ | + | </source> |
- | + | ||
<!-- | <!-- | ||
====Intra genomes==== | ====Intra genomes==== | ||
Nous vous proposons un script perl pour réaliser les ''blastp'' de l'ensemble des génomes avec '''sbatch''': | Nous vous proposons un script perl pour réaliser les ''blastp'' de l'ensemble des génomes avec '''sbatch''': | ||
- | < | + | <source lang='bash'>mkdir -p ~/work/Prochlorococcus/BlastP |
- | mkdir -p ~/work/Prochlorococcus/BlastP | + | |
~/work/scripts/blastp_intra.pl | ~/work/scripts/blastp_intra.pl | ||
Line 56: | Line 53: | ||
ls BlastP | wc -l | ls BlastP | wc -l | ||
- | </ | + | </source> |
<pre style="color:red;white-space: pre-wrap;white-space: -moz-pre-wrap;white-space: -pre-wrap;white-space: -o-pre-wrap"> | <pre style="color:red;white-space: pre-wrap;white-space: -moz-pre-wrap;white-space: -pre-wrap;white-space: -o-pre-wrap"> | ||
Question 1.6: | Question 1.6: | ||
Line 65: | Line 62: | ||
====Paire de genomes==== | ====Paire de genomes==== | ||
- | < | + | <source lang='bash'> |
mkdir -p ~/work/Prochlorococcus/BlastP | mkdir -p ~/work/Prochlorococcus/BlastP | ||
- | </ | + | </source> |
Exemple : | Exemple : | ||
- | < | + | <source lang='bash'> |
module load bioinfo/ncbi-blast-2.7.1+ | module load bioinfo/ncbi-blast-2.7.1+ | ||
srun -n1 -l blastp -query ~/work/Prochlorococcus/peptide/Aaaa.faa -db ~/work/Prochlorococcus/peptide/Aaaa.faa -seg yes -dbsize 100000000 -evalue 1e-5 -outfmt 6 -num_threads 1 -out ~/work/Prochlorococcus/BlastP/Aaaa_Aaaa.tab | srun -n1 -l blastp -query ~/work/Prochlorococcus/peptide/Aaaa.faa -db ~/work/Prochlorococcus/peptide/Aaaa.faa -seg yes -dbsize 100000000 -evalue 1e-5 -outfmt 6 -num_threads 1 -out ~/work/Prochlorococcus/BlastP/Aaaa_Aaaa.tab | ||
- | </ | + | </source> |
<pre style="color:red;white-space: pre-wrap;white-space: -moz-pre-wrap;white-space: -pre-wrap;white-space: -o-pre-wrap"> | <pre style="color:red;white-space: pre-wrap;white-space: -moz-pre-wrap;white-space: -pre-wrap;white-space: -o-pre-wrap"> | ||
Question 1.6: | Question 1.6: | ||
Line 82: | Line 79: | ||
MSK | MSK | ||
- | |||
<syntaxhighlight lang="bash"> | <syntaxhighlight lang="bash"> | ||
evalue=1e-5 | evalue=1e-5 | ||
Line 100: | Line 96: | ||
</syntaxhighlight> | </syntaxhighlight> | ||
- | < | + | <source lang='bash'> |
sarray -J mkdb -o %j.out -e %j.err -t 01:00:00 --cpus-per-task=1 blast_allall.sh | sarray -J mkdb -o %j.out -e %j.err -t 01:00:00 --cpus-per-task=1 blast_allall.sh | ||
squeue -l -u $USER | squeue -l -u $USER | ||
- | </ | + | </source> |
- | + | ||
<!-- | <!-- | ||
Pour les blastp inter génomes, nous allons utiliser un script similaire au précédent, mais avec une double boucle (sur -query et -db). | Pour les blastp inter génomes, nous allons utiliser un script similaire au précédent, mais avec une double boucle (sur -query et -db). | ||
Line 123: | Line 118: | ||
---- | ---- | ||
- | *[http://silico.biotoul.fr/p/Atelier_Phylog%C3%A9nomique#Pr.C3.A9liminaires Atelier de Phylogénomique | + | *retour à [http://silico.biotoul.fr/p/Atelier_Phylog%C3%A9nomique#Pr.C3.A9liminaires Atelier de Phylogénomique] |
Current revision as of 16:02, 30 November 2022
Contents |
Liens
- retour à Atelier de Phylogénomique
Préliminaires
Question 1.5: Selon vous qu'est-ce qui guide le choix du type de séquences à utiliser dans les comparaisons (peptides ou nucléotidiques)?
Blast All-All
Nous allons utiliser NCBI_Blast+.
Nous allons copier les fichiers peptides dans un répertoire de travail:
mkdir -p ~/work/Prochlorococcus/peptide cp ~/work/Prochlorococcus/prokka/Aaa*/*.faa ~/work/Prochlorococcus/peptide/. ls -l ~/work/Prochlorococcus/peptide
make blast database
Exemple:
search_module blast module load bioinfo/ncbi-blast-2.7.1+ srun -n1 -l makeblastdb -in Aaaa.faa -dbtype prot
Vous allez procéder comme précédemment, avec un script donné à sarray, pour réaliser le makeblastdb sur tous les fichiers.
MSK
for i in ~/work/Prochlorococcus/peptide/*.faa; do echo "module load bioinfo/ncbi-blast-2.7.1+; makeblastdb -in $i -dbtype prot;" done > makeblastdb.sh cat makeblastdb.sh
sarray -J mkdb -o %j.out -e %j.err -t 01:00:00 --cpus-per-task=1 makeblastdb.sh squeue -l -u $USER ll /home/yquentin/work/Prochlorococcus/peptide/*.faa.*
Paire de genomes
mkdir -p ~/work/Prochlorococcus/BlastP
Exemple :
module load bioinfo/ncbi-blast-2.7.1+ srun -n1 -l blastp -query ~/work/Prochlorococcus/peptide/Aaaa.faa -db ~/work/Prochlorococcus/peptide/Aaaa.faa -seg yes -dbsize 100000000 -evalue 1e-5 -outfmt 6 -num_threads 1 -out ~/work/Prochlorococcus/BlastP/Aaaa_Aaaa.tab
Question 1.6: Explicitez et justifiez les paramètres de blast utilisés dans votre script.
Boucle sur les génomes
Utilisez sarray pour réaliser les blast en toutes les paires de génomes.
MSK
evalue=1e-5 dbsize=100000000 for i in ~/work/Prochlorococcus/peptide/*.faa; do ip=$(basename $i .faa) for j in ~/work/Prochlorococcus/peptide/*.faa; do jp=$(basename $j .faa) outfile="~/work/Prochlorococcus/BlastP/"$ip"_"$jp".tab" echo "module load bioinfo/ncbi-blast-2.7.1+; blastp -query $i -db $j -seg yes -dbsize $dbsize -evalue $evalue -outfmt 6 -num_threads 1 -out $outfile;" done done > blast_allall.sh cat blast_allall.sh
sarray -J mkdb -o %j.out -e %j.err -t 01:00:00 --cpus-per-task=1 blast_allall.sh squeue -l -u $USER
vérifiez que les fichiers de sorties de blast sont présents et non vides.
Question 1.7: Combien de fichiers attendez-vous?
- retour à Atelier de Phylogénomique