silico.biotoul.fr
 

Atelier Phylogénomique Blast

From silico.biotoul.fr

(Difference between revisions)
Jump to: navigation, search
m
m (Boucle sur les génomes)
 
(6 intermediate revisions not shown)
Line 1: Line 1:
==Liens==
==Liens==
-
*[http://silico.biotoul.fr/p/Atelier_Phylog%C3%A9nomique#Pr.C3.A9liminaires Atelier de Phylogénomique Blast All-vs-All]
+
*retour à [http://silico.biotoul.fr/p/Atelier_Phylog%C3%A9nomique#Pr.C3.A9liminaires Atelier de Phylogénomique]
==Préliminaires==
==Préliminaires==
Line 11: Line 11:
Nous allons copier les fichiers peptides dans un répertoire de travail:
Nous allons copier les fichiers peptides dans un répertoire de travail:
-
<pre style="color:blue;white-space: pre-wrap;white-space: -moz-pre-wrap;white-space: -pre-wrap;white-space: -o-pre-wrap">
+
<source lang='bash'>
mkdir -p ~/work/Prochlorococcus/peptide
mkdir -p ~/work/Prochlorococcus/peptide
cp ~/work/Prochlorococcus/prokka/Aaa*/*.faa ~/work/Prochlorococcus/peptide/.
cp ~/work/Prochlorococcus/prokka/Aaa*/*.faa ~/work/Prochlorococcus/peptide/.
ls -l ~/work/Prochlorococcus/peptide
ls -l ~/work/Prochlorococcus/peptide
-
</pre>
+
</source>
====make blast database====
====make blast database====
Exemple:
Exemple:
-
<pre style="color:green;white-space: pre-wrap;white-space: -moz-pre-wrap;white-space: -pre-wrap;white-space: -o-pre-wrap">
+
<source lang='bash'>
search_module blast
search_module blast
module load bioinfo/ncbi-blast-2.7.1+
module load bioinfo/ncbi-blast-2.7.1+
srun -n1 -l makeblastdb -in Aaaa.faa -dbtype prot
srun -n1 -l makeblastdb -in Aaaa.faa -dbtype prot
-
</pre>
+
</source>
Vous allez procéder comme précédemment, avec un script donné à ''sarray'', pour réaliser le makeblastdb sur tous les fichiers.
Vous allez procéder comme précédemment, avec un script donné à ''sarray'', pour réaliser le makeblastdb sur tous les fichiers.
MSK
MSK
-
<!--
 
<syntaxhighlight lang="bash">
<syntaxhighlight lang="bash">
for i in ~/work/Prochlorococcus/peptide/*.faa;  
for i in ~/work/Prochlorococcus/peptide/*.faa;  
Line 38: Line 37:
</syntaxhighlight>
</syntaxhighlight>
-
<pre style="color:blue;white-space: pre-wrap;white-space: -moz-pre-wrap;white-space: -pre-wrap;white-space: -o-pre-wrap">
+
<source lang='bash'>sarray -J mkdb -o %j.out -e %j.err -t 01:00:00 --cpus-per-task=1 makeblastdb.sh
-
sarray -J mkdb -o %j.out -e %j.err -t 01:00:00 --cpus-per-task=1 makeblastdb.sh
+
squeue -l -u $USER
squeue -l -u $USER
ll /home/yquentin/work/Prochlorococcus/peptide/*.faa.*
ll /home/yquentin/work/Prochlorococcus/peptide/*.faa.*
-
</pre>
+
</source>
-
-->
+
 
<!--
<!--
====Intra genomes====
====Intra genomes====
Nous vous proposons un script perl pour réaliser les ''blastp'' de l'ensemble des génomes avec '''sbatch''':
Nous vous proposons un script perl pour réaliser les ''blastp'' de l'ensemble des génomes avec '''sbatch''':
-
<pre style="color:blue;white-space: pre-wrap;white-space: -moz-pre-wrap;white-space: -pre-wrap;white-space: -o-pre-wrap">
+
<source lang='bash'>mkdir -p ~/work/Prochlorococcus/BlastP
-
mkdir -p ~/work/Prochlorococcus/BlastP
+
~/work/scripts/blastp_intra.pl
~/work/scripts/blastp_intra.pl
Line 56: Line 53:
ls BlastP | wc -l
ls BlastP | wc -l
-
</pre>
+
</source>
<pre style="color:red;white-space: pre-wrap;white-space: -moz-pre-wrap;white-space: -pre-wrap;white-space: -o-pre-wrap">
<pre style="color:red;white-space: pre-wrap;white-space: -moz-pre-wrap;white-space: -pre-wrap;white-space: -o-pre-wrap">
Question 1.6:
Question 1.6:
Line 65: Line 62:
====Paire de genomes====
====Paire de genomes====
-
<pre style="color:blue;white-space: pre-wrap;white-space: -moz-pre-wrap;white-space: -pre-wrap;white-space: -o-pre-wrap">
+
<source lang='bash'>
mkdir -p ~/work/Prochlorococcus/BlastP
mkdir -p ~/work/Prochlorococcus/BlastP
-
</pre>
+
</source>
Exemple :  
Exemple :  
-
<pre style="color:green;white-space: pre-wrap;white-space: -moz-pre-wrap;white-space: -pre-wrap;white-space: -o-pre-wrap">
+
<source lang='bash'>
module load bioinfo/ncbi-blast-2.7.1+
module load bioinfo/ncbi-blast-2.7.1+
srun -n1 -l blastp -query ~/work/Prochlorococcus/peptide/Aaaa.faa -db ~/work/Prochlorococcus/peptide/Aaaa.faa -seg yes -dbsize 100000000 -evalue 1e-5 -outfmt 6 -num_threads 1 -out ~/work/Prochlorococcus/BlastP/Aaaa_Aaaa.tab
srun -n1 -l blastp -query ~/work/Prochlorococcus/peptide/Aaaa.faa -db ~/work/Prochlorococcus/peptide/Aaaa.faa -seg yes -dbsize 100000000 -evalue 1e-5 -outfmt 6 -num_threads 1 -out ~/work/Prochlorococcus/BlastP/Aaaa_Aaaa.tab
-
</pre>
+
</source>
<pre style="color:red;white-space: pre-wrap;white-space: -moz-pre-wrap;white-space: -pre-wrap;white-space: -o-pre-wrap">
<pre style="color:red;white-space: pre-wrap;white-space: -moz-pre-wrap;white-space: -pre-wrap;white-space: -o-pre-wrap">
Question 1.6:
Question 1.6:
Line 82: Line 79:
MSK
MSK
-
<!--
 
<syntaxhighlight lang="bash">
<syntaxhighlight lang="bash">
evalue=1e-5
evalue=1e-5
Line 100: Line 96:
</syntaxhighlight>
</syntaxhighlight>
-
<pre style="color:blue;white-space: pre-wrap;white-space: -moz-pre-wrap;white-space: -pre-wrap;white-space: -o-pre-wrap">
+
<source lang='bash'>
sarray -J mkdb -o %j.out -e %j.err -t 01:00:00 --cpus-per-task=1 blast_allall.sh
sarray -J mkdb -o %j.out -e %j.err -t 01:00:00 --cpus-per-task=1 blast_allall.sh
squeue -l -u $USER
squeue -l -u $USER
-
</pre>
+
</source>
-
-->
+
<!--
<!--
Pour les blastp inter génomes, nous allons utiliser un script similaire au précédent, mais avec une double boucle (sur -query et -db).
Pour les blastp inter génomes, nous allons utiliser un script similaire au précédent, mais avec une double boucle (sur -query et -db).
Line 123: Line 118:
----
----
-
*[http://silico.biotoul.fr/p/Atelier_Phylog%C3%A9nomique#Pr.C3.A9liminaires Atelier de Phylogénomique Blast All-vs-All]
+
*retour à [http://silico.biotoul.fr/p/Atelier_Phylog%C3%A9nomique#Pr.C3.A9liminaires Atelier de Phylogénomique]

Current revision as of 16:02, 30 November 2022

Contents

Liens

Préliminaires

Question 1.5:
Selon vous qu'est-ce qui guide le choix du type de séquences à utiliser dans les comparaisons (peptides ou nucléotidiques)?

Blast All-All

Nous allons utiliser NCBI_Blast+.

Nous allons copier les fichiers peptides dans un répertoire de travail:

mkdir -p ~/work/Prochlorococcus/peptide
cp ~/work/Prochlorococcus/prokka/Aaa*/*.faa ~/work/Prochlorococcus/peptide/.
 
ls -l ~/work/Prochlorococcus/peptide

make blast database

Exemple:

search_module blast
 
module load bioinfo/ncbi-blast-2.7.1+
srun -n1 -l makeblastdb -in Aaaa.faa -dbtype prot

Vous allez procéder comme précédemment, avec un script donné à sarray, pour réaliser le makeblastdb sur tous les fichiers.

MSK

for i in ~/work/Prochlorococcus/peptide/*.faa; 
do      
  echo "module load bioinfo/ncbi-blast-2.7.1+; makeblastdb -in $i  -dbtype prot;" 
done > makeblastdb.sh
 
cat makeblastdb.sh
sarray -J mkdb -o %j.out -e %j.err -t 01:00:00 --cpus-per-task=1 makeblastdb.sh
squeue -l -u $USER
 
ll /home/yquentin/work/Prochlorococcus/peptide/*.faa.*


Paire de genomes

mkdir -p ~/work/Prochlorococcus/BlastP

Exemple :

module load bioinfo/ncbi-blast-2.7.1+
srun -n1 -l blastp -query ~/work/Prochlorococcus/peptide/Aaaa.faa -db ~/work/Prochlorococcus/peptide/Aaaa.faa -seg yes -dbsize 100000000 -evalue 1e-5 -outfmt 6 -num_threads 1 -out ~/work/Prochlorococcus/BlastP/Aaaa_Aaaa.tab
Question 1.6:
Explicitez et justifiez les paramètres de blast utilisés dans votre script.

Boucle sur les génomes

Utilisez sarray pour réaliser les blast en toutes les paires de génomes.

MSK

evalue=1e-5
dbsize=100000000
for i in ~/work/Prochlorococcus/peptide/*.faa; 
do 
  ip=$(basename $i .faa)     
  for j in ~/work/Prochlorococcus/peptide/*.faa;   
  do
    jp=$(basename $j .faa)     
    outfile="~/work/Prochlorococcus/BlastP/"$ip"_"$jp".tab"
    echo "module load bioinfo/ncbi-blast-2.7.1+; blastp -query $i -db $j -seg yes -dbsize $dbsize -evalue $evalue -outfmt 6 -num_threads 1 -out $outfile;" 
  done
done > blast_allall.sh
 
cat blast_allall.sh
sarray -J mkdb -o %j.out -e %j.err -t 01:00:00 --cpus-per-task=1 blast_allall.sh
squeue -l -u $USER

vérifiez que les fichiers de sorties de blast sont présents et non vides.

Question 1.7:
Combien de fichiers attendez-vous?