silico.biotoul.fr
 

TD4 Bioanalyse

From silico.biotoul.fr

Revision as of 09:53, 10 September 2016 by Gaulin (Talk | contribs)
Jump to: navigation, search

OBJECTIFS DU TP

   Comprendre le résultat du programme BLAST
   Utiliser un programme d'alignement multiple, et identifier des zones conservées, générer un Logo
   Ecrire une signature protéique (pattern)
   Rechercher dans une banque protéique des séquences qui possèdent cette signature 

Ci-dessous une sélection des sites Internet qui vous seront nécessaires :

  • EBI European Bioinformatics Institute (EMBL, GB)
  • NCBI National Center for Biotechnology Information (NIH, USA)
  • Expasy Expert Protein Analysis System (Swiss Institute of Bioinformatics, Suisse)
  • PBIL Pôle Bio-Informatique Lyonnais (CNRS, Lyon)
  • Phylogeny
  • Génopôle Toulouse


Lors du TD3, vous avez étudiez le gène BCL2 humain. Nous allons maintenant chercher des homologues à ce gène, construire un alignement multiple et une signature protéique.

Exercice 1 : recherche d'homologue avec BlastN

1/ A partir de la séquence de l'ARNm de l'isoforme 1 (NM_000633), lancer un BLASTN contre la banque nr (cochez la case Exclude models XM/XP)
2/ Regardez le résultat du BLAST et répondez aux questions suivantes :

  • pourquoi y a-t-il des lettres en minuscules dans le premier alignement ?
  • combien d'exons composent le gène ?
  • pourquoi la majorité des alignements sont sur la région 5' ?
  • existe-t-il le gène BCL2 chez le poulet ?

3/ Relancer un BLASTN en précisant l'organisme que vous cherchez : quel est le résultat ?
4/ Des alignements avec des E-value >1 vous semblent-ils être de bons alignements ?

En fait, on travaillera plutôt au niveau protéique pour chercher des homologues, pour les raisons déjà vues au TD2 (conservation uniquement des CDS, pas sur les UTR, pas de problème de variation d'usage des codons donc taux d'identité plus élevé, et notion de similarité des acides aminés)

Exercice 2 : recherche de protéines homologues à BCL2 humaine

1/ Récupérer la protéine codée par l'ARNm NM_000633, et utiliser maintenant BLASTP, contre la banque SwissProt 2/ Regardez l'alignement avec la séquence BCL2-like protein 1 de poulet Q07816

  • quelle est la taille de cette séquence ?
  • à quoi correspond le % positives ?
  • combien y a-t-il d'événement d'insertion-délétion ?

3/ Sélectionner les séquences qui vous semblent homologues à notre séquence (prenez une vingtaine de séquences) 4/ Récupérer les séquences en cliquant sur Download 5/ Ouvrez le fichier avec un editeur de texte et renommer les séquences pour avoir des noms courts : changer le nom dans l'entête FASTA, en gardant nom de protéine et de l'organisme, et sans espace (mais des tirets - ou _)

   Vous pouvez garder le nom fourni dans SwissProt. Par exemple :
   >gi|231632|sp|P10415.2|BCL2_HUMAN RecName: Full=Apoptosis regulator Bcl-2
   devient :
   >BCL2_HUMAN