silico.biotoul.fr
 

Bioanalyse TD Analyse de sequences et Biologie Moleculaire

From silico.biotoul.fr

Revision as of 14:46, 13 March 2012 by Gaulin (Talk | contribs)
Jump to: navigation, search

Contents

Introduction

Contexte Scientifique: vous venez d'arriver dans une équipe de recherche travaillant sur le gène BCL2 humain, impliqué dans différents cancers. Une analyse fonctionnelle de BCL2 doit être réalisée afin de mieux comprendre le rôle de la protéine BCL2. Pour cela l'équipe souhaite tout d'abord obtenir un anticorps dirigé contre BCL2. Pour cela il est nécessaire i) d'identifier quel(s) domaine(s) de BCL2 sont les plus appropriés et ii) de produire ce(s) domaine(s) de façon hétérologue dans Escherichia coli, afin d'immuniser des lapins.
L'ensemble des exercices ci-dessous permettront de réaliser ces étapes.

Ci-dessous une sélection des sites Internet qui vous seront également nécessaires au cours des séances:

  • Génopôle Toulouse
  • EBI European Bioinformatics Institute (EMBL, GB)
  • NCBI National Center for Biotechnology Information (NIH, USA)
  • Expasy Expert Protein Analysis System (Swiss Institute of Bioinformatics, Suisse)
  • PBIL Pôle Bio-Informatique Lyonnais (CNRS, Lyon)
  • Institut Pasteur

Exercice 1: Recherche dans les banques

Dans un premier temps, il est nécessaire de récupérer les séquences humaines codant BCL2.

Sur le site du NCBI:

  • Recherchez les protéines codées par le gène BCL2. Combien en avez-vous ? Sélectionnez celles qui proviennent du génome humain.

Vérifiez que ce sont toutes des BCL2 et non des protéines associées à BCL2. Regardez quelques entrées et l’endroit dans la fiche où le nom BCL2 apparaît. Trouvez alors une façon de raffiner la requête.

  • Restreindre les résultats aux séquences de la banque RefSeq.

Vous devez maintenant avoir 2 isoformes NP_000624 et NP_000648.

  • A l’aide des programmes d’alignement de la suite EMBOSS, comparez les séquences protéiques des 2 isoformes. Quelles sont vont conclusions ?

Exercice 2: Analyse d'une séquence protéique

Afin d'appréhender l'organisation structurale et la localisation cellulaire de BCL2, une analyse fine des séquences protéiques est nécessaire.

Allez sur le site d’EXPASy:

  • Qu’est-ce-que le serveur Expasy ? Regardez les outils disponibles dans Proteomics.

Etudiez maintenant la plus longue des 2 séquences précédemment trouvées

  • Utilisez SMART pour cherchez si elle contient des domaines connus : regardez les domaines identifiés, notez leur position.
  • Avec le programme TopPred (cochez la case pour avoir une image), cherchez si la protéine a des domaines membranaires.
  • Trouvez un/des programme(s) pour calculer le Poids moléculaire et le Point isoélectrique de la protéine (dans la catégorie Primary structure analysis)
  • Essayez de prédire les structures secondaires avec GOR (dans la catégorie Primary structure analysis)
  • Testez d’autres programmes de votre choix.
  • Comparez les résultats que vous avez obtenus avec l’annotation présente dans la fiche de la séquence, au format GenPept.

Regardez maintenant l’entrée P10415 sur ExPASY

  • Quelle est cette séquence ? Regardez la partie Features. Que constatez-vous ?
  • Confrontez à nouveau vos résultats avec l’annotation de cette séquence.

Exercice 3 : Synthèse d'une sonde spécifique pour hybrider une banque d'ADNc

Il faut maintenant cloner le domaine d'intérêt de BCL2 pour réaliser la protéine recombinante correspondante en vue d'immuniser un lapin. Le laboratoire dispose d'une banque d'ADNc humaine dans laquelle il est possible de récupérer les clones correspondant à l'ADNc de BCL2. Pour cela, il faut cribler la banque d'ADNc avec une sonde qui s'hybridera de façon spécifique au(x) clone(s) contenant BCL2.

  • En regardant les positions des motifs que vous avez trouvées, quelles parties de la séquence n’appartiennent pas à un domaine ?

Les domaines protéiques peuvent être partagés par d'autres protéines. Donc les régions spécifiques sont plus probablement en dehors des domaines.

  • Parmi celles-ci, laquelle n’est pas commune à l’isoforme de cette protéine ?

Nous allons maintenant extraire la région d'intérêt de la séquence BCL2 pour définir la sonde qui sera utilisée pour cribler la banque ADNc. Pour cela

  • Utilisez le programme ExtractSeq de la suite EMBOSS. pour extraire la région identifiée.
  • Utilisez le programme Backtranseq pour faire la traduction inverse (rubrique Nucleic translation dans EMBOSS). Ce logiciel génère l’ARNm le plus probable en fonction de l’usage des codons, à partir de la protéine.

Nous allons maintenant simuler in silico l’hybridation de cette sonde avec la banque d’ADNc. Pour cela nous allons faire une recherche de similarité contre les séquences d’ARNm humaines.

  • Sur le site du NCBI, aller dans BLAST, puis nucleotide Blast. Collez la séquence, choisissez : dans Database : Reference mRNA sequences et dans Organism : human. Choisissez l'option "Somewhat similar sequences (blastn)". Lancez le BLAST et regardez les résultats : votre sonde est-elle bien spécifique ? (</br>)

Si vous n'avez obtenu qu'une séquence correctement alignée à l'issue du BLAST, de la même façon, dans des conditions de stringence assez forte, l'hybridation de votre sonde se fera préférentiellement sur les clones contenant l'ADNc de BCL2.