silico.biotoul.fr
 

Enseignements

From silico.biotoul.fr

(Difference between revisions)
Jump to: navigation, search
m (BioAnalyse L3 - 2B2M et BCP)
(Bioinformatique pour la Génomique (EMBIA1DM))
Line 139: Line 139:
==== Bioinformatique pour la Génomique (EMBIA1DM) ====
==== Bioinformatique pour la Génomique (EMBIA1DM) ====
-
Supports de cours:
+
'''Supports de cours :'''
* [[Media:Introduction_bio_annotation.pdf|Introduction biologique  (Gwennaele Fichant)]]
* [[Media:Introduction_bio_annotation.pdf|Introduction biologique  (Gwennaele Fichant)]]
* [[Media:Annotation1.pdf|Annotation partie 1 (Gwennaele Fichant)]]
* [[Media:Annotation1.pdf|Annotation partie 1 (Gwennaele Fichant)]]
Line 146: Line 146:
* [[Media:HMM_2015.pdf|Modèle de Markov Caché (HMM) (Gwennaele Fichant)]]
* [[Media:HMM_2015.pdf|Modèle de Markov Caché (HMM) (Gwennaele Fichant)]]
-
Tutoriels de TP:
+
'''Tutoriels de TP :'''
*[[silico:enseignement/m1-bioinfo/BG/TD_annotation/tutorial_annotation_new_NVU.html|Annotation d'un fragment génomique bactérien]]
*[[silico:enseignement/m1-bioinfo/BG/TD_annotation/tutorial_annotation_new_NVU.html|Annotation d'un fragment génomique bactérien]]
*[[silico:enseignement/m1-bioinfo/BG/summary_SignalP.pdf|Petite explication de SignalP]]
*[[silico:enseignement/m1-bioinfo/BG/summary_SignalP.pdf|Petite explication de SignalP]]
*[[silico:enseignement/m1-bioinfo/BG/TD_HMM/TD_HMM.html| design d'un HMM pour prédire les promoteurs sigma A de B. subtilis]]
*[[silico:enseignement/m1-bioinfo/BG/TD_HMM/TD_HMM.html| design d'un HMM pour prédire les promoteurs sigma A de B. subtilis]]
*[[Media:Complement_TD_HMM.pdf|Complément d'information pour réaliser le TD de design du HMM ]]
*[[Media:Complement_TD_HMM.pdf|Complément d'information pour réaliser le TD de design du HMM ]]
 +
 +
'''Contrôle continu :'''
 +
 +
* Rapport de TP sur le design d'un HMM à rendre au plus tard le '''lundi 14 novembre'''. M'envoyer pa courrier le rapport en format pdf ainsi que le fichier en format texte comportant votre modèle avant estimation des probabilités.
 +
 +
* Projet annotation d'un fragment génomique à remettre au plus tard '''le vendredi 9 décembre'''
 +
'''Description du travail à réaliser : '''
 +
Annoter l'un des deux fragments génomiques ci-joint en utilisant les différentes approches vues en cours. Les deux brins direct et complémentaire seront analysés. Intégrer les résultats dans Artemis. Dans le TP Utilisation d'Artemis, vous trouverez le lien pour télécharger le logiciel ainsi que son guide d'utilisation.
 +
Pour intégrer les résultats, il faudra réaliser plusieurs parsers pour mettre les résultats des programmes dans le format GFF compris par Artemis que vous trouverez décrit dans TP Utilisation Artemis : des résultats de GenMark, des résultats de  GenMark.hmm et les résultats de scan_for_matches concernant la prédiction des RBS et donc du codon initiateur, des promoteurs et des terminateurs de transcription. Un seul programme doit pouvoir permettre de parser les différents résultats de scan_for_matches. Comme les programmes à réaliser sont simples, pour vous habituer a utiliser des langages différents, il serait souhaitable que ces parsers soient écrits en Perl en utilisant le petit mémo qui est mis en ligne. La prédiction fonctionnelle sera réalisée ensuite à partir des produits protéiques potentiels déduits de votre annotation. Cette annotation fonctionnelle comprendra la détection de domaines fonctionnels. Votre annotation finale devra être fournie dans un fichier au format EMBL que vous pouvez obtenir en sortie d'Artemis ensuivant le modèle qui vous est fourni en exemple.
 +
Même si la sortie de GenMark.hmm est actuellement disponible au format GFF, je vous demanderai de bien vouloir réaliser le programme qui transforme la sortie LST en format GFF, ceci pour vous entraîner à la programmation.
 +
Je vous demande aussi de me fournir les algorithmes de chacun de vos programmes (cf. ci-dessous rapport)
 +
 +
Envoyer par courrier électronique :
 +
** un rapport écrit qui doit être réalisé individuellement. Ce rapport doit justifier votre démarche et votre raisonnement, présenter les résultats obtenus à chaque étape et leur synthèse. Il devra inclure une image de l'interface d'Artemis. Il devra intégrer les algorithmes des différents parsers.
 +
** Les fichiers de vos programmes
 +
** Le fichier de la séquence annotée en format EMBL
 +
 +
 +
Précision pour le parser des résultats de scan_for_matches (ou Patscan)
 +
 +
Faire un seul programme pour parser les résultats des trois features (RBS, promoteur, terminateur). Pour cela passer en argument le nom de fichier d'entrée, la feature, le nom du fichier de sortie.
 +
 +
Il faut transformer les résultats qui sont du type :
 +
 +
>BS09819:[347,378]
 +
ttgata tttttttgatttttagaatg tatagt
 +
<br>
 +
>BS09819:[1038,1084]
 +
ttgata aatgaactgtgtggtgaatctgctgcatatcaaga tataat
 +
<br>
 +
 +
pour créer le fichier gff ayant le format suivant (chaque colonne est séparée de la suivante par une tabulation) :
 +
 +
nomseq method feature         posgauche      posdroite      .      strand  . note motif <br>
 +
BS09819 Patscan promoter 347 378 . + . note "ttgata tttttttgatttttagaatg tatagt"<br>
 +
BS09819 Patscan promoter 1038 1084 . + . note " ttgata aatgaactgtgtggtgaatctgctgcatatcaaga tataat"<br>
 +

Revision as of 12:22, 21 October 2016

Contents

Licence 2 et 3 Biologie

Bioinformatique - 2B2M (EDSVB4IM), BCP (EDSVA4HM), BOPE (L2 EDSVC4MM, L3 ELSVC6JM)

BioAnalyse L3 - 2B2M et BCP

Licence 3 Biologie des Organismes des populations et Ecosystemes (BOPE)

Du génome à la sélection des plantes (ELSVC5EM)


Master

Master 1

Master 1 - Bioinformatique et Biologie des Systèmes + Biologie Végétale ADAM

Traitement de données biologiques (EMBIA1FM)

Support de cours:

Support de TD/TP:

Liens

Génétique Evolutive et Quantitative (EMBIA1GM)

Support de cours:


Master 1 - Bioinformatique et Biologie des Systèmes + Biotechnologies

Evolution Moléculaire (EMBIA2EM)


Master 1 - Bioinformatique et Biologie des Systèmes


Bioinformatique pour la Génomique (EMBIA1DM)

Supports de cours :

Tutoriels de TP :

Contrôle continu :

  • Rapport de TP sur le design d'un HMM à rendre au plus tard le lundi 14 novembre. M'envoyer pa courrier le rapport en format pdf ainsi que le fichier en format texte comportant votre modèle avant estimation des probabilités.
  • Projet annotation d'un fragment génomique à remettre au plus tard le vendredi 9 décembre

Description du travail à réaliser : Annoter l'un des deux fragments génomiques ci-joint en utilisant les différentes approches vues en cours. Les deux brins direct et complémentaire seront analysés. Intégrer les résultats dans Artemis. Dans le TP Utilisation d'Artemis, vous trouverez le lien pour télécharger le logiciel ainsi que son guide d'utilisation. Pour intégrer les résultats, il faudra réaliser plusieurs parsers pour mettre les résultats des programmes dans le format GFF compris par Artemis que vous trouverez décrit dans TP Utilisation Artemis : des résultats de GenMark, des résultats de GenMark.hmm et les résultats de scan_for_matches concernant la prédiction des RBS et donc du codon initiateur, des promoteurs et des terminateurs de transcription. Un seul programme doit pouvoir permettre de parser les différents résultats de scan_for_matches. Comme les programmes à réaliser sont simples, pour vous habituer a utiliser des langages différents, il serait souhaitable que ces parsers soient écrits en Perl en utilisant le petit mémo qui est mis en ligne. La prédiction fonctionnelle sera réalisée ensuite à partir des produits protéiques potentiels déduits de votre annotation. Cette annotation fonctionnelle comprendra la détection de domaines fonctionnels. Votre annotation finale devra être fournie dans un fichier au format EMBL que vous pouvez obtenir en sortie d'Artemis ensuivant le modèle qui vous est fourni en exemple. Même si la sortie de GenMark.hmm est actuellement disponible au format GFF, je vous demanderai de bien vouloir réaliser le programme qui transforme la sortie LST en format GFF, ceci pour vous entraîner à la programmation. Je vous demande aussi de me fournir les algorithmes de chacun de vos programmes (cf. ci-dessous rapport)

Envoyer par courrier électronique :

    • un rapport écrit qui doit être réalisé individuellement. Ce rapport doit justifier votre démarche et votre raisonnement, présenter les résultats obtenus à chaque étape et leur synthèse. Il devra inclure une image de l'interface d'Artemis. Il devra intégrer les algorithmes des différents parsers.
    • Les fichiers de vos programmes
    • Le fichier de la séquence annotée en format EMBL


Précision pour le parser des résultats de scan_for_matches (ou Patscan)

Faire un seul programme pour parser les résultats des trois features (RBS, promoteur, terminateur). Pour cela passer en argument le nom de fichier d'entrée, la feature, le nom du fichier de sortie.

Il faut transformer les résultats qui sont du type :

>BS09819:[347,378] ttgata tttttttgatttttagaatg tatagt
>BS09819:[1038,1084] ttgata aatgaactgtgtggtgaatctgctgcatatcaaga tataat

pour créer le fichier gff ayant le format suivant (chaque colonne est séparée de la suivante par une tabulation) :

nomseq method feature posgauche posdroite . strand . note motif
BS09819 Patscan promoter 347 378 . + . note "ttgata tttttttgatttttagaatg tatagt"
BS09819 Patscan promoter 1038 1084 . + . note " ttgata aatgaactgtgtggtgaatctgctgcatatcaaga tataat"



Mathématique pour la Biologie (EMBIA1EM)

  • Memento de Régine André-Obrecht
  • TD Calcul matriciel
  • TD ACP
  • TD Modélisation
  • TD Probabilités


Projet 2016-17:

Références

  • Mathématiques pour les Sciences de la vie et de la Terre – C. David, S. Mustapha, F. Viens, N. Capron, edition Dunod


Traitement de graphes et réseaux biologiques (EMBIA1KM)

Supports de cours

Supports de TD/TP:

  • TP Visualisation et parcours en profondeur
  • TP Parcours en largeur et plus court chemin
  • TP Dessin de graphes et initiation à la librairie iGraph
  • TP Recherche de communautés dans les graphes

Projets 2015-16

Liens:

Références

  • Introduction to Algorithms, Corsen, Leiserson and Rivest, MIT Press and McGraw-Hill
  • Detection of Functional Modules From Protein Interaction Networks, Pereira-Leal, Enright and Ozounis, PROTEINS: Structure, Function, and Bioinformatics, 49-57, 2004.
  • An efficient algorithm for large-scale detection of protein families, Enright, Van Dongen and Ozounis, Nucleic Acids Research, 1575-84, 2002 PMID:11917018
  • Kavosh: a new algorithm for finding network motifs, Kashani et al., BMC Bioinformatics, 2009. DOI:10.1186/1471-2105-10-318
  • Pathway discovery in metabolic networks by subgraph extraction, Faust et al., Bioinformatics, 1211-1218, 2010. DOI:10.1093/bioinformatics/btq105

Fouille de données (EMBIA2DM)

Support de cours:

Sujets de TD

  • TD Classification, validation croisée et clustering

Projet


Liens

Références

  • Data Mining: Concepts and Techniques, J. Han and M. Kamber, 2006.
  • GENECODIS: a web-based tool for finding significant concurrent annotations in gene lists, Carmona-Saez et al., Genome Biology, 2007.

Master 1 - MEEF

Sciences de la Vie (EE7BSVFM)

Supports de TD :


Supports de Cours :

Master 2

Master 2 - Bioinformatique et Biologie des Systèmes


UE Communication
liste des publications à présenter en préparation des ateliers:

Chaque publication sera choisie par deux étudiant(e)s. La présentation de la publication est personnelle. Donc chaque personne préparera une présentation powerpoint (ou pdf), diapositives en anglais, de 15 minutes qui sera suivie de 10 minutes de questions. Attention, ne pas oublier de récupérer les supplementary data si il y en a et qu'ils ne vous sont pas fournis et bien entendu de les consulter. La présentation devra faire ressortir la problématique abordée (question posée et contexte), la démarche bioinformatique adoptée, les résultats sous forme synthétisée avec choix pertinent des figures pour illustrer votre propos et la conclusion/discussion.

Calendrier des présentations
EDT présentation des articles (les noms sont donnés pour rappel mais ordre de passage indifférent)
lundi 10 octobre 9h30-10h30 : article Atelier Modélisation Moléculaire (Alexandra, Soukaïna))
lundi 10 octobre 10h30-11h45 : (pause de 11h à 11h15) article Atelier Biologie des Systèmes (Leila, Raphael)
lundi 10 octobre 11h45-12h35 : article Atelier Génome (David, Adrien)
lundi 10 octobre 14h30-17h : articles Atelier ChipSeq (Emilie, Laurent,Léa,Thomas)
Intégration de Données Hétérogènes - Partie R. Barriot
Biologie des Systèmes - G. Fichant

Support de cours:


Master 2 - ADAM (Adaptation, Développement et Amélioration des plantes en présence de Microorganismes)

Biologie Computationnelle

Documents, partie E. Gaulin


Examen 2016, partie E. Gaulin

Documents, partie C. Mathé

Documents, partie C. Albenne

F.A.Q.

  • Installation de igraph sur CentOS 6.7 en P0

Sous R, l'installation d'igraph échoue avec le protocole https, il faut donc choisir un mirroir avec le protocol http : choseCRANmirror() dernier choix (http mirrors) puis Lyon2

R> chooseCRANmirror()
R> install.packages('igraph')


  • Installation de Rstudio sur CentOS 6.7 en P0

La dernière version de Rstudio desktop ne fonctionne pas pour CentOS6.7 (nécessite des librairies plus récentes). Il faut donc télécharger et installer la version serveur :

# Dans un terminal, passer root (super-utilisateur)
bash> su
# puis les commandes ci-dessous (sans le "root>")
root> wget https://download2.rstudio.org/rstudio-server-rhel-0.99.892-x86_64.rpm
root> yum install --nogpgcheck rstudio-server-rhel-0.99.892-x86_64.rpm

Ensuite, on accède à l'interface avec le navigateur : http://localhost:8787 avec un compte de la machine (normalement le compte guest)