Enseignements
From silico.biotoul.fr
m |
m (→Fouille de données (EMBIA2DM): comment planning + lien neural net en R) |
||
Line 220: | Line 220: | ||
==== Fouille de données (EMBIA2DM) ==== | ==== Fouille de données (EMBIA2DM) ==== | ||
- | + | <!-- | |
{| class="wikitable" | {| class="wikitable" | ||
!colspan="2"| Planning 2015-2016 | !colspan="2"| Planning 2015-2016 | ||
Line 260: | Line 260: | ||
| Einstein CM7 Règles d'associations | | Einstein CM7 Règles d'associations | ||
|} | |} | ||
- | + | --> | |
'''Support de cours:''' | '''Support de cours:''' | ||
* [[Media:Data Mining - Intro.pdf|Introduction et Généralités]] | * [[Media:Data Mining - Intro.pdf|Introduction et Généralités]] | ||
Line 285: | Line 285: | ||
** [http://www.kdnuggets.com/2010/12/book-mining-massive-datasets.html Book: Mining of Massive Datasets (free download)] | ** [http://www.kdnuggets.com/2010/12/book-mining-massive-datasets.html Book: Mining of Massive Datasets (free download)] | ||
** [http://www.kdnuggets.com/2016/08/10-algorithms-machine-learning-engineers.html The 10 Algorithms Machine Learning Engineers Need to Know] | ** [http://www.kdnuggets.com/2016/08/10-algorithms-machine-learning-engineers.html The 10 Algorithms Machine Learning Engineers Need to Know] | ||
+ | ** [http://www.kdnuggets.com/2016/08/begineers-guide-neural-networks-r.html Réseau de neurones avec R présenté très simplement] | ||
* [http://kdd.ics.uci.edu/ UCI KDD Archive] (datasets) | * [http://kdd.ics.uci.edu/ UCI KDD Archive] (datasets) | ||
* mloss (machine learning open source software) http://mloss.org | * mloss (machine learning open source software) http://mloss.org |
Revision as of 12:51, 24 August 2016
Contents |
Licence
Licence 2
Biologie - BCP, 2B2M, Ecologie : Bioinformatique
Licence 3
Biologie - BCP et 2B2M : Bioanalyse (codes)
Supports de cours :
- Introduction
- banques et bases de données biologiques
- Alignement de deux séquences d'acides nucléiques
- Alignement de deux séquences protéiques
- Recherche par similarité dans les banques de données : la suite Blast
- Alignement multiple
- Motifs et profils
- Introduction évolution moléculaire
Correction du sujet de contrôle continu 2016 :
Annales :
- exemple de sujet de contrôle continu 2012
- correction du sujet de contrôle continu du 6 mars 2012
- exemple de sujet de contrôle terminal
- correction du sujet de contrôle terminal de janvier 2009
- un autre exemple de problème de contrôle terminal
Supports de TD :
- TD1 : Interrogation des banques de données
- TD2 : Comparaison de deux séquences
- TD3 : Analyse de séquences et Biologie Moléculaire
- TD4 : Analyse évolutive de la RNase J
Master
Master 1
Master 1 - Bioinformatique et Biologie des Systèmes + Biologie Végétale ADAM
Traitement de données biologiques (EMBIA1FM)
Support de cours:
Support de TD:
- Introduction à R
- Tests
- Tests et ANOVA
- Analyses mutivariées
- TD Transcriptome : Gènes différentiellement exprimés avec R/Bioconductor
- TD Transcriptome : clustering de profils d'expression
Liens
- Contrôle continu de 2011 avec son corrigé CC 2011 et correction.zip
- Aide mémoire des commandes R
- http://www.rdocumentation.org/ Toute l'aide des librairies R (avec recherche)
- http://www.datamind.org Apprendre R en ligne
Evolution Moléculaire (EMBIA2EM)
Master 1 - Bioinformatique et Biologie des Systèmes
Bioinformatique pour la Génomique (EMBIA1DM)
- Cours et TP
- Projets à remettre pour le 17 mai
- Support de cours sur les réseaux de régulation. Quelques liens :
- Banjo (inférence de réseaux bayésiens statiques et dynamiques) : http://www.cs.duke.edu/~amink/software/banjo/
- Large-scale mapping and validation of Escherichia coli transcriptional regulation from a compendium of expression profiles. (2007) Faith JJ, Hayete B, Thaden JT, Mogno I, Wierzbowski J, Cottarel G, Kasif S, Collins JJ, Gardner TS., PLoS Biol Lien PubMed
- minet: A R/Bioconductor Package for Inferring Large Transcriptional Networks Using Mutual Information (2008) Patrick E Meyer, Frédéric Lafitte and Gianluca Bontempi, BMC Bioinformatics Lien
- Gene regulatory network inference: data integration in dynamic models-a review. (2009) Hecker M, Lambeck S, Toepfer S, van Someren E, Guthke R., BioSystems Lien PubMed
- Computational methods for discovering gene networks from expression data (2009) Wei-Po Lee and Wen-Shyong Tzou, Brief Bioinform Lien
- TD Reconstruction de réseaux de régulation
- TD Reconstruction de réseaux de régulation (version 2015)
Mathématique pour la Biologie (EMBIA1EM)
Projet 2015-16:
Références
- Mathématiques pour les Sciences de la vie et de la Terre – C. David, S. Mustapha, F. Viens, N. Capron, edition Dunod
Harmonisation des Connaissances, partie Bioanalyse (EMBIA1IM)
- Supports de cours
http://www.mabs.ups-tlse.fr/index.php/Ressources_pedagogique#Bioanalyse_.28EM7BMGD2.29
- TD1 : Interrogation des banques de données
- TD2 : Analyse de séquences I: recherche par similarité, alignements deux à deux
- TD3 : Analyse de séquences II: alignements multiples et profils|
- Contrôle Continu Décembre 2015
- Exemples d'examen terminal
2014-2015: Janvier 2015, Controle Terminal, session 1
Traitement de graphes et réseaux biologiques (EMBIA1KM)
Supports de cours
Supports de TD/TP:
- TP Visualisation et parcours en profondeur
- TP Parcours en largeur et plus court chemin
- TP Dessin de graphes et initiation à la librairie iGraph
- TP Recherche de communautés dans les graphes
Projets 2015-16
Liens:
- Cytoscape (et Cytoscape Web mais un peu dépassé maintenant)
- Tulip
- Gephi
- igraph
- Pathway tools
- Radatools
- NeAT
- METACYC
- STRING
- Bioconductor/STRINGdb interface STRINGdb et R igraph
- RegulonDb
- MetaNetX
Références
- Introduction to Algorithms, Corsen, Leiserson and Rivest, MIT Press and McGraw-Hill
- Detection of Functional Modules From Protein Interaction Networks, Pereira-Leal, Enright and Ozounis, PROTEINS: Structure, Function, and Bioinformatics, 49-57, 2004.
- An efficient algorithm for large-scale detection of protein families, Enright, Van Dongen and Ozounis, Nucleic Acids Research, 1575-84, 2002 PMID:11917018
- Kavosh: a new algorithm for finding network motifs, Kashani et al., BMC Bioinformatics, 2009. DOI:10.1186/1471-2105-10-318
- Pathway discovery in metabolic networks by subgraph extraction, Faust et al., Bioinformatics, 1211-1218, 2010. DOI:10.1093/bioinformatics/btq105
Fouille de données (EMBIA2DM)
Support de cours:
- Introduction et Généralités
- Classification, prédiction et caractérisation
- Clustering
- Règles d'association
Sujets de TD
- TD Classification, validation croisée et clustering
Projet
- Enoncé du projet
Liens
- Data mining map
- http://www.kdnuggets.com/
- UCI KDD Archive (datasets)
- mloss (machine learning open source software) http://mloss.org
- Librairies et logiciels
- RapidMiner
- Knime
- weka
- Orange librairie python
- scikit-learn une autre librairie python
- Sequential Pattern Mining Framework open source Java implementation
Références
- Data Mining: Concepts and Techniques, J. Han and M. Kamber, 2006.
- GENECODIS: a web-based tool for finding significant concurrent annotations in gene lists, Carmona-Saez et al., Genome Biology, 2007.
Master 1 - MEEF
Sciences de la Vie (EE7BSVFM)
Supports de TD :
Supports de Cours :
Master 2
Master 2 - Bioinformatique et Biologie des Systèmes
- Génome de E. coli de 2002 EcolA01.embl
Intégration de Données Hétérogènes - Partie R. Barriot
Master 2R - BioSciences Végétales (http://www.m2rbsv.ups-tlse.fr)
Bioanalyse, Protéomique
TDs
Examen 2015 Documents, partie E. Gaulin
Documents, partie C. Mathé
Documents, partie C. Albenne
F.A.Q.
- Caractérisation d'un ensemble de gènes d'intérêt. Soit qu'ils sont différentiellement exprimés, soit qu'ils sont co-exprimés.
- Installation de igraph sur CentOS 6.7 en P0
Sous R, l'installation d'igraph échoue avec le protocole https, il faut donc choisir un mirroir avec le protocol http : choseCRANmirror() dernier choix (http mirrors) puis Lyon2
R> chooseCRANmirror() R> install.packages('igraph')
- Installation de Rstudio sur CentOS 6.7 en P0
La dernière version de Rstudio desktop ne fonctionne pas pour CentOS6.7 (nécessite des librairies plus récentes). Il faut donc télécharger et installer la version serveur :
# Dans un terminal, passer root (super-utilisateur) bash> su # puis les commandes ci-dessous (sans le "root>") root> wget https://download2.rstudio.org/rstudio-server-rhel-0.99.892-x86_64.rpm root> yum install --nogpgcheck rstudio-server-rhel-0.99.892-x86_64.rpm
Ensuite, on accède à l'interface avec le navigateur : http://localhost:8787 avec un compte de la machine (normalement le compte guest)