silico.biotoul.fr
 

M1 MABS BBS Math TD Proba

From silico.biotoul.fr

Revision as of 07:38, 28 October 2011 by Barriot (Talk | contribs)
Jump to: navigation, search

Loi hypergéométrique

p=\sum^{min(q,t)}_{k=c}\frac{C^k_t\times C^{q-k}_{g-t}}{C^q_g}

appliquée à la sur-représentation d'une annotation dans un ensemble de gènes, c'est-à-dire à la comparaison de 2 ensembles :

  • c: nombre de gènes communs
  • q: nombre de gènes du premier ensemble (query par exemple gènes différentiellement exprimés ou co-exprimés)
  • t: nombre de gènes du deuxième ensemble (target par exemple gènes annotatés 'biosynthèse des acides aminés')
  • g: nombre de gènes dans le génome


A quoi correspondent C^k_t ? C^{q-k}_{g-t} et C^q_g ?


Rappel : Combinaisons: C^p_n = \frac{A^p_n}{p!} = \frac{n!}{p!(n-p)!}


  • Calculer la p-valeur pour c=30, q=100, t=300 et g=20000
  • Quelle est le plus grand nombre x pour lequel vous pouvez calculer x! ?

Vraissemblance

Rappel :

P(A/B) = \frac{P(A \cap B)}{P(B)} = \frac{P(B/A) \times P(A)}{P(B)}

Séquences upstream du codon start chez B. subtilis.

Conservation du motif RBS. Pour s'en convaincre, on peut utiliser WebLogo.

Alignement de séquences RBS de B. subtilis.

Séquence test