ARN ksako Julie BERNAUER Adrien GUILHOTGAUDEFFROY Yann PONTY
ARN késako ? Julie BERNAUER Adrien GUILHOT-GAUDEFFROY Yann PONTY Mireille REGNIER EQUIPE PROJET AMIB Inria Saclay 28 Septembre 2012
1 Les ARN et leur repliement Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 2
Principe central de la biologie moléculaire C G A G T C A G ARN Poly. C T C A G G A G U C A ADN ARNm Protéine Ala A Leu G G T U C Cyt Ribosome Règle : ADN (A, C, G, T) → ARN (A, C, G, U) → Protéine Mais il existe de très nombreuses exceptions, et de très nombreux autres rôles pour l’ARN ! Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 3
Repliement des ARN • ARN = un seul brin • Structure très variable … • … plus conservée au cours de l’évolution que la séquence • Diversité de fonction Fonction (partiellement) codée dans la structure Prédire le repliement de l’ARN Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 4
Les paires de bases (Canoniques) Canonical base-pairs Paires Watson/Crick G/C U/A Nuit des chercheurs - LIX/Inria AMIB Paire Wobble U/G 28/09/2012 5
La structure secondaire : Une simplification raisonnable Contraintes/Règles du jeu G U G A • Uniquement Watson/Crick (A/U et G/C) et Wobble (G/U) U G G A G … C G C • Pseudonoeuds interdits Modèle 3 D ARN ribosomal (5 s) Nuit des chercheurs - LIX/Inria AMIB Structure secondaire 28/09/2012 6
Repliement par minimisation de l’énergie libre Séquence d’ARN …CAGUAGCCGAUCGCAGCUAGCGUA… Nombreuses structures secondaires Paradigme historique : Structure fonctionnelle = Structure compatible la plus stable = Structure d’énergie libre minimale Nombre maximal de paires de bases Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 7
2 Au boulot … Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 8
A vous de jouer ! GAGAAGUACUUGAAAUUGGCCUCCUC Saurez vous trouver, pour l’ARN ci-dessus, le repliement ayant un nombre maximal de paires de bases ? Règles : 1. Seules paires de bases canoniques sont autorisées. C G A U U G G C U A G U 2. Les croisements et liaisons extérieures sont interdites. Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 9
Solution • Ce repliement est le seul à apparier toutes les bases. • Il existait 8 553 597 repliements (partiels) valides. Comment retrouver ce repliement sans les énumérer tous ? Algorithme de programmation dynamique (Diviser pour régner + Mémorisation des résultats) Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 10
3 Le design d’ARN Un problème inverse Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 11
Design d’ARN structurés • On sait (à peu près) prédire le repliement des ARN • Pourrait on s’en servir pour créer de nouvelles molécules ? Design d’ARN : Créer une séquence se repliant en une structure secondaire prédéterminée (ex. : rôle thérapeutique). …CAGUAGCCGAUC GCAGCUAGCGUA… Prédiction du repliement Design d’ARN Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 12
A vous de jouer… Aucun algorithme exact et efficace n’est actuellement connu. Saurez vous résoudre le problème à la main ? But du jeu : Créer une séquence ARN 1. se repliant optimalement en la structure cible #maximal de paires de bases = #paires dans structure cible. 2. de façon unique pas de repliement alternatif ayant autant de paires de bases. Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 13
A vous de jouer… Positions correctes Nombre de repliements co-optimaux (7 paires de base) Navigation parmis les co-optimaux Séquence courante Repliement visé Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 14
A vous de jouer… La séquence est modifiée en cliquant sur une position Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 15
A vous de jouer… La séquence est modifiée en cliquant sur une position Le repliement de la nouvelle séquence est calculé et affiché Le nombre de repliements co-optimaux est mis à jour Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 16
A vous de jouer… La séquence est modifiée en cliquant sur une position La partie se termine quand le repliement est correct et unique. Le repliement de la nouvelle séquence est calculé et affiché Le nombre de repliements co-optimaux est mis à jour Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 17
Merci ! Questions ? AMIB Saclay www. inria. fr
Algorithmique du repliement Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 19
Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 20
? Quel cas choisir ? ? ? Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 21
… ? ? ? Quel cas choisir ? ? ? Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 22
20 19 22 0 17 18 16 2 20 <22 … 20 Quel cas choisir ? ? ? Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 23
… … Quel cas choisir ? ? ? Faut il tout essayer ? tout Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 24
Quel cas choisir ? ? ? Faut il tout essayer ? tout Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 25
70000 60000 50000 40000 30000 20000 10000 0 Migraine 1 2 3 4 5 6 7 8 9 10 Nombre exponentiel de solutions → Impossible de tout essayer !! Impossible Quel cas choisir ? ? ? Faut il tout essayer ? Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 26
400000 350000 300000 250000 200000 150000 100000 50000 0 Migraine 1 3 5 7 9 11 13 15 17 19 Nombre exponentiel de solutions → Impossible de tout essayer !! Impossible Quel cas choisir ? ? ? Faut il tout essayer ? Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 27
2 E+80 1. 5 E+80 #Atomes dans l’univers (1080) 1 E+80 5 E+79 1 12 23 34 45 56 67 78 89 100 111 122 133 144 155 166 0 Migraine Nombre exponentiel de solutions → Impossible de tout essayer !! Impossible Quel cas choisir ? ? ? Faut il tout essayer ? Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 28
… … Mais calcul redondant … Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 29
Mais calcul redondant … Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 30
… Solution : Diviser pour régner (Déléguer pour résoudre) Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 31
… 20 ! ? Solution : Diviser pour régner (Déléguer pour résoudre) Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 32
19 ! … ? Solution : Diviser pour régner (Déléguer pour résoudre) Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 33
0 ! 18 ! ? … ? Solution : Diviser pour régner (Déléguer pour résoudre) Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 34
2 ! 16 ! … ? ? Solution : Diviser pour régner (Déléguer pour résoudre) Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 35
19 ! ? … Solution : Diviser pour régner (Déléguer pour résoudre) Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 36
18 ! … ? Solution : Diviser pour régner (Déléguer pour résoudre) Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 37
Combien ça coûte ? (Programmation dynamique) ? ? = Max ? ? ? Max( + + ) Nombre de danseurs → n • Un assistant par région dans la ronde → (n*(n-1)) / 2 ≈ n 2 • Chaque assistant fait, au pire, n calculs Nombre total de calculs : A peu près n 3 … ! Attention à l’ordre des calculs (Commencer par les petites régions …) Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 38
Combien ça coûte 70000 60000 50000? 40000 30000 20000 10000 0 ? Migraine = Max ? ? Max( + + ) 1 2 3 4 5 6 7 8 9 10 Stratégie ? Tout essayer 1 2 3 4 5 6 7 8 9 10 Diviser pour régner Nombre de danseurs → n Nombre de Exponentiel Polynomial O(n 3) 2 • calculs Un assistant par région dans la ronde → (n*(n-1)) / 2 ≈ n • Chaque assistant fait, au pire, n+1 calculs Nombre total de calculs : A peu près n 3 … ! Attention à l’ordre des calculs (Commencer par les petites régions …) Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 39
Combien ça coûte 70000 60000 50000? 40000 30000 20000 10000 0 Stratégie ? Migraine = Max ? ? ? Max( + + ) 1 5 9 13 17 21 25 29 33 3740 Tout essayer Diviser pour régner Nombre de danseurs → n Nombre de Exponentiel Polynomial O(n 3) 2 • calculs Un assistant par région dans la ronde → (n*(n-1)) / 2 ≈ n • Chaque assistant fait, au pire, n+1 calculs Nombre total de calculs : A peu près n 3 … ! Attention à l’ordre des calculs (Commencer par les petites régions …) Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 40
Quelques applications Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 - 41
Performances Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 42
Evaluer la qualité d’une prédiction Intron du groupe II (D 1 -D 4) RFAM ID: RF 02001 RNAFold [Gruber AR et al. NAR 2008] Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 43
Evaluer la qualité d’une prédiction Intron du groupe II (D 1 -D 4) RFAM ID: RF 02001 RNAFold [Gruber AR et al. NAR 2008] Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 44
Evaluer la qualité d’une prédiction Intron du groupe II (D 1 -D 4) RFAM ID: RF 02001 • • • De faibles probabilités indiquent des régions incertaines BP>99% → Avg. PPV>90% BP>90% → PPV>83% RNAFold [Gruber AR et al. NAR 2008] Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 45
Sensibilité des ARN aux mutations • Echantillonage → Clustering → PCA [Halvorsen M et al, PLOS Gen 2010] Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 46
Sensibilité des ARN aux mutations • Echantillonage → Clustering → PCA ? [Halvorsen M et al, PLOS Gen 2010] Nuit des chercheurs - LIX/Inria AMIB 28/09/2012 47
- Slides: 47