Gaspard Kerner Laboratoire de gntique humaine des maladies
Gaspard Kerner Laboratoire de génétique humaine des maladies infectieuses Inserm U 1163, Institut Imagine Directeur de thèse: Laurent Abel 1
Cursus et Plan Projet de thèse: Recherche de mutations prédisposant à certaines pathologies infectieuses rares et sévères par analyse d’exome de larges échantillons de patients. 2009 2016 2015 « Licenciatura en Ciencias Matematicas » (Argentine) • Equivalent M 2 Mars 2015 -Septembre 2015: Réalisation du mémoire sous la direction du Pr. Pablo E. Verde – biostatisticien à l’Université de Düsseldorf. (Collaboration Argentine – Allemagne) Analyse des facteurs de risque d’infections nécrosantes par une méthode bootstrap. • Novembre 2015 – présent : Ingénieur au « laboratoire de Génétique humaine des maladies infectieuses » Interactions Gène-Gène dans les analyses d’exome. Auditeur libre au M 2 Génétique épidémiologique et biomarqueurs à Paris S 2
Etudes d’association utilisant les données de séquençage à haut débit Données SHD accès à tous les variants de l’ADN, en particulier à ceux des régions (SHD) codantes (exomes) témoins cas Variants communs A G A A § ≠ analyses de génome entier (GWAS) Génotypages variants communs / OR modérés (<1. 5) G G G Test allélique A f( ) 3
Etudes d’association utilisant les données de séquençage à haut débit Données SHD accès à tous les variants de l’ADN, en particulier à ceux des régions (SHD) codantes (exomes) témoins cas Variants communs Variants rares A G A A G G G G A T A A A C C C G C C Test allélique Test agrégé A f( ) fcum( ) ØDéfinition de l’unité d’agrégation génétique: Gène Ensemble de gènes (cascade) Au moins un variant rare § Permet l’analyse de tous les variants exoniques, en particulier les variants rares ( < 5%) Tester l’impact des variants rares des régions codantes Hypothèse: effet plus important (OR>3) 4
Etudes d’association utilisant les données de séquençage à haut débit (SHD) Effet individuel Fréquence allélique Adapté de Manolio et al (Nature, 2009) 5
Etudes d’association utilisant les données de séquençage à haut débit (SHD) Effet individuel Association génome-entier Fréquence allélique Adapté de Manolio et al (Nature, 2009) 6
Etudes d’association utilisant les données de séquençage à haut débit (SHD) Etudes gène. Effet individuel candidat Association génome-entier Fréquence allélique Adapté de Manolio et al (Nature, 2009) 7
Etudes d’association utilisant les données de séquençage à haut débit (SHD) Etudes gène. Effet individuel candidat Séquençage haut débit (régions codantes = exome) Association génome-entier Fréquence allélique Adapté de Manolio et al (Nature, 2009) 8
Méthode d’association pour variants rares Ø Recherche d’épistasie (interaction gène x gène) Agrégation de variants rares Gène 2 Gène 1 9
Méthode d’association pour variants Controls Cases rares Gene 22 Gene 1 10
Puissance (α=0. 05) L’approche « Case-only » § Comparaison analytique des méthodes « cas – témoins » et «cas seulement » (case only) Case only (200) Cas-témoins (200 vs 200) R 12 11
Puissance (α=0. 05) L’approche « Case-only » § Comparaison analytique des méthodes « cas – témoins » et «cas seulement » (case only) EUR Case only (200) AFR Composante principale 2 Cas-témoins (200 vs 200) ASN R 12 Composante principale 1 § Hypothèse: Indépendance des fréquences de porteurs entre les deux gènes testés sous H 0. 12
Puissance (α=0. 05) L’approche « Case-only » § Comparaison analytique des méthodes « cas – témoins » et «cas seulement » (case only) Erreur de type I Case only (200) Cas de stratification de population 0, 4 Erreur de type I Cas-témoins (200 vs 200) 0, 05 R 12 0 0, 1 ρ = corrélation des fréquences § Hypothèse: Indépendance des fréquences de porteurs entre les deux gènes testés sous H 0. 13
L’approche « Case-only » § Comparaison analytique des méthodes « cas – témoins » et «cas seulement » (case only) Erreur de type I Puissance (α=0. 05) Case only (200) Cas de stratification de population 0, 4 Erreur de type I Cas-témoins (200 vs 200) 0, 05 R 12 0 0, 1 ρ = corrélation des fréquences § Hypothèse: Indépendance des fréquences de porteurs entre les deux gènes testés sous H 0. Solution: 14
Projet de thèse Recherche de mutations prédisposant à certaines pathologies infectieuses rares et sévères par analyse d’exome de larges échantillons de patients • Susceptibilité mendélienne aux infections mycobactériennes [MSMD] Þ Prédisposition mendélienne : la cascade IL 12 – IFNγ • Tuberculose sévère de l’enfant Þ Etiologie génétique inconnue chez la majorité des patients Þ Certaines mutations dans l’axe IL 12 – IFNγ 15
Plan de la thèse Données: Grande diversité d’origines EUR AFR mposante principale 2 Exomes sur: Tuberculose (N=213) MSMD (N=277) Témoins (N=378) 1000 genomes ASN Composante principale 1 16
Plan de la thèse Stratégies d’analyse: Fréquence allélique (données, Exac, …) Þ Sélection de variants Impact fonctionnel § CADD (généralisation – seuil par gène) § Polyphen § Sift Þ Prise en compte de la stratification de population § Composantes principales § Permutations adaptées Þ Choix de l’unité d’agrégation génomique § Gène § Cascade: Ensemble de gènes reliés biologiquement Þ Interactions entre gènes Développements méthodologiques à proposer 17
- Slides: 17