Impact sur la puissance statistique de la binarisation
Impact sur la puissance statistique de la binarisation d’un critère de jugement continu dans un essai randomisé en clusters Agnès Caille, Clémence Leyrat, Bruno Giraudeau INSERM, CIC 0202, Tours 5ème Conférence Francophone d’Epidémiologie Clinique 5 mai 2011, Marseille
Essais randomisés en clusters l « Cluster randomization trial (CRT) is one in which intact social units, or clusters of individuals, rather than individuals themselves are randomized » Allan Donner, Design and analysis of cluster randomization trials in health research (London: Arnold, 2000). l Conséquence statistique : présence d’une corrélation intraclasse Les réponses de deux sujets d’un même cluster sont plus ressemblantes que les réponses de deux sujets de clusters différents. 5 mai 2011 2
Coefficient de corrélation intra-classe l Part de la variance totale attribuable à la variance entre les clusters l Positif, ρ Є [0; 1] l Estimation : l l l Critère de jugement continu et binaire Analyse de variance Puissance d’un CRT diminue quand le CCI augmente 5 mai 2011 3
Dichotomisation l Dichotomisation : transformation d’une variable continue en une variable binaire selon un seuil défini au préalable l Motivation : l Simplifier l’interprétation des résultats l Conséquences : l l Perte d’information Perte de puissance Parfois, mauvaise classification 5 mai 2011 4
Dichotomisation et CCI l Kirk (1973) : études de reproductibilité Formule d’atténuation : CCI après binarisation en fonction du CCI initial et de la prévalence X binarisé en une variable X’ = 1 quand Xi ≥ μ + hσy l π = 3. 14 Le CCI diminue systématiquement après binarisation. Diminution minimale quand P = 0. 5 Gain de puissance dans un CRT 5 mai 2011 5
Objectif Dichotomisation Présence d’une corrélation Perte d'information Diminution du CCI (études de reproductibilité) Quel est l’impact global de la dichotomisation du critère de jugement continu sur la puissance d’un essai randomisé en cluster ? 5 mai 2011 6
Méthodes l Développement analytique l l Formule de Kirk Formule du calcul du NSN pour les CRT l Simulations (5000 par scenario) l Objectifs : l Etudier la performance de notre développement analytique avec différentes méthodes d’analyse statistique (approche GEE et chi-deuxajusté) l Illustrer les résultats selon différents scenarii l Paramètres l l l 5 mai 2011 CCI initial (CCI=0 pour randomisation individuelle) Taille d’effet initiale Seuil de binarisation (prévalence bras contrôle = 0. 2, 0. 5 ou 0. 8) Nombre de clusters par bras Variabilité de la taille des clusters 7
Méthodes l Calcul du NSN pour atteindre une puissance de 80 % avec un risque alpha de 5 % avec un critère de jugement continu l Dichotomisation l Estimation a posteriori : l Du CCI l De la puissance l De l’erreur de première espèce
Résultats • Diminution systématique du cci • Minimale pour P=0. 5 • Résultat théorique valide également dans les CRT 5 mai 2011 9
Résultats Approche GEE Chi-deux ajusté
Discussion l l Deux phénomènes antagonistes après binarisation dans un CRT : l Perte d’information : Baisse de puissance l Diminution du CCI : Gain de puissance Globalement, diminution de la puissance après binarisation dans les CRT mais moindre que dans les essais à randomisation individuelle l Différence entre résultats théoriques et observés : correction avec le risque alpha observé l Vision statistique versus utilité pratique de la dichotomisation 5 mai 2011 11
~~Merci de votre attention~~
- Slides: 12