Bioestadstica Regresin y Correlacin Mltiple Confusin y colinearidad
Bioestadística Regresión y Correlación Múltiple: Confusión y colinearidad.
Sesgo de confusión. Implica la posibilidad de que la asociación observada entre dos variables (una independiente y otra dependiente) sea explicada, totalmente o en parte, mediante una distribución desigual entre los grupos de estudio de otros factores diferentes a la exposición de interés que también influyen en la variable dependiente. n El sesgo que introduce un factor de confusión puede sobreestimar, subestimar y aún cambiar la dirección en la estimación de la asociación a evaluar. n
Sesgo de confusión. Implica la posibilidad de que la asociación observada entre dos variables (una independiente y otra dependiente) sea explicada, totalmente o en parte, mediante una distribución desigual entre los grupos de estudio de otros factores diferentes a la exposición de interés que también influyen en la variable dependiente. n El sesgo que introduce un factor de confusión puede sobreestimar, subestimar y aún cambiar la dirección en la estimación de la asociación a evaluar. n
Sesgo de confusión. De manera intuitiva, la confusión debe ser entendida como una mezcla del efecto de la variable independiente en estudio con otra variable independiente (factor de confusión) que influye en la variable dependiente. n Este tercer factor, o factor de confusión, debe estar asociado con la exposición en estudio y modificar la variable a predecir, independientemente de la variable predictora en estudio. n
Sesgo de confusión. De manera intuitiva, la confusión debe ser entendida como una mezcla del efecto de la variable independiente en estudio con otra variable independiente (factor de confusión) que influye en la variable dependiente. n Este tercer factor, o factor de confusión, debe estar asociado con la exposición en estudio y modificar la variable a predecir, independientemente de la variable predictora en estudio. n
Sesgo de confusión. n Tres condiciones son necesarias para que un factor sea considerado de confusión: – El factor debe de estar asociado con la variable dependiente, aún en ausencia de la variable independiente en estudio. – El factor debe estar asociado con la variable independiente en la población base. – El potencial factor no debe ser un eslabón intermedio de la cadena causal entre la variable independiente de interés y la variable dependiente. Para evaluar esto es necesario información externa al estudio.
Sesgo de confusión. n Tres condiciones son necesarias para que un factor sea considerado de confusión: – El factor debe de estar asociado con la variable dependiente, aún en ausencia de la variable independiente en estudio. – El factor debe estar asociado con la variable independiente en la población base. – El potencial factor no debe ser un eslabón intermedio de la cadena causal entre la variable independiente de interés y la variable dependiente. Para evaluar esto es necesario información externa al estudio.
Sesgo de confusión. n Tres condiciones son necesarias para que un factor sea considerado de confusión: – El factor debe de estar asociado con la variable dependiente, aún en ausencia de la variable independiente en estudio. – El factor debe estar asociado con la variable independiente en la población base. – El potencial factor no debe ser un eslabón intermedio de la cadena causal entre la variable independiente de interés y la variable dependiente. Para evaluar esto es necesario información externa al estudio.
Sesgo de confusión. n Tres condiciones son necesarias para que un factor sea considerado de confusión: – El factor debe de estar asociado con la variable dependiente, aún en ausencia de la variable independiente en estudio. – El factor debe estar asociado con la variable independiente en la población base. – El potencial factor no debe ser un eslabón intermedio de la cadena causal entre la variable independiente de interés y la variable dependiente. Para evaluar esto es necesario información externa al estudio.
Sesgo de confusión. Hipótesis Variable dependiente Variable independiente Covariable Factor de confusión
Sesgo de confusión. Hipótesis Variable dependiente Variable independiente Covariable Factor de confusión
Sesgo de confusión. Hipótesis Variable dependiente Variable independiente Covariable Factor de confusión
Sesgo de confusión. Hipótesis Variable dependiente Variable independiente Covariable Factor de confusión
El factor no confunde. Hipótesis Variable dependiente Variable independiente Covariable No confunde
Sesgo de confusión. Hipótesis Variable dependiente Variable independiente Covariable No confunde
El factor no confunde. Hipótesis Variable dependiente Variable independiente Covariable No confunde
Sesgo de confusión. Hipótesis Variable dependiente Variable independiente Covariable No confunde
El factor no confunde. Hipótesis Variable dependiente Variable independiente Covariable No confunde
Evaluación de la confusión. Para evaluar si hay confusión comparamos dos modelos, uno que incluye la variable que consideramos confunde y otro sin la variable. n Si al ajustar se observa una variación sustantiva, y si el conocimiento del investigador sobre el tema hace suponer que es preferible la estimación ajustada, entonces hay que ajustar, aunque no exista asociación significativa entre la exposición o el evento de estudio. n Si el ajuste no modifica sustancialmente la estimación hay que ignorarla sin importar que el potencial factor de confusión esté asociado "significativamente" con la variable dependiente. n
Evaluación de la confusión. Para evaluar si hay confusión comparamos dos modelos, uno que incluye la variable que consideramos confunde y otro sin la variable. n Si al ajustar se observa una variación sustantiva, y si el conocimiento del investigador sobre el tema hace suponer que es preferible la estimación ajustada, entonces hay que ajustar, aunque no exista asociación significativa entre la exposición o el evento de estudio. n Si el ajuste no modifica sustancialmente la estimación hay que ignorarla sin importar que el potencial factor de confusión esté asociado "significativamente" con la variable dependiente. n
Evaluación de la confusión. Para evaluar si hay confusión comparamos dos modelos, uno que incluye la variable que consideramos confunde y otro sin la variable. n Si al ajustar se observa una variación sustantiva, y si el conocimiento del investigador sobre el tema hace suponer que es preferible la estimación ajustada, entonces hay que ajustar, aunque no exista asociación significativa entre la exposición o el evento de estudio. n Si el ajuste no modifica sustancialmente la estimación hay que ignorarla sin importar que el potencial factor de confusión esté asociado "significativamente" con la variable dependiente. n
Registro: datos en hoja RM 5. i X 1 X 2 X 3 Y 1 0 35 61 0. 242 … 2 0 50 33 0. 690 42 1 77 56 1. 153 3 1 33 78 0. 467 43 1 25 83 0. 815 4 1 39 63 0. 523 44 1 41 90 0. 583 5 1 57 84 1. 066 45 0 66 29 0. 529 6 1 88 77 0. 768 46 0 33 39 0. 347 7 1 100 56 1. 287 47 0 46 45 0. 287 8 1 96 71 1. 208 48 0 89 58 0. 943 49 1 48 52 0. 821 … § “X 1” es una variable cualitativa independiente. § “X 2” y “X 3” son variables cuantitativas independientes. § “Y” es la variable dependiente cuantitativa.
Evaluación de la confusión. Variable X 1 Coeficiente 0. 219 p < 0. 01 Constante Variable X 2 Constante Coeficiente 0. 005 p < 0. 01 p X 1 0. 288 < 0. 01 X 2 0. 006 < 0. 01 Constante Variable Coeficiente
Evaluación de la confusión. Variable X 1 Coeficiente 0. 219 p 0. 01 Constante Variable X 3 Constante Coeficiente 0. 005 p 0. 01 p X 1 0. 180 0. 02 X 3 0. 002 0. 38 Constante Variable Coeficiente
Evaluación de la confusión. Variable X 2 Coeficiente 0. 005 p 0. 01 Constante Variable X 3 Constante Coeficiente 0. 005 p 0. 01 p X 2 0. 005 < 0. 01 X 3 0. 006 < 0. 01 Constante Variable Coeficiente
Evaluación de la confusión. Variable Coeficiente p X 1 0. 265 < 0. 01 X 2 0. 006 < 0. 01 X 3 0. 001 0. 45 Constante
Asociación entre covariables. X 1 Media de X 2 0 71. 12 1 60. 50 0. 10 X 1 Media de X 3 p 0 52. 64 1 70. 54 Asociación entre X 2 y X 3 r 0. 004 r 2 0. 000 p < 0. 01 p 0. 67
Registro: datos en hoja RM 6. i cm pulg peso 1 181 71. 26 81. 30 7 155 61. 02 55. 77 2 183 72. 05 84. 14 8 175 68. 9 77. 58 3 159 62. 6 60. 28 9 162 63. 78 67. 17 4 157 61. 81 58. 62 10 177 69. 69 79. 20 5 152 59. 84 50. 93 11 158 62. 2 63. 68 6 160 62. 99 62. 90 12 151 59. 45 50. 96 § “cm” y “pulg” son variables cuantitativas. § “peso” es la variable dependiente cuantitativa.
Colinearidad entre cm y pulg. Asociación entre cm y pulg r 1. 00 r 2 1. 00 p < 0. 01
Colinearidad. Variable cm Constante Variable pulg Constante Coeficiente p 1. 009 < 0. 01 -. 99. 542 Coeficiente p 2. 561 < 0. 01 -99. 473 Variable cm Coeficiente p 82. 392 0. 49 pulg -206. 632 0. 49 Constante -104. 842
- Slides: 30