Regresin lineal REGRESIN LINEAL SIMPLE N AZIRA C

  • Slides: 49
Download presentation
Regresión lineal REGRESIÓN LINEAL SIMPLE N AZIRA C ALLEJA

Regresión lineal REGRESIÓN LINEAL SIMPLE N AZIRA C ALLEJA

Regresión lineal • • PROPÓSITOS • SUPUESTOS MODELO DE REGRESIÓN • REGRESIÓN LINEAL VS

Regresión lineal • • PROPÓSITOS • SUPUESTOS MODELO DE REGRESIÓN • REGRESIÓN LINEAL VS CORRELACIÓN • PRUEBA DE BONDAD DEL AJUSTE • INFERENCIA PARA β • INTERVALOS DE CONFIANZA PARA β • REGRESIÓN EN SPSS

Regresión lineal • PROPÓSITOS DE LA REGRESIÓN

Regresión lineal • PROPÓSITOS DE LA REGRESIÓN

¿Qué es la regresión? El análisis de regresión: Intenta describir la naturaleza de la

¿Qué es la regresión? El análisis de regresión: Intenta describir la naturaleza de la asociación mediante la creación de un modelo matemático de "mejor ajuste".

Propósitos de la regresión El análisis de regresión: 1º Permite examinar el efecto de

Propósitos de la regresión El análisis de regresión: 1º Permite examinar el efecto de diferentes variables (VIs / predictoras) sobre una variable de resultados (VD).

Propósitos de la regresión Analiza si una variable predice (explica / impacta) a otra

Propósitos de la regresión Analiza si una variable predice (explica / impacta) a otra variable.

Propósitos de la regresión VI VD Permite determinar el porcentaje de la varianza de

Propósitos de la regresión VI VD Permite determinar el porcentaje de la varianza de la VD que es explicado por la VI ρ2 Coeficiente de determinación: Porcentaje de variación en Y que es explicado por la variación en X.

Propósitos de la regresión El análisis de regresión: 2º Permite hacer predicciones puntuales del

Propósitos de la regresión El análisis de regresión: 2º Permite hacer predicciones puntuales del puntaje de una VD (Y) a partir del puntaje de una VI (X).

Regresión lineal • SUPUESTOS DE LA REGRESIÓN LINEAL

Regresión lineal • SUPUESTOS DE LA REGRESIÓN LINEAL

Supuestos Al utilizar la regresión lineal asumimos que: �Las variables están medidas a nivel

Supuestos Al utilizar la regresión lineal asumimos que: �Las variables están medidas a nivel cuantitativo. �Las variables se asocian de manera lineal.

Regresión lineal • MODELO DE REGRESIÓN

Regresión lineal • MODELO DE REGRESIÓN

MODELO DE REGRESIÓN LINEAL Para variables que posiblemente están asociadas (X y Y) asumimos

MODELO DE REGRESIÓN LINEAL Para variables que posiblemente están asociadas (X y Y) asumimos el modelo: Coeficientes que calculamos Y = α + β·X + ε Variables que observamos Parte de Y que X no explica. Es el error aleatorio que define los valores de la vida real.

Modelo de regresión lineal La ecuación Y = α + β • X define

Modelo de regresión lineal La ecuación Y = α + β • X define la asociación promedio entre X y Y. ε = error (diferencia entre lo observado y lo predicho (x, y) ε β β α Valor predicho para Y por Xi Valor observado para Y por Xi Línea de mejor ajuste

Modelo de regresión lineal Coeficientes de la línea de mejor ajuste Los coeficientes se

Modelo de regresión lineal Coeficientes de la línea de mejor ajuste Los coeficientes se estiman minimizando los residuales cuadrados. α = β 0 = Intercepto β = β 1 = Pendiente • α indica el punto en el que la línea cruza el eje de las ordenadas (donde X = 0). • β es el valor de la pendiente.

Encontrar la línea del mejor ajuste b: estimación de β a: estimación de α

Encontrar la línea del mejor ajuste b: estimación de β a: estimación de α

Encontrar la línea del mejor ajuste e: estimación de ε

Encontrar la línea del mejor ajuste e: estimación de ε

Encontrar la línea del mejor ajuste Para encontrar la línea que ajuste mejor se

Encontrar la línea del mejor ajuste Para encontrar la línea que ajuste mejor se evalúa qué tan cercanamente se ajusta cada una de las posibles líneas a los datos observados. Para ello se calculan las distancias verticales de todos los puntos (x, y) a la línea. Estas distancias se llaman “residuales” y corresponden al error, ei.

Encontrar la línea del mejor ajuste La línea de mejor ajuste se define como

Encontrar la línea del mejor ajuste La línea de mejor ajuste se define como aquélla en la que la suma de los cuadrados de los residuales es mínima.

Regresión lineal • REGRESIÓN LINEAL VS CORRELACIÓN

Regresión lineal • REGRESIÓN LINEAL VS CORRELACIÓN

Regresión lineal vs. Correlación • La correlación es una medida de la fuerza de

Regresión lineal vs. Correlación • La correlación es una medida de la fuerza de la asociación. • La regresión intenta describir la forma de la asociación. El parámetro β (la pendiente) está relacionada con ρ:

Regresión lineal • EJEMPLO

Regresión lineal • EJEMPLO

Ejemplo ¿Cuál es la asociación entre: Consumo de tabaco y Pérdida de fijación dental?

Ejemplo ¿Cuál es la asociación entre: Consumo de tabaco y Pérdida de fijación dental?

¿Qué es la regresión? Pérdida media de fijación dental (mm) Línea de ajuste de

¿Qué es la regresión? Pérdida media de fijación dental (mm) Línea de ajuste de la asociación entre el consumo de tabaco (número de cigarros fumados por día) y la pérdida de fijación dental (en mm). N = 28 fumadores. Número de cigarros fumados por día (autorreporte)

Ejemplo: Pérdida de fijación dental y cigarros fumados por día Pérdida media de fijación

Ejemplo: Pérdida de fijación dental y cigarros fumados por día Pérdida media de fijación dental (mm) Consumo de tabaco y pérdida de fijación dental (28 fumadores) Número de cigarros fumados por día (autorreporte)

Ejemplo: Pérdida de fijación dental y cigarros fumados por día α β Este resultado

Ejemplo: Pérdida de fijación dental y cigarros fumados por día α β Este resultado de SPSS dice que: a = 2. 319, b = 0. 067 La línea de mejor ajuste es: Y = 2. 319 + 0. 067 × X Nivel promedio de fijación dental Cigarros fumados por día

Ejemplo: Pérdida de fijación dental y cigarros fumados por día �Y = 2. 319

Ejemplo: Pérdida de fijación dental y cigarros fumados por día �Y = 2. 319 + 0. 067 × X puede interpretarse como: “Cada cigarro fumado extra por día se asocia con una pérdida adicional de 0. 067 mm de fijación dental. " También : “Cada paquete fumado al día (20 cigarros) se asocia con una pérdida de 2. 319 +(0. 067 × 20) = 3. 659 mm de fijación dental. "

Las predicciones basadas en regresión ¿Qué nivel de fijación dental tendrá alguien que fuma

Las predicciones basadas en regresión ¿Qué nivel de fijación dental tendrá alguien que fuma 30 cigarros al día? La mejor estimación del nivel de pérdida de fijación dental promedio de las personas que fuman 30 cigarrillos / día es: Y = 2. 319 + 0. 067 × X Y = 2. 319 + (0. 067 x 30) = 4. 329 mm

Regresión lineal • PRUEBA DE BONDAD DEL AJUSTE

Regresión lineal • PRUEBA DE BONDAD DEL AJUSTE

Bondad de ajuste Se considera que el modelo de regresión es una buena explicación

Bondad de ajuste Se considera que el modelo de regresión es una buena explicación de la asociación entre X y Y, es decir, su ajuste a los datos es bueno, cuando el error (ε) es pequeño.

Bondad de ajuste Media Cuadrática de Error (MCE o MSE) Es una medida clave

Bondad de ajuste Media Cuadrática de Error (MCE o MSE) Es una medida clave del error o de la fuerza de la asociación entre X y Y. Es básicamente la media de los residuales elevados al cuadrado.

Bondad de ajuste La MCE se utiliza para estimar el error estándar (ES) de

Bondad de ajuste La MCE se utiliza para estimar el error estándar (ES) de b. ↓ la MCE El ES(b) en la medida en que la sx Es decir: Se obtienen mejores estimaciones de β cuando ↓ ↑ la línea constituye un buen ajuste los puntajes de X están más dispersos

Bondad de ajuste El ajuste del modelo se prueba con el estadístico F: a.

Bondad de ajuste El ajuste del modelo se prueba con el estadístico F: a. Predictor: Número de cigarros fumados por día (autorreporte) b. Variable dependiente: Pérdida de fijación dental (mm) Número de cigarros fumados por día (autorreporte) Pérdida de fijación dental (mm)

Regresión lineal • INFERENCIA PARA β

Regresión lineal • INFERENCIA PARA β

Inferencia para los coeficientes de regresión Es posible probar H 0: β = 0

Inferencia para los coeficientes de regresión Es posible probar H 0: β = 0 versus H 1: β ≠ 0 utilizando el estadístico t:

Ejemplo: Pérdida de fijación dental y cigarros fumados por día 1. Hipótesis de investigación:

Ejemplo: Pérdida de fijación dental y cigarros fumados por día 1. Hipótesis de investigación: El número de cigarros fumados por día está relacionado con la fijación dental. 2. Hipótesis estadísticas: H 0: β = 0 H 1: β ≠ 0. 3. Prueba estadística: Prueba t para la regresión lineal.

Ejemplo: Pérdida de fijación dental y cigarros fumados por día 4. Regla de decisión:

Ejemplo: Pérdida de fijación dental y cigarros fumados por día 4. Regla de decisión: Puede rechazarse Ho, con p < 0. 05 , si |t 26 |> 2. 056. 5. Cálculos: t 26 = 0. 046, p =. 046

Ejemplo: Pérdida de fijación dental y cigarros fumados por día 6. Resultados Se rechaza

Ejemplo: Pérdida de fijación dental y cigarros fumados por día 6. Resultados Se rechaza Ho. 7. Conclusión: Existe relación entre el número de cigarros fumados diariamente y la fijación dental.

Regresión lineal • INTERVALOS DE CONFIANZA PARA β

Regresión lineal • INTERVALOS DE CONFIANZA PARA β

Intervalo de confianza para β Un intervalo de confianza de 1 -α para β

Intervalo de confianza para β Un intervalo de confianza de 1 -α para β es: t: valor de t en tablas con n– 2: grados de libertad y % de confianza: 1 - α (error tipo 1) / 2 (dos colas) Ej. : Al 95% de confianza: 1 –. 95 / 2 =. 05/. 025

Intervalo de confianza para β Ejemplo: Cigarros fumados por día y pérdida de fijación

Intervalo de confianza para β Ejemplo: Cigarros fumados por día y pérdida de fijación dental b = 0. 067 n = 28 ; gl = 26 α = . 05/2 colas =. 025 t = 2. 056 SE(b) = 0. 032 0. 067 ± 0. 066 El intervalo de confianza de 95% para β es: 0. 001 - 0. 133

Ejemplo: Pérdida de fijación dental y cigarros fumados por día Y = 2. 319

Ejemplo: Pérdida de fijación dental y cigarros fumados por día Y = 2. 319 + 0. 067 × X Con un intervalo de confianza de 95% para β (0. 001 - 0. 133), el valor predicho para la pérdida de fijación dental oscilará entre: Y = 2. 319 + 0. 001 × X y Y = 2. 319 + 0. 133 × X

Regresión lineal • REGRESIÓN EN SPSS

Regresión lineal • REGRESIÓN EN SPSS

Regresión en SPSS Generalmente se utiliza un programa de computadora para el cálculo de

Regresión en SPSS Generalmente se utiliza un programa de computadora para el cálculo de los coeficientes.

Regresión en SPSS

Regresión en SPSS

Regresión en SPSS Hay tres tablas generales que deben interpretarse en los resultados del

Regresión en SPSS Hay tres tablas generales que deben interpretarse en los resultados del análisis de regresión. 1ª Resumen del modelo 2ª ANOVA 3ª Coeficientes

Regresión en SPSS 1ª tabla a. Predictor: Número de cigarros fumados por día (autorreporte)

Regresión en SPSS 1ª tabla a. Predictor: Número de cigarros fumados por día (autorreporte) La información que se toma de esta tabla es el R 2, que es la proporción de variación en la VD que es explicada por la VI. Se expresa como porcentaje. También se llama coeficiente de determinación.

Regresión múltiple en SPSS 2ª tabla a. Predictor: Número de cigarros fumados por día

Regresión múltiple en SPSS 2ª tabla a. Predictor: Número de cigarros fumados por día (autorreporte) b. Variable dependiente: Pérdida de fijación dental (mm) La tabla prueba el ajuste modelo. Muestra si la proporción de varianza explicada en la primera tabla es significativa. También dice si el efecto total de las VIs sobre la VD es significativa.

Regresión múltiple en SPSS 3ª tabla Muestra si el predictor es significativo de (o

Regresión múltiple en SPSS 3ª tabla Muestra si el predictor es significativo de (o significativamente relacionado con) la VD.

Regresión múltiple en SPSS 3ª tabla Los coeficientes beta estandarizados indican la fuerza y

Regresión múltiple en SPSS 3ª tabla Los coeficientes beta estandarizados indican la fuerza y dirección de la relación (se interpretan como coeficientes de r).