Tema 1 Regresin lineal simple 1 1 Introduccin

  • Slides: 56
Download presentation
Tema 1 - Regresión lineal simple. 1. 1. Introducción 1. 2. Especificación del modelo

Tema 1 - Regresión lineal simple. 1. 1. Introducción 1. 2. Especificación del modelo de regresión lineal simple en la población. 1. 2. 1. Estructura de los modelos de regresión 1. 2. 2. Hipótesis básicas 1. 3. Estimación de los parámetros del modelo de regresión lineal simple 1. 3. 1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades 1. 3. 2. La recta de regresión en puntuaciones diferenciales 1. 3. 3. La recta de regresión en puntuaciones típicas 1. 3. 4. Relación entre la pendiente de la recta y el coeficiente de correlación 1. 3. 5. Interpretación de los coeficientes de la recta de regresión 1. 4. El contraste de la regresión 1. 4. 1. Componentes de variabilidad y bondad de ajuste 1. 4. 2. Validación del modelo 1. 4. 3. Significación de parámetros 1. 5. Diagnosis del modelo: Análisis de residuos 1. 6. Predicción

Tema 1 - Regresión lineal simple. 1. 1. Introducción 1. 1. 1. Ejemplos de

Tema 1 - Regresión lineal simple. 1. 1. Introducción 1. 1. 1. Ejemplos de investigaciones en las que puede ser adecuado utilizar el modelo de regresión simple. 1. 1. 2. El concepto de relación entre variables: naturaleza y tipos de relación. 1. 1. 3. Herramientas para evaluar la relación entre dos variables 1. 1. 3. 1. El diagrama de dispersión 1. 1. 3. 2. La covarianza 1. 1. 3. 3. El coeficiente de correlación de Pearson

1. 1. Introducción 1. 1. Ejemplos de investigaciones en las que puede ser adecuado

1. 1. Introducción 1. 1. Ejemplos de investigaciones en las que puede ser adecuado utilizar el modelo de regresión simple. Se pretende estudiar si la competencia escolar de niños, medida en una escala entre 1 y 4, depende del tiempo en meses que llevan viviendo con un progenitor Variable dependiente o criterio (endógena): competencia escolar Variable independiente o predictora (exógena): meses de monoparentalidad Se pretende estudiar si el ajuste emocional de niños, medido por un test de ajuste que proporciona puntuaciones en una escala entre 0 y 10, depende del ámbito rural o urbano en el que vive la familia Variable dependiente o criterio: ajuste emocional Variable independiente o predictora: ámbito geográfico

1. 1. Introducción 1. 1. Ejemplos de investigaciones en las que puede ser adecuado

1. 1. Introducción 1. 1. Ejemplos de investigaciones en las que puede ser adecuado utilizar el modelo de regresión simple. Se pretende estudiar la relación entre estrés laboral y la variable trabajo a turno Variable dependiente o criterio: estrés laboral Variable independiente o predictora: tipo de turno: fijo o variable Se pretende estudiar si las notas en Análisis de Datos II dependen de Análisis de Datos I Variable dependiente o criterio: Análisis de Datos II Variable independiente o predictora: Análisis de datos I Para estudiar empíricamente estas relaciones medimos, en una muestra de sujetos, los valores de las variables incluidas en la relación. Genéricamente, la información de un sujeto cualquiera de la muestra Si, vendrá dada por el par (Xi, Yi). El conjunto de pares constituye la matriz de datos de la investigación y para los ejemplos propuestos tendrá el siguiente formato.

Tabla o matriz de datos N=9 N=10 Observar que las variable ámbito y turno

Tabla o matriz de datos N=9 N=10 Observar que las variable ámbito y turno aunque no son métricas las hemos codificado como numéricas. Hemos elegido el 0 y el 1 para diferenciar entre las categorías de las variables. Este tipo de codificación, muy frecuente en estadística, se conoce como codificación “dummy” o ficticia N=10

1. 1. 2. El concepto de relación entre variables. Naturaleza y tipos de relación:

1. 1. 2. El concepto de relación entre variables. Naturaleza y tipos de relación: el gráfico de dispersión

1. 1. 2. El concepto de relación entre variables: naturaleza y tipos de relación.

1. 1. 2. El concepto de relación entre variables: naturaleza y tipos de relación.

1. 1. 2. El concepto de relación entre variables: naturaleza y tipos de relación.

1. 1. 2. El concepto de relación entre variables: naturaleza y tipos de relación.

1. 1. 3. 2. La covarianza puede tomar valores entre (-∞, +∞) de manera

1. 1. 3. 2. La covarianza puede tomar valores entre (-∞, +∞) de manera que si: Sxy= 0 independencia lineal Sxy> 0 relación lineal directa o positiva Sxy< 0 relación lineal inversa o negativa Vamos a ver, utilizando el gráfico de dispersión, porque las relaciones De orden anteriores están relacionadas con el tipo de relación lineal.

Y Y Sxy> 0 relación lineal directa o positiva Sxy< 0 relación lineal inversa

Y Y Sxy> 0 relación lineal directa o positiva Sxy< 0 relación lineal inversa o negativa X Y Sxy= 0 independencia lineal X X

1. 1. 3. 2. La covarianza: dependencia de escalas

1. 1. 3. 2. La covarianza: dependencia de escalas

1. 1. 3. 3. El coeficiente de correlación de Pearson rxy = 0. 88

1. 1. 3. 3. El coeficiente de correlación de Pearson rxy = 0. 88 rxy = 0 rxy = 1 rxy = -0. 88 rxy = 0

1. 2. Especificación del modelo de regresión lineal simple en la población. 1. 2.

1. 2. Especificación del modelo de regresión lineal simple en la población. 1. 2. 1. Estructura de los modelos de regresión Xi predictora independiente exógena explicativa Yi criterio dependiente endógena explicada Expresión matemática del modelo en la población Puntuación predicha por la recta de regresión verdadera Residuo o error de predicción En el modelo hay dos variables observadas: X e Y y dos parámetros la ordenada en el origen de la recta de regresión y la pendiente Interpretación de los parámetros:

Interpretación de los parámetros: Ejercicio físico Esperanza de vida Consumo de tabaco Esperanza de

Interpretación de los parámetros: Ejercicio físico Esperanza de vida Consumo de tabaco Esperanza de vida

1. 2. 2. Hipótesis básicas 1. El término de Error es una variable aleatoria

1. 2. 2. Hipótesis básicas 1. El término de Error es una variable aleatoria con media cero: 2. Homocedasticidad: la varianza del término de error es constante: 3. Los errores se distribuyen normalmente: 4. Los errores son independientes entre sí. Las hipótesis anteriores pueden formularse de manera equivalente en términos de la variable criterio. Así, 1’. La media de Y depende linealmente de X: 2’. La varianza de Y es constante: 3’. La distribución de Y es normal para cada X: 4’. Las observaciones Yi son independientes entre sí.

Resumen gráfico de las hipótesis básicas formuladas en términos de la variable criterio Distribución

Resumen gráfico de las hipótesis básicas formuladas en términos de la variable criterio Distribución Normal X 1, X 2, X 3, X 4

Resumen gráfico de las hipótesis básicas formuladas en términos de los residuos 0 X

Resumen gráfico de las hipótesis básicas formuladas en términos de los residuos 0 X 1, X 2, X 3, X 4

El objetivo del análisis de regresión será estimar los parámetros del modelo presentado y

El objetivo del análisis de regresión será estimar los parámetros del modelo presentado y contrastar las hipótesis de partida todo ello a partir de una muestra.

1. 3. Estimación de los parámetros del modelo de regresión lineal simple 1. 3.

1. 3. Estimación de los parámetros del modelo de regresión lineal simple 1. 3. 1. La recta de regresión de mínimos cuadrados en directas y principales propiedades puntuaciones 1. 3. 2. La recta de regresión en puntuaciones diferenciales 1. 3. 3. La recta de regresión en puntuaciones típicas 1. 3. 4. Relación entre la pendiente de la recta y el coeficiente de correlación 1. 3. 5. Interpretación de los coeficientes de la recta de regresión

1. 3. 1. La recta de regresión de mínimos cuadrados en puntuaciones directas y

1. 3. 1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades Partimos de una muestra de sujetos extraídos de una población en la que se han tomado valores de las variables X e Y. La situación más frecuente es que los puntos estén dispersos en el plano definido por X e Y. La primera pregunta a plantearnos es de las infinitas rectas que podemos ajustar a la nube de puntos ¿Cuál estimará mejor los parámetros? . Existen diferentes criterios.

1. 3. 1. La recta de regresión de mínimos cuadrados en puntuaciones directas y

1. 3. 1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades

1. 3. 1. La recta de regresión de mínimos cuadrados en puntuaciones directas y

1. 3. 1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades Criterio de mínimos cuadrados:

1. 4. 1. La recta de regresión de mínimos cuadrados en puntuaciones directas y

1. 4. 1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades Recta de regresión mínimo cuadrática (puntuaciones directas):

Ejemplo de cálculo de la recta de regresión de mínimos cuadrados x y 1

Ejemplo de cálculo de la recta de regresión de mínimos cuadrados x y 1 2 -4, 5 -2, 1 20, 25 9, 45 2 1 -3, 5 -3, 1 12, 25 10, 85 3 3 -2, 5 -1, 1 6, 25 2, 75 4 4 -1, 5 -0, 1 2, 25 0, 15 5 2 -0, 5 -2, 1 0, 25 1, 05 6 3 0, 5 -1, 1 0, 25 -0, 55 7 5 1, 5 0, 9 2, 25 1, 35 8 4 2, 5 2, 9 6, 25 7, 25 9 6 3, 5 1, 9 12, 25 6, 65 10 8 4, 5 3, 9 20, 25 17, 55 55 41 0 0 82, 5 56, 5

1. 4. 1. La recta de regresión de mínimos cuadrados en puntuaciones directas y

1. 4. 1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades Recta de regresión mínimo cuadrática: dependencia de escalas. xls

1. 4. 1. La recta de regresión de mínimos cuadrados en puntuaciones directas y

1. 4. 1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades Propiedades de la Recta de regresión mínimo cuadrática: 1) La media de las puntuaciones predichas es igual a la media de Y 2) Los errores tienen media cero 3) La recta de mínimos cuadrados pasa por el punto: 4) Los errores no correlacionan ni con la variable predictora ni con las puntuaciones predichas

1. 4. 2. La recta de regresión de mínimos cuadrados en puntuaciones diferenciales a)

1. 4. 2. La recta de regresión de mínimos cuadrados en puntuaciones diferenciales a) Modelo y recta en puntuaciones diferenciales

1. 4. 2. La recta de regresión de mínimos cuadrados en puntuaciones estandarizadas a)

1. 4. 2. La recta de regresión de mínimos cuadrados en puntuaciones estandarizadas a) Modelo y recta en puntuaciones estandarizadas

Recta de regresión en diferenciales y en tipificadas. Relación entre b y r. Interpretación

Recta de regresión en diferenciales y en tipificadas. Relación entre b y r. Interpretación de los coeficientes de la regresión a) En puntuaciones directas b) En puntuaciones diferenciales c) En puntuaciones estandarizadas

1. 4. El contraste de la regresión: introducción

1. 4. El contraste de la regresión: introducción

1. 4. El contraste de la regresión: introducción

1. 4. El contraste de la regresión: introducción

1. 4. El contraste de la regresión: introducción

1. 4. El contraste de la regresión: introducción

1. 4. El contraste de la regresión: introducción

1. 4. El contraste de la regresión: introducción

1. 4. El contraste de la regresión: introducción Yi Xi

1. 4. El contraste de la regresión: introducción Yi Xi

1. 4. 1. Componentes de variabilidad y bondad de ajuste Yi Desviación total Desviación

1. 4. 1. Componentes de variabilidad y bondad de ajuste Yi Desviación total Desviación explicada Desviación residual Xi

1. 4. 1. Componentes de variabilidad y bondad de ajuste Variación Total Variación Explicada

1. 4. 1. Componentes de variabilidad y bondad de ajuste Variación Total Variación Explicada Variación Residual Xi

1. 4. 1. Componentes de variabilidad y bondad de ajuste Fórmulas para calcular las

1. 4. 1. Componentes de variabilidad y bondad de ajuste Fórmulas para calcular las sumas de cuadrados en puntuaciones directas y diferenciales:

1. 4. 1. Componentes de variabilidad y bondad de ajuste Fórmulas para calcular las

1. 4. 1. Componentes de variabilidad y bondad de ajuste Fórmulas para calcular las sumas de cuadrados en tipificadas:

1. 4. 1. Componentes de variabilidad y bondad de ajuste Bondad de ajuste o

1. 4. 1. Componentes de variabilidad y bondad de ajuste Bondad de ajuste o Coeficiente de determinación

1. 4. 1. Componentes de variabilidad y bondad de ajuste Representación en diagramas de

1. 4. 1. Componentes de variabilidad y bondad de ajuste Representación en diagramas de Venn r 2 xy= 0 Y X r 2 xy= 1 Y X r 2 xy Y X

1. 4. 2. Validación del modelo Esquema del Contraste de Hipótesis Contrastar una Hipótesis

1. 4. 2. Validación del modelo Esquema del Contraste de Hipótesis Contrastar una Hipótesis Estadísticamente es juzgar si cierta propiedad supuesta para una población es compatible con lo observado en una muestra de ella.

Elementos de una Prueba de Hipótesis 1. - Hipótesis Nula (H 0), Hipótesis Alternativa.

Elementos de una Prueba de Hipótesis 1. - Hipótesis Nula (H 0), Hipótesis Alternativa. 2. - Estadístico de Contraste (Discrepancia). 3. - Región de Rechazo (Región Crítica): nivel de significación. 4. - Regla de Decisión.

1. 4. 2. Validación del modelo 1. - Hipótesis Nula (H 0), Hipótesis Alternativa.

1. 4. 2. Validación del modelo 1. - Hipótesis Nula (H 0), Hipótesis Alternativa. 2. - Estadístico de Contraste (Discrepancia).

1. 4. 2. Validación del modelo 3. - Región de Rechazo (Región Crítica): nivel

1. 4. 2. Validación del modelo 3. - Región de Rechazo (Región Crítica): nivel de significación. Región de aceptación de H 0 Región de rechazo de H 0 1 - Fc

1. 4. 2. Validación del modelo 4. - Regla de Decisión. Se rechaza la

1. 4. 2. Validación del modelo 4. - Regla de Decisión. Se rechaza la H 0 si: F >Fc o de manera equivalente si: p< Por el contrario, se acepta la H 0 si: F �≤Fc o de manera equivalente si: p ≥

Tabla F

Tabla F

Tabla F

Tabla F

1. 4. 3. Significación de parámetros 1. - Hipótesis Nula (H 0), Hipótesis Alternativa.

1. 4. 3. Significación de parámetros 1. - Hipótesis Nula (H 0), Hipótesis Alternativa. 2. - Estadístico de Contraste (Discrepancia). Nota: en regresión simple t 2 = F

1. 4. 3. Significación de parámetros 3. - Región de Rechazo (Región Crítica): nivel

1. 4. 3. Significación de parámetros 3. - Región de Rechazo (Región Crítica): nivel de significación. Región de aceptación de H 0 Fc Regiones de rechazo de H 0

1. 4. 3. Significación de parámetros 4. - Regla de Decisión. Se rechaza la

1. 4. 3. Significación de parámetros 4. - Regla de Decisión. Se rechaza la H 0 si: t� >+tc o de manera equivalente si: p< Por el contrario, se acepta la H 0 si: t ≤ �+tc o de manera equivalente si: p≥

http: //www. stat. ucla. edu/~dinov/courses_students. dir/Applets. dir/T-table. html

http: //www. stat. ucla. edu/~dinov/courses_students. dir/Applets. dir/T-table. html

Tabla t de Student

Tabla t de Student

Calculadoras estadísticas en internet http: //faculty. vassar. edu/lowry/Vassar. Stats. htm http: //members. aol. com/johnp

Calculadoras estadísticas en internet http: //faculty. vassar. edu/lowry/Vassar. Stats. htm http: //members. aol. com/johnp 71/pdfs. html http: //davidmlane. com/hyperstat/F_table. html http: //davidmlane. com/hyperstat/t_table. html http: //www. psychstat. missouristate. edu/introbook/tdist. htm http: //www. psychstat. missouristate. edu/introbook/fdist. htm http: //calculators. stat. ucla. edu/cdf/

1. 6. Predicción Intervalos de predicción:

1. 6. Predicción Intervalos de predicción: