REGRESIN CON VARIABLES DICOTMICAS TEMA 1 CONTINUACIN 1
REGRESIÓN CON VARIABLES DICOTÓMICAS TEMA 1 (CONTINUACIÓN) 1
INTRODUCCIÓN • Variable dependiente cuantitativa. • Variable independiente cualitativa: – Dicotómica: regresión simple. – Más de dos condiciones: regresión múltiple. • • Codificación: dummy. Variable: ficticia. 1 = presencia; 0 = ausencia. Ejemplo: 1 = mujer; 0 = hombre (ausencia de la cualidad de ser mujer). 2
SUPUESTOS DEL MODELO 1. Linealidad: se cumple seguro, al formarse dos nubes de puntos. 3
SUPUESTOS DEL MODELO 2. Homocedasticidad: S 2 de ambos grupos (0 y 1) han de ser semejantes. 3. Normalidad: muestras del grupo 0 y del grupo 1 han de provenir de poblaciones con distribución normal. 4. Independencia de errores: incorrelación de las puntuaciones de Y en los distintos niveles de X porque son gente distinta. 4
ECUACIÓN DE REGRESIÓN • Las fórmulas hasta ahora vistas para calcular la a y la b siguen siendo útiles. • Además: 5
ECUACIÓN DE REGRESIÓN: EJEMPLO Estos son los resultados obtenidos en una prueba de expresión lingüística por mujeres (X=0) y hombres (X=1). X Y 0 7 0 6 0 7 0 8 0 9 1 3 1 5 1 4 1 5 1 3 6
ECUACIÓN DE REGRESIÓN: EJEMPLO 1. Calcular la ecuación de regresión en puntuaciones directas utilizando las nuevas fórmulas. 2. Interpretar los parámetros. 3. Calcular la ecuación de regresión en puntuaciones directas utilizando las fórmulas clásicas. 4. Calcular la ecuación de regresión en puntuaciones directas suponiendo que ahora las mujeres fueran codificadas con un 1 y los hombres, con un 0. 7
ECUACIÓN DE REGRESIÓN: EJEMPLO 1. Calcular la ecuación de regresión en puntuaciones directas utilizando las nuevas fórmulas. 8
ECUACIÓN DE REGRESIÓN: EJEMPLO 2. Interpretar los parámetros. 1. a es el valor medio en Y cuando X = 0. 7, 4 es el resultado medio obtenido en la prueba de expresión lingüística en el grupo de las mujeres. 1. b es el cambio en el valor medio de Y en el grupo de X = 1 en comparación con el grupo X =0. El resultado medio es 3, 4 puntos menor en hombres que en mujeres (concretamente, el resultado medio en hombres es 4). 9
ECUACIÓN DE REGRESIÓN: EJEMPLO 3. Calcular la ecuación de regresión en puntuaciones directas utilizando las fórmulas clásicas. X Y x y x*y x 2 y 2 0 7 -0, 5 1, 3 -0, 65 0, 25 1, 69 0 6 -0, 5 0, 3 -0, 15 0, 25 0, 09 0 7 -0, 5 1, 3 -0, 65 0, 25 1, 69 0 8 -0, 5 2, 3 -1, 15 0, 25 5, 29 0 9 -0, 5 3, 3 -1, 65 0, 25 10, 89 1 3 0, 5 -2, 7 -1, 35 0, 25 7, 29 1 5 0, 5 -0, 7 -0, 35 0, 25 0, 49 1 4 0, 5 -1, 7 -0, 85 0, 25 2, 89 1 5 0, 5 -0, 7 -0, 35 0, 25 0, 49 1 3 0, 5 -2, 7 -1, 35 0, 25 7, 29 5 57 -8, 5 2, 5 38, 1 Sumatorio 10
ECUACIÓN DE REGRESIÓN: EJEMPLO 3. Calcular la ecuación de regresión en puntuaciones directas utilizando las fórmulas clásicas. 11
ECUACIÓN DE REGRESIÓN: EJEMPLO 4. Calcular la ecuación de regresión en puntuaciones directas suponiendo que ahora las mujeres fueran codificadas con un 1 y los hombres, con un 0. X Y 1 7 1 6 1 7 1 8 1 9 0 3 0 5 0 4 0 5 0 3 12
ECUACIÓN DE REGRESIÓN: EJEMPLO 4. Calcular la ecuación de regresión en puntuaciones directas suponiendo que ahora las mujeres fueran codificadas con un 1 y los hombres, con un 0. 13
BONDAD DE AJUSTE p = proporción de n 1 respecto al total de la muestra. q = proporción de n 0 respecto al total de la muestra. p+q=1 14
BONDAD DE AJUSTE: EJEMPLO • Con los datos iniciales, calcular la bondad de ajuste utilizando las dos fórmulas propuestas, e interpretar el resultado. 15
BONDAD DE AJUSTE Proporción, del total de variabilidad de Y, explicada por X. El 75, 8% de la variabilidad de la expresión lingüística es explicada por el sexo. 16
VALIDACIÓN DEL MODELO 17
VALIDACIÓN DEL MODELO – Se rechaza la Hipótesis nula. Las variables están relacionadas. El modelo es válido. – Se acepta la Hipótesis nula. Las variables no están relacionadas. El modelo no es válido. (k = número de variables independientes) 18
VALIDACIÓN DEL MODELO: EJEMPLO • Con los datos iniciales, concluir acerca de la validación del modelo. 19
VALIDACIÓN DEL MODELO: EJEMPLO 20
VALIDACIÓN DEL MODELO: EJEMPLO Conclusión: Se rechaza la Hipótesis nula. Las variables X e Y están relacionadas. El modelo es válido. Existe relación estadísticamente significativa entre el sexo y el resultado en la prueba de expresión lingüística 21
SIGNIFICACIÓN • Del coeficiente de correlación: 22
SIGNIFICACIÓN • De la pendiente de la recta: 23
SIGNIFICACIÓN • Por contraste de medias: 24
SIGNIFICACIÓN – Se rechaza la Hipótesis nula. El modelo es válido. La pendiente es estadísticamente distinta de 0. Existe, por tanto, relación entre las variables. – Se acepta la Hipótesis nula. El modelo no es válido. La pendiente es estadísticamente igual a 0. No existe, por tanto, relación entre las variables. 25
SIGNIFICACIÓN: EJEMPLO Aplica las diferentes fórmulas de la t y concluye acerca de la significación. 26
SIGNIFICACIÓN: EJEMPLO 27
SIGNIFICACIÓN: EJEMPLO X Y 0 7 0 6 0 7 0 8 0 9 1 3 1 5 1 4 1 5 1 3 5 57 x y x*y x 2 y 2 Y 2 X 2 -0, 5 1, 3 -0, 65 0, 25 1, 69 49 0 -0, 5 0, 3 -0, 15 0, 25 0, 09 36 0 -0, 5 1, 3 -0, 65 0, 25 1, 69 49 0 -0, 5 2, 3 -1, 15 0, 25 5, 29 64 0 -0, 5 3, 3 -1, 65 0, 25 10, 89 81 0 0, 5 -2, 7 -1, 35 0, 25 7, 29 9 1 0, 5 -0, 7 -0, 35 0, 25 0, 49 25 1 0, 5 -1, 7 -0, 85 0, 25 2, 89 16 1 0, 5 -0, 7 -0, 35 0, 25 0, 49 25 1 0, 5 -2, 7 -1, 35 0, 25 7, 29 9 1 -8, 5 2, 5 38, 1 363 5 Sumatorio 28
SIGNIFICACIÓN: EJEMPLO 29
SIGNIFICACIÓN Conclusión: se rechaza la hipótesis nula. El modelo es válido. Existe relación estadísticamente significativa entre las variables sexo y resultado en la prueba de expresión lingüística. 30
- Slides: 30