Prueba de Ji Cuadrada 2 Prueba No Paramtrica
Prueba de Ji Cuadrada (χ2) Prueba No Paramétrica Particularmente útil con datos Nominales
Preferencia de cerveza • Supongamos que quiero saber la cerveza de preferencia en una región: Elijo al azar a 150 consumidores y les permito probar las principales marcas, quedando los resultados así:
MARCA TOTAL A B C 45 40 65 150 Hipótesis Nula: NO existe diferencia en la preferencia en la Población por las diversas marcas de cerveza. Hipótesis Alterna: SI existe diferencia en la preferencia en la Población por las diversas marcas de cerveza
Cálculo de (χ2 obt) • Tenemos que determinar las frecuencias esperadas (fe) si se realizara un muestreo aleatorio dentro de la hipótesis nula, y compararlas con las frecuencias observadas (fo). • Mientras más se acerque la fe a la fo, MÁS razonable será la Hipótesis Nula.
Fórmula de (χ2 obt)
¿Y si la preferencia de cerveza fuera aleatoria? MARCA TOTAL A B C 45 (50) 40 (50) 65 (50) 150 (150)
Evaluación de (χ2 obt) • Es necesario compararlo con una distribución muestral teórica que varía según los grados de libertad. • Los grados de libertad quedan eterminados por el número de datos fo que varían libremente. • Los grados de libertad se calculan con k-1, donde k es igual al número de grupos o categorías.
• En tablas o en SPSS, sabemos los VALORES CRÍTICOS para comparar el valor obtenido. Así: Si En nuestro experimento, con 2 grados y α=0. 05, el valor crítico es de 5. 991
En resumen: • 1) Formar tabla con las categorías y las frecuencias obtenidas • 2) Determinar cómo sería la tabla si las frecuencias hubieran sido al azar • 3) Calcular (χ2 obt) • 4) Determinar grados de libertad (k-1) y alfa, para buscar el valor crítico de χ2 • 5) Comparar (χ2 obt) con (χ2 crit) para descartar o no la Ho
Uso de χ2 para probar la independencia entre dos variables categóricas • Supongamos que hay una propuesta de ley para reducir la edad para beber legalmente, de 18 a 16 años. Yo quiero saber si el hecho de ser PANISTA o PERREDISTA afecta tu actitud al respecto. Hago un sondeo con miembros registrados de cada partido, y obtengo los siguientes resultados:
Actitud A favor Indeciso En contra TOTAL PAN 68 22 110 200 PRD 92 18 90 200 TOTAL 160 40 200 400
• Acabo de hacer una TABLA DE CONTINGENCIA que se compone de dos vías o entradas y muestra la relación contingente entre dos o más variables, cuando éstas han sido clasificadas en categorías mutuamente excluyentes y las entradas de cada celda son frecuencias.
Cálculo de (χ2 obt) • Aquí, para obtener la fe de cada celda, tenemos que calcular la proporción estimada de la Ho para cada columna: • En cada una es TOTAL CELDA/TOTAL COLUMNA • Vg: 160/400, 40/400, 200/400 • Ya teniendo las proporciones, para cada celda es PROPORCION POR TOTAL FILA. • Vg: (160/400)(200) = 80; (40/400)(200) = 20
Tabla ya con los valores de fe A favor Indeciso En contra TOTAL PAN 68 (80) 22 (20) 110 (100) 200 PRD 92 (80) 18 (20) 90 (100) 200 TOTAL 160 40 200 400
Grados de libertad en tablas de contingencia gl = (r-1)(c-1) Donde R es el número de renglones y C es el número de columnas En nuestro ejemplo, gl=(2 -1)(3 -1)=2
- Slides: 16