ESTADSTICA NO PARAMTRICA Proporciones 2 ChiCuadrado c MannWhitney

  • Slides: 57
Download presentation
ESTADÍSTICA NO PARAMÉTRICA Proporciones 2 Chi-Cuadrado (c ) Mann-Whitney Kruskal-Wallis Correlación de Spearman

ESTADÍSTICA NO PARAMÉTRICA Proporciones 2 Chi-Cuadrado (c ) Mann-Whitney Kruskal-Wallis Correlación de Spearman

Tipo de Variables y test a utilizar Variable Grupos Test Intervalar Dep/Ind Nominal Ordinal

Tipo de Variables y test a utilizar Variable Grupos Test Intervalar Dep/Ind Nominal Ordinal Ordinal Student no pareado Student pareado ANOVA/Scheffé/. . . Análisis de Reg. / r Chi cuadrado Mann-Whitney Kruskal-Wallis Wilcoxon Spearman 2 - ind dif. 2 - mismos ind. 3 ó más grupos 2 grupos 3 grupos 2 g /mismos ind dep/ind

Tipo de experimento Dos grupos de tratamiento consistentes de individuos diferentes Tres o más

Tipo de experimento Dos grupos de tratamiento consistentes de individuos diferentes Tres o más grupos consistentes de individuos diferentes Antes y después de un tratamiento en los mismos individuos Múltiples tratamientos en los mismos individuos Asociación entre dos variables Intervalar (y obtenida de población con distribución normal)* Test t no pareado Análisis de Varianza Test t pareado Análisis de varianza de medidas repetidas Regresión linear y correlación de Pearson; análisis de Bland-Altman Nominal Chi-cuadrado de tabla de contingencia Test de Mc. Nemar Q de Cochrane Coeficiente de contingencia Ordinal Test de suma de rangos de Mann. Whitney Estadístico de Kruskal-Wallis Test del signo de rangos de Wilcoxon Estadístico de Friedman Correlación de rangos de Spearman Tiempo de sobrevida Test de Gehan ó Test de rango del Log Escala de medición Ya vistos Test e stadís ticos no pa ramét ricos * Si los datos no tienen distribución normal, se ordenan y se aplican los tests para variables ordinales

Proporción • Resumen de variables binarias: – Síntoma: Presente / Ausente – Tratamiento: Efectivo

Proporción • Resumen de variables binarias: – Síntoma: Presente / Ausente – Tratamiento: Efectivo / Fracaso • Si r, número de sujetos observados con la característica, en la muestra n la proporción será: – Con la característica p = r / n – Sin la característica q = 1 - p

Intervalo de confianza de una proporción

Intervalo de confianza de una proporción

No confía En una clínica dental le preguntan a 263 pctes si confían que

No confía En una clínica dental le preguntan a 263 pctes si confían que sus CD tengan los datos en un PC, 81 dicen que la privacidad se pierde, el IC 95% es: 30. 8% Si confía 69. 2%

Tests de proporciones • Si existe diferencia con una proporción conocida • Comparar si

Tests de proporciones • Si existe diferencia con una proporción conocida • Comparar si existen diferencias significativas entre dos proporciones no pareadas • Comparar si existen diferencias significativas entre dos proporciones pareadas

Si existe diferencia con una proporción conocida • Similar a lo visto en test

Si existe diferencia con una proporción conocida • Similar a lo visto en test t (comparar con promedio conocido), o sea:

En una clínica de 215 pctes, 39 (18%) tienen asma, a nivel nacional se

En una clínica de 215 pctes, 39 (18%) tienen asma, a nivel nacional se sabe que el asma se presenta en 15%. ¿Existen diferencias significativas, entre 15% y 18%?

A 25 pctes con osteoartrosis cervical se les dividió, al azar, en dos grupos

A 25 pctes con osteoartrosis cervical se les dividió, al azar, en dos grupos (Lewith y Machin, 1981): • 12 fueron tratados con estimulación infra roja (IR). • 13 recibieron placebo. 9/12 con IR mejoró o desapareció el dolor = 0, 75 4/13 en el grupo placebo mejoró =0, 31 ¿Existen diferencias significativas?

Chi cuadrado

Chi cuadrado

MEJORA SINTOMAS DEL RESFRIO NO SI VITAMINA C PLACEBO 75 34 25 63 c

MEJORA SINTOMAS DEL RESFRIO NO SI VITAMINA C PLACEBO 75 34 25 63 c 2= 31, 793, gl = 1, p<0, 0001

Cálculo del test – chi-cuadrado Mejoran de los síntomas del resfrío SI NO Total

Cálculo del test – chi-cuadrado Mejoran de los síntomas del resfrío SI NO Total Vitamina C fo =75 fe =55, 33 fo =34 109 fe =53, 67 Placebo fo =25 fe =44, 67 fo =63 88 fe =43, 33 Total f columna 100 25 = 100*109/197 = 100*88/197

Cálculo de valores esperados A B C D

Cálculo de valores esperados A B C D

Cálculo de valores esperados Tot Si No al Es perados 75 34 109 55,

Cálculo de valores esperados Tot Si No al Es perados 75 34 109 55, 33 53, 67 25 63 88 44, 67 43, 33 100 97 197

Chi-Square Table

Chi-Square Table

ESTUDIO DE TRES PASTAS DENTALES Y SU EFECTO ANTICÁLCULO PD Bajo A 49 B

ESTUDIO DE TRES PASTAS DENTALES Y SU EFECTO ANTICÁLCULO PD Bajo A 49 B 67 C 49 TOTAL 165 E = 100 165 300 E (55) Moderado E Alto E TOTAL 30 (26) 21 (26) 27 (26) 78 21 (19) 12 (19) 24 (19) 57 E = 55 c 2 = å(49 - 55)2/55 +. . . + (24 - 19)2/19 = 9, 65 gl = (f - 1) (c - 1) = (3 - 1) = 4 Crítico: c 2 0. 05 = 9, 49. SE RECHAZA HO 100 100 300

Chi-Square Table

Chi-Square Table

Chi - cuadrado (c 2) c 2 = å(O - E)2/E (Chi cuadrado de

Chi - cuadrado (c 2) c 2 = å(O - E)2/E (Chi cuadrado de Pearson) c 2 = å(|O - E|2 - 1/2) / E Corrección de Yates: para tablas 2 x 2, con muestras pequeñas (en una celda existen menos de 5 observaciones). Tamaño de muestra: n de celdas x 10. Ej: 2 x 2 = 4 x 10 = 40 Ej. Ant: 3 x 3 = 9 x 10 = 90

Áreas bajo la curva

Áreas bajo la curva

Distribución de Chi-Cuadrado • Supongamos que repetimos experimento 1000 veces (el de la Vit

Distribución de Chi-Cuadrado • Supongamos que repetimos experimento 1000 veces (el de la Vit C / Placebo). Para cada experimento calculamos el valor de Chi-Cuadrado y ploteamos dichos valores. • Eje X es el valor calculado de Chi-cuadrado de acuerdo a la fórmula. • Eje Y es el número de veces que se obtiene el valor de chicuadrado.

ODDS RATIO • Proporciona: – Estimado de la relación entre dos variables binarias (si

ODDS RATIO • Proporciona: – Estimado de la relación entre dos variables binarias (si / no) – Permite examinar los efectos de otras variables en dicha relación – Forma especial y conveniente de interpretación en estudios caso-control

 • “The odds that a single throw of a die will produce a

• “The odds that a single throw of a die will produce a six are 1 to 5, or 1/5”. • “ODDS: es la relación de la probabilidad que el evento de interés ocurra contra la probabilidad de que esto no ocurra”. Bland y Altman. The odds ratio, BMJ 320; 1468, 2000

Razón de desigualdad (Odd ratio) Si OR = 5, 559 IC 95% : 3,

Razón de desigualdad (Odd ratio) Si OR = 5, 559 IC 95% : 3, 00 a 10, 29 Si No No 75 (a) 34 (b) 25 (c) 63 (d)

 Cases are weighted by the value of variable N. Frequencies HACE_EJERC$ (rows) by

Cases are weighted by the value of variable N. Frequencies HACE_EJERC$ (rows) by MEJOR_SINT$ (columns) si Si 75. 000 No 25. 000 Total 100. 000 no Total 34. 000 109. 000 63. 000 88. 000 97. 000 197. 000 Test statistic Pearson Chi-square Yates corrected Chi-square Coefficient Odds Ratio Ln(Odds) Value 5. 559 1. 715 Value 31. 793 30. 197 df Prob 1. 000 Asymptotic Std Error 0. 314 Oj. O: Debe calcular IC 95% = 1. 715 ± 1. 96 * 0. 314 0. 000

Riesgo Relativo • Relación de frecuencias de dos categorías. O desigualdad de ser clasificado

Riesgo Relativo • Relación de frecuencias de dos categorías. O desigualdad de ser clasificado en la columna 1 en lugar de la columna 2. • OR = (A/C) / (B/D) • >1: personas con factor de riesgo tienen más probabilidad que presenten el evento. • <1: personas con factor de riesgo son menos probable que experimenten el evento.

Edad Materna y peso al nacer (Fleiss y col, 3ª. Ed, ) Peso al

Edad Materna y peso al nacer (Fleiss y col, 3ª. Ed, ) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. > 20 a. Total 10 15 40 135 50 150 25 175 200 Existe asociación entre niños de bajo peso al nacer y edad de la madre?

Odds ratio (es solamente para estudios caso-control, variables nominales, tablas 2 x 2) (similar

Odds ratio (es solamente para estudios caso-control, variables nominales, tablas 2 x 2) (similar a riesgo relativo) • Si OR >1: existe una asociación positiva entre el factor de riesgo y el evento. • Si OR <1: hay una asociación negativa, (presencia del factor disminuye la probabilidad de encontrar el evento.

Edad Materna y peso al nacer (Fleiss y col, 3ª. Ed, ) Peso al

Edad Materna y peso al nacer (Fleiss y col, 3ª. Ed, ) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. > 20 a. Total 10 15 40 135 50 150 25 175 200 n. . (|n 11 n 22 – n 12 n 21| - ½ n. . )2 200(|10 x 135 -40 x 15| -1/2 200)2 c 2 = --------------------------------------------- = 2, 58 n 1. n 2. n. 1 n. 2 50 x 150 x 25 x 175

Edad Materna y peso al nacer (Fleiss y col, 3ª. Ed, ) Peso al

Edad Materna y peso al nacer (Fleiss y col, 3ª. Ed, ) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. > 20 a. Total n 11 n 21 n 12 n 22 n 1. n 2. n. 1 n. 2 n. . (|n 11 n 22 – n 12 n 21| - ½ n. . )2 200(|10 x 135 -40 x 15| -1/2 200)2 c 2 = --------------------------------------------- = 2, 58 n 1. n 2. n. 1 n. 2 50 x 150 x 25 x 175

Proporciones (Fleiss y col, 3ª. Ed, ) Peso al nacer <= 2500 g >2500

Proporciones (Fleiss y col, 3ª. Ed, ) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. > 20 a. Total 0, 050 0, 075 0, 125 0, 200 0, 675 0, 875 0, 25 0, 75 1, 00

Edad Materna y peso al nacer (Fleiss y col, 3ª. Ed, ) Peso al

Edad Materna y peso al nacer (Fleiss y col, 3ª. Ed, ) Peso al nacer <= 2500 g >2500 g Total Edad Mat <= 20 a. > 20 a. Total 20 30 80 270 100 300 50 350 400 Existe asociación entre niños de bajo peso al nacer y edad de la madre?

 • Sensibilidad: proporción de positivos que son correctamente identificados por el test. •

• Sensibilidad: proporción de positivos que son correctamente identificados por el test. • Especificidad: proporción de negativos que son correctamente identificados por el test

Comparación de sensibilidad y especificidad vs. Valores predictivos positivo y negativo para evaluar la

Comparación de sensibilidad y especificidad vs. Valores predictivos positivo y negativo para evaluar la seguridad de tests para diagnóstico ENFERMEDAD SI NO SI (a) Verdad + 45 (b) Falso + 10 NO (c) Falso – 5 (d) Verdad 40 TEST Sensibilidad = Especificidad = VPP = VPN = 100 a / a + c = 45 / 50 = 0, 90 d / b + d = 40 / 50 = 0, 80 a / a + b = 45 / 55 = 0, 82 d / c + d = 40 / 45 = 0, 89

Comparación de sensibilidad y especificidad vs. Valores predictivos positivo y negativo para evaluar la

Comparación de sensibilidad y especificidad vs. Valores predictivos positivo y negativo para evaluar la seguridad de tests para diagnóstico Tomado de Kramer, 1988 ENFERMEDAD SI NO SI (a) Verdad + 9 (b) Falso + 18 NO (c) Falso – 1 (d) Verdad 72 TEST Sensibilidad = Especificidad = VPP = VPN = 100 a / a + c = 9 / 10 = 0, 90 d / b + d = 72 / 90 = 0, 80 a / a + b = 9 / 27 = 0, 33 d / c + d = 72 / 73 = 0, 99

 • Valor predictivo positivo (VPP): proporción de pacientes con resultado de test positivo

• Valor predictivo positivo (VPP): proporción de pacientes con resultado de test positivo que son correctamente diagnosticados. • Valor predictivo negativo (VPN): proporción de pacientes con resultado de test negativo que son correctamente diagnosticados.

Tests no paramétricos para dos o más muestras Equivalente a test t pareado: Wilcoxon

Tests no paramétricos para dos o más muestras Equivalente a test t pareado: Wilcoxon Equivalente a test t no pareado: Mann-Whitney Equivalente a ANOVA: Kruskal Wallis Utilizar con variables ordinales o cuando variables intervalares no presenten distribución normal

Test U de Mann-Whitney • Colocar rangos a las observaciones en orden de menor

Test U de Mann-Whitney • Colocar rangos a las observaciones en orden de menor a mayor

Test de Mann-Whitney Producción de orina diaria m. L/día. Placebo Rango Droga Rango ------------------------------------1000

Test de Mann-Whitney Producción de orina diaria m. L/día. Placebo Rango Droga Rango ------------------------------------1000 1 1400 6 1380 5 1600 7 1200 3 1180 2 1220 4 T= 9 19 ------------------------------------- Mann-Whitney U= 3, p = 0. 289

Test de Tukey-Duckworth • Cálculos se pueden hacer en la cabeza • Existe solamente

Test de Tukey-Duckworth • Cálculos se pueden hacer en la cabeza • Existe solamente un requisito que cumplir: 4 ≤ n 1 ≤ n 2 ≤ 30 • Ho: Las muestras son idénticas • Ha: Las muestras son diferentes • El test estadístico a calcular es C

Test de Tukey-Duckworth • Existen solamente dos valores críticos: C 0, 05 = 7

Test de Tukey-Duckworth • Existen solamente dos valores críticos: C 0, 05 = 7 C 0, 01 = 10

Test de Tukey-Duckworth Procedimiento 1. Determine medición más grande y más pequeña en cada

Test de Tukey-Duckworth Procedimiento 1. Determine medición más grande y más pequeña en cada muestra ranqueada. 2. En la muestra que contiene el valor más grande de todos los valores combinados, cuente todos los valores que son mayores que la medición más grande en el otro grupo.

3. En la otra muestra, cuente todas las mediciones que son más pequeñas que

3. En la otra muestra, cuente todas las mediciones que son más pequeñas que la medición más pequeña del grupo de la primera medición. 4. Sume ambas cantidades (= C).

Grupo 1 80 81 82 83 84 85 86 87 89 92 93 94

Grupo 1 80 81 82 83 84 85 86 87 89 92 93 94 96 97 98 Grupo 2 84 89 92 92 92 94 95 96 96 96 98 98 99 101 103 Valores de exclusión Mayor valor Ccalc = 4 + 3 = 7 C 0, 05 = 7 Ccalc ≥ C 0, 05 por lo tanto se rechaza Ho. Conclusión: las muestras son diferentes

Kruskal-Wallis • Equivalente a Anova • Extensión del test de Mann-Whitney a más de

Kruskal-Wallis • Equivalente a Anova • Extensión del test de Mann-Whitney a más de dos grupos • Al conjunto de observaciones (N) se les da rango (1 a N), indiferente de qué grupo estén, y para cada grupo se calcula la suma de rangos, y posteriormente se calcula H, definido por

Donde R es el promedio de todos los rangos, y es siempre igual a

Donde R es el promedio de todos los rangos, y es siempre igual a (N+1)/2. Ri = es la suma de los rangos de ni observaciones. Para calcular es más fácil:

% de reducción de cefalea en tres grupos (Fentress et al, 1986) (Rangos en

% de reducción de cefalea en tres grupos (Fentress et al, 1986) (Rangos en paréntesis) Relajación y biofeedback Relajación No tratados 62 (11) 69 (10) 50 (12) 74 ( 8, 5) 43 (13) -120 (17) 86 ( 7) 100 ( 2) 74 ( 8, 5) 94 ( 5) -288 (18) 91 ( 6) 100 ( 2) 4 (15) 37 (14) 98 ( 4) -76 (16) S rango 55 Rango medio 9, 17 36 6, 00 80 13, 33

Gl = GRUPOS – 1 = 2 Valor crítico: tabla de c 2 =

Gl = GRUPOS – 1 = 2 Valor crítico: tabla de c 2 = 5, 99 Se acepta Ho.

Sicólogo, 1863 - 1945 Correlación de Spearman • Medida No Paramétrica para establecer relación

Sicólogo, 1863 - 1945 Correlación de Spearman • Medida No Paramétrica para establecer relación de dos variables ordinales (ó intervalares sin DN) Ventajas: - No se necesita distribución normal - No se ve tan afectada por “outliers”

Correlación de Spearman • Correlación para variables ordinales • Para determinar la significancia de

Correlación de Spearman • Correlación para variables ordinales • Para determinar la significancia de la asociación de dos variables continuas en que no existe normalidad de las variables. • Contrapartida no paramétrica de la correlación de Pearson.

(n: número de pares de obs. ) (d= dif de rangos)

(n: número de pares de obs. ) (d= dif de rangos)

Grado de reabsorción ósea en mandíbula, lado der e izq. Existe relación ? Derecha

Grado de reabsorción ósea en mandíbula, lado der e izq. Existe relación ? Derecha (x) 83 97 91 72 76 88 95 89 75 74 Rango 5 10 8 1 4 6 9 7 3 2 - - - - - - - - - - Izquierda(y) 87 98 84 82 74 92 91 83 80 77 Rango 7 10 6 4 1 9 8 5 3 2 - - - - - - - - - - Dif. de rangos: -2 0 2 -3 3 -3 1 2 0 0 (x – y) d 2 = 4 0 4 9 9 9 1 4 0 0 = 40 å d 2 rs = 1 – [ 6(40) / 10(102 – 1)] = 0, 757

Diferentes escalas, diferentes medidas de su asociación Escala de ambas variables Nominal Medida de

Diferentes escalas, diferentes medidas de su asociación Escala de ambas variables Nominal Medida de asociación Chi-Square de Pearson: χ2 Ordinal rho de Spearman Intervalar r de Pearson

Resumen • Método de investigación – Protocolo – Artículo científico • Bioestadística – Estadística

Resumen • Método de investigación – Protocolo – Artículo científico • Bioestadística – Estadística descriptiva: n, %, x ± ds – Inferencia estadística: test t, ANOVA, ARS, RL, c 2