UNIVERSIDAD INCA GARCILASO DE LA VEGA Vicerrectorado Acadmico

  • Slides: 55
Download presentation
UNIVERSIDAD INCA GARCILASO DE LA VEGA Vicerrectorado Académico Instituto de Capacitación Docente MUESTREO E

UNIVERSIDAD INCA GARCILASO DE LA VEGA Vicerrectorado Académico Instituto de Capacitación Docente MUESTREO E INSTRUMENTOS DE MEDICIÓN, TABULACIÓN, ANÁLISIS E INTERPRETACIÓN DE RESULTADOS Mag. Renán Quispe Ll. Lima, enero 2005

EJEMPLO Se desea estimar, con 95% de confianza, el tiempo promedio para la fabricación

EJEMPLO Se desea estimar, con 95% de confianza, el tiempo promedio para la fabricación de cierto producto. En un estudio piloto se encontró que S=1. 2 horas. El investigador asume una precisión de 0. 25 horas. Entonces, se tiene que: Confianza 1 -α=0. 95 S=1. 2 horas, Z=1. 96 E=0. 25 horas Si se desea mejorar la precisión, asumiendo a E=0. 2

Deducción del tamaño de la muestra utilizando los errores de muestreo relativo

Deducción del tamaño de la muestra utilizando los errores de muestreo relativo

EJEMPLO Se desea conocer tamaño de la muestra para estimar el porcentaje de hogares

EJEMPLO Se desea conocer tamaño de la muestra para estimar el porcentaje de hogares pobres en una provincia, si se sabe que la desviación standart de la población es cerca del 20% de la proporción de hogares pobres y se desea estar seguro en un 95% que la proporción muestral se halle dentro del 5% de la proporción poblacional (Z 2 = 1. 96) Resolviendo, tenemos lo siguiente: Si se escoge el tamaño de la muestra igual a 62, tenemos la seguridad al 95% de confianza que la proporción muestral se halle dentro del 5% de la proporción poblacional

EJEMPLO ¿Que pasaría, si la desviación standart de la población aumenta al 40% de

EJEMPLO ¿Que pasaría, si la desviación standart de la población aumenta al 40% de la proporción de hogares pobres? El tamaño de la muestra debe ser 246 para tener la seguridad al 95% de confianza que la proporción muestral se halle dentro del 5% de la proporción poblacional ¿Que pasaría, si se desea estar seguro en un 95% que la proporción muestral se halle dentro del 10% de la proporción poblacional ? El tamaño de la muestra debe ser 15 para tener la seguridad al 95% de confianza que la proporción muestral se halle dentro del 5% de la proporción poblacional

PRUEBAS DE HIPOTESIS Son supuestos o enunciados que pueden o no ser verdaderas, relativas

PRUEBAS DE HIPOTESIS Son supuestos o enunciados que pueden o no ser verdaderas, relativas a una o más poblaciones y pueden ser: Contrastar una Hipótesis Estadísticamente Es juzgar si cierta propiedad supuesta para una población es compatible con lo observado en una muestra de ella.

PRUEBAS DE HIPOTESIS ALTERNATIVAS Pueden ser: Hipótesis nula : HO, Determina supuestos o conjeturas

PRUEBAS DE HIPOTESIS ALTERNATIVAS Pueden ser: Hipótesis nula : HO, Determina supuestos o conjeturas de la población o poblaciones bajo estudio, con el propósito de rechazar. Hipótesis alternativa : H 1, Determina supuestos o conjeturas de la población o poblaciones bajo estudio con el propósito de no rechazarla.

Tipos de Hipótesis: Alternativas: Hipótesis A v/s Hipótesis B, donde A y B no

Tipos de Hipótesis: Alternativas: Hipótesis A v/s Hipótesis B, donde A y B no pueden cumplirse simultáneamente. Anidadas: Hipótesis A y B, donde A es un caso especial de B.

HIPOTESIS A CONTRASTAR Se definen: Las hipótesis nula y alternativa con una distribución de

HIPOTESIS A CONTRASTAR Se definen: Las hipótesis nula y alternativa con una distribución de probabilidad conocida Regla de decisión(nivel de significación ) datos de la muestra Valor crítico o tabulado Se calcula una medida asociada a la hipótesis que se desea docimar Se comparan los valores calculado con tabulado H 1 ¿se rechaza Ho? SI NO Se extraen conclusiones

Utilizar prueba de Z Si ¿Se conoce ? No Si Utilizar prueba de Z

Utilizar prueba de Z Si ¿Se conoce ? No Si Utilizar prueba de Z Es n ≥ 30? No Utilizar prueba de Z Si Si ¿Se conoce? No ¿Se sabe q la población es normal? Utilizar prueba de t Si No Utilizar prueba de Z (por el teorema central del límite) ¿Se conoce? No Si Es n ≥ 30? Utilizar prueba de Z (por el teorema central del límite) Utilizar una prueba no paramétrica

CLASES DE HIPOTESIS Hipótesis simples: Da valores exactos para todos los parámetros desconocidos de

CLASES DE HIPOTESIS Hipótesis simples: Da valores exactos para todos los parámetros desconocidos de la ley de probabilidad asumida. Hipótesis compuesta: Es la hipótesis que no da valores exactos, sino tiene un conjunto de valores para todos los parámetros desconocidos de la ley de probabilidad asumida. Se refiere a regiones de valores. Prueba de hipótesis: Es un procedimiento basado en la evidencia muestral y en la teoría de probabilidad que se emplea para determinar si la hipótesis es un enunciado razonable y no debe ser rechazada, o si es irrazonable y debe ser rechazada.

PROCEDIMIENTO DE CINCO PASOS PARA PROBAR UNA HIPOTESIS ÄPaso 1: Plantear Hipótesis nula y

PROCEDIMIENTO DE CINCO PASOS PARA PROBAR UNA HIPOTESIS ÄPaso 1: Plantear Hipótesis nula y Alternativa ÄPaso 2: Seleccionar un Nivel de significación ÄPaso 3: Identificar el Valor estadístico de prueba ÄPaso 4: Formular una regla de decisión ÄPaso 5: Tomar una muestra y llegar a una decisión ÄFinalmente: Aceptar H 0, o bien rechazar H 0 y aceptar H 1 Nivel de significación: El riesgo que se asume acerca de rechazar la hipótesis nula cuando en realidad debe aceptarse por ser verdadera.

TIPOS DE ERROR Error Tipo I: Se refiere a la probabilidad de rechazar la

TIPOS DE ERROR Error Tipo I: Se refiere a la probabilidad de rechazar la hipótesis nula, H 0, cuando en realidad es verdadera. Se busca minimizar este tipo de error. 1 - : Se refiere a la probabilidad de no rechazar la hipótesis nula, H 0, cuando en realidad es verdadera. Se busca maximizar este tipo de error. Error tipo II: Se refiere a la probabilidad de aceptar la hipótesis nula, H 0 cuando en realidad es falsa. Este tipo de error busca aceptar lo que espero que no se acepte. 1 - : Se refiere a la probabilidad de rechazar la hipótesis nula, H 0, cuando en realidad es falsa. No se busca maximizarlo por que nunca se va aceptar la H 0.

Hipótesis Nula Si HO es verdadera Si HO es falsa El investigador No Rechazar

Hipótesis Nula Si HO es verdadera Si HO es falsa El investigador No Rechazar HO Rechaza HO Decisión Correcta = (1 - ) Error Tipo I = NIVEL DE SIGNIFIC. Error Tipo II = Decisión Correcta = 1 - POTENCIA

Valor estadístico de prueba: Un valor, determinado a partir de la información muestral, que

Valor estadístico de prueba: Un valor, determinado a partir de la información muestral, que se utiliza para aceptar o rechazar la hipótesis nula. La regla de decisión Una regla de decisión es simplemente la condiciones bajo las que se acepta o rechaza la hipótesis nula. El área de rechazo define la ubicación de todos los valores que son demasiado grandes o demasiado pequeños, por lo que la probabilidad de que se rechace la hipótesis nula es alta.

PRUEBA DE UNA COLA Distribución muestral del valor estadístico z, regiones de aceptación y

PRUEBA DE UNA COLA Distribución muestral del valor estadístico z, regiones de aceptación y de rechazo para una prueba de una cola, nivel de significación de 0. 05. Región de rechazo 1. 645 Escala de Z Probabilidad 0. 05 Probabilidad 0. 95 Valor Crítico Toma de una decisión: Es la de afirmar que no hay evidencias suficientes para rechazar o no la hipótesis nula.

PRUEBAS DE SIGNIFICACION DE UNA COLA Y DOS COLAS PRUEBA DE UNA COLA Región

PRUEBAS DE SIGNIFICACION DE UNA COLA Y DOS COLAS PRUEBA DE UNA COLA Región de aceptación H 0 Región de rechazo -1. 645 Valor crítico 0 Escala de Z

Se acepta la hipótesis nula si el estadístico de la prueba cae dentro de

Se acepta la hipótesis nula si el estadístico de la prueba cae dentro de esta región Se rechaza la hipótesis nula Área = nivel deseado de significancia Valor critico del estadístico de la prueba

PRUEBAS PARA LA MEDIA DE LA POBLACION MUESTRA GRANDE Y SE CONOCE LA DESVIACION

PRUEBAS PARA LA MEDIA DE LA POBLACION MUESTRA GRANDE Y SE CONOCE LA DESVIACION ESTANDAR DE LA POBLACION Se utiliza la siguiente estadística de prueba:

Las pruebas de hipótesis que se desean probar son: H 0 H 1 Rc

Las pruebas de hipótesis que se desean probar son: H 0 H 1 Rc = o = 1 ( < o) Z<-z 1 - 1 (> o) Z> z 1 - o o < o o > o Z<-z 1 - /2 ó Z> z 1 - /2 | Z|< z 1 - Z<-z 1 - Z> z 1 -

PRUEBA DE DOS COLAS Región de rechazo 0. 025 Región de aceptación H 0

PRUEBA DE DOS COLAS Región de rechazo 0. 025 Región de aceptación H 0 0. 95 -1. 96 Valor crítico Escala de Z 0 -1. 96 Valor crítico

MUESTRA GRANDE Y SE DESCONOCE LA DESVIACION ESTANDAR DE LA POBLACION Se utiliza la

MUESTRA GRANDE Y SE DESCONOCE LA DESVIACION ESTANDAR DE LA POBLACION Se utiliza la siguiente estadística de prueba:

Las pruebas de hipótesis que se desean probar son: H 0 H 1 Rc

Las pruebas de hipótesis que se desean probar son: H 0 H 1 Rc = o = 1 ( < o) T<-t 1 - = 1 (> o) T> t 1 - o T<-t 1 - /2 o T> t 1 - /2 o < o T<-t 1 - o > o T> t 1 -

PRUEBA DE DOS COLAS Región de rechazo 0. 025 Región de aceptación H 0

PRUEBA DE DOS COLAS Región de rechazo 0. 025 Región de aceptación H 0 0. 95 -1. 96 Valor crítico Escala de t 0 -1. 96 Valor crítico

PRUEBAS DE HIPOTESIS SOBRE LA DIFERENCIA DE MEDIAS PRUEBA DE DIFERENCIA DE MEDIAS CON

PRUEBAS DE HIPOTESIS SOBRE LA DIFERENCIA DE MEDIAS PRUEBA DE DIFERENCIA DE MEDIAS CON 21 = 22 PERO DESCONOCIDAS, EN MUESTRAS PEQUEÑAS Se utiliza la siguiente estadística de prueba: Donde:

Las pruebas de hipótesis que se desean probar son:

Las pruebas de hipótesis que se desean probar son:

PRUEBA DE DIFERENCIA DE MEDIAS CON 21 22 PERO DESCONOCIDAS, EN MUESTRAS PEQUEÑAS Si

PRUEBA DE DIFERENCIA DE MEDIAS CON 21 22 PERO DESCONOCIDAS, EN MUESTRAS PEQUEÑAS Si se quiere probar la hipótesis sobre la diferencia de medias, cuando los tamaños de las muestras son pequeños y las poblaciones tienen distribuciones normales, con varianzas diferentes, se utiliza la siguiente estadística de prueba: Que tiene una distribución t con K grados de libertad.

Intervalo para la diferencia de medias cuando se conoce la varianza poblacional

Intervalo para la diferencia de medias cuando se conoce la varianza poblacional

Se acepta la hipótesis nula Se Rechaza Área =. 025 Z= -1. 96 -.

Se acepta la hipótesis nula Se Rechaza Área =. 025 Z= -1. 96 -. 1220. 3 Valor critico Z= +1. 96 +. 1220. 3 Valor critico +1050 = diferencia observada entre las medias muestrales.

Ejemplo 3

Ejemplo 3

Solución: a. Intervalo: (x – y) + z α/2 √ σ 2 x/nx +

Solución: a. Intervalo: (x – y) + z α/2 √ σ 2 x/nx + σ 2 y /ny ) Reemplazando datos: (32 -25) + (1. 645) √ 48/45 + 56/60 ) [ 4. 67, 9. 33] b. Interpretación: La verdadera diferencia de medias se halla entre 4. 67 y 9. 33 con una certeza del 90%. b. Si las dos medias son iguales, la diferencia entre ambas es cero. Por lo tanto, para que la igualdad entre las medias no pueda descartarse el cero debe estar en el intervalo calculado. Como en este caso no sucede, no hay evidencia de la igualdad entre las medias.

PRUEBA DE HIPOTESIS PARA UNA PROPORCION Las pruebas de hipótesis con relación a proporciones

PRUEBA DE HIPOTESIS PARA UNA PROPORCION Las pruebas de hipótesis con relación a proporciones son básicamente iguales a las relativas con medias. Para probar la hipótesis de la proporción se usa la siguiente estadística de prueba:

Las pruebas de hipótesis que se desean probar son: H 0 p = p

Las pruebas de hipótesis que se desean probar son: H 0 p = p 0 H 1 p=p 1 ( <p. O) Rc Z<-z 1 - p=p 1 (>po ) Z> z 1 - p po Z<-z 1 - /2 o Z> z 1 - /2 p po p<po Z<-z 1 - p p p>po Z> z 1 -

Intervalo de confianza para una proporción P ∊ ( p + Z α/2 √

Intervalo de confianza para una proporción P ∊ ( p + Z α/2 √ pq/n) Intervalo de confianza para la diferencia de 2 proporciones P 1 – P 2 ∊ ( (p 1 – p 2) + Z α/2 √ p 1 q 1/n 1 + p 2 q 2/n 2 ) Consultoría Virgen del Carmen S. A.

Esquema cuando se comprar la diferencia entre dos medias o proporciones muéstrales Se acepta

Esquema cuando se comprar la diferencia entre dos medias o proporciones muéstrales Se acepta la hipótesis nula si el estadístico de la prueba cae dentro de esta región. Se rechaza la hipótesis nula Area A = área B y (A+B) = el nivel deseado de significancia Area A Area B Valor critico Valor teórico de la diferencia + Valor critico

Se acepta la hipótesis nula Se rechaza Área =. 025 Z= -1. 96 Diferencia

Se acepta la hipótesis nula Se rechaza Área =. 025 Z= -1. 96 Diferencia observada entre las proporciones muestrales = (. 40 -. 50) =-. 10 -. 071 Valor critico Z= +1. 96 +. 071 Valor critico

Ejemplo 4 Una fábrica desea saber la proporción de amas de casa que preferirían

Ejemplo 4 Una fábrica desea saber la proporción de amas de casa que preferirían una aspiradora de su marca. Se toma al azar una muestra de 100 amas de casa y 20 dicen que les gustaría la máquina. Calcule e interprete un intervalo del 95% de confianza para la verdadera proporción de amas de casa que preferirían dicha aspiradora. Solución: Intervalo: p + Z α/2 √ pq/n Reemplazando datos: [0. 2 + √ (0. 2)(0. 8)/100 ] [0. 122, 0. 278 ] Interpretación: Tenemos una certeza del 95% de que la verdadera proporción de amas de casa que preferirían la aspiradora está entre 12. 2% y 27. 8%. Consultoría Virgen del Carmen S. A. 37

Ejemplo 5 Se está considerando cambiar el procedimiento de manufactura de partes. Se toman

Ejemplo 5 Se está considerando cambiar el procedimiento de manufactura de partes. Se toman muestras del procedimiento actual así como del nuevo para determinar si este último resulta mejor. Si 75 de 1000 artículos del procedimiento actual presentaron defectos y lo mismo sucedió con 80 de 2500 partes del nuevo, determine un intervalo de confianza del 90% para la verdadera diferencia de proporciones de partes defectuosas. Solución: Intervalo: [(p 1 – p 2) + Z α/2 √ p 1 q 1/n 1 + p 2 q 2/n 2 ] Reemplazando datos: (0. 075 – 0. 032) + (1. 645) √ (0. 075)(0. 925)/1000 + (0. 032)(0. 968)/2500 [0. 0281 , 0. 0579 ] Interpretación: Tenemos una certeza del 90% de que la diferencia de proporciones está entre 0. 0281 y 0. 0579. Consultoría Virgen del Carmen S. A.

Se hizo una encuesta a 212 altos ejecutivos de grandes compañías de un país,

Se hizo una encuesta a 212 altos ejecutivos de grandes compañías de un país, para estudiar problemas de comunicación y moral en las grandes compañías de ese país. Uno de los problemas que se estudiaron fue si los altos ejecutivos encontraban útiles las encuestas regulares de opiniones de empleados. Queremos usar los resultados de la encuesta para apoyar la aseveración de que más del 90% de los altos ejecutivos encuentran útiles dichas encuestas. Se encontró ( en la encuesta) que el 93% la encontraban útil. Consultoría Virgen del Carmen S. A.

Consultoría Virgen del Carmen S. A.

Consultoría Virgen del Carmen S. A.

ESTIMACION PUNTUAL La muestra proporciona el estimador. Las muestras repetidas proporciona valores alrededor del

ESTIMACION PUNTUAL La muestra proporciona el estimador. Las muestras repetidas proporciona valores alrededor del parámetro. Parámetro Poblacional Media: Varianza: 2 Proporción: P Estimador

ESTIMACION INTERVALICA Para una estimación interválica, usamos los datos de la muestra para obtener

ESTIMACION INTERVALICA Para una estimación interválica, usamos los datos de la muestra para obtener los límites del intervalo de manera que tengamos una probabilidad (1 - ) de que el intervalo contiene al parámetro poblacional, así por ejemplo Al considerar la distribución de la media muestral 95 % El 95% de todas las muestras tiene en este intervalo

ESTIMACION INTERVALICA Luego para el 95% de las muestras el intervalo obtenido con límites

ESTIMACION INTERVALICA Luego para el 95% de las muestras el intervalo obtenido con límites incluirá entre sus valores el valor de la media poblacional

Intervalo de confianza para la media poblacional A) Si la varianza poblacional ( 2)

Intervalo de confianza para la media poblacional A) Si la varianza poblacional ( 2) es conocida Para todo tamaño de muestra de población normal o Para muestra grande (n 30) de cualquier población donde Z 1 - es la cuantila 1 - de la normal estándar

Intervalo de confianza para la media poblacional B) Si la varianza poblacional ( 2)

Intervalo de confianza para la media poblacional B) Si la varianza poblacional ( 2) es desconocida, para muestra grande (n 30)

Intervalo de confianza para la media poblacional En un experimento diseñado para estimar el

Intervalo de confianza para la media poblacional En un experimento diseñado para estimar el número promedio de latidos por minuto del corazón para cierta población, se encontró que el número promedio de latidos por minuto de 49 personas fue de 90 con una desviación estándar de 10. Obtenga un intervalo de 90% de confianza para estimar el número promedio de latidos por minuto.

Intervalo de confianza para la media poblacional C) Si la varianza poblacional ( 2)

Intervalo de confianza para la media poblacional C) Si la varianza poblacional ( 2) es desconocida, para muestra pequeña de población normal Donde t 1 - es la cuantila 1 - de la distribución t-Student con n-1 grados de libertad (g. l. )

Distribución t-Student Para muestras pequeñas de población normal 0 t 1 - t(v) Si

Distribución t-Student Para muestras pequeñas de población normal 0 t 1 - t(v) Si v = 15 y = 0. 10, entonces t 1 - = t 0. 95 = 1. 753

Intervalo de confianza para la diferencia de medias a) Si las varianzas 12 y

Intervalo de confianza para la diferencia de medias a) Si las varianzas 12 y 22 son conocidas Para muestras grandes donde

Intervalo de confianza para la diferencia de medias b) Si las varianzas 12 y

Intervalo de confianza para la diferencia de medias b) Si las varianzas 12 y 22 son desconocidas Para muestras grandes donde

Intervalo de confianza para la diferencia de medias c) Si las varianzas son desconocidas,

Intervalo de confianza para la diferencia de medias c) Si las varianzas son desconocidas, pero semejantes ( 12 = 22), entonces para muestras pequeñas de poblaciones normales donde t 1 - es la cuantila 1 - de la distribución t-Student con (n 1 + n 2 – 2) grados de libertad

Ejemplo 1 Los siguientes datos corresponden a los pesos (en kgs) de 15 hombres

Ejemplo 1 Los siguientes datos corresponden a los pesos (en kgs) de 15 hombres escogidos al azar y que trabajan en una empresa: 72, 68, 63, 75, 84, 91, 66, 75, 86, 90, 62, 87, 70, 69. Estime el peso promedio y la desviación estándar. Luego estime el error del peso promedio. Solución: Sea X = peso promedio de los hombres en kgs. x = Σ xi / n = (72+68+63+. . . +69)/ 15 = 75. 67 S =√ Σ (xi – x)2 / (n-1) = √ [ (72 -75. 67)2 +. . +(69 -75. 67)2] /(15 -1) = 9. 77 Sx = error del peso promedio. Sx = S/ √n = 9. 77/ √ 15 = 2. 52

Ejemplo 2 Entre los miembros de una comunidad se escogieron 150 personas al azar

Ejemplo 2 Entre los miembros de una comunidad se escogieron 150 personas al azar y se les preguntó si estaban de acuerdo con los programas que el gobierno estaba desarrollando para prevenir el consumo de drogas. La encuesta dio como resultado que 130 sí estaban de acuerdo. Estime la proporción de los que estaban de acuerdo y el error estándar. Solución: p = (individuos que tienen la característica)/ total p = 130/150 = 0. 87. S p = √ p(1 -p)/n = √ (0. 87)(0. 13)/ 150 = 0. 027.

Ejemplo 3 De las 50 aulas que tiene un edificio de la facultad de

Ejemplo 3 De las 50 aulas que tiene un edificio de la facultad de matemáticas de una Universidad, se escogieron al azar 5 y se determinó el número de alumnos que había en cada una de ellas en la primera hora de clases. Estime el número de alumnos que hay en el edificio si todas las aulas se encuentran ocupadas a esa hora y si el número de alumnos en cada una de las aulas inspeccionadas fue: 24, 35, 16, 30, 28. Luego estime el error del número total de estudiantes. Solución: x = promedio de alumnos en las 5 aulas inspeccionadas. x = Σ xi / n = (24+35+16+30+28)/5 = 26. 6 T = total de alumnos estimados en las 50 aulas. N = número total de aulas = 50. T = Nx = 50 x 26. 6 = 1330 alumnos. S = =√ Σ (xi – x)2 / (n-1) = √ (24 -26. 6)2+. . +(28 -26. 6)2/(5 -1) = 7. 13 SNx = NS / √ n = (50)(7. 13)/ √ 5 = 159. 43