Intervalos de Confianza Contenido Estimacin de parmetros Estimacin

  • Slides: 38
Download presentation
Intervalos de Confianza

Intervalos de Confianza

Contenido Estimación de parámetros ÖEstimación de intervalos ÖIntervalo de confianza para la media ÖIntervalo

Contenido Estimación de parámetros ÖEstimación de intervalos ÖIntervalo de confianza para la media ÖIntervalo de confianza para la varianza ÖOtros Intervalos de Confianza ÖIntervalos de tolerancia ÖInts. de confianza y regresión lineal Ö UMSNH-FIE

Estimación de Parámetros poblacionales y Estadísticos Muestrales Parámetros: Media (m) Datos (Población de Interés)

Estimación de Parámetros poblacionales y Estadísticos Muestrales Parámetros: Media (m) Datos (Población de Interés) Varianza(s 2) Desv. Est. (s) Etc. I n fe r e n c i a s Muestr eo Muestras Estadísticos: Promedio ( X ) Varianza muestral(S 2) Desv. Est. muestral(S) Etc. UMSNH -

Estimación de Parámetros Ejemplo: Estimación de la media de una población Parámetro que se

Estimación de Parámetros Ejemplo: Estimación de la media de una población Parámetro que se pretende estimar : La media de la población ( µ ) que en general no se conoce, no se puede conocer, o se conoce sólo un valor teórico: Estimador: La media muestral ( X ) que se calcula a partir de una muestra de N datos como sigue: El estimador (en el ejemplo la media muestral) puede tomar diferentes valores (aleatorios) dependiendo de la muestra (aleatoria) considerada, es decir, el estimador es una variable aleatoria Es natural preguntarse : ¿Cuál será la distribución de probabilidad del estimador? De hecho ¿cuáles serán sus parámetros? ¿tendrán que ver con los de la población? UMSNH -

Estimación de Parámetros Ejemplo: Lanzamiento de un dado Población de interés : El conjunto

Estimación de Parámetros Ejemplo: Lanzamiento de un dado Población de interés : El conjunto de datos obtenidos al lanzar un dado legal en diversas ocasiones Parámetro de interés : La media (µ) de la población Estimador: La media muestral ( X ) Experimento aleatorio : Lanzar un dado Variable aleatoria X= número obtenido en la cara superior Espacio muestral = {1, 2 , 3, 4, 5 , 6} Distribución de la variable aleatoria X: Uniforme Media teórica: µ=3. 5 UMSNH -

Estimación de Parámetros Ejemplo: Lanzamiento de un dado Distribución de la variable aleatoria (X)

Estimación de Parámetros Ejemplo: Lanzamiento de un dado Distribución de la variable aleatoria (X) del experimento Función de Probabilidad: f(x) = P(X=x) x 1 2 3 4 5 6 f(x) 1/6 1/6 1/6 Función de Probabilidad 0. 2 f(x) 0. 15 0. 1 m 0. 05 0 1 2 3 4 5 6 x UMSNH -

Estimación de Parámetros Ejemplo: Lanzamiento de un dado Distribución del estadístico X . Diferentes

Estimación de Parámetros Ejemplo: Lanzamiento de un dado Distribución del estadístico X . Diferentes cálculos de X para N=10: Muestra x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 x 10 X 1 1 3 5 1 1 2 2 4 2 2 2. 1 2 1 5 3 6 3 3 6 4 2 5 3. 8 3 6 1 5 3 5 4 5 3 2 2 3. 2 4 2 5 2 4 1 5 3 6 6 4 3. 8 5 3 6 5 4 3 2 3 4 3. 7 . . . Cada muestra puede considerarse como: § 10 valores de la variable aleatoria X, § 1 sólo valor para 10 variables aleatorias X 1, X 2, . . . , X 10 UMSNH -

Estimación de Parámetros Ejemplo: Lanzamiento de un dado Distribución del estadístico X . Si

Estimación de Parámetros Ejemplo: Lanzamiento de un dado Distribución del estadístico X . Si obtenemos 1000 muestras, obtendremos 1000 valores de X , para estos 1000 valores realizamos el histograma: frecuencia relativa 0. 25 Distribución de la media muestral 0. 2 0. 15 0. 1 0. 05 0 1 2 3 X 4 5 6 UMSNH -

Estimación de Parámetros Ejemplo: Lanzamiento de un dado Código en Matlab: %se simula el

Estimación de Parámetros Ejemplo: Lanzamiento de un dado Código en Matlab: %se simula el dado x=round(rand(N, n)*6+0. 5); M=sum(x)/N; [X, c]=hist(M, 15); %se grafica el histograma de frecuencia relativa en p. u. X=X/n; bar(c, X) Recordatorio: Cada muestra puede considerarse como: § 10 valores de la variable aleatoria X, § 1 sólo valor para 10 variables aleatorias X 1, X 2, . . . , X 10 UMSNH -

Estimación de Parámetros ^ que pretende estimar un parámetro En general: un estadístico Q

Estimación de Parámetros ^ que pretende estimar un parámetro En general: un estadístico Q q es una v. a. Que depende de las N variables aleatorias que forman una muestra, es decir ^ Q = f(X 1, X 2, . . . , XN) Así, una muestra es un conjunto de valores (x 1, x 2, . . . , x. N) tomados por las variables aleatorias (X 1, X 2, . . . , XN). Es natural suponer que la distribución f(Xi)=P(Xi=xi) de cada variable de la muestra es igual a la de la población ^ ^ Sin embargo, la distribución f(^ q) = P( Q = q ) del estadístico como se vió en el ejemplo del dado es otra cosa. UMSNH -

Estimación de Intervalos ^ produce un valor ^ En la explicación previa, un estimador

Estimación de Intervalos ^ produce un valor ^ En la explicación previa, un estimador Q q que pretende aproximar a un parámetro q. A este enfoque se le llama estimación puntual En el enfoque de estimación de intervalos, para un parámetro q no se estima un valor, sino un intervalo de la forma l q u, donde los valores extremos l, u dependen del valor numérico del ^ para una muestra en particular y de la distribución estadístico q ^ de muestreo de Q Es decir, l, u dependen de la muestra, por lo tanto son valores de variables aleatorias L, U UMSNH -

Estimación de Intervalos ^ , es posible Partiendo de la distribución de muestreo para

Estimación de Intervalos ^ , es posible Partiendo de la distribución de muestreo para Q determinar valores de L, U tales que se cumpla lo siguiente: P(L q U) =1 – a Donde 0 < a < 1 Es decir, se puede garantizar con una probabilidad de 1 -a que la muestra elegida contendrá el valor verdadero de q Al intervalo resultante l q u se le conoce como el intervalo de confianza del 100(1– a) % para el parámetro desconocido q UMSNH -

Estimación de Intervalos Ejemplo: Construcción repetida de un intervalo de confianza para la media

Estimación de Intervalos Ejemplo: Construcción repetida de un intervalo de confianza para la media m: m Si los intervalos de confianza mostrados son del 95% significa que si se construye un gran número de ellos, el 95% de ellos contendrá a la media UMSNH -

Estimación de Intervalos En la práctica se obtiene solamente una muestra y se calcula

Estimación de Intervalos En la práctica se obtiene solamente una muestra y se calcula con ella un intervalo de confianza dicho intervalo contiene o no contiene a m, no es razonable asignar una probabilidad a este evento. La proposición a decuada es que el intervalo contiene a m “con una confianza” del 95% La longitud del intervalo de confianza (u-l) es una medida de la calidad de la información obtenida en la muestra, al semi intervalo u-q, o q-l se le llama Precisión del estimador. ¿Qué significado tiene un intervalo grande? ¿És deseable que sea grande o que sea pequeño? ¿Qué relación tiene con el valor de 1 -a? UMSNH -

Estimación de Intervalos Intervalo para la Media (Varianza conocida) Situación: Se tiene una población

Estimación de Intervalos Intervalo para la Media (Varianza conocida) Situación: Se tiene una población con media desconocida m, pero se supone conocida la varianza s 2. Se toma una muestra aleatoria (X 1, X 2, . . . , XN). Con esta muestra se calcula el estadístico X el cual es un estimador puntual insesgado para la media m desconocida. Se puede obtener un intervalo de confianza del 100(1 -a) % para m si consideramos los siguientes hechos acerca de la distribución de : X UMSNH -

Intervalo para la media Intervalo para la Media (Varianza conocida) 1. Si la población

Intervalo para la media Intervalo para la Media (Varianza conocida) 1. Si la población es Normal, la distribución de X es Normal 2. Si la población no es Normal, el Teorema del límite central nos garantiza una distribución Xde cuando N aproximadamente normal 3. La media de X es m ( X es insesgado) 4. La varianza de X es s 2/N Teorema del Límite Central: Afirma que la media muestral tiene una distribución Normal aunque la población original no la tenga, siempre y cuando la muestra sea muy grande (de manera práctica N>30) UMSNH -

Intervalo para la media Intervalo para la Media (Varianza conocida) De acuerdo a lo

Intervalo para la media Intervalo para la Media (Varianza conocida) De acuerdo a lo anterior, podemos suponer que la variable Tiene una distribución N(0, 1) a/2 -za/2 Z de la figura: P{-za/2 Z za/2 }=1 -a. Con lo cual el intervalo de confianza del 100(1 -a)% para la media es UMSNH -

Intervalo para la media Intervalo para la Media (Varianza conocida) Ejemplo: Los siguientes son

Intervalo para la media Intervalo para la Media (Varianza conocida) Ejemplo: Los siguientes son datos de conductividad térmica de cierto tipo de hierro (en BTU/hr-ft-°F): 41. 60 41. 48 42. 34 41. 95 41. 86 42. 18 41. 72 42. 26 41. 81 42. 04 Una estimación puntual para la media, es X = 41. 924. Hallar un intervalo de confianza del 95 % y uno del 99% para la media. Se supone que la población tiene una distribución Normal con s=0. 3 Usamos la expresión para encontrar el intervalo de confianza para la media: Usando Matlab para calcular za/2 = norminv(0. 025, 0, 1) l = 41. 924 - 1. 96(0. 3)/ 10 = 41. 738, u = 41. 924+1. 96(0. 3)/ 10 = 42. 110 Entonces el intervalo de confianza del 95% es 41. 738 m 42. 11 Y la longitud de este intervalo es 3. 92 s/ N UMSNH -

Intervalo para la media Intervalo para la Media (Varianza conocida) Selección del tamaño de

Intervalo para la media Intervalo para la Media (Varianza conocida) Selección del tamaño de la muestra: La precisión del intervalo de confianza es za/2 s/ N esto significa que al usar X para estimar m, el error de estimación, dado por E=| X - m| es menor o igual que za/2 s/ N, con una confianza de 100(1 -a)%. El problema inverso consiste en calcular N para obtener un error E con una confianza del 100(1 -a)% previamente especificado: N 1/2= za/2 s/E Ejercicio: Calcular el tamaño adecuado de la muestra para lograr que el error de estimación de conductividad del hierro sea menor de 0. 05 Btu/hr-ft-°F con una confianza del 95% UMSNH -

Intervalo para la media Intervalo para la Media (Varianza desconocida) Si no se conoce

Intervalo para la media Intervalo para la Media (Varianza desconocida) Si no se conoce la varianza s 2 de la población, una posibilidad es utilizar la varianza muestral S 2 en las ecuaciones obtenidas para estimar intervalos en el caso de varianza conocida Este procedimiento funciona para muestras grandes (N>30), por ello los intervalos de confianza anteriores se les suele llamar intervalos de confianza para muestras grandes. Si las muestras son pequeñas el enfoque anterior no funciona y para lograr un procedimiento válido se supondrá que la población tiene una distribución Normal UMSNH -

Intervalo para la media Intervalo para la Media (Varianza desconocida) Si la población es

Intervalo para la media Intervalo para la Media (Varianza desconocida) Si la población es Normal, la siguiente estadística Tiene una distribución t con N-1 grados de libertad a/2 -ta/2, N-1 T UMSNH -

Intervalo para la media Intervalo para la Media (Varianza desconocida) a/2 -ta/2, N-1 T

Intervalo para la media Intervalo para la Media (Varianza desconocida) a/2 -ta/2, N-1 T de la figura: P{-ta/2, N-1 T ta/2, N-1 }=1 -a. Con lo cual el intervalo de confianza del 100(1 -a)% para la media es Ejercicio: Repetir el ejemplo de la conductividad del hierro suponiendo que no se conoce la varianza UMSNH -

Intervalo para la Varianza de una distribución Normal Si la Población es Normal, la

Intervalo para la Varianza de una distribución Normal Si la Población es Normal, la distribución muestral del estadístico siguiente Donde S 2 es la varianza muestral usada como estimador puntual de s 2 Es de tipo Ji-cuadrada con N-1 grados de libertad a/2 0 X c 2 a/2, N-1 c 21 -a/2, N-1 UMSNH -

Intervalo para la Varianza de una distribución Normal a/2 0 X c 2 a/2,

Intervalo para la Varianza de una distribución Normal a/2 0 X c 2 a/2, N-1 c 21 -a/2, N-1 De acuerdo a la figura, P(c 21 -a/2, N-1 X c 2 a/2, N-1) = 1 -a Por lo tanto, el intervalo de confianza del 100(1 -a)% buscado para la varianza es Ejercicio: Hallar el intervalo de confianza del 95% para la varianza en el ejemplo de la conductividad del hierro UMSNH -

Intervalo para la Varianza de una distribución Normal Intervalos de confianza unilaterales. - En

Intervalo para la Varianza de una distribución Normal Intervalos de confianza unilaterales. - En el caso de la varianza es más común buscar cotas inferiores o superiores que ambas a la vez Intervalo de confianza inferior. - Se obtiene reemplazando el límite superior por y c 21 -a/2, N-1 por c 21 -a, N-1, obteniendo: Intervalo de confianza superior. - En forma similar, se reemplaza el límite inferior por 0 y c 2 a/2, N-1 por c 2 a, N-1, obteniendo: UMSNH -

Intervalo para la Varianza de una distribución Normal Ejercicio: Un fabricante de detergente líquido

Intervalo para la Varianza de una distribución Normal Ejercicio: Un fabricante de detergente líquido está interesado en la efectividad de su proceso para llenar envases de detergente. La norma dice que no se debe tener una desviación estándar s en el proceso mayor de 0. 15, ya que de lo contrario habrá envases más vacíos de lo permitido. Se toma una muestra aleatoria de 20 envases y se obtiene una varianza muestral s 2=0. 0153 onzas 2. ¿Es esta medición una evidencia de que se está cumpliendo la norma con una confianza del 95% ? Sugerencia: se puede usar la función chi 2 inv de Matlab UMSNH -

Otros intervalos de Confianza Intervalo de confianza para una Proporción Se toma una muestra

Otros intervalos de Confianza Intervalo de confianza para una Proporción Se toma una muestra de tamaño N de una población muy grande y resulta que X datos de la muestra pertenecen a alguna clase de interés. Entonces un estimador puntual de la proporción p de los datos de la población que pertenecen a la clase en cuestión es: ^ P=X/N Nótese que N y p son los parámetros de una distribución binomial ^ se puede considerar La distribución de muestreo de P aproximadamente Normal con media p y varianza p(1 -p)/N, siempre que p no esté muy cerca de 0 o de 1 y si N es relativamente grande UMSNH -

Otros intervalos de Confianza Intervalo de confianza para una Proporción De lo anterior, la

Otros intervalos de Confianza Intervalo de confianza para una Proporción De lo anterior, la distribución de la variable Es aproximadamente N(0, 1) Entonces, partiendo de P{-za/2 Z za/2 }=1 -a Obtenemos el siguiente intervalo de confianza aproximado del 100(1 -a)% para la proporción p de la población que pertenece a la clase dada: UMSNH -

Otros intervalos de Confianza Intervalo de confianza para una Proporción Ejemplo: De 1000 casos

Otros intervalos de Confianza Intervalo de confianza para una Proporción Ejemplo: De 1000 casos de cáncer pulmonar seleccionados al azar, 823 son de pacientes que fallecieron. Construya un intervalo de confianza del 95% para la tasa de mortalidad del cáncer pulmonar Solución: La tasa de mortalidad es la proporción de los que mueren a los que contraen el cáncer pulmonar, de la muestra tenemos que p^ = 0. 823. Por otro lado z 0. 025=1. 96, entonces: Es decir, 0. 799 p 0. 847 UMSNH -

Otros intervalos de Confianza Intervalo de confianza para el cociente de varianzas de dos

Otros intervalos de Confianza Intervalo de confianza para el cociente de varianzas de dos distribuciones Normales Situación: Se tienen dos poblaciones normales e independientes con varianzas desconocidas s 12, s 22 respectivamente. Se tienen disponibles dos muestras aleatorias de tamaños N 1, N 2 una de cada población respectivamente. Sean S 12 S 22 las varianzas muestrales respectivas. Se busca un intervalo de confianza del 100(1 -a)% del cociente de varianzas s 12/ s 22 Para hallar el intervalo de confianza se debe recordar que la distribución de muestreo del estadístico siguiente Es de tipo F con N 2 -1 y N 1 -1 grados de libertad en el numerador y denominador respectivamente. (Ver la figura siguiente) UMSNH -

Otros intervalos de Confianza Intervalo de confianza para el cociente de varianzas de dos

Otros intervalos de Confianza Intervalo de confianza para el cociente de varianzas de dos distribuciones Normales a/2 0 F fa/2, N 2 -1, N 1 -1 f 1 -a/2, N 2 -1, N 1 -1 Así, de la figura: P{fa/2, N 2 -1, N 1 -1 F f 1 -a/2, N 2 -1, N 1 -1}=1 -a Por lo tanto, el intervalo de confianza buscado es: UMSNH -

Otros intervalos de Confianza Intervalo de confianza para el cociente de varianzas de dos

Otros intervalos de Confianza Intervalo de confianza para el cociente de varianzas de dos distribuciones Normales Ejemplo: Una compañía fabrica piezas para turbinas. Tiene dos procesos distintos para hacer el esmerilado de las piezas y ambos procesos producen terminados con la misma rugosidad promedio. El ingeniero del proceso desea seleccionar el proceso con la menor variabilidad en la rugosidad de la superficie. Para ello toma una muestra de 12 piezas del primer proceso, obteniendo una desviación estándar muestral s 1= 5. 1 micropulgadas, luego toma una muestra de 15 piezas del segundo proceso, obteniendo s 2= 4. 7. ¿Puede elegir el primer poceso con una confianza del 90% de tener menor variabilidad en la rugosidad? Solución: Suponiendo que los dos procesos son Normales e independientes. Usando la función finv de Matlab, obtenemos f 0. 95=2. 7386 y f 0. 05=0. 3898, por lo tanto, Haciendo operaciones: Ö Como el intervalo incluye la unidad, no se puede concluir que los procesos tengan variabilidad sgnificativamente diferente con una confianza del 90% UMSNH -

Otros intervalos de Confianza Resumen de intervalos de confianza Parámetros de interés La media

Otros intervalos de Confianza Resumen de intervalos de confianza Parámetros de interés La media m Suposiciones Dist. Muestral Normal (o N grande) s 2 conocida s 2 desconocida (Dist. Muestral T) La varianza s 2 Dist. Normal (Dist. Muestral Ji 2 ) Proporción p Dist. Muest. Normal (N grande, p alejado de 0 y de 1) Cociente de varianzas Dos poblaciones Normales e independientes (Dist. s 1 2 / s 2 2 Muestral tipo F) s 12 y s 22 conocidas Diferencia de medias m 1 -m 2 Distribuciones s 12 = s 22 desconocidas (Dist muest T) normales, s 12 s 22 desconocidas (Dist muest T) Diferencia entre dos proporciones p 1 -p 2 Dist. Muestral Normal (N 1 y N 2 grandes, p 1 y p 2 alejados de 0 y de 1) Otras. . . (Ver libros de estadística) UMSNH -

Intervalos de Tolerancia Concepto En ocasiones no nos interesa estimar algún parámetro, sino establecer

Intervalos de Tolerancia Concepto En ocasiones no nos interesa estimar algún parámetro, sino establecer un rango en donde se puede esperar que caigan observaciones (datos) individuales en un proceso. La respuesta es muy sencilla si se conoce la distribución y los parámetros de la población, por ejemplo, si se obtuvo una muestra aleatoria de una población Normal con media m y varianza s 2 conocidas, se esperará que el 95% de los datos caerán entre los límites m 1. 96 s A este intervalo se le llama intervalo de tolerancia y si m y s son conocidos la cobertura del 95% es exacta UMSNH -

Intervalos de Tolerancia Concepto Si m y s son desconocidos a veces se puede

Intervalos de Tolerancia Concepto Si m y s son desconocidos a veces se puede determinar una constante k tal que los límites x ks constituyan un intervalo de tolerancia para una distribución normal En este caso los límites del intervalo son variables aleatorias y la proporción de datos cubierta por el intervalo no es exacta. Entonces se debe introducir un intervalo de confianza para la proposición de los límites del intervalo de tolerancia. ÖEn la bibliografía se pueden consultar tablas para elegir estos límites dada una confianza deseada para el caso Normal. UMSNH -

Intervalos de Confianza y Regresión Lineal Intervalo de Confianza para la Respuesta Media En

Intervalos de Confianza y Regresión Lineal Intervalo de Confianza para la Respuesta Media En la regresión lineal se supone un modelo de la forma y = mx + b Para describir la “respuesta” y del proceso bajo la entrada x Para una muestra de N puntos (valores de x, y) se calculan valores ^, ^ estimados m b de m, b resolviendo las ecuaciones normales, de manera que se obtiene un modelo estimado ^ y = ^mx + ^b Así, para un dato x 0, se puede estimar una predicción puntual para ^ my/xo (respuesta media) mediante: my/xo = ^ mx 0+ b^ Se puede encontrar un intervalo de confianza para la respuesta media my/xo dado un valor x 0 como se explica a continuación UMSNH -

Intervalos de Confianza y Regresión Lineal Intervalo de Confianza para la Respuesta Media Un

Intervalos de Confianza y Regresión Lineal Intervalo de Confianza para la Respuesta Media Un intervalo de confianza alrededor de la respuesta media my/xo del 100(1 -a)% para el valor de x=x 0 está dado por: Donde m^y/xo se calcula a partir del modelo de regresión estimado _2 ^ 2 2 ^ Además, s = S(yi - (m xi+b) ) /(N-2) y Sxx = S(xi-x). Obsérvese _ que el ancho de este intervalo _ de confianza es mínimo para x 0= x y crece a medida que |x 0 - x| aumenta. En la siguiente gráfica se muestra un comportamiento típico de este intervalo UMSNH -

Intervalos de Confianza y Regresión Lineal Intervalo de Confianza para la Respuesta Media Límites

Intervalos de Confianza y Regresión Lineal Intervalo de Confianza para la Respuesta Media Límites del intervalo de confianza para la respuesta media Puntos experimentales Recta de regresión Observación: Estos límites de intervalo están basados en los puntos experimentales dados, no se pueden usar para predecir intervalos sobre datos nuevos. A los límites para nuevos datos se les llama límites de predicción y son más amplios que los límites para la respuesta UMSNH -