TEMA 3 MUESTREO Y ESTIMACIN 3 2 Estimacin

  • Slides: 20
Download presentation
TEMA 3: MUESTREO Y ESTIMACIÓN 3. 2 Estimación de la Media

TEMA 3: MUESTREO Y ESTIMACIÓN 3. 2 Estimación de la Media

INTRODUCIÓN Supongamos queremos estudiar una determinada característica de una población. Como vimos en el

INTRODUCIÓN Supongamos queremos estudiar una determinada característica de una población. Como vimos en el anterior power point, es muy complejo hacer el estudio sobre el total. Es por ello que recurrimos a hacerlo en una muestra de tamaño n. La inferencia estadística sirve para deducir rasgos de la población conociendo sólo los resultados obtenidos en la muestra Vamos a estudiar una de las principales aplicaciones de la inferencia estadística, que es la estimación de la media de la población a partir de la media muestral

DISTRIBUCIÓN DE LA MEDIA MUESTRAL Supongamos una población a estudiar cualquiera, y que vamos

DISTRIBUCIÓN DE LA MEDIA MUESTRAL Supongamos una población a estudiar cualquiera, y que vamos a seleccionar una muestra de tamaño n. Es fácil darse cuenta de que no existe una única muestra con dicho tamaño sino que, por el contrario, existen muchísimas muestras posibles. En cada una de las muestras podemos calcular la media muestral. Si calculásemos las medias de todas las muestras posibles, obtenemos lo que se llama distribución de las medias muestrales. Sobre dicha distribución se tiene el siguiente resultado

TEOREMA CENTRAL DEL LÍMITE Dada una población de media m y desviación típica s,

TEOREMA CENTRAL DEL LÍMITE Dada una población de media m y desviación típica s, no necesariamente normal, la distribución de las medias muestrales de tamaño n, cuando n tiende a infinito, es una variable normal de media m y desviación típica CONSIDERACIONES: Si la distribución de partida es normal, también lo será la distribución de las medias muestrales, cualquiera que sea el valor de n Si la distribución de partida no es normal, la distribución de medias muestrales es cada vez más parecida a la normal cuanto mayor sea el valor de n, y se suele tomar que n≥ 30 para afirmar que es prácticamente normal

EJEMPLO Las bolsas de azúcar envasadas por una cierta máquina tienen una media de

EJEMPLO Las bolsas de azúcar envasadas por una cierta máquina tienen una media de 500 g y. una desviación típica de 35 g. Si elegimos una muestra de 100 unidades: a) Calcular la probabilidad de que la media de esa muestra sea menor que 495 Tal y como dice el teorema central del límite (TCL) la muestra es una variable normal de m = 500 y s = 35/10 = 3. 5 Entonces: Mirando la tabla de la normal obtenemos p = 0. 0764 b) Calcular el intervalo centrado en la media de manera que en él se encuentre el 90% de las media muestrales Se trata de encontrar el intervalo característico para p = 0. 90

EJEMPLO b) Calcular el intervalo centrado en la media de manera que en él

EJEMPLO b) Calcular el intervalo centrado en la media de manera que en él se encuentre el 90% de las media muestrales Se trata de encontrar el intervalo característico para p = 0. 90 Como aprendimos en el tema pasado, en primer lugar calculamos el intervalo característico como si fuera una N(0, 1) y después destipificamos P(-za/2 < za/2 ) = 0, 90 Es decir: = 0, 95 2 · P(z < za/2 ) - 1 = 0, 90 Mirando en la tabla de corresponde con za/2 = 1, 645 El intervalo entonces es (-1. 645, 1. 645)

EJEMPLO Ahora destipificamos: x = 500 – 1. 645 · 3. 5 x =

EJEMPLO Ahora destipificamos: x = 500 – 1. 645 · 3. 5 x = 494. 24 x = 500 + 1. 645 · 3. 5 x = 505. 76 Es decir el 90% las medias muestrales estarán en el intervalo (494. 24, 505. 76) Dicho de otra forma, el 90% de las veces que hagamos el experimento, la media estará en el intervalo señalado Al número 1 -p, se le representa con la letra a y se conoce como nivel de significación

INTERVALO DE CONFIANZA PARA LA MEDIA En la población del ejemplo anterior (bolsas de

INTERVALO DE CONFIANZA PARA LA MEDIA En la población del ejemplo anterior (bolsas de azúcar) supongamos que no conocemos la media (que antes decíamos que era 500) pero si la desviación típica 35 g. No podemos saber exactamente cuánto vale la media de la población, pero si la de una muestra y la llamaremos media muestral. Con ella podemos: (a) Decidir que la media de la población es la que hemos obtenido de la muestra. (Esto se conoce como estimación puntual) (b) Estimar entre qué valores está la media de la población (intervalo de confianza) con un nivel de confianza determinado (que antes llamábamos probabilidad) y que suele representarse también como p = 1 – a. (Esto se conoce como estimación por intervalos)

Para estimar el intervalo, necesitaremos saber si la población es normal o bien que

Para estimar el intervalo, necesitaremos saber si la población es normal o bien que el tamaño de la muestra es mayor o igual que 30, y el intervalo de confianza se calcula exactamente igual que como hemos hecho el intervalo característico en el ejemplo anterior.

INTERVALO DE CONFIANZA PARA LA MEDIA OBSERVACIONES: 1. - Una vez extraída la muestra

INTERVALO DE CONFIANZA PARA LA MEDIA OBSERVACIONES: 1. - Una vez extraída la muestra y calculada la media , estará o no en el intervalo que calculemos, pero ya no podemos hablar de probabilidad. Por eso, diremos que tenemos un nivel de confianza (del 90%, 95, …. . ) de que m esté en dicho intervalo 2. - Si la desviación típica es desconocida, hay que estimarla a partir de la muestra, que para valores relativamente grandes de n se puede utilizar justamente la desviación típica de la muestra.

EJEMPLO Hemos utilizado aquí otra Deseamos conocer el grado de conocimientos de historia de

EJEMPLO Hemos utilizado aquí otra Deseamos conocer el grado de conocimientos de historia de una población de varios forma dequeencontrar el estimar m pasando una miles de alumnos. Sabemos s = 3. Nos proponemos prueba a 100 alumnos. intervalo, pero se puede hacer por cualquiera. Una vez realizada la prueba a 100 alumnos Es concretos se ha obtenido que la media es 6, 32. Hallar el intervalo de confianza para m con un nivel de conveniente que te confianza del 95% aprendeas una de ellas (la que te gusta más) y lo hagas siempre igual Es decir: También nos podemos aprender de memoria, que se calcula así:

EJEMPLO 1(continuación) Deseamos conocer el grado de conocimientos de historia de una población de

EJEMPLO 1(continuación) Deseamos conocer el grado de conocimientos de historia de una población de varios miles de alumnos. Sabemos que s = 3. Nos proponemos estimar m pasando una prueba a 100 alumnos. El intervalo característico es entonces Destipificamos: Para ello tenemos que tener en cuenta que ahora la desviación típica es diferente porque estamos con muestras Es decir: que la media real de la población, en el 95% de los casos, está entre 5. 732 y 6. 908

EJEMPLO 2 Para estimar la media de los resultados que obtendrían el resolver un

EJEMPLO 2 Para estimar la media de los resultados que obtendrían el resolver un cierto test los alumnos de 4º ESO de toda una comunidad autónoma, se les pasa dicho test a 400 de ellos elegidos al azar. Los resultados se muestran en la tabla adjunta. Estimar con un nivel de confianza del 95% el valor de la media de la población xi fi 1 24 2 80 3 132 4 101 5 63 En este caso son desconocidos tanto la media poblacional como la desviación típica, pero como es muy grande la muestra podemos utilizar los de la muestra Si hacemos los cálculos Como el nivel de confianza es el mismo que en el apartado anterior, se va a obtener otra vea que El TCL nos dice que las medias se distribuyen de manera

EJEMPLO 2 (continuación) Para estimar la media de los resultados que obtendrían el resolver

EJEMPLO 2 (continuación) Para estimar la media de los resultados que obtendrían el resolver un cierto test los alumnos de 4º ESO de toda una comunidad autónoma, se les pasa dicho test a 400 de ellos elegidos al azar. Los resultados se muestran en la tabla adjunta. Estimar con un nivel de confianza del 95% el valor de la media de la población xi fi 1 24 2 80 3 132 4 101 5 63 Entonces el intervalo de confianza será: Es decir, con una confianza del 95% podemos decir que la media de la población está entre 3. 24 y 3. 36

VALORES MÁS USUALES En la mayoría de los ejercicios se usan niveles de confianza

VALORES MÁS USUALES En la mayoría de los ejercicios se usan niveles de confianza del 90%, 95% o 99%, es por lo que se detallan los valores correspondientes por si te los quieres aprender de memoria p = 1 -a a/2 Za/2 0. 90 0. 05 1. 645 0. 95 0. 025 1. 96 0. 99 0. 005 2. 575

¿te basta con saberte fórmulas? El intervalo de confianza (y el intervalo característico también)

¿te basta con saberte fórmulas? El intervalo de confianza (y el intervalo característico también) se puede calcular de muchas maneras, yo he mostrado una en clase y en los power point, pero en el vídeo se muestra otra. También puede simplemente aplicarse la fórmula que es

ERROR ADMISIBLE Al valor se le llama error máximo admisible y además: Cuanto mayor

ERROR ADMISIBLE Al valor se le llama error máximo admisible y además: Cuanto mayor sea la muestra, menor es el error (mejor es la estimación) Cuánto mayor sea 1 – a (es decir cuanto mas seguro queramos estar de nuestra estimación) mayor es E

Hallar el tamaño de la muestra Si fijamos el error máximo admisible y el

Hallar el tamaño de la muestra Si fijamos el error máximo admisible y el nivel de confianza, podemos calcular el mínimo tamaño de la muestra con solo despejar de la fórmula anterior EJEMPLO: La desviación típica de los resultados de las distintas mediciones para calcular lo que dura un proceso es de 0. 5 s, ¿Cuál es el número de medidas que hay que realizar para que, con un 99% de confianza el error de la estimación no exceda 0. 1 s? Si miramos la tabla de la diapositiva 15 obtenemos que Es decir hay que hacer 166 mediciones

HALLAR EL NIVEL DE CONFIANZA Si conocemos el tamaño de la muestra y el

HALLAR EL NIVEL DE CONFIANZA Si conocemos el tamaño de la muestra y el error admisible, podemos determinar el intervalo de confianza. Para ello, despejamos de la expresión anterior A partir de la tabla de la normal se obtiene a/2 y de aquí ya podemos concluir 1 -a

EJEMPLO Un coronel desea estimar la estatura media de todos los soldados de su

EJEMPLO Un coronel desea estimar la estatura media de todos los soldados de su regimiento con un error menor que 0, 5 cm utilizando una muestra de 30 soldados. Sabiendo que la desviación típica es de 5, 3, ¿cuál será el nivel de significación con el que se realiza la estimación Usamos ahora la tabla de la normal, y calculamos p( z < 0. 52) = 0. 6985 Un nivel de significación demasiado bajo, debido a que se pretendía afinar mucho (error menor que medio centímetro y que la muestra era muy pequeña)