MUESTREO ESTADSTICO Facultad de Ingeniera Industrial Universidad Tecnolgica

  • Slides: 43
Download presentation
MUESTREO ESTADÍSTICO Facultad de Ingeniería Industrial Universidad Tecnológica de Pereira

MUESTREO ESTADÍSTICO Facultad de Ingeniería Industrial Universidad Tecnológica de Pereira

CONDUCTA DE ENTRADA • ¿Qué entiendo por Muestreo? • ¿Es mejor el censo que

CONDUCTA DE ENTRADA • ¿Qué entiendo por Muestreo? • ¿Es mejor el censo que la muestra? • ¿Todas las muestras son representativas? • ¿Cuándo se incrementa el tamaño de la muestra, los resultados son más confiable?

RUTA DE APRENDIZAJE Estimador

RUTA DE APRENDIZAJE Estimador

MUESTREO ESTADÍSTICO «En estadística se conoce como muestreo a la técnica para la selección

MUESTREO ESTADÍSTICO «En estadística se conoce como muestreo a la técnica para la selección de una muestra a partir de una población»

EJEMPLOS DE MUESTREO • Una empresa de fabricación de llantas para automóviles desea establecer

EJEMPLOS DE MUESTREO • Una empresa de fabricación de llantas para automóviles desea establecer cual es el promedio de vida de una referencia de la línea de automóviles hogar. • Un partido político desea establecer la proporción de la población que tiene favorabilidad por determinado candidato al senado.

POBLACIÓN O UNIVERSO Son todas y cada una de las posibles observaciones o medidas

POBLACIÓN O UNIVERSO Son todas y cada una de las posibles observaciones o medidas que se estén considerando. De acuerdo a su tamaño, la población puede considerarse finita o infinita. La estatura de todos los niños en un preescolar (finita), el puntaje obtenido en un test sobre estrés para todos los empleados del estado (finita), el total de vehículos que llegan a un peaje durante un mes (infinita), el número de computadores existentes en Colombia (¿finita? ), etc. Es útil aclarar que en estadística cuando la población es muy grande, se considera infinita. El grupo que en realidad podemos estudiar se denomina población de estudio.

POBLACIÓN VS POBLACIÓN DE ESTUDIO File: Blank. Map-World. png

POBLACIÓN VS POBLACIÓN DE ESTUDIO File: Blank. Map-World. png

CENSO El censo de una población estadística consiste básicamente, en obtener mediciones del número

CENSO El censo de una población estadística consiste básicamente, en obtener mediciones del número total de individuos mediante diversas técnicas de recuento.

MUESTRA Es un subconjunto de la población estadística, es decir, es una parte de

MUESTRA Es un subconjunto de la población estadística, es decir, es una parte de ella y por lo tanto se espera posea las mismas características de la población objeto de estudio. Población Muestra

POBLACIÓN VS. MUESTRA

POBLACIÓN VS. MUESTRA

MUESTRA La Muestra puede ser: Representativa No Representativa La representatividad de una muestra está

MUESTRA La Muestra puede ser: Representativa No Representativa La representatividad de una muestra está dada por su tamaño y por el tipo de muestreo.

MUESTRA REPRESENTATIVA Es aquella que representa adecuadamente la composición de la población, es decir,

MUESTRA REPRESENTATIVA Es aquella que representa adecuadamente la composición de la población, es decir, que las diferentes categorías claves del estudio estén representadas en la muestra.

MUESTREO • Es el método estadístico por medio del cual se definen los criterios

MUESTREO • Es el método estadístico por medio del cual se definen los criterios y técnicas que deben orientar el proceso de recolección u obtención de información. • Es claro que el procedimiento de selección y el tamaño está cruzado por los objetivos de la investigación, las poblaciones son en lo general diferentes y por lo tanto, deberán utilizarse criterios distintos para seleccionar las unidades bajo estudio.

TIPOS DE MUESTREO PROBABILÍSTICO Muestreo Aleatorio Simple Muestreo Estratificado Muestreo Sistemático Muestreo por Conglomerados

TIPOS DE MUESTREO PROBABILÍSTICO Muestreo Aleatorio Simple Muestreo Estratificado Muestreo Sistemático Muestreo por Conglomerados MUESTREO NO PROBABILÍSTICO Por Cuotas Discrecional Bola de nieve Casual o Incidental Por conveniencia Opinático o Intencional

MUESTREO ALEATORIO SIMPLE La forma en que una muestra se selecciona recibe el nombre

MUESTREO ALEATORIO SIMPLE La forma en que una muestra se selecciona recibe el nombre de plan muestral o diseño experimental y determina la cantidad de información de la muestra. Saber el plan muestral empleado en una situación particular permitirá medir la confiabilidad o bondad de la inferencia. El muestreo aleatorio simple es un plan muestral de uso común en el que cada muestra de tamaño n tiene la misma probabilidad de ser seleccionado. Por ejemplo, supongamos que se desea seleccionar una muestra de tamaño n = 2 de una población que contiene N = 4 objetos. Si los cuatro objetos están identificados por los símbolos x 1, x 2, x 3 y x 4, hay seis pares distintos que podrían seleccionarse, si la muestra de n = 2 observaciones se selecciona de modo que cada una de estas seis muestras tenga la misma probabilidad de selección, dada por 1/6, entonces la muestra resultante se denomina muestra aleatoria simple o únicamente muestra aleatoria.

MUESTREO ALEATORIO SIMPLE x 1, x 2, x 3, x 4, x 5, x

MUESTREO ALEATORIO SIMPLE x 1, x 2, x 3, x 4, x 5, x 6

MUESTREO ALEATORIO SIMPLE Definición Si una muestra de n elementos se selecciona de entre

MUESTREO ALEATORIO SIMPLE Definición Si una muestra de n elementos se selecciona de entre una población de N elementos, usando un plan muestral en el que cada una de las posibles muestras tiene la misma probabilidad de selección, entonces se dice que el muestreo es aleatorio y la muestra resultante es una muestra aleatoria simple.

MUESTREO ALEATORIO SIMPLE Un muestreo aleatorio perfecto es difícil de obtener en la práctica.

MUESTREO ALEATORIO SIMPLE Un muestreo aleatorio perfecto es difícil de obtener en la práctica. Si el tamaño N de la población es pequeño, se podría escribir cada uno de los N números en una ficha, mezclar las fichas y seleccionar una muestra de n fichas. Los números que seleccione corresponden a las n mediciones que aparecen en la muestra. Como este método no siempre es práctico, un método más sencillo y confiable utiliza números aleatorios, es decir, dígitos generados de modo que los valores de 0 a 9 se presentan al azar y con igual frecuencia. Estos números pueden ser generados por computadora o pueden incluso aparecer en una calculadora científica.

MUESTREO ALEATORIO SIMPLE Una base de datos de computadora en una empresa urbana de

MUESTREO ALEATORIO SIMPLE Una base de datos de computadora en una empresa urbana de abogados contiene archivos para N = 1000 clientes. La empresa desea seleccionar n = 10 archivos para revisión. Seleccione una muestra aleatoria simple de cinco archivos de esta base de datos.

MUESTREO ALEATORIO SIMPLE Primero debe marcar cada archivo con un número de 1 a

MUESTREO ALEATORIO SIMPLE Primero debe marcar cada archivo con un número de 1 a 1000. Quizá los archivos se guarden alfabéticamente y la computadora ya ha asignado un número a cada uno. A continuación genere una secuencia de 10 números aleatorios de tres dígitos. Concepto de semilla: El punto inicial aleatorio asegura que usted no use la misma secuencia una y otra vez.

MUESTREO ALEATORIO SIMPLE • La situación descrita en el ejemplo se denomina estudio observacional,

MUESTREO ALEATORIO SIMPLE • La situación descrita en el ejemplo se denomina estudio observacional, porque los datos ya existían antes que usted decidiera observar o describir las características de ellos. La mayor parte de los estudios muestrales, en los que la información se capta con un cuestionario, caen en esta categoría. • Las bases de datos de computadora hacen posible asignar números de identificación a cada elemento aun cuando la población sea grande y seleccionar una muestra aleatoria simple.

MUESTREO ALEATORIO SIMPLE Tenga cuidado al efectuar un estudio muestral y esté atento a

MUESTREO ALEATORIO SIMPLE Tenga cuidado al efectuar un estudio muestral y esté atento a estos problemas que se presentan con frecuencia: – No respuesta: Usted ha seleccionado su muestra aleatoria y enviado sus cuestionarios, pero sólo 50% de los entrevistados devolvió sus cuestionarios. ¿Las respuestas que usted recibió son representativas de toda la población o están sesgadas porque sólo quienes eran particularmente obstinados en el tema fueron escogidos para responder? – Cobertura demasiado baja: Usted ha seleccionado su muestra aleatoria usando registros telefónicos como una base de datos. ¿La base de datos que usó sistemáticamente excluye ciertos segmentos de la población, quizá aquellos que no tienen teléfono? – Sesgo verbal: El cuestionario de usted puede tener preguntas que son demasiado complicadas o tienden a confundir al lector. Posiblemente las preguntas son sensibles por naturaleza, por ejemplo, “¿Alguna vez ha consumido usted drogas? ” o “¿Alguna vez ha engañado en su declaración de impuestos? ” y quienes responden no contestan con la verdad.

MUESTREO NO PROBABILISTICO A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso

MUESTREO NO PROBABILISTICO A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones (estimaciones inferenciales sobre la población), pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de se elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la muestra sea representativa. En algunas circunstancias los métodos estadísticos y epidemiológicos permiten resolver los problemas de representatividad aun en situaciones de muestreo no probabilístico, por ejemplo los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la población.

MUESTREO NO PROBABILISTICO TIPO DE MUESTREO DESCRIPCIÓN Se asienta generalmente sobre la base de

MUESTREO NO PROBABILISTICO TIPO DE MUESTREO DESCRIPCIÓN Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél. Muestreo por cuotas En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.

MUESTREO NO PROBABILISTICO TIPO DE MUESTREO Muestreo intencional o de conveniencia DESCRIPCIÓN Este tipo

MUESTREO NO PROBABILISTICO TIPO DE MUESTREO Muestreo intencional o de conveniencia DESCRIPCIÓN Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto. También puede ser que el investigador seleccione directa e intencionadamente los individuos de la población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos).

MUESTREO NO PROBABILISTICO TIPO DE MUESTREO DESCRIPCIÓN Bola de nieve Se localiza a algunos

MUESTREO NO PROBABILISTICO TIPO DE MUESTREO DESCRIPCIÓN Bola de nieve Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc. Discrecional A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al estudio.

MUESTREO PROBABILISTICO Los métodos de muestreo probabilísticos son aquellos que se basan en el

MUESTREO PROBABILISTICO Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables.

MUESTREO PROBABILISTICO TIPO DE MUESTREO CARACTERÍSTICAS Aleatorio Simple Se selecciona una muestra de tamaño

MUESTREO PROBABILISTICO TIPO DE MUESTREO CARACTERÍSTICAS Aleatorio Simple Se selecciona una muestra de tamaño n de una población de N unidades, cada elemento tiene una probabilidad de inclusión igual y conocida de n/N. Sistemático Conseguir un listado de los N elementos de la población Determinar tamaño muestral n. Definir un intervalo k= N/n. Elegir un número aleatorio, r, entre 1 y k (r= arranque aleatorio). Seleccionar los elementos de la lista. VENTAJAS • • • DESVENTAJAS Sencillo y de fácil comprensión. Cálculo rápido de medias y varianzas. Se basa en la teoría estadística, y por tanto existen paquetes informáticos para analizar los datos. Requiere que se posea de antemano un listado completo de toda la población. Cuando se trabaja con muestras pequeñas es posible que no represente a la población adecuadamente. Fácil de aplicar. No siempre es necesario tener un listado de toda la población. Cuando la población está ordenada siguiendo una tendencia conocida, asegura una cobertura de unidades de todos los tipos. Si la constante de muestreo está asociada con el fenómeno de interés, las estimaciones obtenidas a partir de la muestra pueden contener sesgo de selección

MUESTREO PROBABILISTICO TIPO DE MUESTREO Estratificado CARACTERÍSTICAS En ciertas ocasiones resultará conveniente estratificar la

MUESTREO PROBABILISTICO TIPO DE MUESTREO Estratificado CARACTERÍSTICAS En ciertas ocasiones resultará conveniente estratificar la muestra según ciertas variables de interés. Para ello debemos conocer la composición estratificada de la población objetivo a hacer un muestreo. Una vez calculado el tamaño muestral apropiado, este se reparte de manera proporcional entre los distintos estratos definidos en la población usando una simple regla de tres. VENTAJAS • Tiende a asegurar que la muestra represente adecuadamente a la población en función de unas variables seleccionadas • Se obtienen estimaciones más precisa • Su objetivo es conseguir una muestra lo más semejante posible a la población en lo que a la o las variables estratificadoras se refiere. DESVENTAJAS Se ha de conocer la distribución en la población de las variables utilizadas para la estratificación.

MUESTREO PROBABILISTICO TIPO DE MUESTREO Conglomerados CARACTERÍSTICAS Se realizan varias fases de muestreo sucesivas

MUESTREO PROBABILISTICO TIPO DE MUESTREO Conglomerados CARACTERÍSTICAS Se realizan varias fases de muestreo sucesivas (polietápico) La necesidad de listados de las unidades de una etapa se limita a aquellas unidades de muestreo seleccionadas en la etapa anterior. VENTAJAS • • DESVENTAJAS Es muy eficiente cuando la población es muy grande y dispersa. • No es preciso tener un listado de toda la población, sólo de las unidades primarias de muestreo. El error estándar es mayor que en el muestreo aleatorio simple o estratificado. • El cálculo del error estándar es complejo.

ESTIMADOR Un estimador es un estadístico (una función de la muestra) usado para estimar

ESTIMADOR Un estimador es un estadístico (una función de la muestra) usado para estimar un parámetro desconocido de la población. Por ejemplo, si se desea conocer el precio medio de un artículo (el parámetro desconocido) se recogerán observaciones del precio de dicho artículo en diversos establecimientos (la muestra) y la media aritmética de las observaciones puede utilizarse como estimador del precio medio. Para cada parámetro pueden existir varios estimadores diferentes. En general, escogeremos el estimador que posea mejores propiedades que los restantes, como insesgadez, eficiencia, convergencia y robustez (consistencia).

ESTIMADOR El valor de un estimador proporciona lo que se denomina en estadística una

ESTIMADOR El valor de un estimador proporciona lo que se denomina en estadística una estimación puntual del valor del parámetro en estudio. En general, se suele preferir realizar una estimación mediante un intervalo, esto es, obtener un intervalo [a, b] dentro del cual se espera esté el valor real del parámetro con un cierto nivel de confianza. Utilizar un intervalo resulta más informativo, al proporcionar información sobre el posible error de estimación, asociado con la amplitud de dicho intervalo. El nivel de confianza es la probabilidad de que a priori el verdadero valor del parámetro quede contenido en el intervalo.

ESTIMADOR

ESTIMADOR

PROPIEDADES DE LOS ESTIMADORES • Sesgo Se denomina sesgo de un estimador a la

PROPIEDADES DE LOS ESTIMADORES • Sesgo Se denomina sesgo de un estimador a la diferencia entre la esperanza (o valor esperado) del estimador y el verdadero valor del parámetro a estimar. Es deseable que un estimador sea insesgado o centrado, es decir, que su sesgo sea nulo por ser su esperanza igual al parámetro que se desea estimar. Por ejemplo, si se desea estimar la media de una población, la media aritmética de la muestra es un estimador insesgado de la misma, ya que su esperanza (valor esperado) es igual a la media de la población.

PROPIEDADES DE LOS ESTIMADORES • Eficiencia Diremos que un estimador es más eficiente o

PROPIEDADES DE LOS ESTIMADORES • Eficiencia Diremos que un estimador es más eficiente o más preciso que otro estimador, si la varianza del primero es menor que la del segundo. • Consistencia Si no es posible emplear estimadores de mínima varianza, el requisito mínimo deseable para un estimador es que a medida que el tamaño de la muestra crece, el valor del estimador tienda a ser el valor del parámetro, propiedad que se denomina consistencia. Existen diversas definiciones de consistencia, más o menos restrictivas, pero la más utilizada es la denominada consistencia en media cuadrática que exige que:

PROPIEDADES DE LOS ESTIMADORES • Robustez El estimador será un estimador robusto del parámetro

PROPIEDADES DE LOS ESTIMADORES • Robustez El estimador será un estimador robusto del parámetro si la violación de los supuestos de partida en los que se basa la estimación (normalmente, atribuir a la población un determinado tipo de función de distribución que, en realidad, no es la correcta), no altera de manera significativa los resultados que éste proporciona.

PROPIEDADES DE LOS ESTIMADORES • Suficiencia Se dice que un estimador es suficiente cuando

PROPIEDADES DE LOS ESTIMADORES • Suficiencia Se dice que un estimador es suficiente cuando resume toda la información relevante contenida en la muestra, de forma que ningún otro estimador pueda proporcionar información adicional sobre el parámetro desconocido de la población. Por ejemplo, la media muestral sería un estimador suficiente de la media poblacional, mientras que la moda no lo sería.

NIVEL DE CONFIANZA En el contexto de estimar un parámetro poblacional, un intervalo de

NIVEL DE CONFIANZA En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada. La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina nivel de confianza (1 -α)

MARGEN DE ERROR El margen de error es una estadística que expresa la cantidad

MARGEN DE ERROR El margen de error es una estadística que expresa la cantidad de error de muestreo aleatorio en los resultados de una encuesta. Cuanto mayor sea el margen de error, menos confianza que uno debe tener que los resultados reportados de la encuesta se encuentran cerca de las cifras "reales", es decir, las cifras para el conjunto de la población. Margen de error se produce cada vez que una población se muestrea incompleta. Ejemplo, si el valor real es de 50 personas, y la estadística tiene un radio intervalo de confianza de 5 personas, entonces podríamos decir que el margen de error es de 5 personas.

MARGEN DE ERROR

MARGEN DE ERROR

Tamaño de muestra para proporciones con población desconocida con población finita o conocida Tamaño

Tamaño de muestra para proporciones con población desconocida con población finita o conocida Tamaño de muestra para variables Cuantitativas con población desconocida Tamaño de muestra para variables Cuantitativas con población Finita o conocida z=DISTR. NORM. ESTAND. INV(probabilidad/2)

Ejemplo

Ejemplo