Universidad de Lima Escuela de Negocios CURSO ESTADSTICA

  • Slides: 40
Download presentation
Universidad de Lima Escuela de Negocios CURSO: ESTADÍSTICA APLICADA I APUNTES DEL CURSO No.

Universidad de Lima Escuela de Negocios CURSO: ESTADÍSTICA APLICADA I APUNTES DEL CURSO No. 4 TEMA: INTRODUCCIÓN AL MUESTREO

Muestreo "Por una muestra pequeña podemos juzgar la pieza entera". -- Cervantes Saavedra

Muestreo "Por una muestra pequeña podemos juzgar la pieza entera". -- Cervantes Saavedra

¿Qué es el Muestreo? ü El Muestreo es el método que se utiliza para

¿Qué es el Muestreo? ü El Muestreo es el método que se utiliza para diseñar y seleccionar una muestra. ü El muestreo es un proceso que consiste en extraer un conjunto de datos de un marco o de varios marcos de muestreo. El objetivo del muestreo es estimar los parámetros de la población (µ, , p) utilizando la información contenida en la muestra. ü La población puede ser finita, infinita numerable o infinita no numerable. ü El muestreo puede hacerse con o sin reemplazo. Si la población es finita pero muy grande, entonces es factible aplicar los conceptos de poblaciones infinitas.

Objetivo de Estudio (N) Colección completa de todas las observaciones de interés para el

Objetivo de Estudio (N) Colección completa de todas las observaciones de interés para el investigador. Población Muestra (n) X 1, X 2, X 3, …Xn Variable (X): Característica de La población que se analiza en un estudio. Pueden ser: -Cuantitativas o cualitativas. -Discretas o continuas Porción representativa de la población que se selecciona para su estudio porque la población es demasiado grande para analizarla en su totalidad.

MUESTRA Sea una característica de la población en estudio con distribución de probabilidad f

MUESTRA Sea una característica de la población en estudio con distribución de probabilidad f (x, ). Se dice que las v. a. X 1, X 2. . . Xn, conforman una muestra aleatoria (m. a. ) de tamaño n si: üCada Xi, i= 1, 2, . . , n es una variable aleatoria con distribución idénticaüLas variables aleatorias X 1. . Xn son independientes. Muestra (n) X 1, X 2, X 3, …Xn

Razones para Muestrear ü La imposibilidad física de revisar todos los integrantes de la

Razones para Muestrear ü La imposibilidad física de revisar todos los integrantes de la población (casos). ü La naturaleza destructiva de algunas pruebas. ü Menor costo. ü Menor tiempo empleado y por tanto mayor rapidez en la recolección y análisis (para tomar decisiones oportunas). ü Datos disponibles limitados. ü Lo adecuado de los resultados de una muestra.

Requisitos ü La muestra debe ser representativa de la totalidad de la población en

Requisitos ü La muestra debe ser representativa de la totalidad de la población en cuanto a características importantes para el problema en estudio. Se deben reflejat todos los elementos de la población en la muestra (MUESTRA REPRESENTATIVA). ü El número de miembros seleccionados debe ser lo suficientemente elevado para que las estimaciones tengan el grado de precisión adecuado (MUESTRA ADECUADA). ü El método de selección debe permitir el cálculo de una medida del error de muestreo. ü La muestra ha de ser lo más eficiente posible en cuanto a tiempo y costo. ü El proceso de muestreo ha de tener el mínimo de errores no muestrales.

La Investigación por Muestreo - Etapas ü Establecimiento de Objetivos. ü Población Objetivo y

La Investigación por Muestreo - Etapas ü Establecimiento de Objetivos. ü Población Objetivo y Marco de Muestreo. ü Diseño de la muestra. ü Método de medición. ü Instrumento de medición. ü Capacitación de investigadores de campo. ü Prueba piloto. ü Organización del trabajo de campo. ü Análisis de los datos.

Términos técnicos en el Muestreo • Población Muestra

Términos técnicos en el Muestreo • Población Muestra

Términos usados en el muestreo Unidad de muestreo (grupo) Ejemplo: Un área / una

Términos usados en el muestreo Unidad de muestreo (grupo) Ejemplo: Un área / una sección Unidad elemental Ejemplo: Un trabajador / una familia / un alumno Unidad reportante (proporciona los datos)

Términos usados en el muestreo ü Parámetro: Es un número que resume y describe

Términos usados en el muestreo ü Parámetro: Es un número que resume y describe información de una variable poblacional. Describe el comportamiento de una característica de la población. Es una valor constante y para calcularlo se deben tener todos los datos de la población (µ, , p). ü Estadística o estadígrafo: Es una función de las n observaciones de una muestra aleatoria. Sirve de base a todos los métodos estadísticos para hacer inferencias con relación a poblaciones y sus parámetros. Es una variable porque su valor puede cambiar de una muestra a otra (ejemplo: la media muestral, la varianza muestral y la proporción muestral). Tiene una distribución de probabilidad y se le llama distribución muestral. ü Datos: Son mediciones que son recolectadas de una población (tomando una muestra). Ejemplo: precio, costo, ingresos, etc.

Términos usados en el muestreo ü Variable: Característica de la población o muestra que

Términos usados en el muestreo ü Variable: Característica de la población o muestra que se observa. ü Estadística descriptiva: Proceso de recopilación, organización y presentación de un conjunto de datos. ü Estadística inferencial: Utilización de un conjunto de datos muestrales para extraer inferencias o conclusiones sobre una población. ü Muestreo sin reemplazo: Cuando una vez incluído en la muestra un elemento de la población, sale de ésta y ya no se puede seleccionar por segunda vez. Se usa con mayor frecuencia que el muestreo con reemplazo. ü Muestreo con reemplazo: Cuando al seleccionar cada elemento para la muestra, se regresa a la población. Un elemento que ya se seleccionó se puede volver a seleccionar y, en consecuencia, puede aparecer más de una vez en la muestra.

Términos usados en el muestreo • Marco de muestreo Base de datos (Registros)

Términos usados en el muestreo • Marco de muestreo Base de datos (Registros)

El Marco Muestral ü Un marco muestral es una lista de las unidades a

El Marco Muestral ü Un marco muestral es una lista de las unidades a ser muestreadas (registros). ü Se espera que la diferencia entre el marco y la población sea pequeña. ü Ejemplos: - Si tomamos un hogar como unidad de muestreo, la guía telefónica o una lista obtenida de los datos del censo podrían ser el marco muestral. - Saga / Ripley: Base de datos de sus clientes. - Para elaborar un estudio de los socios de un Club: Base de datos de los socios. ü Todos los marcos presentan inconveniencias. ü Definición de muestra: Es una colección de unidades seleccionada de un marco o de varios marcos muestrales. ü Observación: La información de la muestra será tan buena como lo es la información contenida en el marco muestral.

Error Muestral • Definición: Es el error natural que se origina por el hecho

Error Muestral • Definición: Es el error natural que se origina por el hecho de trabajar con una muestra. Diferencia entre el estadístico de la muestra que sirve como estimación del parámetro desconocido de la población y el propio valor real del parámetro. • Ejemplo: Se realizó una encuesta para determinar el porcentaje de usuarios de un producto y los resultados mostraron que el 61% usaban el producto. El análisis mostró que el error muestral era de más o menos 3%. Esto significa que el verdadero valor de la proporción de usuarios estaría entre 58% (61 -3) y 64% (61+3).

Error Muestral y Tamaño de la Muestra 1. Las muestras más grandes proporcionan errores

Error Muestral y Tamaño de la Muestra 1. Las muestras más grandes proporcionan errores de muestreo más pequeños. 1. Un aumento en el tamaño de la muestra, será siempre más beneficioso en una muestra pequeña que en una grande, si se trata de reducir el error muestral. 1. El tamaño de la muestra se refiere siempre al número entero real de unidades extraídas de la población, y no a un porcentaje de la misma.

Error no Muestral • Son errores metodológicos y/o de procedimiento. • Normalmente, aumentan con

Error no Muestral • Son errores metodológicos y/o de procedimiento. • Normalmente, aumentan con el tamaño de la muestra. • Una muestra más grande no necesariamente significa que es mejor. • Ejemplos: – Errores de los entrevistadores. – Errores en el instrumento. – Errores en el trabajo de campo o ejecución. – Errores en el marco muestral.

Clasificación del Muestreo Probabilístico (Probabilidad) No probabilístico

Clasificación del Muestreo Probabilístico (Probabilidad) No probabilístico

Muestreo Probabilístico ü Los miembros de la muestra se seleccionan aplicando un proceso aleatorio

Muestreo Probabilístico ü Los miembros de la muestra se seleccionan aplicando un proceso aleatorio (no subjetivo). ü Los elementos de la población tienen una probabilidad conocida de ser incluídos en la muestra. ü Se pueden usar fórmulas para determinarlas propiedades de la distribución muestral. Ésta se puede usar para establecer afirmaciones probabilísticas acerca de posibles errores de muestreo asociados con los resultados de la muestra. Permite estimar objetivamente el error. ü Es superior a los métodos de muestreo no probabilísticopara estimar las características de la población. ü Permite determinar matemáticamente el tamaño de la muestra.

Muestreo No Probabilístico ü Incluye aquellos métodos en los que algunos elementos del juicio

Muestreo No Probabilístico ü Incluye aquellos métodos en los que algunos elementos del juicio ó criterio humano está involucrado en las decisiones a fin de lograr lo más conveniente. ü Se incorporan los elementos muestrales sin probabilidades preespecificadas o conocidas de selección. ü La selección y recolección de los datos es fácil. ü No permiten estimar el error muestral. ü No podemos estar seguros de que la muestra sea representativa. ü Ejemplos: -Un profesor escoge a los primeros alumnos del registro de asistencia. - Un supervisor recluta a los vendedores voluntarios que se ofrecen a efectuar una tarea. - Un periodista puede formar una muestra de los tres congresistas que considera que reflejan la opinión de la mayoría.

Técnicas de Muestreo • Técnicas No probabilísticas ü Muestreo por conveniencia. ü Muestreo por

Técnicas de Muestreo • Técnicas No probabilísticas ü Muestreo por conveniencia. ü Muestreo por juicio. ü Muestreo por cuotas. ü Muestreo bola de nieve. • Técnicas probabilísticas ü Muestreo Aleatorio Simple. ü Muestreo Sistemático. ü Muestreo Estratificado. ü Muestreo de Conglomerados (racimos). ü Muestreo Multietápico.

El Muestreo Aleatorio Simple ü Es el proceso en el que las unidades de

El Muestreo Aleatorio Simple ü Es el proceso en el que las unidades de la muestra son escogidas individual y directamente por un proceso aleatorio de manera que cada unidad de población tiene la misma probabilidad de ser seleccionada. ü Esto sólo se logra cuando se tienen listas disponibles que puedan servir como un inventario de los elementos de la población. ü En la práctica requiere que cada unidad pueda ser identificada y nemrada antes de que se realice la selección. ü Se utiliza cuando la población no es muy grande. ü Se eligen al azar los elementos de la muestra. ü Se requiere emplear tablas de números aleatorios, urnas con bolas u generación de números aleatorios por computadora, etc.

Muestreo Aleatorio Simple Ejemplo: Si se desea elegir una muestra de 50 clientes a

Muestreo Aleatorio Simple Ejemplo: Si se desea elegir una muestra de 50 clientes a partir de una población de 500 clientes de una tienda. La muestra se elige a partir de una lista de los clientes inscritos en los archivos de la tienda, a cada uno de los cuales se les asigna un número de identificación consecutivo. Dos formas de elegir la muestra por el muestreo aleatorio simple: 1) Poner en una urna 500 papeles con la numeración correlativa de 1 a 500 y seleccionar en forma aleatoria 50 papeles. Los números seleccionados corresponderán a los 50 clientes que conformarán la muestra (puesto que cada cliente posee un número de identificación). 2) Emplear una tabla de números aleatorios, en la cual los números son seleccionados por un proceso aleatorio con ayuda de la computadora. Se puede elegir cualquier punto de inicio de la tabla y dirección; se debe emplear el número de dígitos conforme el tamaño de la población. 3) 50525 57454 28455 68226 34656 38884 39018 4) 72507 53380 53827 42486 54465 71819 11999

Muestreo Sistemático ü En algunos casos, en especial cuando la población es grande, puede

Muestreo Sistemático ü En algunos casos, en especial cuando la población es grande, puede llevar mucho tiempo la selección de una muestra aleatoria simple (numerar los elementos de la población, seleccionar aleatoriamente los números y luego identificar a los elementos de la población que corresponden a dichos números). ü Una alternativa eficiente sería el muestreo sistemático. ü Los elementos de la población se ordenan de alguna forma (aleatoriamente, alfabéticamente, según la fecha en que ingresaron a la base de datos, etc. ). Se selecciona al azar un punto de partida, y después se elige para la muestra cada k-ésimo elemento de la población (K=N/n).

Muestreo Sistemático Ejemplo: si se desea una muestra de 50 (n) de una población

Muestreo Sistemático Ejemplo: si se desea una muestra de 50 (n) de una población de 5, 000 (N) elementos, podríamos seleccionar un elemento de cada 100 (K) elementos de la población (5, 000/50). Si parto del elemento No. 5, eligiremos posteriormente el elemento No. 105, 205, 305, etc, hasta completar la muestra de 50. üNo requiere tabla de números aleatorios, ni urnas, ni generación de números aleatorios por computadora. üEs eficiente en poblaciones homogéneas. üNo debe utilizarse este método si hay un patrón predeterminado en la población pues se podría obtener una muestra sesgada. üNo siempre se necesita un listado de unidades numerado en forma correlativa (por ejemplo la elección de una de cada 10 facturas tomadas de un archivador que contiene 200 facturas hasta completar una muestra de 20 facturas).

Muestreo Estratificado ü Por lo general se emplea cuando la población es heterogénea pero

Muestreo Estratificado ü Por lo general se emplea cuando la población es heterogénea pero contiene determinados grupos homogéneos. ü Primero se divide a los elementos de la población en grupos llamados estratos. Cada elemento de la población debe pertenecer a un sólo estrato. ü Después de formar los estratos se toma una muestra de cada uno de ellos (proporcional o no proporcional). ü Si los elementos de cada estrato son homogéneos, el muestreo estratificado producirá, empleando un menor tamaño muestral, resultados tan precisos como el muestreo aleatorio simple. ü Reduce el costo del muestreo al reducir los tamaños de muestra sin perder precisión. ü El criterio para la formación de los estratos queda a discreción del investigador (por ubicación, edad, giro de negocio, estrato socioeconómico, profesión, Facultad en la que estudia un alumno, etc. ). ü Se requiere información para estratificar la población.

Muestreo Estratificado Criterios ü HOMOGENEIDAD (Dentro): Entre elementos de un mismo estrato. ü HETEROGENEIDAD

Muestreo Estratificado Criterios ü HOMOGENEIDAD (Dentro): Entre elementos de un mismo estrato. ü HETEROGENEIDAD (Entre): Entre estratos. ü INDEPENDENCIA: Entre estratos al seleccionar la muestra.

Muestreo Estratificado Ejemplo: Si se desea estudiar la inversión en maquinaria y equipos de

Muestreo Estratificado Ejemplo: Si se desea estudiar la inversión en maquinaria y equipos de las 1, 000 (N) medianas empresas que han presentado las mayores utilidades el año pasado en determinados sectores económicos. Para ello de divide a las empresas por dichos sectores económicos (estratos) y se decide obtener una muestra proporcional de 100 empresas empleando el muestreo estratificado; es decir se requiere que en la muestra seleccionada el número de elementos de cada estrato tenga la misma proporción que se encuentra en la población. Si se emplea el muestreo aleatorio simple se corre el riesgo de no seleccionar ningún elemento del sector confecciones. ==================================== Estrato Sector Económico No. de empresas en N Porcentaje de N No. de empresas (n) ==================================== 1 Confecciones 70 7% 7 2 Art. de cuero 130 13 % 13 3 Agro industria 500 50 % 50 4 Artesanía 100 10 % 10 5 Servicios 200 20 % 20 Total 1, 000 100% 100

PROBLEMA: Heterogeneidad de las unidades

PROBLEMA: Heterogeneidad de las unidades

SOLUCIÓN: Estratificación de la población

SOLUCIÓN: Estratificación de la población

ESTRATOS POBLACIÓN MUESTRA

ESTRATOS POBLACIÓN MUESTRA

Muestreo Estratificado Población. . . . n 1 n 2 n 3 n. L

Muestreo Estratificado Población. . . . n 1 n 2 n 3 n. L n = n 1 + n 2 + n 3 +. . + n. L

Muestreo por Conglomerados ü Se divide a los elementos de la población en conjuntos

Muestreo por Conglomerados ü Se divide a los elementos de la población en conjuntos o grupos separados denominados conglomerados, unidades primarias o racimos. ü Cada elemento de la población debe pertenercer a un sólo conglomerado. ü Luego se toma una muestra aleatoria simple de los conglomerados. Conforman la muestra todos los elementos dentro de cada conglomerado muestreado. ü La medición se realiza a todos los elementos del conglomerado seleccionado. ü Cada uno de los conglomerados puede tener diferente número de elementos. ü Los conglomerados deben ser homogeneos pero los elementos dentro de los conglomerados deben ser heterogéneos. ü En el caso ideal, cada conglomerado es una versión representativa, en pequeña escala, de toda la población. ü Mientras más semejantes sean los conglomerados entre sí, al muestrear una pequeña cantidad de conglomerados se obtendrán buenas estimaciones. ü El marco de muestreo es una lista de conglomerados. ü Se puede obtener un mayor tamaño de muestra con un costo bastante menort por elemento y, por ende, un costo toal menor. ü Se utiliza en las investigaciones por muestreo a gran escala. ü Reduce el tiempo de la organización y ejecución del trabajo de campo.

Muestreo por Conglomerados ü Una de las principales aplicaciones del muestreo por Conglomerados es

Muestreo por Conglomerados ü Una de las principales aplicaciones del muestreo por Conglomerados es el muestreo de áreas (cuando la población se encuentra dispersa en un área geográfica grande), en las que los conglomerados son distritos, manzanas urbanas u áreas bien definidas. Ejemplo: Se desea obtener información sobre el consumo de cierto producto de todas las familias residentes en Miraflores. Con el propósito de subdividir una region extensa en áreas menores, se divide la zona de Miraflores en manzanas; es decir se forman 70 conglomerados (manzanas) y se eligen 10 manzanas a fin de entrevistar a todas las familias que conforman estas 10 manzanas. La muestra total estaría dada por todas las familias residentes en las 10 manzanas elegidas. ü Por lo general se requiere un tamaño muestral total mayor que el muestreo aleatorio o el muestreo estratificado. Sin embargo, se origina ahorro porque cuando se envía al entrevistador a aplicar una encuesta a todos los elementos del conglomerado (manzanas en el ejemplo) se podrán obtener muchas observaciones muestrales en un tiempo relativamente corto y con mayor facilidad.

Muestreo por Conglomerados Criterios • Homogeneidad: (Entre) Entre elementos de diferentes conglomerados. • Heterogeneidad:

Muestreo por Conglomerados Criterios • Homogeneidad: (Entre) Entre elementos de diferentes conglomerados. • Heterogeneidad: (Dentro) Entre elementos del mismo conglomerado.

Esquema gráfico de una muestra por conglomerados Conglomerado seleccionado Conglomerado no seleccionado

Esquema gráfico de una muestra por conglomerados Conglomerado seleccionado Conglomerado no seleccionado

CONGLOMERADOS MUESTRA POBLACIÓN . . . MUESTRA

CONGLOMERADOS MUESTRA POBLACIÓN . . . MUESTRA

Muestreo multietápico ü Selecciona primero una muestre de conglomerados. Luego, selecciona una submuestra de

Muestreo multietápico ü Selecciona primero una muestre de conglomerados. Luego, selecciona una submuestra de elementos en cada conglomerado seleccionado. Este tipo de muestreo se le denomina muestreo en dos etapas o bietápico. ü La generalización de este muestreo a más etapas se llama muestreo Multietápico o Polietápico. ü Ofrece las mismas ventajas del muestreo conglomerados, es decir, reducción del costo y tiempo. de ü La muestra se distribuye mejor que en el muestreo de conglomerados.

Esquema gráfico de una muestra Uidad Secundaria de Unidad Primaria de bietápica Muestreo (UPM)

Esquema gráfico de una muestra Uidad Secundaria de Unidad Primaria de bietápica Muestreo (UPM) seleccionada Muestreo (USM) seleccionada UMS no seleccionada Unidad Primaria de Muestreo (USM) no seleccionada