Muestreo Aleatorio simple 1 Estimador de la media

  • Slides: 28
Download presentation
Muestreo Aleatorio simple 1. Estimador de la media poblacional: 2. Media muestral: Cuasivarianza muestral:

Muestreo Aleatorio simple 1. Estimador de la media poblacional: 2. Media muestral: Cuasivarianza muestral: Error de muestreo Tamaño muestral 1

2. Estimador del total poblacional: Error de muestreo Tamaño muestral 2

2. Estimador del total poblacional: Error de muestreo Tamaño muestral 2

3. Estimador de la proporción poblacional: Error de muestreo: Tamaño muestral 3

3. Estimador de la proporción poblacional: Error de muestreo: Tamaño muestral 3

Muestreo con probabilidades proporcionales al tamaño 1. Estimador del total poblacional Error de muestreo

Muestreo con probabilidades proporcionales al tamaño 1. Estimador del total poblacional Error de muestreo 2. Estimador de la media poblacional Error de muestreo 4

Muestreo estratificado h= estrato cualquiera i=1, …, nh unidad dentro de un estrato L

Muestreo estratificado h= estrato cualquiera i=1, …, nh unidad dentro de un estrato L último estrato N=N 1+N 2+…+NL tamaño de la población N=n 1+n 2+…+n. L tamaño de la muestra Wh=Nh/N ponderación poblacional del estrato h wh ponderación muestral del estrato h fh=nh/Nh f=n/N 5

1. Estimador de la media poblacional (I) 6

1. Estimador de la media poblacional (I) 6

2. Estimador del total poblacional (II) 7

2. Estimador del total poblacional (II) 7

3. Estimador de la proporción Dadas 2 clases excluyentes C 1(rubio) y C 2

3. Estimador de la proporción Dadas 2 clases excluyentes C 1(rubio) y C 2 (moreno) : Ah nº unidades del estrato h que pertenece a la clase C 1. Ph = Ah/Nh proporción de unidades de la clase C 1 en el estrato h de la población. ph = ah/nh proporción de unidades de la clase C 1 en el estrato h de la muestra. ● Proporción poblacional: 8

● Estimador de la proporción: (III) 9

● Estimador de la proporción: (III) 9

●Afijación reparto del tamaño muestral n entre los diferentes estratos Se obtiene wh según

●Afijación reparto del tamaño muestral n entre los diferentes estratos Se obtiene wh según el tipo de afijación y se sustituye en las fórmulas (I) o (II), según calculemos n para el promedio o el total: a) Afijación uniforme: b) b) Afijación proporcional: c) c) “ de Neyman o varianza mínima: d) d) Afijación óptima: d) Afijación óptima para la proporción: Sustituimos en (III) 10

Muestreo Sistemático: a) Muestreo Sistemático: - El 1º elemento de la muestra es aleatorio

Muestreo Sistemático: a) Muestreo Sistemático: - El 1º elemento de la muestra es aleatorio - Los demás se seleccionan a partir del 1º: x 1+k, x 1+2 k, x 1+3 k, etc. - Obtención del nº k: k N/n - Fórmulas: las mismas que en M. A. S. b) Muestreo Sistemático replicado: - Dado un nº de elementos muestrales n (Ej=n=40) - Seleccionamos varias muestras sistemáticas replicadas ns (Ej: ns=10) - Nº de elementos por muestra n/ns (Ej: 40/10=4) - Distancia entre elementos: k’ = kns (Ej: 50), donde k N/n - Selección de los primeros elementos de cada muestra: MAS entre los k’ (Ej=50) primeros números. 11

Muestras 1ºs elementos 2 os 3 os 4 os 1 x 1+k’ (x 1+50)

Muestras 1ºs elementos 2 os 3 os 4 os 1 x 1+k’ (x 1+50) x 1+2 k’ (x 1+100) x 1+3 k’ (x 1+150) ALEATO 2 RIOS x 2 3 4 5 6 x 1 ENTRE x 3 LOS 7 1 OS 8 k’=nsk (50) 9 números 10 12

Fórmulas para el muestreo Sistemático replicado ● Media muestral 13

Fórmulas para el muestreo Sistemático replicado ● Media muestral 13

● Estimación del total poblacional ; ● Estimación de la proporción poblacional 14

● Estimación del total poblacional ; ● Estimación de la proporción poblacional 14

Muestreo por conglomerados Las unidades de muestreo comprenden 2 o más unidades de estudio.

Muestreo por conglomerados Las unidades de muestreo comprenden 2 o más unidades de estudio. Es más preciso cuanto mayor sea la heterogeneidad dentro de los conglomerados y la homogeneidad entre los conglomerados. Observación j-ésima que pertenece al iésimo conglomerado total de observaciones en el í-ésimo conglomerado N nº de conglomerados en la población n nº de conglomerados en el mas Mi nº de elementos en el conglomerado í-ésimo en la población tamaño promedio del conglomerado en la muestra nº de elementos en la muestra tamaño promedio del conglomerado en la población Nº elementos de la población 15

Estimador de la media poblacional a) Si M es conocido NOTA: si se desconoce

Estimador de la media poblacional a) Si M es conocido NOTA: si se desconoce M, puede sustituirse por - La varianza es sesgada. Sólo será un buen estimador cuando n sea grande. Si los conglomerados tienen igual tamaño, el sesgo desaparece. 16

Estimador del total poblacional a) Si M es conocido 17

Estimador del total poblacional a) Si M es conocido 17

b) Si M es desconocido 18

b) Si M es desconocido 18

Estimador de la proporción poblacional 19

Estimador de la proporción poblacional 19

Determinación del tamaño muestral para un error dado Donde: para la media y el

Determinación del tamaño muestral para un error dado Donde: para la media y el total poblacional para la proporción poblacional 20

Muestreo por conglomerados combinado con estratificación Si disponemos de varios estratos, y cada uno

Muestreo por conglomerados combinado con estratificación Si disponemos de varios estratos, y cada uno tiene un número de conglomerados: Estratos: j= 1, 2, …, J Nj nº de conglomerados en la población del estrato j nº promedio del conglomerado en la muestra del estrato j nj nº de conglomerados seleccionados a través del muestreo aleatorio simple en el estrato j promedio de los totales de conglomerados en los nj conglomerados muestreados 21

Estimador del promedio poblacional del total por conglomerado Si, por ejemplo, tenemos 2 estratos:

Estimador del promedio poblacional del total por conglomerado Si, por ejemplo, tenemos 2 estratos: Estimador del promedio del tamaño de conglomerados Estimador de la media poblacional por elemento Estimador de la varianza de la media para ambos estratos 22

Muestreo por conglomerado en dos etapas Se selecciona por m. a. s. una muestra

Muestreo por conglomerado en dos etapas Se selecciona por m. a. s. una muestra de conglomerados, y a su vez, dentro de cada conglomerado, se seleccionan los elementos también por m. a. s. Notación: N: nº de conglomerados en la población n: nº de conglomerados en la muestra Mi: nº de elementos en el conglomerado i-ésimo mi: nº de elementos de la m. a. s. dentro del conglomerado i-ésimo : nº de elementos de la población : tamaño promedio del conglomerado en la muestra Xij: j-ésima observación de la muestra del i-ésimo conglomerado : media muestral del i-ésimo conglomerado 23

● Estimador de la media poblacional Los totales de los conglomerados xi suelen ser

● Estimador de la media poblacional Los totales de los conglomerados xi suelen ser desconocidos, y pueden estimarse con Denotando con subíndice 1 a las unidades primarias (conglomerados), y con 2 a las unidades últimas (elementos dentro de los conglomerados): 24

donde es la varianza intraconglomerados es la varianza entre conglomerados Varianza del estimador de

donde es la varianza intraconglomerados es la varianza entre conglomerados Varianza del estimador de la media en el muestreo por conglomerados: 25

Error de muestreo: Para medir el incremento de la varianza debido a la selección

Error de muestreo: Para medir el incremento de la varianza debido a la selección de n conglomerados, en lugar de trabajar con las n. M unidades del mas: Para medir el grado de homogeneidad de los conglomerados se utiliza el coeficiente de correlación siguiendo los mismos criterios que para el caso de conglomerados unietápicos. ● Estimador del total poblacional La varianza del total: ; error de estimación: 26

● Estimador de la proporción poblacional Estimador de la varianza: donde: Límite de error

● Estimador de la proporción poblacional Estimador de la varianza: donde: Límite de error de estimación: 27

●Tamaño óptimo de la muestra y de los conglomerados El valor de m que

●Tamaño óptimo de la muestra y de los conglomerados El valor de m que minimiza la varianza de la media muestral para un coste total fijo es igual a: donde c 1 y c 2 son los costes individuales de muestrear a los n conglomerados y a los elementos, que proceden de la siguiente función de costes: Despejando, obtenemos n, si nos dan los costes totales ● Si nos dan una varianza se despeja de: fija, el valor óptimo de n una vez obtenido m 28