Podatki Vzorni nart Vzorec ali populacija Prednosti vzorca

  • Slides: 17
Download presentation
Podatki Vzorčni načrt Vzorec ali populacija? Prednosti vzorca: • • vseh enot populacije ne

Podatki Vzorčni načrt Vzorec ali populacija? Prednosti vzorca: • • vseh enot populacije ne moremo uporabiti o zaradi stroškov (ni mogoče zajeti vseh) o zaradi učinka merjenja (ni smiselno zajeti vseh) skupna napaka je manjša prirejeno po: Lobe, Uhan, Tivadar, FDV

Podatki Vzorčni načrt Koraki procesa vzorčenja: o opredelitev populacije n glede na raziskovalni problem

Podatki Vzorčni načrt Koraki procesa vzorčenja: o opredelitev populacije n glede na raziskovalni problem n problem pogostosti (incedence) n po lastnostih, prostorsko, časovno, . . . o izbor vzorčnega okvirja (spiska enot opredeljene populacije) n stopnja pomanjkljivosti vzorčnih okvirjev o izbor metode vzorčenja n neverjetnostni vzorci, pri katerih posploševanje na populacijo z logiko statističnega sklepanja ni možno (vzorčne napake ne moremo oceniti) n verjetnostni vzorci, pri katerih je možno posploševanje na populacijo z logiko statističnega sklepanja (vzorčno napako lahko ocenimo) prirejeno po: Lobe, Uhan, Tivadar, FDV

Podatki Vzorčni načrt o določitev velikosti vzorca: pomembna je variabilnost merjenega, ne pa velikost

Podatki Vzorčni načrt o določitev velikosti vzorca: pomembna je variabilnost merjenega, ne pa velikost populacije! n vsaj nekaj sto enot n intuitivna ocena oziroma ocena strokovnjaka n pripravljalna raziskava n pri verjetnostnih vzorcih izračun o na osnovi absolutne natančnosti ali relativne natančnosti ali dopustnega tveganja o pri oceni parametra ali pri zavračanju ničelne domneve n izračun na osnovi drugih raziskav n poseben primer so zaporedni (sequential) vzorci, kjer število enot ni vnaprej določeno prirejeno po: Lobe, Uhan, Tivadar, FDV

Podatki Vzorčni načrt – neverjetnostni vzorci o o o priložnostni vzorec (convenience sample) n

Podatki Vzorčni načrt – neverjetnostni vzorci o o o priložnostni vzorec (convenience sample) n vzorec enot, ki so 'pri roki‘ o npr. prostovoljci, mimoidoči, . . . , kličejo na odzivnik, . . . subjektivni vzorec (judgment sample) n vzorec enot, ki ga sestavi poznavalec na osnovi svoje presoje za predstavitev opredeljene populacije o npr. prebivalci “ključnih” okolišev, . . . , snežna kepa, . . . , košarice, . . . , izbrane trgovine, . . . kvotni vzorec (quota sample) n enote niso izbrane naključno, vendar celotni vzorec odseva izbrane lastnosti populacije o npr. izobrazbeno strukturo, vernost, spol, . . . o izbrane lastnosti morajo biti ključne za problem (tiste, ki povzročajo variabilnost merjenega) o po drugih lastnostih je vzorec lahko povsem nereprezentativen prirejeno po: Lobe, Uhan, Tivadar, FDV

Podatki Vzorčni načrt – verjetnostni vzorci o o enostavni slučajni vzorec (simple random sample

Podatki Vzorčni načrt – verjetnostni vzorci o o enostavni slučajni vzorec (simple random sample ) n vzorec, pri katerem naključno izbiramo enote iz vzorčnega okvirja o npr. žreb iz bobna, naključna števila, . . . o problem je resnična naključnost o vsak element ima vnaprej znano in enako verjetnost izbora, vse kombinacije elementov v izbranem vzorcu so enako verjetne, . . . o intuitivno preprost vzorec, izhodišče vseh teorij o običajno precej veliki vzorci o primeren predvsem za splošne, manj raziskane probleme sistematični vzorec (sistematic sample ) n vzorec, pri katerem po naključnem začetku sistematično izbiramo enote iz urejenega vzorčnega okvirja o npr. vsako n-to enoto, po narisanem vzorcu, . . . o primerno predvsem kot korak do končnega vzorca. . . prirejeno po: Lobe, Uhan, Tivadar, FDV

Podatki Vzorčni načrt – verjetnostni vzorci o stratificirani vzorec (stratified sample ) n vzorec,

Podatki Vzorčni načrt – verjetnostni vzorci o stratificirani vzorec (stratified sample ) n vzorec, pri katerem enote v vzorčnem okvirju najprej stratificiramo v homogene stratume, nato pa vzorčimo znotraj vsakega stratuma o izbor lastnosti za oblikovanje stratumov in število stratumov sta ključna - v stratumih mora biti variabilnost merjenega karseda majhna o pri vzorčenju lahko iz stratumov z večjo variabilnostjo izberemo neproporcionalno višje deleže enot o ocena parametra bo natančnejša pri manjšem vzorcu, oblikovanje vzorca pa zahtevnejše o primerno predvsem za konkretne, že dobro raziskane probleme prirejeno po: Lobe, Uhan, Tivadar, FDV

Podatki Vzorčni načrt – verjetnostni vzorci o vzorec skupin (cluster sample ) n vzorec,

Podatki Vzorčni načrt – verjetnostni vzorci o vzorec skupin (cluster sample ) n vzorec, pri katerem enote najprej razdelimo na heterogene skupine, nato pa izberemo vzorec skupin (enostopenjski vzorec skupin) ali pa vzorčimo znotraj vsake skupine (dvostopenjski vzorec skupin) o v skupinah mora biti variabilnost merjenega karseda podobna variabilnosti v populaciji o sistematično vzorčenje lahko uporabimo za oblikovanje skupin na osnovi urejenega vzorčnega okvira o geografske enote lahko uporabimo za oblikovanje skupin brez kakršnegakoli vzorčnega okvira o pri vzorčenju iz skupin (druga stopnja) lahko popravimo verjetnost izbora enot iz bolj zapostavljenih skupin o primerno predvsem, kadar vzorčni okvir ni dosegljiv ali ima preveč pomanjkljivosti (uporabimo geografske enote) o stroškovno je praviloma ugoden, zato lahko zajame večje število anketiranih prirejeno po: Lobe, Uhan, Tivadar, FDV

Preprost primer ESV o Najpreprostejša metoda (ne tudi najbolj razširjena), vsebuje načela kompleksnejših metod

Preprost primer ESV o Najpreprostejša metoda (ne tudi najbolj razširjena), vsebuje načela kompleksnejših metod Ponazoritev: o o 1. populacija so vsi študenti in študentke vpisani na FDV 2000/09 2. uporabimo celoten seznam vpisnih številk - npr. N=2000 študentov n (celoten seznam enot v populaciji = primer vzorčnega okvira) prirejeno po: Lobe, Uhan, Tivadar, FDV

Preprost primer ESV o 3. določimo velikost vzorca, recimo n = 250 n Znak

Preprost primer ESV o 3. določimo velikost vzorca, recimo n = 250 n Znak “n” se uporablja za velikost vzorca, “N” za velikost ciljne populacije. Vzorčni delež je f=250/2000=0. 125 n vzorčni interval je 1: 8 n sistematični vzorec n=250 dobimo tako, da določimo slučajno številko med 1 in 8 - s tem dobimo prvega študenta v vzorcu, nato pa vključimo vsakega osmega študenta prirejeno po: Lobe, Uhan, Tivadar, FDV

ESV o o če se zgodi, da nam zmanjka enot, tj. da bi prišli

ESV o o če se zgodi, da nam zmanjka enot, tj. da bi prišli do konca seznama, preden bi nabrali dovolj enot, nadaljujemo na začetku seznama n (obravnamo ga kot, da je cikličen = konec in začetek seznama se stikata) Problem: če je vzorčni okvir narejen po kakšnem specifičnem ključu – npr. slučajni začetek = 2 vzorčni interval = 4 prirejeno po: Lobe, Uhan, Tivadar, FDV 1 M 2 Ž 3 M 4 Ž 5 M 6 Ž 7 M 8 Ž 9 M 10 Ž 11 M 12 Ž

Stratificirani vzorec o Zgled: o o o 1. ciljna populacija: vpisani na visokošolski program

Stratificirani vzorec o Zgled: o o o 1. ciljna populacija: vpisani na visokošolski program v šolskem letu 2008/09 na FDV 2. seznam vpisnih številk po letnikih (letnik = stratum), 3. iz vsakega letnika v vzorec slučajno izberemo določeno število vpisnih številk, n tako, da je velikost posameznega stratuma, sorazmerna velikosti posameznega letnika. prirejeno po: Lobe, Uhan, Tivadar, FDV

Vzorec skupin o o o Ko popolnega seznama enot ciljne populacije nimamo ali ko

Vzorec skupin o o o Ko popolnega seznama enot ciljne populacije nimamo ali ko želimo prihraniti čas in denar (zelo pogosta želja). Značilen tip vzorčenja pri osebnem anketiranju na terenu oz. za velike in/ali geografsko razpršene populacije n npr. država, regije, velika mesta Uporabljamo hierarhijo skupin: n najprej izberemo večje skupine, v njih manjše itn. dokler ne pridemo do stopnje, kjer izbiramo enote, npr. n 1. seznam vseh podjetij (npr. srednje velikih podjetij) , 2. izberemo verjetnostni vzorec 100 podjetij, 3. v vsakem od 100 podjetij naredimo verjetnostni vzorec zaposlenih prirejeno po: Lobe, Uhan, Tivadar, FDV

Vzorec skupin o o Odločitev: koliko skupin? n Manj podjetij in več oseb ali

Vzorec skupin o o Odločitev: koliko skupin? n Manj podjetij in več oseb ali več podjetij in manj oseb v vsakem? n Več skupin je bolje kot manj večja raznolikost boljša reprezentativnost Še boljše: večstopenjsko vzorčenje v skupinah n Primer: ciljna populacija: zaposleni v srednje velikih podjetjih n 1. naredimo seznam srednje velikih podjetij po dejavnosti (SKD – npr. strokovne, znanstvene in tehnične; finančne in zavarovalniške, informacijske in komunikacijske. . . ) prirejeno po: Lobe, Uhan, Tivadar, FDV

Vzorec skupin n n 2. iz vsake dejavnosti slučajno izberemo po eno podjetje 3.

Vzorec skupin n n 2. iz vsake dejavnosti slučajno izberemo po eno podjetje 3. iz vsakega podjetja z enim od verjetnostnih postopkov izberemo zaposlene prirejeno po: Lobe, Uhan, Tivadar, FDV

Vzorec skupin o o o 1) Komplicirani statistični izračuni oz. 2) Praksa (Neuman, 2001)

Vzorec skupin o o o 1) Komplicirani statistični izračuni oz. 2) Praksa (Neuman, 2001) – ki izhaja iz statistične teorije: manjša kot je populacija, večji vzorec rabimo n za populacije manjše od 1000 enot vključi 30 % populacije (n = 300) n za populacije 10. 000 enot vključi 10 % populacije (n = 1000) n populacije nad 150. 000 vključi 1 % populacije (n = 1500) n populacije nad 10 milijonov vključi 0, 025 % populacije (n = 2500) prirejeno po: Lobe, Uhan, Tivadar, FDV

Moč verjetnostnih vzorcev o o V splošnem verjetnostni vzorci bolj verjetno predstavljajo populacijo kot

Moč verjetnostnih vzorcev o o V splošnem verjetnostni vzorci bolj verjetno predstavljajo populacijo kot neverjetnostni = so bolj verjetno reprezentativni Verjetnostni vzorci nam omogočajo, da na podlagi rezultata, ki smo ga dobili z njimi, sklepamo, kakšen rezultat bi dobili, če bi vprašali vso populacijo jezik: statistično značilne razlike prirejeno po: Lobe, Uhan, Tivadar, FDV

Vzorčna napaka o o o Nikoli pa ne moremo biti 100 % gotovi, vedno

Vzorčna napaka o o o Nikoli pa ne moremo biti 100 % gotovi, vedno obstaja možnost, da se motimo, tudi pri odličnih verjetnostnih vzorcih Vzorčna napaka: posledica tega, da raziskujemo vzorec in ne celo populacijo n = razlika med vzorcem in populacijo iz katere je izbran n zato je pričakovano, da se rezultati različnih raziskav istega pojava (npr. katero stranko bi volili. . . ? ), med seboj razlikujejo prirejeno po: Lobe, Uhan, Tivadar, FDV