2 ht Mintavteles eljrsok Adatszerzsi mdok tpusai Kontrolllt

  • Slides: 28
Download presentation
2. hét Mintavételes eljárások

2. hét Mintavételes eljárások

Adatszerzési módok típusai

Adatszerzési módok típusai

Kontrollált kísérletek q q A végtelen sokaságról való informálódás eszköze. Arra ad választ, hogy

Kontrollált kísérletek q q A végtelen sokaságról való informálódás eszköze. Arra ad választ, hogy a kísérlet végzője által megtervezett feltétel együttesek (kezelések) milyen eredményre vezetnek.

Reprezentatív megfigyelés q q q A legfontosabb adatfelvételi módszer. A statisztikai következtetéselmélet kiindulópontja. A

Reprezentatív megfigyelés q q q A legfontosabb adatfelvételi módszer. A statisztikai következtetéselmélet kiindulópontja. A mintavételből származó minden eredményt a sokaság egészének jellemzésére használják fel, azaz általánosítanak a teljes sokaságra. Reprezentatív a minta, ha tükrözi az alapsokaságot, annak jellemzőit, tulajdonságait, összetételét. Mindig megadható a mintavételi hiba, azaz, hogy a mintavétel tényéből mekkora hiba fakad.

Nem reprezentatív megfigyelés (egyéb részleges megfigyelés) q Nincs benne az általánosításra való törekvés, a

Nem reprezentatív megfigyelés (egyéb részleges megfigyelés) q Nincs benne az általánosításra való törekvés, a következtetések kizárólag megfigyelt egyedekre vonatkoznak.

A statisztikai következtetéselmélet Célja: a részleges megfigyelések eredményeiből következtetés a sokaságra. Területei: q. A

A statisztikai következtetéselmélet Célja: a részleges megfigyelések eredményeiből következtetés a sokaságra. Területei: q. A mintavétel módszertana és gyakorlata. q A becslési eljárás. q Hipotézisvizsgálat. q Több változó kapcsolatának, együttmozgásának vizsgálata.

A mintavétel Célja: a megszerzett adatok alapján megalapozott következtetéseket hozni az alapsokaságra vonatkozóan. Lépései:

A mintavétel Célja: a megszerzett adatok alapján megalapozott következtetéseket hozni az alapsokaságra vonatkozóan. Lépései: q A minta és a mintavétel megtervezése, mintaelemek kijelölése. q A kijelölt mintaelemek megfigyelése. q A mintavételi hiba kezelésének megtervezése.

A mintavételi hiba A vizsgált mutató lehetséges mintákból számított értékeinek átlagos eltérését mutatja a

A mintavételi hiba A vizsgált mutató lehetséges mintákból számított értékeinek átlagos eltérését mutatja a megfelelő sokasági értéktől. Típusai: q Nemmintavételi hiba q Mintavételi hiba A mintavételi hiba függ: q A sokaság jellegétől. q Az alkalmazott mintavételi eljárástól. q A vizsgált mutatószám fajtájától. q A minta nagyságától.

Véletlenen alapuló kiválasztás

Véletlenen alapuló kiválasztás

I. FAE - független, azonos eloszlású minta Jellemzői: q Homogén, végtelen sokaságból veszünk véletlen,

I. FAE - független, azonos eloszlású minta Jellemzői: q Homogén, végtelen sokaságból veszünk véletlen, visszatevéses vagy visszatevés nélküli mintát. q Véges sokaságból azonos valószínűséggel veszünk visszatevéses mintát. q Gyakorlati alkalmazása elsősorban a tömegtermelés minőségellenőrzésénél célszerű. Hibája: q A sokasági szórás gyakran ismeretlen. q Sokszor több változó vizsgálata a cél – a mintaelemszám meghatározása problémás.

II. EV - egyszerű véletlen minta q q Homogén és véges elemszámú sokaság esetén

II. EV - egyszerű véletlen minta q q Homogén és véges elemszámú sokaság esetén alkalmazható. A mintát visszatevés nélkül választjuk ki. Minden lehetséges n elemű minta kiválasztásának a valószínűsége azonos. Hasonló a FAE mintához, de véges és kisebb elemszámú sokaságok esetén inkább ez használatos.

EV - egyszerű véletlen minta Előnye: q A visszatevés a gyakorlatban nem mindig, vagy

EV - egyszerű véletlen minta Előnye: q A visszatevés a gyakorlatban nem mindig, vagy nem teljeskörűen hajtható végre. q Azonos elem ismételt megfigyelése felesleges. Hátránya: q A megfigyelt sokaságok többnyire nem homogének. Lépései: q A komplett lista összeállítása. q A mintanagyság meghatározása. q A minta kiválasztása.

III. R - rétegzett mintavétel Jellemzői: q Heterogén sokaság esetén alkalmazható. q Előzetes információ

III. R - rétegzett mintavétel Jellemzői: q Heterogén sokaság esetén alkalmazható. q Előzetes információ áll rendelkezésre arra nézve, hogy a sokaságot homogén osztályokba lehet sorolni. Lépései: q Először a fősokaságot valamilyen ismérv szerint átfedésmentesen homogén rétegekre osztjuk. q Ezután az egyes rétegeken belül egymástól függetlenül EV (ritkábban FAE) mintát veszünk. Előnye: q Azonos mintanagyság esetén a vizsgált jellemzőkre ( , ) kisebb hibát kapunk, mint az EV mintavétellel feltéve, hogy a rétegezés jó volt. TÍPUSAI

1. Egyenletes rétegzés Jellemző: q Minden egyes rétegbe azonos számú mintaelem kerül. Előnye: q

1. Egyenletes rétegzés Jellemző: q Minden egyes rétegbe azonos számú mintaelem kerül. Előnye: q Egyszerű. q Végrehajtása kényelmes. q Könnyű az egyes rétegeket számszerűen jellemezni. N 1≠N 2, de n 1= n 2

2. Arányos rétegzés Jellemző: q A mintába a sokasági arányoknak megfelelően választjuk meg az

2. Arányos rétegzés Jellemző: q A mintába a sokasági arányoknak megfelelően választjuk meg az elemszámot. Előnye: q Ha a rétegenkénti sokasági szórást nem ismerjük, az ebből számított mutatók mintavételi hibája minimális. q A mintából számított főátlag hibája sohasem nagyobb, mint EV mintavételnél. q.

3. Neyman-féle optimális rétegzés Jellemzői: q A szórások alapján osztja a mintát. q q

3. Neyman-féle optimális rétegzés Jellemzői: q A szórások alapján osztja a mintát. q q Nagyobb rétegekből nagyobb mintát vesz. A változékonyabb, heterogénebb rétegekből szintén nagyobb mintát vesz. Előnye: q Főátlag becslése során a mintavételi hiba minimális. Hátránya: q σj ritkán ismert.

4. Költség-optimális rétegzés Jellemzői: q Az egyes rétegek szórása mellett ismerjük és a kiválasztásnál

4. Költség-optimális rétegzés Jellemzői: q Az egyes rétegek szórása mellett ismerjük és a kiválasztásnál figyelembe vesszük az egyes rétegek megfigyelésének költségét is. q Adott költségkeret mellett minimális hibát eredményez. Képlete: ahol πj az egyes rétegek elemeinek megfigyelési egységköltsége.

IV. CS - csoportos (egylépcsős) mintavétel Homogén, véges sokaság esetén használható, ha § nem

IV. CS - csoportos (egylépcsős) mintavétel Homogén, véges sokaság esetén használható, ha § nem áll rendelkezésre a sokasági elemek teljes listája, de nagyobb csoportokra rendelkezünk listával. § a csoportok a koncentráltságuk miatt könnyebben, olcsóbban figyelhetők meg, mint az egyedek. Lépései: q Először a csoportok halmazából EV mintát veszünk. q Az így kiválasztott csoportokat teljes körűen megfigyeljük. Előnye: q Egyszerűbb és olcsóbb, mint a FAE vagy az EV minta. Hátránya: q Pontossága függ a csoporton belüli homogenitástól.

V. TL - többlépcsős mintavétel Jellemzői: q Hasonló esetekben használjuk, mint a csoportos mintavételt.

V. TL - többlépcsős mintavétel Jellemzői: q Hasonló esetekben használjuk, mint a csoportos mintavételt. q Több lépcsőben jutunk el a végső megfigyelési egységhez. q Leggyakoribb típusa a kétlépcsős mintavétel: § § először EV mintavétellel kiválasztjuk a csoportokat, majd a csoporton belül is EV mintavételt végzünk. Követelmény: q A minta önsúlyozó legyen, azaz megtartsa a sokasági arányokat.

Nem véletlen mintavételi eljárások

Nem véletlen mintavételi eljárások

1. Szisztematikus kiválasztás Jellemzői: q ha n elemű mintát akarunk venni egy N elemű

1. Szisztematikus kiválasztás Jellemzői: q ha n elemű mintát akarunk venni egy N elemű sokaságból, akkor meghatározva a k=N/n lépésközt a k 0 véletlen kezdőpontból kiindulva minden k-adik elemet figyeljük meg: q A minta gyorsan és mechanikusan kiválasztható. q Egybeeshet az EV megfigyeléssel, ha az elemek felsorolása független a megfigyelés tárgyától.

2. Kvótás kiválasztás Jellemzői: q Rögzítve van, hogy milyen összetételű mintát kell létrehozni. q

2. Kvótás kiválasztás Jellemzői: q Rögzítve van, hogy milyen összetételű mintát kell létrehozni. q A „kereteket” véletlen kiválasztással kitöltik. q A rétegzett mintavételhez hasonló eredmény hoz. q Nem szükséges előre rögzíteni a sokasági vagy réteglistákat.

3. Koncentrált kiválasztás Jellemzői: q Erősen koncentrált sokaság esetén alkalmazzák. q Kevés egyed rendelkezik

3. Koncentrált kiválasztás Jellemzői: q Erősen koncentrált sokaság esetén alkalmazzák. q Kevés egyed rendelkezik nagy befolyással a sokasági jellemzőre.

4. Hólabda kiválasztás Jellemzői: q Ritka, nehezen számba vehető sokaságok esetén alkalmazzuk. q Néhány

4. Hólabda kiválasztás Jellemzői: q Ritka, nehezen számba vehető sokaságok esetén alkalmazzuk. q Néhány kiválasztott egyedből indulunk ki. q Minden egyed a saját „ismeretségi köréből” keresi a következő mintaelemet.

5. Önkényes, szubjektív kiválasztás Jellemzői: q Szubjektív szempontok alapján történik a minta kiválasztása. q

5. Önkényes, szubjektív kiválasztás Jellemzői: q Szubjektív szempontok alapján történik a minta kiválasztása. q Széleskörű ismeretek esetén jó jellemzőkkel rendelkező mintát lehet kapni.

Ismételt vagy másodlagos mintavételi eljárások jellemzői q q q Speciális csoport a gyakorlatban alkalmazott

Ismételt vagy másodlagos mintavételi eljárások jellemzői q q q Speciális csoport a gyakorlatban alkalmazott mintavételi módok között. Elvi alapja az a felismerés, hogy a tényleges mintavétel igen költséges, míg a számítógép használata egyre olcsóbb! → a meglévő kisebb és olcsóbb mintákat számítógépes módszerekkel megtöbbszörözik. A meglévő mintából újabb mintákat képeznek azért, hogy a mintában lévő információkat jobban kihasználják.

Ismételt vagy másodlagos mintavételi eljárások típusai 1. ) Független részminták módszere 2. ) Kiegyensúlyozott

Ismételt vagy másodlagos mintavételi eljárások típusai 1. ) Független részminták módszere 2. ) Kiegyensúlyozott ismétlések 3. ) Jackknife módszer 4. ) Bootstrap módszer

KÖSZÖNÖM A FIGYELMET!

KÖSZÖNÖM A FIGYELMET!