Optimlis rtegzs s teleplsrtegzsi vizsglatok a KSH lakossgi
- Slides: 29
Optimális rétegzés és településrétegzési vizsgálatok a KSH lakossági felvételeiben Fraller Gergely
1. Mintavételi rétegzés – példa 2. Településrétegzési vizsgálatok – az ok 3. Településrétegzési vizsgálatok - rétegzés - allokáció 4. Új mintavételi terv - rétegzés - allokáció
Példa: adott 10000 elemű sokaság – x
Példa (folyt. ): X értékösszeg becslése egy • 99 elemű • rétegzett (rétegszám=3) • egyszerű véletlen mintából, • arányos allokáció mellett
Példa (folyt. ) értékösszegbecslés elméleti szórásnégyzete elemszám az rétegzés 1. 2. 3. szórásnégyzet a rétegzés nélküli változat %-ában 376 817 100 rétegben nincs rétegzés 1. 2. 3. 4. 5. 10 000
Példa (folyt. ) értékösszegbecslés elméleti szórásnégyzete elemszám az rétegzés 1. 2. 3. szórásnégyzet a rétegzés nélküli változat %-ában 376 817 100 129 063 34 rétegben nincs rétegzés 1. 2. 3. 4. 5. egyenlő elemszám 10 000 3 333 3 334
Példa (folyt. ) értékösszegbecslés elméleti szórásnégyzete elemszám az rétegzés 1. 2. 3. szórásnégyzet a rétegzés nélküli változat %-ában 376 817 100 rétegben nincs rétegzés 10 000 1. egyenlő elemszám 3 333 3 334 129 063 34 2. egyenlő súlyú x-re 5 275 2 974 1 751 93 929 25 3. 4. 5.
Példa (folyt. ) értékösszegbecslés elméleti szórásnégyzete elemszám az rétegzés 1. 2. 3. szórásnégyzet a rétegzés nélküli változat %-ában 376 817 100 rétegben nincs rétegzés 10 000 1. egyenlő elemszám 3 333 3 334 129 063 34 2. egyenlő súlyú x-re 5 275 2 974 1 751 93 929 25 4 277 4 603 1 120 85 157 23 3. 4. 5.
Példa (folyt. ) értékösszegbecslés elméleti szórásnégyzete elemszám az rétegzés 1. 2. 3. szórásnégyzet a rétegzés nélküli változat %-ában 376 817 100 rétegben nincs rétegzés 10 000 1. egyenlő elemszám 3 333 3 334 129 063 34 2. egyenlő súlyú x-re 5 275 2 974 1 751 93 929 25 3. 4 277 4 603 1 120 85 157 23 4. 5 578 3 599 823 79 908 21 5.
Példa (folyt. ) értékösszegbecslés elméleti szórásnégyzete elemszám az rétegzés 1. 2. 3. szórásnégyzet a rétegzés nélküli változat %-ában 376 817 100 rétegben nincs rétegzés 10 000 1. egyenlő elemszám 3 333 3 334 129 063 34 2. egyenlő súlyú x-re 5 275 2 974 1 751 93 929 25 3. 4 277 4 603 1 120 85 157 23 4. 5 578 3 599 823 79 908 21 5. 5 529 3 642 829 79 921 21
Példa (folyt. ) értékösszegbecslés elméleti szórásnégyzete elemszám az rétegzés 1. 2. 3. szórásnégyzet a rétegzés nélküli változat %-ában 376 817 100 rétegben nincs rétegzés 10 000 1. egyenlő elemszám 3 333 3 334 129 063 34 2. egyenlő súlyú x-re 5 275 2 974 1 751 93 929 25 3. kumulatív √f szabály 4 277 4 603 1 120 85 157 23 4. Sethi algoritmusa 5 578 3 599 823 79 908 21 5. A 1 -A 4 algoritmus 5 529 3 642 829 79 921 21
Léteznek optimális rétegzési eljárások
Optimális rétegzésegyszerű véletlen kiválasztás • Számos eredmény már az ’ 50 -es években • Sethi: – táblázatban optimális réteghatárok Normális és Khi-négyzet eloszlásokra különböző allokációkra különböző rétegszám mellett – egyszerű algoritmusok
Optimális rétegzéspps kiválasztás • • A 1 -A 4 algoritmus (a kanadai gyakorlatból) Arányos allokáció optimális rétegzés Több változó bevonása lehetséges! A hatékonyság mérőszáma: rétegzési index (0 -100) ennyi %-kal csökken az összegbecslés szórásnégyzete
Példa (folyt. ) értékösszegbecslés elméleti szórásnégyzete és a rétegzési index elemszám az rétegzés 1. 2. 3. rétegben nincs rétegzés 10 000 szórásnégyzet a rétegzés nélküli változat %-ában rétegzési index 100 0 1. egyenlő elemszám 3 333 3 334 34 66 2. egyenlő súlyú x-re 5 275 2 974 1 751 25 75 3. kumulatív √f szabály 4 277 4 603 1 120 23 77 4. Sethi algoritmusa 5 578 3 599 823 21 79 5. A 1 -A 4 algoritmus 5 529 3 642 829 21 79
A településrétegzési vizsgálatok előélete • 2003: új MEFés HKF • 2004: LUSZ • 2005: IKT és VÉKA 1135 település érintett 2008 -ban • 2008 -9: koncentrált összeíró-hálózat • 2008: a lakossági adatgyűjtések mintáinak harmonizálása projekt
A lakossági adatgyűjtések mintáinak harmonizálása – településrétegzési vizsgálatok 1. 2. 3. 4. 5. 6. helyzetfelmérés rétegzési technikák kutatása új rétegző változók és technikák tesztelése optimális allokáció vizsgálata konkrét településrétegzés konkrét allokáció
Új rétegző változók és technikák tesztelése – célok • Milyen változókat érdemes bevonni? • Milyen technikát érdemes alkalmazni? • Hány réteget célszerű kialakítani?
Új rétegző változók és technikák tesztelése – módszer • Nagy számú rétegzés kialakítása – különböző változók bevonásával – különböző módszerekkel – különböző rétegszámokkal • Az összehasonlítás alapja a MEF • Az összehasonlítás eszköze a rétegzési index népszámlálási változókon, a MEF nem önreprezentáló településeinek sokaságán
Új rétegző változók és technikák tesztelése – néhány rétegzés
Új rétegző változók és technikák tesztelése – tanulságok • • az A 1 -A 4 algoritmust célszerű használni megyénként eltérő számú réteg megyénként független rétegkialakítás a regisztrált mn. és jövedelem változók bevonása célszerű • felértékelődik az optimális allokáció
Az optimális allokáció vizsgálata • Képletszerű megoldások a településszámra és a településenkénti mintaelemszámokra • Vizsgálatok a MEF rétegzése mellett – Az összehasonlítás alapja: a munkanélküli létszám becslésének elméleti szórásnégyzete – Optimális allokáció – X-optimális allokáció – Rétegen belüli allokáció • Vizsgálatok alternatív rétegzések mellett
Optimális allokáció alternatív rétegzések mellett
Új mintavételi terv – településrétegzés • Bevont változók – V 1 munkanélküli létszám (2001 cenzus) – V 2 foglakoztatott létszám (2001 cenzus) – V 3 felsőfokú végz. létszáma (2001 cenzus) – V 4 -V 11 regisztrált munkanélküliek 2001 -2008 – V 12 -V 19 jövedelem 2001 -2008 • Összesen 113 réteg, megyénként 5 -8
Új mintavételi terv – településrétegzés, eredmény Országos rétegzés indexek a V 1 -V 19 változókra rétegzés alternatí v rétegzés MEF rétegzés réteg szám V 1 V 2 V 3 V 4 V 5 V 6 V 7 V 8 V 9 V 10 V 11 V 12 V 13 V 14 V 15 V 16 V 17 V 18 V 19 113 77 80 73 81 82 82 82 81 80 79 78 87 89 88 88 88 87 103 53 63 40 61 60 57 56 54 52 52 50 68 69 68 67 66 65 68 66
Új mintavételi terv – allokáció • A MEF megyei mintaelemszámai mellett • Cél: minél kevesebb település mellett nem kevésbé pontos becslések • Településszám-allokáció • Településenkénti mintaelemszám
Mintaelemszám és szórásnégyzet – a MEF és az új terv szerint
Településrétegzési kutatások – összefoglalás • Eredményes elméleti kutatás új ismeretek az optimális rétegzés területén • Gyakorlati tapasztalatok az optimális településrétegzés és allokáció területén hatékonynak tűnő újfajta mintavételi terv – időbeli hatékonysága bizonytalan
Településrétegzési kutatások – jelen és jövő • a projektnek vége, • a kutatásnak még nem – a 2011 -es cenzus után ellenőrzés két népszámlálás adatai alapján válasz arra, hogy időben tud-e hatékony maradni az újfajta mintavételi terv (rétegzés)