2 ht Mintavteles eljrsok Becsls Teljes sokasg vizsglata
2. hét Mintavételes eljárások Becslés
Teljes sokaság vizsgálata Egy tanulócsoport hallgatóinak ösztöndíjaira vonatkozó adatokat Hallgató sorszáma Ösztöndíj értéke (Ft) 1 2 3 4 5 6 7 8 7000 9500 13000 10000 8000 9000 12000 11000 Jellemezzük a tanulócsoport hallgatóit, sokaságot az ösztöndíjuk alapján! mint
Általános jelölések: sokaság-minta Megnevezés Alapsokaságban Mintában Sokaság elemszáma N n Az i-edik egyed ismérvértéke Xi xi Az ismérvértékek átlaga Az ismérvértékek szórása
Mintából való következtetés Becslés Hipotézisvizsgálat Becslés: A sokaság bizonyos jellemzőinek, paraméterének közelítő megállapításával foglalkozik. Hipotézisvizsgálat: A sokaságra vonatkozó valamely állítás helyességét ellenőrzi.
STATISZTIKAI BECSLÉS
Alapfogalmak q q Becslőfüggvény : egy olyan statisztika, ami valamely sokasági jellemző mintából történő közelítő meghatározását szolgálja. n Pontbecslés A becslőfüggvény mintából számított konkrét értéke n Intervallumbecslés Adott megbízhatósági szinthez tartozó intervallum alsó és felső határának meghatározása Sokasági jellemző (paraméter): Konfidencia-intervallum egy x 1, x 2, …. xn mintából: Meg kell határoznunk a becslő függvénynek azt a és értékeit, melyekre teljesül, hogy π valószínűséggel közrefogják a sokasági paramétert. Standard hiba A becslő függvény valamennyi lehetséges mintából számított értékeinek a szórása.
Becslő függvényekkel szemben támasztott követelmények Torzítatlanság: Torzítatlannak nevezzük a becslő függvényt, ha a várható értéke egyenlő a paraméterrel, ellenkező esetben a becslő függvény torzított. A továbbiakban a következők becslő függvényeket fogjuk alkalmazni: q Mintaátlag (a sokasági várható érték torzítatlan becslő függvénye). q A mintabeli relatív gyakoriság (a sokasági megoszlási viszonyszám (valószínűség) torzítatlan becslése). q A korrigált tapasztalati szórásnégyzetet (a sokasági szórásnégyzet torzítatlan becslő függvénye. ) Hatásosság: két becslő függvény közül azt tekintjük hatásosabbnak, amelynek kisebb a szórása (standard hibája). Konzisztencia: a mintanagyság növelésével a becslés nagy valószínűséggel a sokasági paraméter felé, a becslő függvény szórása pedig a nulla felé tart. Ezért nagy minta használata esetén elfogadható az olyan konzisztens becslés is, amely nem torzítatlan.
A becslési eljárás lépései q q q A becslés célja és a sokaságra vonatkozó mintán kívüli információk ismeretében megválasztjuk az alkalmazandó becslő formulát. Meghatározzuk a mintaátlagot. Megfelelő módon kiszámítjuk a standard hibát. Az elvárt megbízhatósági szintnek megfelelően meghatározzuk a megbízhatósági együttható értékét az eloszlástáblázatok segítségével. Meghatározzuk a konfidencia intervallumot.
Várható érték intervallum becslése Alapesetei: q Normális eloszlású sokaság, melynek szórása ismert. q Normális eloszlású sokaság, melynek szórása nem ismert. Ha a sokaság nem tekinthető normális eloszlásúnak: Ebben az esetben a központi határeloszlás már említett tételére támaszkodva azt mondhatjuk, hogy ha kellően nagy méretű mintát vizsgálunk, akkor a változó közelíti a normális eloszlást. Amennyiben kis minta áll rendelkezésre az elemzéshez, úgy egyéni sajátosságokat figyelembe vevő módszereket kell alkalmaznunk.
Várható érték becslése
1. ) sokaság eloszlása normális, ismert a sokasági szórás, mintanagyság tetszőleges 2. ) sokaság eloszlása nem ismert, nem ismert a sokasági szórás, nagy minta 3. ) sokaság eloszlása normális, nem ismert a sokasági szórás, n < 100
Ahol: a becslőfüggvény mintából számított konkrét értéke standard normális eloszlású valószínűségi változó a mintaátlag standard hibája ( a mintaátlagok szórása) =n-1 szabadságfokú Student-eloszlású valószínűségi változó A Student-féle t eloszlás a szabadságfok növelésével a normálishoz tart.
Várható érték intervallum becslése Lépései: q A sokaság a vizsgált változó alapján normális eloszlású, a minta elemszám tetszőleges és a szórását is ismerjük valamilyen korábbi felmérésből. q A várható érték pontbecsléséből kell kiindulnunk. q A mintaátlagot standardizáljuk, azaz a következő képlet alapján transzformáljuk: q Adott π megbízhatósági szint mellett egy normális eloszlású, ismert szórású sokaság várható értékének intervalluma a következő formula segítségével becsülhető:
Mintapélda – várható érték Egy élelmiszer-feldolgozó vállalat adatai (N=50. 000): Nettó töltősúly (g) 1440 - 1460 1461 - 1480 1481 - 1500 1501 - 1520 1521 - 1540 Összesen Üvegek száma (db) 10 40 180 50 20 300 A sokasági szórás ismeretében (σ=15 g) a standard hiba z =2, 32
z 0, 0 0, 1 0, 2 0, 3 0, 4 0, 5 0, 6 0, 7 0, 8 0, 9 1, 0 1, 1 1, 2 1, 3 1, 4 1, 5 1, 65 1, 7 1, 8 1, 96 2, 06 2, 17 2, 2 2, 32 2, 4 2, 58 2, 6 2, 7 2, 8 2, 9 3, 0 3, 30 (z) 0, 000 0, 080 0, 159 0, 236 0, 311 0, 383 0, 452 0, 516 0, 576 0, 632 0, 683 0, 729 0, 770 0, 806 0, 839 0, 866 0, 890 0, 911 0, 928 0, 943 0, 955 0, 964 0, 972 0, 979 0, 984 0, 988 0, 991 0, 993 0, 995 0, 996 0, 997 0, 999
Várható érték intervallum becslése Lépései: q A sokaság a vizsgált változó alapján normális eloszlású, a minta elemszám 100 egyednél nagyobb és a szórását nem ismerjük. q A várható érték pontbecsléséből kell kiindulnunk. q A mintaátlagot standardizáljuk, azaz a következő képlet alapján transzformáljuk: q Adott π megbízhatósági szint mellett egy normális eloszlású, ismeretlen szórású sokaság várható értékének intervalluma a következő formula segítségével becsülhető:
Mintapélda – várható érték Egy élelmiszer-feldolgozó vállalat adatai Nettó töltősúly (g) 1440 - 1460 1461 - 1480 1481 - 1500 1501 - 1520 1521 - 1540 Összesen Üvegek száma (db) 10 40 180 50 20 300 A mintabeli szórás és a standard hiba meghatározása z =1, 96
Valószínűség vagy arány becslése
Konfidencia-intervallum
Mintapélda – arány Egy élelmiszer-feldolgozó vállalat adatai (N=50. 000): Nettó töltősúly (g) 1440 - 1460 1461 - 1480 1481 - 1500 1501 - 1520 1521 - 1540 Összesen Üvegek száma (db) 10 40 180 50 20 300 Határozzuk meg 95%-os megbízhatóság mellett, hogy a gép áltat megtöltött üvegek közül hány százalék nem haladja meg az 1480 grammot! Mintabeli arány meghatározása: Standard hiba meghatározása: 95%-os megbízhatósággal a 1480 grammnál kisebb súlyú üvegek aránya legalább 12, 465 és legfeljebb 20, 88% z =1, 96
Szórásnégyzet, szórás becslése Jellemzői: q A szórás pontbecslésére általában a korrigált tapasztalati szórást, mint torzítatlan becslő függvényt használjuk. q A minta normális eloszlású sokaságból származik. q Nincs semmiféle korlátozás a minta nagyságára nézve. q Becslőfüggvény:
Mintapélda – szórás becslése Egy egyetemen dolgozatírás után a hallgatók által elért pontszámok alakulását vizsgáltuk 100 elemű véletlen kiválasztással gyűjtött minta alapján. Dolgozatok Pontszáma (db) 0 - 20 8 21 - 40 26 41 - 60 37 61 - 80 23 81 - 100 6 Összesen 100
χ2 Df 1 0, 005 0, 0000 0, 01 0, 0002 0, 025 0, 0010 0, 05 0, 039 0, 10 0, 0158 0, 25 0, 102 0, 50 0, 455 0, 75 1, 32 0, 90 2, 71 0, 95 3, 84 0, 975 5, 02 0, 99 6, 63 0, 995 7, 88 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 0, 072 0, 207 0, 412 0, 676 0, 989 1, 34 1, 73 2, 16 2, 60 3, 07 3, 57 4, 07 4, 60 5, 14 5, 70 6, 26 6, 84 7, 43 8, 03 8, 64 9, 26 9, 89 10, 5 11, 2 11, 8 12, 5 13, 1 13, 8 20, 7 28, 0 35, 5 43, 3 51, 2 59, 2 67, 3 0, 0201 0, 115 0, 297 0, 554 0, 872 1, 24 1, 65 2, 09 2, 56 3, 05 3, 57 4, 11 4, 66 5, 23 5, 81 6, 41 7, 01 7, 63 8, 26 8, 90 9, 54 10, 2 10, 9 11, 5 12, 2 12, 9 13, 6 14, 3 15, 0 22, 2 29, 7 37, 5 45, 4 53, 5 61, 8 70, 1 0, 0506 0, 216 0, 484 0, 831 1, 24 1, 69 2, 18 2, 70 3, 25 3, 82 4, 40 5, 01 5, 63 6, 26 6, 91 7, 56 8, 23 8, 91 9, 59 10, 3 11, 0 11, 7 12, 4 13, 1 13, 8 14, 6 15, 3 16, 0 16, 8 24, 4 32, 4 40, 5 48, 8 57, 2 65, 6 74, 2 0, 103 0, 352 0, 711 1, 15 1, 64 2, 17 2, 73 3, 33 3, 94 4, 57 5, 23 5, 89 6, 57 7, 26 7, 96 8, 67 9, 39 10, 1 10, 9 11, 6 12, 3 13, 1 13, 8 14, 6 15, 4 16, 2 16, 9 17, 7 18, 5 26, 5 34, 8 43, 2 51, 7 60, 4 69, 1 77, 9 0, 211 0, 584 1, 06 1, 61 2, 20 2, 83 3, 49 4, 17 4, 87 5, 58 6, 30 7, 04 7, 79 8, 55 9, 31 10, 9 11, 7 12, 4 13, 2 14, 0 14, 8 15, 7 16, 5 17, 3 18, 1 18, 9 19, 8 20, 6 29, 1 37, 7 46, 5 55, 3 64, 3 73, 3 82, 4 0, 575 1, 21 1, 92 2, 67 3, 45 4, 25 5, 07 5, 90 6, 74 7, 58 8, 44 9, 30 10, 2 11, 0 11, 9 12, 8 13, 7 14, 6 15, 5 16, 3 17, 2 18, 1 19, 0 19, 9 20, 8 21, 7 22, 7 23, 6 24, 5 33, 7 42, 9 52, 3 61, 7 71, 1 80, 6 90, 1 1, 39 2, 37 3, 36 4, 35 5, 35 6, 35 7, 34 8, 34 9, 34 10, 3 11, 3 12, 3 13, 3 14, 3 15, 3 16, 3 17, 3 18, 3 19, 3 20, 3 21, 3 22, 3 23, 3 24, 3 25, 3 26, 3 27, 3 28, 3 29, 3 39, 3 49, 3 59, 3 69, 3 79, 3 89, 3 99, 3 2, 77 4, 11 5, 39 6, 63 7, 84 9, 04 10, 2 11, 4 12, 5 13, 7 14, 8 16, 0 17, 1 18, 2 19, 4 20, 5 21, 6 22, 7 23, 8 24, 9 26, 0 27, 1 28, 2 29, 3 30, 4 31, 5 32, 6 33, 7 34, 8 45, 6 56, 3 67, 0 77, 6 88, 1 98, 6 109, 1 4, 61 6, 25 7, 78 9, 24 10, 6 12, 0 13, 4 14, 7 16, 0 17, 3 18, 5 19, 8 21, 1 22, 3 23, 5 24, 8 26, 0 27, 2 28, 4 29, 6 30, 8 32, 0 33, 2 34, 4 35, 6 36, 7 37, 9 39, 1 40, 3 51, 8 63, 2 74, 4 85, 5 96, 6 107, 6 118, 5 5, 99 7, 81 9, 49 11, 1 12, 6 14, 1 15, 5 16, 9 18, 3 19, 7 21, 0 22, 4 23, 7 25, 0 26, 3 27, 6 28, 9 30, 1 31, 4 32, 7 33, 9 35, 2 36, 4 37, 7 38, 9 40, 1 41, 3 42, 6 43, 8 55, 8 67, 5 79, 1 90, 5 101, 9 113, 1 124, 3 7, 38 9, 35 11, 1 12, 8 14, 4 16, 0 17, 5 19, 0 20, 5 21, 9 23, 3 24, 7 26, 1 27, 5 28, 8 30, 2 31, 5 32, 9 34, 2 35, 5 36, 8 38, 1 39, 4 40, 6 41, 9 43, 2 44, 5 45, 7 47, 0 59, 3 71, 4 83, 3 95, 0 106, 6 118, 1 129, 6 9, 21 11, 3 13, 3 15, 1 16, 8 18, 5 20, 1 21, 7 23, 2 24, 7 26, 2 27, 7 29, 1 30, 6 32, 0 33, 4 34, 8 36, 2 37, 6 38, 9 40, 3 41, 6 43, 0 44, 3 45, 6 47, 0 48, 3 49, 6 50, 9 63, 7 76, 2 88, 4 100, 4 112, 3 124, 1 135, 8 10, 6 12, 8 14, 9 16, 7 18, 5 20, 3 22, 0 23, 6 25, 2 26, 8 28, 3 29, 8 31, 3 32, 8 34, 3 35, 7 37, 2 38, 6 40, 0 41, 4 42, 8 44, 2 45, 6 46, 9 48, 3 49, 6 51, 0 52, 3 53, 7 66, 8 79, 5 92, 0 104, 2 116, 3 128, 3 140, 2
KÖSZÖNÖM A FIGYELMET!
- Slides: 24