Gazdasgstatisztika Hipotzisvizsglatok ltalnos krdsei Nemparamteres prbk 2014 november
Gazdaságstatisztika Hipotézisvizsgálatok általános kérdései Nemparaméteres próbák 2014. november 6. és november 13.
Becslés vs hipotézisvizsgálat q q Következtető statisztikai eszközök Egy véletlen minta ismeretében hogyan lehet becslést adni annak a sokaságnak bizonyos jellemzőire, amelyből a minta származik. § § § q Várható érték becslése ismeretlen és ismert sokasági szórás esetén Sokasági variancia becslése Sokasági arány becslése De nem mindig erre van szükség: § § § el kell döntenünk, hogy a rendelkezésre álló egy vagy több minta származhat -e meghatározott tulajdonságokkal rendelkező egy vagy több sokaságból vagy összehasonlítási célok mérlegelni kell, hogy a mintavétel eredménye alátámasztja vagy cáfolja a feltevésünket Kvantitatív módszerek
A hipotézisvizsgálat lényege q q q A vizsgálandó sokaságra vonatkozó ismereteink gyakran hiányosak és/vagy bizonytalanok sejtésünket hipotézisként fogalmazzuk meg, amelynek igazságáról meg kell győződni Hipotézis: sokasággal (!!!) kapcsolatos feltevés, amely vonatkozhat § A sokaság eloszlására § A sokaság eloszlásának egy vagy több paraméterére Az állítások helyességéről kétféleképpen lehet meggyőződni: • • • q Teljes körű adatfelvételt végzünk Mintavétel eredményei alapján következtetünk MINTAVÉTELI INGADOZÁS, MINTAVÉTELI HIBA Hipotézisvizsgálat: a sokaságra vonatkozó feltevés mintavételi eredményekre támaszkodó vizsgálata. A hipotézisvizsgálat annak mérlegelése, hogy egy sokaságra vonatkozó állítás mennyire hihető a mintavétel eredményeinek tükrében.
A hipotézisvizsgálat lényeges kérdései q q q 1. lépés: a null- és alternatív hipotézisek megfogalmazása Nullhipotézis (H 0): az a sokaságra vonatkozó feltevés, amelynek igazságáról a hipotézisvizsgálat során közvetlenül meg kívánunk győződni. Alternatív (vagy ellen-) hipotézis (H 1): a nullhipotézissel együtt minden lehetőséget kimerítő, azzal egymást kölcsönösen kizáró hipotézis, amelynek helyességéről közvetetten döntünk a hipotézisvizsgálat során. § q A kettő közül azt fogjuk igaznak tekinteni, elfogadni, amelyik a mintavétel eredménye alapján hihetőbbnek tűnik a másiknál A hipotézisek megfogalmazásának szempontjai: • • • Megválaszolható legyen a bennünket érdeklő kérdés Egymást kizárják Mindig a nullhipotézis helyességéről döntünk, de az arról való döntés egyben közvetett döntés az alternatív hipotézisről.
Példa Igaz-e, hogy egy őrölt kávét töltő gép az előírásoknak megfelelően átlagosan 1 kg töltősúlyú csomagokat készít? § § q A nullhipotézis: § q A sokaság várható értékére vonatkozó feltevést szeretnénk vizsgálni A töltőtömeg némileg szóródik A töltés szisztematikusan nem tolódik-e el valamelyik irányba, mert az vagy veszteséget okoz a vállalatnak, vagy a vevőket károsítja meg A szórásról nem mond semmit! H 0: μ=1 kg A lehetséges ellenhipotézisek: § § § H 1: (1) μ≠ 1 kg; H 1: (2) μ>1 kg; H 1: (3) μ<1 kg Kvantitatív módszerek
A hipotézisvizsgálat lényeges kérdései q 2. lépés: a próbafüggvény kiválasztása § § § A hipotézisek vizsgálatára próbafüggvényt használunk: a mintából a sokaságra történő következtetést szolgálja A mintaelemek egy olyan függvénye, amelynek valószínűségi eloszlása a sokaság ismert tulajdonságait tekintetbe véve, a nullhipotézis igazságát feltételezve pontosan ismert. A próbafüggvényt eloszlásának ismerete teszi alkalmassá a nullhipotézis helyességének vizsgálatára: sokaság eloszlása, mintavétel módja, minta nagysága A próbafüggvények értékei mintáról mintára ingadozó jellemzők, azaz statisztikák. A próbafüggvények konstruálása elvi, matematikai feladat.
A hipotézisvizsgálat lényeges kérdései q 3. lépés: elfogadási és elutasítási (kritikus) tartomány kijelölése § a próbafüggvény lehetséges értékeinek teljes tartományát két egymást át nem fedő részre bontjuk kritikus érték(ek) segítségével: • § § § elfogadási és elutasítási (kritikus) tartományra. A határt (a kritikus értékeket) úgy választjuk meg, hogy a próbafüggvény a nullhipotézis fennállása esetén előre megadott nagy ε valószínűséggel az elfogadási tartományba essen. Ha a próbafüggvénynek a rendelkezésünkre álló egy – esetleg több – minta adataiból számított értéke az elfogadási tartományba esik, akkor elfogadjuk a nullhipotézist, ellenkező esetben elvetjük azt. A kritikus tartományba esés α valószínűségét szignifikancia szintnek nevezzük (1%-10% között)
A hipotézisvizsgálat lényeges kérdései q Kritikus értékek: § § § Az elfogadási és elutasítási tartományt egymástól elhatároló ca és cf értékeket alsó és felső kritikus értéknek szokás nevezni. A kritikus értékeket mindig a kritikus tartomány részének tekintjük. A kritikus tartomány kijelölésére kétoldali kritikus tartomány használata esetén két kritikus értékre, egyoldali kritikus tartomány esetén pedig egy kritikus értékre van szükség. A kritikus értékek a szignifikancia szint és a próbafüggvény eloszlásának ismeretében egyértelműen meghatározhatóak Speciális táblázatok Gazdaságstatisztika
Egyoldali kritikus Kritikus tartomány Elfogadási α Kritikus érték Bal oldali kritikus tartomány 1 -α Elfogadási Kritikus α 1 -α Kritikus érték q q q Jobb oldali kritikus tartomány Bal vagy jobboldali kritikus tartomány kijelölése: § eleve arra számítunk, hogy a valóság meghatározott irányú eltérést mutat egy általunk feltételezett helyzettől. § ha csak valamilyen feltételezett vagy előírt állapottól való adott irányú eltérés igazán fontos a számunkra. A próbafüggvény mintából nyert értéke elég kicsi-e (elég nagy-e) ahhoz, hogy a nullhipotézis helyett az alternatív hipotézis fennállását legyen indokolt feltételezni. A teljes kritikus tartományt a próbafüggvény eloszlásának vagy csak a bal, vagy csak a jobb szélére tesszük.
Kétoldali kritikus tartomány q q Kétoldali kritikus tartomány kijelölése: § csak a nullhipotézisben feltételezett helyzettől való eltérés ténye érdekel bennünket, és közömbös az eltérés iránya. § A próbafüggvény értéke akár kisebb, akár nagyobb lehet, mint a nullhipotézis fennállásakor A kritikus tartományba esés teljes valószínűségét egyenlő arányban szokás megosztani a kritikus tartomány két része között. Kritikus Elfogadási Kritikus α/2 1 -α α/2 Kritikus érték Két oldali kritikus tartomány
A hipotézisvizsgálat lépései 1. 2. 3. 4. 5. A null- (H 0) és alternatív (H 1) hipotézisek megfogalmazása Olyan próbafüggvény keresése, amelynek eloszlása a nullhipotézis helyességét feltételezve és a próba alkalmazási feltételeit figyelembe véve egyértelműen meghatározható. A szignifikancia szint (α) megválasztása, és a próbafüggvény lehetséges értéktartományának felosztása elfogadási és elutasítási tartományra. Mintavétel, ez alapján a próbafüggvény, mint valószínűségi változó számszerű értékének meghatározása. Döntés a hipotézisek helyességéről: § § ha a próbafüggvény értéke az előre kijelölt elfogadási tartományba esik, akkor elfogadjuk a nullhipotézist, Ha a próbafüggvény értéke az elutasítási tartományba esik, akkor elutasítjuk a nullhipotézist.
Statisztikai próbák elve f( 2) P( 2 szám< 2 krit( )|H 0 igaz) = 1 - = DF DF 2 =1 - 2 szám 2 krit Kvantitatív módszerek 2 szám 2
A hipotézisvizsgálat során elkövethető hibák Minta-1 Adott n mellett: ha α ↑ β ↓ ha α ↓ ↑ β ↑ Adott α mellett: ha n ↑ β ↓ ha próbafüggvény szórása ↓ β ↓ H 0 Nem igaz Igaz Mintából következtetünk !!! Igaz Döntés H 0 -ról a minta alapján Minta-2 Nem igaz Minta-3 Másodfajú hiba Nincs hiba A H 0 téves elfogadása Hibát követhetünk el !!! Elsőfajú hiba Elsőfajú Ahiba H 0 téves ( ) elvetése Másodfajú Nincs hiba ( ) e Cél: a másodfajú hiba valószínűségének csökkentése (adott α mellett) Kvantitatív módszerek
P-érték q q Az a legkisebb szignifikancia szint, amelyen a nullhipotézis épp elvethető az ellenhipotézissel szemben A próbafüggvény mintából nyert értékéhez tartozó szignifikancia szint. § § Ho-t elvetjük, ha a p≤α Ho-t elfogadjuk, ha a p>α Kvantitatív módszerek
Példa Kávétöltési példa: a töltőgép normális eloszlás szerint tölti a csomagokat q H 0: μ=1 kg q H 1: μ≠ 1 kg Legyen egy n=16 elemű mintánk Gazdaságstatisztika
A próbák osztályozása q Mi a nullhipotézisük tárgya: § q Milyen jellegűek a sokaság eloszlásával szemben támasztott alkalmazási feltételek: § § q Paraméterre és eloszlásra irányuló próbák A paraméteres próbák alkalmazási feltételei között szerepelnek a sokasági eloszlás típusára, egyes paramétereire vonatkozó elvárások A nemparaméteres próbák alkalmazása legfeljebb a sokaság eloszlásának folytonosságát követeli meg Hány és mekkora minta szükséges a végrehajtásukhoz § § § Egy, két vagy többmintás próbák Független és páros mintás próbák Kis- és nagymintás próbák (határ n=30)
Illeszkedésvizsgálat q q Arról döntünk, hogy valamely valószínűségi változó F (tapasztalati) eloszlása lehet-e adott F 0 (elméleti) eloszlásfüggvénnyel jellemzett eloszlás Minták száma: egymintás Alkalmazás feltétele: nagymintás, diszkrét és folytonos eloszlásokra egyaránt Hipotézisek: § § H 0 : F = F 0 H 1 : F ≠ F 0 q A próbafüggvény: q A próbafüggvény eloszlása: χ2 eloszlás, DF=r-l-1 Típusai: tiszta és becsléses illeszkedésvizsgálat q 17
Példa – diszkrét eloszlása A Tiszán egy adott időszakban levonuló árhullámok számát vizsgálva az elmúlt 68 év során az alábbi eredményeket kapták: 30 év volt, amikor nem volt árhullám, 25 olyan év volt, amikor 1 árhullám vonult le az adott időszakban, 9 év volt, amikor 2 és 4 olyan év volt, amikor 3 vagy több árhullám következett be. Feltehető-e, hogy a folyón levonuló árhullámok száma modellezhető Poisson-eloszlással? árhullámok száma 0 1 2 3 v. több gyakoriság [db] 30 25 9 4 =? nem ismerjük a mintából kell becsülnünk Poisson-eloszlás esetén: M( )= (számtani átlaggal becsülhető) Mivel az elmúlt 68 év során a kérdéses időszakban összesen 55 árhullám volt: 55/68 0, 8 Gazdaságstatisztika
Példa – diszkrét eloszlása Nullhipotézis és alternatív hipotézis felállítása: H 0 = az árhullámok száma =0, 8 paraméterű Poisson-eloszlású H 1: az árhullámok száma nem =0, 8 paraméterű Poisson-eloszlású q Mintavétel, adatok feldolgozása, kritikus érték (elfogadási és elutasítási tartomány) meghatározása q § • • • k Poisson eloszlás táblázat 0 =0, 8 1 k=0 p 0 =0, 4493 2 k=1 p 1 =0, 3595 3 v. több k=2 p 2 =0, 1438 k= 3 vagy annál több 1 -(p 0 + p 1 + p 2 )=0, 0474 Gazdaságstatisztika f(k) 30 25 9 4 68 pk 0, 4493 0, 3595 0, 1438 0, 0474 1
Példa – diszkrét eloszlás Elméleti gyakoriságok meghatározása k 0 1 2 3 v. több f(k) 30 25 9 4 68 pk 0, 4493 0, 3595 0, 1438 0, 0474 1 Kritikus érték: DF=r-l-1=4 -1 -1=2 =5% táblázatból: 2 elm. =5, 99 Gazdaságstatisztika F(k) 30, 55 24, 45 9, 78 3, 22 68 f(k) 30 25 9 4 68 pk 0, 4493 0, 3595 0, 1438 0, 0474 1
Példa – diszkrét eloszlás q Számított érték: k 0 1 2 3 v. több f(k) 30 25 9 4 68 pk 0, 4493 0, 3595 0, 1438 0, 0474 1 F(k) 30, 55 24, 45 9, 78 3, 22 68 A számított és a kritikus érték összehasonlítása: 2 elm. =5, 99 >> 2 sz=0, 27 q Döntés a nullhipotézisről: q Mivel a számított érték az elfogadási tartományba esik –, ezért 95%-os megbízhatósági elfogadjuk a H 0 -t: a folyón levonuló árhullámok száma modellezhető =0, 8 paraméterű Poisson-eloszlással. Gazdaságstatisztika
Példa – folytonos eloszlás A légi közlekedésben fontos figyelemmel kísérni az utasok átlagos testsúlyát, hogy egyrészt ne terheljék túl a gépet, másrészt ne utazzon a gép fölös kapacitással. Ezért időről időre ellenőrzik, hogy a felnőtt utasok testsúlya nem tér-e el a feltételezettől. A légitársaság a terhelést a 78 kg-os átlagos testsúlyra és 11 kg-os szórásra tervezi. A feltételezés ellenőrzése céljából megmérték 100 véletlenszerűen kiválasztott utas súlyát, akik között 44 nő volt. A mérés eredménye látható a következő táblázatban. 5%-os szignifikancia szint mellett teszteljük, hogy az utasok testsúlya normális eloszlású változó! Testsúly Ügyfelek száma A mintából kiszámított jellemzők: Megoldás: Becsléses illeszkedésvizsgálat Gazdaságstatisztika (kg) (fő) -60 7 60 -70 16 70 -80 32 80 -90 28 90 -100 13 100 - 4 Összesen 100
Példa – folytonos eloszlás Hipotézisek: H 0: az utasok tömege N(78, 6; 12, 187) normális eloszlású H 1: az utasok tömege nem N(78, 6; 12, 187) normális eloszlású q Mintavétel, adatok feldolgozása q Testsúly (kg) -60 60 -70 70 -80 80 -90 90 -100 100Összesen Ügyfelek száma (fő) - fi 7 16 32 28 13 4 100 Pi Gazdaságstatisztika Fi
Példa – folytonos eloszlás q A Pi valószínűségi értékek meghatározása Testsúly (kg) -60 60 -70 70 -80 80 -90 90 -100 100Összesen Ügyfelek száma (fő) - fi 7 16 32 28 13 4 100 Pi 0, 064255 0, 1746 0, 305 0, 2826 0, 1344 0, 04 1 Gazdaságstatisztika Fi
Példa – folytonos eloszlás q Elméleti gyakoriságok meghatározása Testsúly (kg) -60 Ügyfelek száma (fő) - fi 7 Pi Fi 6, 4255 16 0, 064255 0, 1746 60 -70 70 -80 32 0, 305 30, 5 80 -90 28 0, 2826 28, 26 90 -100 13 0, 1344 13, 44 100 - 4 0, 04 4 Összesen 100 ~1 100 Gazdaságstatisztika 17, 46
Példa – folytonos eloszlás q A próbafüggvény értékének meghatározása: Testsúly (kg) Ügyfelek száma (fő) - fi Pi Fi -60 7 0, 064255 6, 4255 0, 0911 60 -70 16 0, 1746 17, 46 0, 122 70 -80 32 0, 305 30, 5 0, 074 80 -90 28 0, 2826 28, 26 0, 0024 90 -100 13 0, 1344 13, 44 0, 0144 100 - 4 0, 04 4 0 Összesen 100 ~1 ~100 0, 3038 Gazdaságstatisztika
Példa – folytonos eloszlás A kritikus érték meghatározása: DF=r-l-1=6 -2 -1=3 χ2 krit=7, 815 q Számított és kritikus érték összevetése, döntés a nullhipotézisről: Mivel a számított érték (0, 3038) kisebb, mint a kritikus érték (7, 815), így a nullhipotézist 5%-os szignifikancia szinten elfogadjuk, azaz az utasok tömege N(78, 6; 12, 187) normális eloszlású. q Gazdaságstatisztika
Homogenitásvizsgálat q q Homogenitásvizsgálat segítségével eldönthetjük, hogy két valószínűségi változó azonos eloszlásúnak tekinthető-e. Minták száma: kétmintás Alkalmazás feltétele: nagymintás, a közösnek feltételezett eloszlásfüggvényre nincs kikötés Hipotézisek: § § H 0: a vizsgált valószínűségi változók két sokaságon belüli eloszlása azonos H 1: a vizsgált valószínűségi változók két sokaságon belüli eloszlása nem azonos q A próbafüggvény: q A próbafüggvény eloszlása: χ2 eloszlás, DF=r-1 Eszköze: kontingencia táblázat q
Kontingencia táblázat 29
Példa A személysérüléssel járó közúti balesetekre vonatkoznak az alábbi, mintavételből származó adatok 2003 -ban. Hasonlítsuk össze a Budapesten és az ország többi részén történt balesetek idősávok szerinti eloszlását (α=1%)! A baleset ideje a nap órái szerint 0 -8 8 -12 12 -15 15 -18 18 -24 Összesen Balesetek száma Budapesten 14 20 19 23 24 100 Balesetek száma az ország többi részén Gazdaságstatisztika 27 39 34 47 53 200
Példa Hipotézisek felállítása: H 0: A balesetek idősávok szerinti eloszlása Budapesten és az ország többi részén megegyezik (H 0: FBP = Gegyéb) H 1: A balesetek idősávok szerinti eloszlása Budapesten és az ország többi részén nem egyezik (H 1: FBP Gegyéb) q Mintavétel, adatok feldolgozása: q § Kontingencia táblázat: § § § Sor- és oszlopösszegek kiszámítása Elméleti gyakoriságok meghatározása Számított érték meghatározása Gazdaságstatisztika
Példa – kontingencia tábla A baleset ideje a nap órái szerint 0 -8 Balesetek száma Peremgyakoriság száma az ország többi (sorösszegek) Budapesten részén 14 27 41 13, 67 27, 34 8 -12 20 12 -15 19 15 -18 23 18 -24 24 Peremgyakoriság (oszlopösszegek) 19, 67 17, 67 23, 33 25, 67 100 39 39, 34 34 35, 34 47 46, 66 53 51, 34 200 Gazdaságstatisztika 59 53 70 77 300
Példa Kritikus érték meghatározása: DF=r-1=5 -1=4 α=1% χ2 krit=13, 277 q Döntés a nullhipotézisről: Mivel a számított érték (0, 29656) kisebb, mint a kritikus érték (13, 277), így a nullhipotézist elfogadjuk, azaz 1%-os szignifikancia szinten elfogadható, hogy a balesetek óránkénti eloszlása Budapesten és az ország többi részén megegyezik. q Gazdaságstatisztika
Függetlenségvizsgálat q q Két minőségi ismérv valamely adott sokaságon belül független-e egymástól. A minták száma: egymintás Alkalmazás feltétele: a kontingencia táblázat méretétől függően nagy minta Hipotézisek: § § H 0 : a két valószínűségi változó független egymástól (nincs sztochasztikus kapcsolat) H 1 : a két valószínűségi nem független egymástól (közöttük sztochasztikus vagy függvénykapcsolat van) q A próbafüggvény: q A próbafüggvény eloszlása: χ2 eloszlás, DF=(r-1)(s-1) 34
Kontingencia táblázat 35
Minőségi ismérvek asszociációja A minőségi ismérvek között kapcsolat szorossága a minőségi ismérvek közötti asszociációval vizsgálható Cramer-féle asszociációs együttható 0 és 1 közötti értéket vesz fel. Minél közelebb esik 1 -hez, annál szorosabb a kapcsolat q = min(r, s) 36
Példa Egy közvéleménykutatás során egyik gazdasági témájú TVműsorról a következő kép alakult ki a diplomások körében: A nyilatkozó foglalkozása közgazdász jogász egyéb diplomás A műsor megítélése jó megfelelő rossz 100 200 100 60 40 Tesztelje 5%-os szignifikancia szinten a foglalkozás jellege és a TV-műsor minősítése közötti kapcsolatot! Határozzuk meg az asszociációs együtthatót is, jellemezzük a kapcsolat szorosságát! Gazdaságstatisztika
Példa Hipotézisek felállítása: H 0: A foglalkozás jellege és a TV-műsor minősítése független egymástól. H 1: A foglalkozás jellege és a TV-műsor minősítése nem független egymástól. q Mintavétel, adatfeldolgozás: q § Kontingencia táblázat elkészítése: • • • Sor-, és oszlop peremgyakoriságok meghatározása Elméleti gyakoriságok kiszámítása Számított érték meghatározása Gazdaságstatisztika
Példa A nyilatkozó foglalkozása jó közgazdász 100 jogász 100 egyéb diplomás 100 Peremgyakoriságok (oszlopösszegek) A műsor megítélése megfelelő 150 75 75 300 200 160 60 80 320 Gazdaságstatisztika rossz 100 40 40 180 90 45 45 Peremgyakori ságok (sorösszegek) 400 200 800
Példa Kritikus érték meghatározása: DF=(r-1)(s-1)=2∙ 2=4 α=5% χ2 krit=9, 488 q Döntés a nullhipotézisről: Mivel a számított érték 55, 53 nagyobb, mint a kritikus érték (9, 488), így a nullhipotézist elutasítjuk, a foglalkozás és a TV műsor minősítése nem független egymástól. q Gazdaságstatisztika
Példa q Asszociációs együttható: n=800 2 szám=55, 53 r=s=3 q=3 A diploma típusa és a TV-műsor megítélése, mint két minőségi ismérv között gyenge az asszociációs kapcsolat. Gazdaságstatisztika
Gyakorló példa – Feladatgyűjtemény (23. ) Egy termelési folyamatban 4 gép működik 3 műszakban. Véletlen mintát véve a hibás termékekből, gépek és műszakok szerint csoportosították azokat. Az eredményt az alábbi táblázat mutatja. Műszak I. III. A 10 16 12 Gépek B C 11 8 9 13 9 14 D 9 11 9 Van-e kapcsolat a selejt nagysága szerint a gépek és műszakok között? (α=10%) Gazdaságstatisztika
Megoldás Hipotézisek felállítása: H 0: független egymástól a selejt nagysága szerint a gép és a műszak H 1: nem független egymástól a selejt nagysága szerint a gép és a műszak q Mintavétel, adatok feldolgozása: q § Kontingencia táblázat elkészítése • • • Sor és oszlopösszegek (peremgyakoriságok számítása) Elméleti gyakoriságok számítása A próbafüggvény értékének kiszámítása Gazdaságstatisztika
Megoldás Műszak Peremgyakoriság (sorösszeg) Gépek χ2 sz=0, 095+0, 7976+0, 455+0, 0414+0, 2255+0, 315+0, 0007 A B C D I. 10 11 8 9 63+0, 002074+0, 0453+0, 05622+0, 4267+0, 05622=2, 517 38 11, 023 II. III. Peremgyakoriságok (oszlopösszeg) 16 8, 41 10, 15 8, 41 9 13 11 10, 85 14, 21 10, 85 13, 1 12 9 14 9 9, 74 11, 76 12, 76 9, 74 38 29 35 29 Gazdaságstatisztika 49 44 131
Megoldás Kritikus érték meghatározása: DF=(3 -1)(4 -1)=2∙ 3=6 α=10% χ2 krit=10, 645 q Döntés a nullhipotézisről: Mivel a számított érték (2, 517) kisebb, mint a kritikus érték (10, 645), így a nullhipotézist elfogadjuk, a selejt nagysága szerint nincs kapcsolat a gép és a műszak között. q Gazdaságstatisztika
Példa – Feladatgyűjtemény (24. ) A Matematika I. és II. tárgyakból a zárthelyi dolgozatokban elért pontszámok eloszlását reprezentálja az alábbi minta: Pontszámok 0 -10 10 -20 20 -30 30 -40 40 -50 Összesen Hallgatók száma (fő) Matematika II. 3 3 12 6 29 39 52 42 14 20 110 Hasonlítsuk össze 10%-os szignifikancia szinten a két tantárgy pontszám szerinti eloszlását! Gazdaságstatisztika
Megoldás Hipotézisek: H 0: a két tantárgy esetében elért pontszámok eloszlása azonos H 1: a két tantárgy esetében elért pontszámok eloszlása nem azonos q Mintavétel, adatok feldolgozása: q § Kontingencia táblázat elkészítése • • • Sor és oszlopösszegek (peremgyakoriságok számítása) Elméleti gyakoriságok számítása A próbafüggvény értékének kiszámítása Gazdaságstatisztika
Megoldás Pontszámok 0 -10 10 -20 Hallgatók száma (fő) Matematika I. II. 3 3 12 6 9 20 -30 29 30 -40 52 40 -50 14 34 47 9 39 42 20 17 Peremgyakoriság 110 Peremgyakoriság 6 18 34 68 47 94 17 34 220 Gazdaságstatisztika
Megoldás Kritikus érték: DF=5 -1=4 α=10% χ2 krit=7, 78 q Döntés a nullhipotézisről: Mivel a számított érték (7, 066) kisebb, mint a kritikus érték (7, 78), így a nullhipotézist elfogadjuk, azonos a pontszámok eloszlása a két tárgy esetében. q Gazdaságstatisztika
Példa – Feladatgyűjtemény (25. ) Egy település rendőrkapitánya azt állítja, hogy az éjszakai betörések száma egyenletesen oszlik meg a hét napjain. Egyheti megfigyelés alapján a betörések száma az egyes napokon az alábbi volt: Nap Betörések Hétfő Kedd Szerda Csütörtök Péntek Szombat Vasárnap Összesen száma 6 8 5 7 12 17 15 70 Ellenőrizzük 5%-os szignifikancia szinten, hogy elfogadható -e a rendőrkapitány állítása! Gazdaságstatisztika
Megoldás Hipotézisek felállítása: H 0: A betörések száma diszkrét egyenletes eloszlású H 1: A betörések száma nem diszkrét egyenletes eloszlású q q Mintavétel, adatfeldolgozás: § § Elméleti gyakoriságok meghatározása Számított érték meghatározása Gazdaságstatisztika
Megoldás Nap Hétfő Kedd Szerda Csütörtök Péntek Szombat Vasárnap Összesen Betörések száma (fi) 6 8 5 7 12 17 15 70 Elméleti gyakoriság (Fi) 10 10 70 Gazdaságstatisztika 1, 6 0, 4 2, 5 0, 9 0, 4 4, 9 2, 5 13, 2
Megoldás Kritikus érték: DF=7 -1=6 α=5% χ2 krit=12, 592 q Döntés a nullhipotézisről: Mivel a számított érték (13, 2) nagyobb, mint a kritikus érték (12, 592), így a nullhipotézist elutasítjuk, a betörések száma nem diszkrét egyenletes eloszlású. q Gazdaságstatisztika
Példa – Feladatgyűjtemény (21. ) Egy vállalatnál az átlagos heti túlóra-kifizetéseket vizsgálták. 80 véletlenszerűen kiválasztott dolgozó adatai alapján az átlagos túlóra-kifizetés az alábbi eloszlást mutatja: Heti túlórabér [font] munkások száma T < 1 19 1 T < 2 29 2 T < 5 17 5 T < 10 12 10 < T 3 Leírhatók-e a heti túlóra-kifizetések normális eloszlással? (Legyen a szignifikancia szint 10%) Gazdaságstatisztika
Megoldás q Illeszkedésvizsgálat § § § q Hipotézisek felállítása H 0: normális eloszlás N(? ; ? ) H 1: nem normális eloszlás Normális eloszlás paramétereinek becslése: s*=2, 98 H 0: a heti túlóra kifizetés N(3, 0; 2, 98) eloszlású H 1: a heti túlóra kifizetés nem N(3, 0; 2, 98) eloszlású Gazdaságstatisztika Heti túlórabér [font] munkások száma T < 1 19 1 T < 2 29 2 T < 5 17 5 T < 10 12 10 < T 3
Megoldás Kritikus érték meghatározása A becsült paraméterek száma: 2 =0, 10 DF=r-1 -2=5 -3=2 2 kr=4, 61 q Mintavétel, adatfeldolgozás q § § Elméleti gyakoriságok meghatározása A próbafüggvény értékének meghatározása Heti túlórabér [font] munkások száma (fi) T < 1 1 T < 2 2 T < 5 5 T < 10 10 < T 19 29 17 12 3 pi Gazdaságstatisztika Elméleti gyakoriságok (Fi)
Megoldás Heti túlórabér [font] munkások száma (fi) pi T < 1 1 T < 2 2 T < 5 5 T < 10 10 < T 19 29 17 12 3 0, 251429 0, 1155 0, 3816 0, 2423 0, 00914 Gazdaságstatisztika Elméleti gyakoriságok (Fi) 20, 114 9, 24 30, 53 19, 384 0, 7312
Megoldás Mivel a számított érték (49, 622) nagyobb, mint a kritikus érték (4, 91), így a nullhipotézist 10%-os szignifikancia szinten elutasítjuk, azaz a túlóra kifizetések nem írhatóak le N(3; 2. 98) paraméterű normális eloszlással. Heti túlórabér [font] munkások száma (fi) T < 1 1 T < 2 2 T < 5 5 T < 10 10 < T 19 29 17 12 3 pi Elméleti gyakoriságok (Fi) 20, 114 0, 251429 9, 24 0, 1155 30, 53 0, 3816 19, 384 0, 2423 0, 00914 0, 7312 Gazdaságstatisztika 0, 0617 42, 26 6 1, 3
- Slides: 58