Gazdasgstatisztika Hipotzisvizsglatok Egy s ktmints paramteres prbk 2017
Gazdaságstatisztika Hipotézisvizsgálatok Egy-, és kétmintás, paraméteres próbák 2017. November 21, 23.
Hipotézisvizsgálat célja q Valamely sokaság(ok)ra vonatkozó feltevés ellenőrzése mintavétel alapján § q q Feltevésünk vonatkozhat a sokaság jellegére vagy a sokaság paraméter(ei)re Hipotézisvizsgálat: a sokaságra vonatkozó feltevés mintavételi eredményekre támaszkodó vizsgálata. A hipotézisvizsgálat annak mérlegelése, hogy egy sokaságra vonatkozó állítás mennyire hihető a mintavétel eredményeinek tükrében. Mintavétel, mintavételi hiba § A mintából számított jellemzők eltérése a feltételezett sokasági jellemzőtől betudható-e a mintavételi hibának? Gazdaságstatisztika
A hipotézisvizsgálatok lépései q 1. lépés: a null-, és az ellenhipotézis megfogalmazása: § § § Nullhipotézis (H 0): az a sokaságra vonatkozó feltevés, amelynek igazságáról a hipotézisvizsgálat során közvetlenül meg kívánunk győződni. Alternatív (vagy ellen-) hipotézis (H 1): a nullhipotézissel együtt minden lehetőséget kimerítő, azzal egymást kölcsönösen kizáró hipotézis, amelynek helyességéről közvetetten döntünk a hipotézisvizsgálat során. A kettő közül azt fogjuk igaznak tekinteni, elfogadni, amelyik a mintavétel eredménye alapján hihetőbbnek tűnik a másiknál Gazdaságstatisztika
A hipotézisvizsgálatok lépései q 2. lépés: a próbafüggvény kiválasztása § § A hipotézisek vizsgálatára próbafüggvényt használunk: a mintából a sokaságra történő következtetést szolgálja A mintaelemek egy olyan függvénye, amelynek valószínűségi eloszlása a sokaság ismert tulajdonságait tekintetbe véve, a nullhipotézis igazságát feltételezve pontosan ismert. A próbafüggvényt eloszlásának ismerete teszi alkalmassá a nullhipotézis helyességének vizsgálatára: sokaság eloszlása, mintavétel módja, minta nagysága Ezért a nullhipotézis a próbafüggvény „tartozéka” o § § Az alternatív hipotézis megválasztható a konkrét, vizsgálandó kérdés, a rendelkezésre álló mintáról rendelkezésre álló információk alapján, de a NULLHIPOTÉZIS NEM MÓDOSÍTHATÓ! A próbafüggvények értékei mintáról mintára ingadozó jellemzők, azaz statisztikák. Alkalmazási feltételek!
A hipotézisvizsgálatok lépései q 3. lépés: elfogadási és elutasítási (kritikus) tartomány kijelölése § § § a próbafüggvény lehetséges értékeinek teljes tartományát két egymást át nem fedő részre bontjuk kritikus érték(ek) segítségével: elfogadási és elutasítási (kritikus) tartományra. Kritikus értékek meghatározása: a szignifikancia szint, a minta elemszáma és az alkalmazott próbafüggvény, valamint a felállított ellenhipotézis ismeretében. A határt (a kritikus értékeket) úgy választjuk meg, hogy a próbafüggvény a nullhipotézis fennállása esetén előre megadott nagy ε valószínűséggel az elfogadási tartományba essen. Ha a próbafüggvénynek a rendelkezésünkre álló egy – esetleg több – minta adataiból számított értéke az elfogadási tartományba esik, akkor elfogadjuk a nullhipotézist, ellenkező esetben elvetjük azt. A kritikus tartományba esés α valószínűségét szignifikancia szintnek nevezzük (1%-10% között)
A hipotézisvizsgálatok lépései q Egy vagy kétoldali kritikus tartomány az ellenhipotézis alapján Kritikus Elfogadási α Bal oldali kritikus tartomány 1 -α Kritikus érték Elfogadási Kritikus Jobb oldali kritikus tartomány α 1 -α Kritikus érték Kritikus Elfogadási Kritikus 1 -α α/2 Kritikus érték Két oldali kritikus tartomány Kritikus érték Gazdaságstatisztika
A hipotézisvizsgálat során elkövethető hibák q q A nullhipotézis a valóságban vagy igaz vagy nem Minta alapján hozunk döntést a nullhipotézisről § q Elsőfajú hiba: A mintavétel alapján a valóságban igaz nullhipotézist elvetjük § q Az elsőfajú hiba értéke (szignifikancia szint) szabadon megválasztható Másodfajú hiba: A mintavétel alapján egy, a valóságban nem igaz nullhipotézist elfogadunk § § q Mintavételi hiba A másodfajú hiba értéke a konkrét, de nem ismert eltérés nagyságától függ Olyan próbafüggvény alkalmazása, amely alkalmazása mellett a másodfajú hiba elkövetésének kockázata alacsony A hibák elkövetésének következményeit mérlegelve kell szignifikancia szintet választani Gazdaságstatisztika
A próbák osztályozása q Mi a nullhipotézisük tárgya: § q Milyen jellegűek a sokaság eloszlásával szemben támasztott alkalmazási feltételek: § § q Paraméterre és eloszlásra irányuló próbák A paraméteres próbák alkalmazási feltételei között szerepelnek a sokasági eloszlás típusára, egyes paramétereire vonatkozó elvárások A nemparaméteres próbák alkalmazása legfeljebb a sokaság eloszlásának folytonosságát követeli meg Hány és mekkora minta szükséges a végrehajtásukhoz: § § § Egy, két vagy többmintás próbák Független és páros mintás próbák Kis- és nagymintás próbák (határ n=30) Gazdaságstatisztika
Paraméteres vs. nem paraméteres próbák q Nemparaméteres próbák § q Az eloszlás típusa nem ismert, a H 0 nullhipotézis magára az eloszlásra (annak típusára) vonatkozik Paraméteres próbák § § Az eloszlás típusa ismert, és a H 0 nullhipotézis ezen eloszlás valamely paraméterére (várható értékére, szórására, a sokasági arányra) vonatkozik. Szigorúbb alkalmazási feltételek (normalitás) Gazdaságstatisztika
Egy, két és többmintás próbák q Egymintás próbák: § § § q Egy adott sokaság valamely jellemzőjére vonatkozó feltevés A mintából meghatározott jellemzőt egyetlen feltételezett, vagy kívánatos értékhez viszonyítjuk A nullhipotézis mindig az, hogy a sokaság paramétere (esetleg típusa) a feltételezett értékkel (típussal) egyező Két és többmintás próbák: § § Két (vagy több) sokaságban a vizsgált jellemzők (várható érték, alapsokasági szórás) is eltérést mutatnak-e Két (vagy több) sokaság egymással való összehasonlítása Független és páros minta A nullhipotézis mindig a két sokaság paramétereinek vagy típusának egyezőségét tételezi fel Gazdaságstatisztika
Nemparaméteres próbák q q q Homogenitásvizsgálat: Két valószínűségi változó azonos eloszlásúnak tekinthető-e Függetlenségvizsgálat: Két, minőségi ismérv egy adott sokaságon belül független-e egymástól Illeszkedésvizsgálat: valamely valószínűségi változó F (tapasztalati) eloszlása lehet-e adott F 0 (elméleti) eloszlásfüggvénnyel jellemzett eloszlás § q Meghatározott paraméterű Normális vagy Poisson-eloszlással leírható Eszköze: χ2 próba; az elméleti és a tapasztalati gyakoriságon eltérésén alapul. Az elméleti gyakoriságok becslése: § § Kontingencia táblázat Valószínűség-eloszlás vagy eloszlásfüggvény segítségével Gazdaságstatisztika
Egymintás, paraméteres próbák q q Az egymintás próbák mindig egy adott sokaság valamely jellemzőjére vonatkozó feltevések helyességének ellenőrzésére szolgálnak. Ennek érdekében a rendelkezésre álló egyetlen mintából meghatározott jellemzőt (átlag, tapasztalati szórás) valamely feltételezett, vagy kívánatosnak tartott állapothoz viszonyítjuk. Így annak a kérdésnek a megválaszolására alkalmasak, hogy az a sokaság, amelyből a minta származik lehet-e olyan, mint amilyennek mi azt a nullhipotézisben feltételezzük. § § Egymintás várható értékre irányuló próbák Egymintás sokasági szórásra irányuló próba
Egymintás próbák – sokasági szórásra irányuló próba q Alkalmazási feltételek: normális eloszlású (!) alapsokaság Nullhipotézis: q Lehetséges ellenhipotézisek és elfogadási tartományok: q A minta korrigált tapasztalati A nullhipotézisben A próbafüggvény χ2 eloszlású (DF=n-1): szórása feltételezett alapsokasági szórás q
Példa q q Egy vízerőmű tervezésénél a folyó átlagos vízhozamát vizsgálták. Az erőmű gazdaságos működtetéséhez szükséges, hogy a vízhozam szórása ne érje el a 150 m 3/s értéket. 6 órán keresztül vizsgálva a vízhozam értékét, az alábbi eredmények adódtak: 3185, 2840, 3060, 3140, 2850, 2925 1%-os szignifikancia szinten teljesül-e a vízhozam szórására vonatkozó feltétel? Gazdaságstatisztika
Példa q Gazdaságstatisztika
Példa q Gazdaságstatisztika
Példa Nézzük ismét az a példát, amely a légi közlekedésben az utasok átlagos testsúlyára és a testsúly szórására vonatkozóan élt feltételezésekkel (lásd illeszkedésvizsgálat, ahol a normalitást már igazoltuk). A légitársaság a terhelést 78 kg-os átlagos testsúlyra és 11 kg-os szórásra tervezi. A feltételezés ellenőrzése céljából megmérték 100 véletlenszerűen kiválasztott utas súlyát, akik között 44 nő volt. A mérés eredménye látható a következő táblázatban. Testsúly Ügyfelek száma (kg) (fő) -60 7 60 -70 16 5%-os szignifikancia szint mellett most teszteljük 70 -80 az utasok testsúlyának szórására 80 -90 vonatkozó feltevést! 90 -100 32 A mintából számított jellemzők: 28 13 100 - 4 Összesen 100
Megoldás: n=100 (DF=99) q Hipotézisek: Elfogadási tartomány: H 0: σ=11 kg Kritikus érték: (α=5%, DF=99) H 1: σ>11 kg q Mivel a számított érték a két kritikus érték közé esik, így 5%-os szignifikancia szinten elfogadjuk a nullhipotézist, azaz a sokasági szórásra vonatkozó feltételezés elfogadható. H 1: σ≠ 11 kg Elfogadási tartomány: Kritikus értékek: (α/2=2, 5%, DF=99) ˂ Példa Mivel a számított érték kisebb, mint a kritikus érték, így 5%-os szignifikancia szinten elfogadjuk a nullhipotézist, azaz a sokasági szórásra vonatkozó feltételezés elfogadható.
Példa Mivel a számított érték kisebb, mint a kritikus érték, így 5%-os A kerti törpék piacán az elmúlt évtizedekben a törpék átlagos szignifikancia szinten elfogadható a magassága 120 cm volt, ugyanakkor a szórás ingadozott. A nullhipotézis, vagyis nincs kiszámítható alapanyag-ellátás feltétele, hogy a szórás ne haladja szignifikáns eltérés a szórás meg a 10 cm-t. Egy tavalyi felmérés szerint egy 25 elemű véletlen tekintetében. minta szórása 12 cm volt. A magasság normális eloszlása ismert. Ellenőrizzük 95%-os megbízhatósággal, nincs-e veszélyben az alapanyag ellátás? Megoldás: n=25 DF=24 Elfogadási tartomány: s*=12 σ0=10 Kritikus érték: (α=5%, DF=24) ˂
Szorgalmi feladat 1 pont q q A Q épület aulájában működő italautomatának minden egyes pohárba 2 dl folyadékot kell töltenie. Jogos vevői elvárás, hogy az automata töltési súlyának szórása minél kisebb legyen, hiszen mind a túltöltés, mind az alultöltés problémát jelent. Az automata tesztelésére 20 elemű mintát vettek, amely alapján a gép 1, 98 dl folyadékot tölt 0, 17 dl szórással. Teszteljük 5%-os szignifikancia szinten, hogy teljesül-e az, hogy az automata legfeljebb 0, 1 dl-es szórással tölti az italokat!
Szorgalmi feladat megoldása q Gazdaságstatisztika
Egymintás próbák – sokasági várható értékre irányuló próba q Az alkalmazási feltételek függvényében kétféle próba: § egymintás z-próba § § egymintás t-próba § q ha ismerjük az alapsokasági szórást ( 0), vagy ha nem ismerjük, de nagy mintával dolgozunk (n>30 és a 0 -t a korrigált tapasztalati szórással becsüljük) ha nem ismerjük az alapsokasági szórást, és kis mintánk van Nullhipotézis: H 0: =m 0, vagyis a várható érték egy adott m 0 értékkel egyenlő. q Lehetséges ellenhipotézisek: H 1: ≠ m 0 H 1: > m 0 H 1: < m 0
Egymintás próbák – egymintás z-próba q H 0: =m 0 H 1: ≠ m 0 H 1: > m 0 H 1: < m 0 -z /2 <zsz<z /2 zsz<z A nullhipotézisben A minta zsz>-z feltételezett várható számtani érték átlaga. A minta Az ismert alapsokasági elemszáma szórás
Példa Nézzük ismét az a példát, amely a légi közlekedésben az utasok átlagos testsúlyára és a testsúly szórására vonatkozóan élt feltételezésekkel (lásd illeszkedésvizsgálat, ahol a normalitást már igazoltuk). A légitársaság a terhelést 78 kg-os átlagos testsúlyra és 11 kg-os szórásra tervezi. A feltételezés ellenőrzése céljából megmérték 100 véletlenszerűen kiválasztott utas súlyát, akik között 44 nő volt. A mérés eredménye látható a következő táblázatban. A mintából számított jellemzők: 5%-os szignifikancia szint mellett most teszteljük az utasok testsúlyának várható értékére vonatkozó feltevést! Testsúly Ügyfelek száma (kg) (fő) -60 7 60 -70 16 70 -80 32 80 -90 28 90 -100 13 100 - 4 Összesen 100
Megoldás: n=100 Hipotézisek: H 0: μ=78 kg H 1: μ>78 kg H 1: μ≠ 78 kg Mivel a számított érték (0, 49) kisebb, mint a kritikus érték, így a nullhipotézist elfogadjuk, azaz 5%-os szignifikancia szinten elfogadható, hogy a sokasági várható érték 78 kg. Elfogadási tartomány: Kritikus érték: (α=5%) ˂ Példa Elfogadási tartomány: Kritikus érték: (α/2=2, 5%) Mivel a számított érték a két kritikus érték közé esik, így a nullhipotézist elfogadjuk, azaz 5%-os szignifikancia szinten elfogadható, hogy az utasok testsúlyának várható értéke 78 kg.
Egymintás próbák – egymintás t-próba q q Alkalmazás feltétele: normális eloszlású alapsokaság, ismeretlen alapsokasági szórás (és kis mintaelemszám) Nullhipotézis: H 0: =m 0 q Ellenhipotézisek és elfogadási tartományok: H 1: ≠ m 0 -t /2 <tsz<t /2 H 1: > m 0 tsz<t H 1: < m 0 tsz>-t q A próbafüggvény Student eloszlású (DF=n-1):
Példa Egy konzervgyárban a sűrített paradicsom töltését automata gép végzi. A dobozok névleges súlya 450 g, amitől csak véletlenszerű eltérések megengedettek. A súly szerinti eloszlás normálisnak tekinthető. A gyár az egyik szállítmányból 25 elemű mintát vett, a mintában a dobozok átlagos súlya 446 g volt, a szórás pedig 11 g. Ellenőrizzük a névleges töltősúlyra vonatkozó hipotézist 5%-os szignifikancia szinten! Megoldás: Mivel a mintaelemszám kisebb, mint 30 és nem ismert a sokasági szórás, továbbá a súly szerinti eloszlás normálisnak tekinthető, így a sokaság várható értékére vonatkozó feltevésünket egymintás tpróbával végezhetjük el.
Megoldás: n=25 (<30) μ=450 g q Hipotézisek: H 0: μ=450 g H 1: μ<450 g q Elfogadási tartomány: Kritikus érték: (α=5%, DF=24) ˂ Példa Mivel a számított érték kisebb, mint a kritikus érték, így a nullhipotézist 5%-os szignifikancia szinten elutasítjuk, azaz nem fogadható el a névleges töltősúlyra vonatkozó feltevés, a töltősúly szignifikánsan eltér 450 g-tól. Elfogadási tartomány: H 1: μ≠ 450 g Kritikus érték: (α/2=2, 5%, DF=24) Mivel a számított érték az elfogadási tartományba esik, így a nullhipotézist 5%-os szignifikancia szinten elfogadjuk, azaz elfogadható a névleges töltősúlyra vonatkozó feltevés, a töltősúly szignifikánsan nem tér el 450 g-tól.
Tesztelendő paraméter Alkalmazási feltételek Hipotézisek Sokasági várható érték Sokasági eloszlás normális sokasági szórás ismert Sokasági eloszlás normális sokasági szórás nem ismert Sokasági eloszlás normális H 0: = m 0 H 1: (1) ≠ m 0 (2) > m 0 (3) < m 0 H 0: σ = σ0 H 1: (1) σ ≠ σ0 (2) σ > σ0 (3) σ < σ0 Sokasági variancia (szórás) Próbafüggvény Próbafüggv ény eloszlása standard normális (z) Student teloszlás (DF=n-1) χ2 -eloszlás (DF=n-1)
Példa – Feladatgyűjtemény (30. ) Egy csővágó automata gépnek 1200 mm hosszú csődarabokat kell levágnia. A gyártásközi ellenőrzés feladata, hogy megállapítsa, hogy a gép által gyártott darabok hosszmérete megfelel-e az előírásoknak. Előző adatfelvételekből ismert, hogy a gép által gyártott csődarabok hossza normális eloszlású valószínűségi változó 3 mm szórással. A gyártásközi ellenőrzésre kiválasztottak egy 16 elemű mintát. A csődarabok hossza a mintában: 1208 1195 1205 1187 a) b) 1204 1202 1194 1205 1194 1197 1193 1202 1191 1195 1194 Vizsgálja meg 5%-os szignifikancia szinten, hogy az alapeloszlás szórása nem haladja meg a 3 mm-t! Ellenőrizze, hogy a gyártott darabok hossza megfelel-e az előírásnak!
Példa – Feladatgyűjtemény (30. ) Vizsgálja meg 5%-os szignifikancia szinten, hogy az alapeloszlás szórása nem haladja meg a 3 mm-t a minta alapján! Megoldás: Egymintás szóráspróba n=16 Hipotézisek: H 0: σ=3 H 1: σ>3 Elfogadási tartomány: Kritikus érték: (α=5%, DF=15) 1208 1204 1202 1194 1195 1205 1194 1197 1193 1205 1202 1191 1195 1194 Mivel a számított érték az elutasítási tartományba esik, így a 1187 nullhipotézist 5%-os szignifikancia szinten elvetjük. A csődarabok hosszának szórása 5%-os szignifikancia szinten meghaladja a 3 mm-t.
Példa – Feladatgyűjtemény (30. ) Ellenőrizze, hogy a gyártott darabok hossza megfelel-e az előírásnak (1200 mm, 5%)! Megoldás: Egymintás t-próba (n<30) H 0: μ=1200 H 1: μ≠ 1200 Elfogadási tartomány: Kritikus érték: (α/2=2, 5%, DF=15) 5%-os szignifikancia szinten a csővágó automata teljesíti az 1200 mm várható értékű specifikációt, így elfogadjuk a nullhipotézist.
Szorgalmi feladat 1 pont q q A Q épület aulájában működő italautomatának minden egyes pohárba 2 dl folyadékot kell töltenie. Az automata tesztelésére 20 elemű mintát vettek, amely alapján a gép 1, 98 dl folyadékot tölt 0, 17 dl szórással. Teszteljük 5%-os szignifikancia szinten, hogy teljesül-e az, hogy az automata 2 dl kávét tölt a poharakba! H 1: ≠ m 0 H 1: > m 0 H 1: < m 0 DF=n-1 -t /2 <tsz<t /2 tsz<t tsz>-t
Szorgalmi feladat megoldása q Gazdaságstatisztika
Példa – Feladatgyűjtemény (27. ) Egy szárazelemeket gyártó vállalatnál megvizsgálták egy új típusú elemfajta élettartamát. A korábbi elemek várható élettartama 299 óra volt. Véletlen mintavétellel kiválasztva 200 új elemet, az átlagos élettartamuk 300 óra volt, 8 óra szórással. Valóban megnőtt az elemek várható élettartama (α=1%)? Megoldás: Egymintás, sokasági várható értékre irányuló próba Bár σ nem ismert, de n>30 egymintás z-próba n=200
Példa – Feladatgyűjtemény (27. ) Hipotézisek: H 0: μ=299 h H 1: μ>299 h q Elfogadási tartomány: ˂ Kritikus érték (α=1%): Mivel zsz<zα, ezért H 0 -t elfogadjuk 99%-os megbízhatósági szinten, azaz nem nőtt meg az elemek élettartama, és az továbbra is várhatóan 299 óra.
Példa – Feladatgyűjtemény (28. ) Egy automata gépsor által töltött dobozokból 10 elemű mintát veszünk. A mintába került 10 doboz grammban kifejezett töltősúlya a következő: 255 g, 242 g, 245 g, 253 g, 249 g, 251 g, 250 g, 255 g, 246 g. Ellenőrizzük, hogy a gépsor teljesíti-e a 250 g várható értékű specifikációt 1%-os szignifikancia szinten! Megoldás: Egymintás sokasági várható értékre irányuló próba egymintás t-próba, n<30 n=10 (DF=9)
Példa – Feladatgyűjtemény (28. ) Hipotézisek: H 0: μ=250 H 1: μ≠ 250 Elfogadási tartomány: Kritikus érték: (α/2=0, 5%, DF=9) Mivel a számított érték (-0, 63) a két kritikus érték közé esik (± 3, 25), így a nullhipotézist elfogadjuk, azaz 1%-os szignifikancia szinten elfogadható, hogy a gépsor teljesíti a 250 g-os specifikációt.
Példa – Feladatgyűjtemény (29. ) Egy konzervgyárban burgonyát használnak fel. Csomagolási okok miatt a burgonyák súlya nem szóródhat. Másfelől a gyárat a súlykülönbségek is érdeklik, mert a különböző méretű burgonyákat futószalag-módszerrel tudják kiválogatni. Ezért az átlagos súlykülönbségnek (szóródásnak) 5 grammnak kell lennie. A burgonyák súlyának eloszlására a normális eloszlás feltételezhető, és a tesztelést 1%-os szignifikancia szinten végezzük el. Tegyük fel, hogy két termelő szállítja be a burgonyákat. Az A termelőtől származó burgonyából vett 16 elemű minta alapján a szórás 3, 8 grammra adódott. A B termelő által beszállított burgonyából vett 101 elemű minta alapján a szórás 6, 6 grammra adódott. Teljesítik-e a beszállítók az elvárást? Megoldás: egymintás, sokasági szórásra irányuló próba
Mivel a számított érték az elfogadási tartományba esik, a nullhipotézis elfogadható, az A termelő esetében a burgonyák méretének szórása nem különbözik szignikánsan (1%) a σ=5 grammtól. „A” termelő esete: Példa – Feladatgyűjtemény (29. ) H 0: σ=5 H 1: σ≠ 5 n=16 s*=3, 8 gr H 1: σ <5 Elfogadási tartomány: Kritikus értékek: (α/2=0, 05%, DF=15) Elfogadási tartomány: Kritikus érték: (α=1%, DF=15) Mivel a számított érték az elfogadási tartományba esik, a nullhipotézis elfogadható, az A termelő esetében a burgonyák méretének szórása nem kisebb szignikánsan (1%), mint 5 gramm.
Mivel a számított érték az elutasítási tartományba esik, a nullhipotézis elutasítható, a B termelő esetében a burgonyák méretének szórása szignikánsan különbözik (1%) a σ=5 grammtól. Példa – Feladatgyűjtemény (29. ) „B” termelő esete: Elfogadási tartomány: H 0: σ=5 Kritikus értékek: (α/2=0, 05%, DF=100) H 1: σ ≠ 5 n=101 s*=6, 6 gr H 1: σ >5 Elfogadási tartomány: Kritikus érték: (α=1%, DF=100) Mivel a számított érték az elutasítási tartományba esik, a nullhipotézis elutasítható, a B termelő esetében a burgonyák méretének szórása szignikánsan (1%) nagyobb, mint 5 gramm.
Kétmintás próbák q A kétmintás próbák – ideértve a speciális páros mintás próbákat is – annak a kérdésnek a vizsgálatára használhatók, hogy két meghatározott szempontból eltérő (pl. különböző műszakok, gépek stb. ) sokaságban a vizsgált paraméterek (várható értékek, szórások) is különböznek-e egymástól. q A kétmintás próbák két sokaság egymással való összehasonlítását szolgálják. A sokaságok időben, térben vagy bármilyen más tekintetben különbözhetnek egymástól. q § § § Kétmintás, a sokasági varianciák egyezésére irányuló próba Páros mintás, a várható értékek különbségére irányuló próba Két, független mintás, várható értékek egyezésére irányuló z-, ill. t- próba
Kétmintás próbák – a sokasági szórások összehasonlítására irányuló próba q q A nagyobb korrigált Alkalmazási feltétel: normális eloszlású, független alapsokaságok A kisebb korr. tapasztalati Szórással Nullhipotézis: H 0: 12= 22 szórással rendelkező minta elemszáma-1 A nagyobb 2 2 Ellenhipotézis: H 1: 1 > 2 elemszáma-1 korrigált A próbafüggvény F-eloszlású (DF tapasztalati szórás 1, DF 2, DF 1, 2=n 1, 2 -1) A kisebb korrigált tapasztalati szórás q q q Táblázataink is egyoldali próbára vonatkoznak (F , DF 1, DF 2 kritikus értékeit adják meg) A két alapeloszlásból vett n 1 és n 2 elemű minták korrigált tapasztalati szórásai torzítatlan becslései az alapsokasági szórásoknak. A számlálóba mindig a nagyobb korrigált tapasztalati szórás kerül!
Példa Egy fodrászatba férfiak és nők egyaránt járnak. 12 véletlenszerűen kiválasztott férfi és 15 véletlenszerűen kiválasztott nő esetében mérjük a szolgáltatás időtartamát, amelynek eloszlása normális. A férfiak esetében a szolgáltatás igénybevételének átlagos ideje 35 perc, 26 perc szórással. A nők esetében a frizura elkészítésének átlagos ideje 48 perc, 30 perc szórással. Teszteljük 5%-os szignifikancia szinten, hogy van-e különbség a szolgáltatási idő szórása között a férfiak és nők esetében! Megoldás: kétmintás, sokasági szórások vizsgálatára irányuló próba Hipotézisek felállítása:
Példa Számított érték meghatározása: Kritikus érték meghatározása: α=5% ( a táblázat címében!) Mivel a számított érték (1, 33), kisebb, DFnő=15 -1=14=DF 1 mint a kritikus érték (2, 72), így a nullhipotézist 5%-os szignifikancia szinten DFférfi=12 -1=11=DF 2 nincs jogunk elutasítani, vagyis a férfiak és Fkrit=2, 72 nők kiszolgálási idejének szórása között nincs szignifikáns különbség.
Példa Két film tetszési indexét hasonlítja össze egy közvéleménykutató intézet. Az első filmre, a Leányregény címűre 104 elemű mintát vettek, ebből 40 nő volt. A pontok átlaga 65, szórása 3, 6 volt a mintában. A rém c. filmre 140 elemű mintát vettek, melyben a férfiak száma 96 volt, a pontok átlaga itt 74 volt, a szórás pedig 4, 4. A pontok normális eloszlása mindkét csoportban feltételezhető. Teszteljük 1%-os szignifikancia szinten, hogy van -e különbség a két filmre adott pontok szórása között! Megoldás: Mivel a filmre adott pontszámok normalitása feltételezhető, így használhatjuk az F-próbát a sokasági szórások egyezőségének a vizsgálatára. 1 -es indexszel jelöljük a A rém c. filmet, 2 -es indexszel Leányregény c. filmet.
Példa Számított érték meghatározása: Kritikus érték meghatározása: α=1% (a táblázat címében!) Mivel a számított érték (1, 494), DF 1=140 -1=139 kisebb, mint a kritikus érték (1, 53), DF 2=104 -1=103 így a nullhipotézist 1%-os Fkrit=1, 53 szignifikancia szinten nincs jogunk elutasítani, vagyis a két filmre adott ponszámok szórása között nincs szignifikáns különbség.
Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák FÜGGETLEN MINTÁK q Az alkalmazási feltételek függvényében kétféle próba: – kétmintás z-próba § – kétmintás t-próba § q ha ismerjük az alapsokasági szórásokat ( 1 és 2), vagy ha nem ismerjük, de nagy mintával dolgozunk (n 1, 2>30 és az ismeretlen alapsokasági szórásokat a korrigált tapasztalati szórásokkal becsüljük) ha nem ismerjük az alapsokasági szórásokat, és kis mintáink vannak Nullhipotézis: H 0: 1= 2 (vagyis a két sokasági várható érték egyenlő) q Lehetséges ellenhipotézisek: H 1: 1 ≠ μ 2 H 1: 1 > μ 2 H 1: 1 < μ 2
Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák q q Kétmintás z-próba Alkalmazás feltétele: normális eloszlású alapsokaságok, ismert alapsokasági varianciák Nullhipotézis: H 0: 1= 2 Lehetséges ellenhipotézisek és elfogadási tartományok: H 1: 1 ≠ 2 -z /2 <zsz<z /2 H 1: 1 > Az első minta z. A második 2 sz<z H 1: 1 < 2 számtani zsz>-z minta számtani q átlaga. A második átlaga A próbafüggvény N(0, 1) eloszlású: Az első minta Az első alapsokasági A második alapsokasági minta szórása elemszáma
Példa Nézzük ismét az előző, két film tetszési indexét összehasonlító példánkat! Most teszteljük azt 1%-os szignifikancia szinten, hogy a van-e különbség a két film átlagos tetszési pontszáma között! Emlékeztetőül: Az első filmre, a Leányregény címűre 104 elemű mintát vettek, ebből 40 nő volt. A pontok átlaga 65, szórása 3, 6 volt a mintában. A rém c. filmre 140 elemű mintát vettek, melyben a férfiak száma 96 volt, a pontok átlaga itt 74 volt, a szórás pedig 4, 4. A pontok normális eloszlása mindkét csoportban feltételezhető. Megoldás: Mivel mindkét film esetében a mintaelemszám nagyobb, mint 30, továbbá feltételezhető a pontok normális eloszlása, így kétmintás zpróbát használhatunk (1 -es index A rém c. film, 2 -es index a Leányregény c. film).
Példa q Mivel a számított érték nem az elfogadási tartományba esik, így szignifikáns különbség van 1%-os szignifikancia szinten a két film tetszési indexe között.
Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák q q Kétmintás t-próba Alkalmazás feltétele: normális eloszlású alapsokaságok, ismeretlen alapsokasági varianciák § q q q kis minták esetén akkor kezelhető, ha az ismeretlen szórásokról tudjuk, hogy egyenlőek (ELŐTTE F-PRÓBÁT KELL VÉGEZNI MINDIG!) Nullhipotézis: H 0: 1= 2 Lehetséges ellenhipotézisek és elfogadási tartományok: H 1: 1 ≠ 2 -t /2 <tsz<t /2 H 1: 1 > 2 tsz<t A második Az első minta H 1: Az első minta < tsz>-t 1 2 minta számtani A második Az első korrigált A második számtani átlaga A próbafüggvény Student eloszlású (DF=n +n -2): minta 1 tapasztalati 2 minta korr. Az első A második minta elemszáma A második elemszáma szórása Az első minta tap. szórása minta elemszáma
Példa Korábbi fodrászatos példánk (lásd sokasági szórások egyezésére irányuló próba) vizsgáljuk meg, hogy van-e különbség a kiszolgálási idő várható értéke között a férfiak és a nők esetében 5%-os szignifikancia szinten! nnő=15 nférfi=12 A kétmintás t-próba alkalmazási feltételei: q az alapsokaságok eloszlásának normalitása (nevezetesen a szolgáltatási idő eloszlása mind a férfiak, mind a nők esetében normális, ezt feltételeztük már az F-próba elvégzésénél is) q nő és férfi nem ismert és nnő<30 és nférfi<30 q nő = férfi, ezt már bizonyítottuk F-próbával korábban
Példa q Mivel a számított érték az elfogadási tartományba esik, így a H 0 hipotézist elfogadjuk, azaz 5%-os szignifikancia szinten nincs különbség a férfiak és a nők kiszolgálási idejének várható értéke között.
Példa q Mivel tsz=1, 185<1, 708, így a H 0 -t elfogadjuk, azaz nincs különbség a két várható érték között 5%-os szignifikancia szinten.
Szorgalmi feladat 2 pont q Gazdaságstatisztika
Szorgalmi feladat megoldása – F-próba q Gazdaságstatisztika
Szorgalmi feladat megoldása – kétmintás t-próba q Mivel a számított érték az elutasítási tartományba esik, a nullhipotézist 5%-os szignifikancia szinten elvetjük, a jobb XIWT csokoládészeletek tömegének várható értéke szignifikánsan nagyobb, mint a bal XIWT-é. Gazdaságstatisztika
Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák q q q q PÁROS MINTÁK Páros mintáknál az egyik minta elemeinek kiválasztása maga után vonja a másik minta elemeinek kiválasztását. n=n 1=n 2 a két páros minta összetartozó elemeinek di=yi-xi különbségeit képezzük egy n elemű minta Nullhipotézis: H 0: μ 1=μ 2 vagy H 0: μd=δ 0 Ellenhipotézis: egyoldali vagy kétoldali A különbségek H 1: 1 ≠ μ 2 A különbségek H 1: 1 > μ 2 H 1: 1 < μ 2 korrigált számtani átlaga Próbafüggvény Student eloszlást követ (DF=n-1): tapasztalati szórása
Példa Egy speciális diéta hatásosságát vizsgálják. Ehhez minden vizsgálati személy testsúlyát megmérték a diéta előtt és után. A hipotetikus kísérlet eredménye 9 kísérleti személyen a következő táblázatban látható. Vizsgáljuk meg 1%-os szignifikancia szinten, hogy hatásos volt-e a diéta! Megoldás: Páros mintáról van szó, hiszen ugyanazon diétában résztvevő személyek testsúlyát mérték meg a diéta megkezdése előtt és után. A vizsgált személy sorszáma 1 2 3 4 5 6 7 8 9 Testsúly a diéta előtt Testsúly a diéta után 95 75 110 81 92 83 94 88 105 90 72 100 75 88 83 93 82 99
Példa q A diéta megkezdése előtt a 9 résztvevő testsúlyának átlaga: Hipotézisek: H 0: μe=μu (μe-μu=0) H 1: μe>μu (μe-μu>0) q A vizsgált személy sorszáma 1 2 3 4 5 6 7 8 9 Testsúly a diéta előtt Testsúly a diéta után 95 75 110 81 92 83 94 88 105 90 72 100 75 88 83 93 82 99
Mivel a számított érték (1, 511) nagyobb, mint a kritikus érték (2, 896), így a nullhipotézist elutasítjuk, vagyis van Számított érték meghatározása: szignifikáns különbség a páciensek testsúlyában a diéta előtt és után. Példa q Kritikus érték: α=1% tα=2, 896 q Elfogadási tartomány: tsz< tα q A vizsgált személy sorszáma 1 2 3 4 5 6 7 8 9 Testsúly a diéta előtt után 95 75 110 81 92 83 94 88 105 90 72 100 75 88 83 93 82 99 di 5 3 10 6 4 0 1 6 6
Gazdaságstatisztika
Köszönöm a figyelmet! ÁRVA GÁBOR
- Slides: 64