Gazdasgstatisztika Hipotzisvizsglatok Paramteres prbk 2015 november 12 november
Gazdaságstatisztika Hipotézisvizsgálatok Paraméteres próbák 2015. november 12. , november 19. , november 23.
A próbák osztályozása q q q Mi a nullhipotézisük tárgya? – Paraméterre és eloszlásra irányuló próbák Milyen jellegűek a sokaság eloszlásával szemben támasztott alkalmazási feltételek? – A paraméteres próbák alkalmazási feltételei között szerepelnek a sokasági eloszlás típusára, egyes paramétereire vonatkozó elvárások – A nemparaméteres próbák alkalmazása legfeljebb a sokaság eloszlásának folytonosságát követeli meg Hány és mekkora minta szükséges a végrehajtásukhoz? – Egy, két vagy többmintás próbák – Független és páros mintás próbák – Kis- és nagymintás próbák (határ n=30)
Paraméteres próbák q q q A paraméteres próbák szigorúbb alkalmazási feltételeket igényelnek. Arány-, ill. intervallum szintű mérési skáláról származó adatok állnak rendelkezésre. Erősségük (a hamis nullhipotézis elutasításának valószínűsége) nagyobb. Normális eloszlás paramétereire vonatkozó próbák Csoportosításuk: – – – Egymintás, kétmintás, többmintás Független és páros mintás Várható értékre, szórásra irányuló
Egymintás próbák q q Az egymintás próbák mindig egy adott sokaság valamely jellemzőjére vonatkozó feltevések helyességének ellenőrzésére szolgálnak. Ennek érdekében a rendelkezésre álló egyetlen mintából meghatározott jellemzőt (átlag, tapasztalati szórás) valamely feltételezett, vagy kívánatosnak tartott állapothoz viszonyítjuk. Így annak a kérdésnek a megválaszolására alkalmasak, hogy az a sokaság, amelyből a minta származik lehet-e olyan, mint amilyennek mi azt a nullhipotézisben feltételezzük. – – Egymintás várható értékre irányuló próbák Egymintás sokasági szórásra irányuló próba
Egymintás próbák – sokasági szórásra irányuló próba q Alkalmazási feltételek: normális eloszlású alapsokaság Nullhipotézis: q Lehetséges ellenhipotézisek és elfogadási tartományok: q A próbafüggvény χ2 eloszlású (DF=n-1): q
Példa q q q Pluszpont szerzési lehetőség: beadás óra végén! A Q épület aulájában működő italautomatának minden egyes pohárba 2 dl folyadékot kell töltenie. Jogos vevői elvárás, hogy az automata töltési súlyának szórása minél kisebb legyen, hiszen mind a túltöltés, mind az alultöltés problémát jelent. Az automata tesztelésére 30 elemű mintát vettek, amely alapján a gép 1, 98 dl folyadékot tölt 0, 17 dl szórással. Teszteljük 5%-os szignifikancia szinten, hogy teljesül-e az, hogy az automata legfeljebb 0, 1 dl-es szórással tölti az italokat!
Példa megoldás Egymintás szóráspróba
Egymintás próbák – sokasági várható értékre irányuló próba q Az alkalmazási feltételek függvényében kétféle próba: – egymintás z-próba § – egymintás t-próba § q ha ismerjük az alapsokasági szórást ( 0), vagy ha nem ismerjük, de nagy mintával dolgozunk (n>30 és a 0 -t a korrigált tapasztalati szórással becsüljük) ha nem ismerjük az alapsokasági szórást, és kis mintánk van Nullhipotézis: H 0: =m 0, vagyis a várható érték egy adott m 0 értékkel egyenlő. q Lehetséges ellenhipotézisek: H 1: ≠ m 0 H 1: > m 0 H 1: < m 0
Egymintás próbák – egymintás z-próba q Alkalmazás feltétele: normális eloszlású alapsokaság Nullhipotézis: H 0: =m 0 q Ellenhipotézisek és elfogadási tartományok: q H 1: ≠ m 0 H 1: > m 0 H 1: < m 0 q -z /2 <zsz<z /2 zsz<z zsz>-z A próbafüggvény N(0; 1) eloszlású:
Egymintás próbák – egymintás t-próba q q Alkalmazás feltétele: normális eloszlású alapsokaság, ismeretlen alapsokasági szórás (és kis mintaelemszám) Nullhipotézis: H 0: =m 0 q Ellenhipotézisek és elfogadási tartományok: H 1: ≠ m 0 -t /2 <tsz<t /2 H 1: > m 0 tsz<t H 1: < m 0 tsz>-t q A próbafüggvény Student eloszlású (DF=n-1):
Példa Egy konzervgyárban a sűrített paradicsom töltését automata gép végzi. A dobozok névleges súlya 450 g, amitől csak véletlenszerű eltérések megengedettek. A súly szerinti eloszlás normálisnak tekinthető. A gyár az egyik szállítmányból 25 elemű mintát vett, a mintában a dobozok átlagos súlya 446 g volt, a szórás pedig 11 g. Ellenőrizzük a névleges töltősúlyra vonatkozó hipotézist 5%-os szignifikancia szinten! Megoldás: Mivel a mintaelemszám kisebb, mint 30 és nem ismert a sokasági szórás, továbbá a súly szerinti eloszlás normálisnak tekinthető, így a sokaság várható értékére vonatkozó feltevésünket egymintás tpróbával végezhetjük el.
Megoldás: n=25 (<30) μ=450 g q Hipotézisek: H 0: μ=450 g H 1: μ<450 g q Elfogadási tartomány: Kritikus érték: (α=5%, DF=24) ˂ Példa Mivel a számított érték kisebb, mint a kritikus érték, így a nullhipotézist 5%-os szignifikancia szinten elutasítjuk, azaz nem fogadható el a névleges töltősúlyra vonatkozó feltevés, a töltősúly szignifikánsan eltér 450 g-tól. Elfogadási tartomány: H 1: μ≠ 450 g Kritikus érték: (α/2=2, 5%, DF=24) Mivel a számított érték az elfogadási tartományba esik, így a nullhipotézist 5%-os szignifikancia szinten elfogadjuk, azaz elfogadható a névleges töltősúlyra vonatkozó feltevés, a töltősúly szignifikánsan nem tér el 450 g-tól.
Tesztelendő paraméter Alkalmazási feltételek Hipotézisek Sokasági várható érték Sokasági eloszlás normális sokasági szórás ismert Sokasági eloszlás normális sokasági szórás nem ismert Sokasági eloszlás normális H 0: = m 0 H 1: (1) ≠ m 0 (2) > m 0 (3) < m 0 H 0: σ = σ0 H 1: (1) σ ≠ σ0 (2) σ > σ0 (3) σ < σ0 Sokasági variancia (szórás) Próbafüggvény Próbafüggv ény eloszlása standard normális (z) Student teloszlás (DF=n-1) χ2 -eloszlás (DF=n-1)
Példa Pluszpont szerzési lehetőség: beadás óra végén! (2 pont) Egy 25 elemű mintából teszteljük, hogy a kenyér átlagos súlya megfelel-e az 1 kg-os előírásnak. A mintaátlag 995 g, a mintából becsült szórás 5 g. A súly szerinti eloszlás normálisnak tekinthető. 5% -os szignifikancia szinten ellenőrizzük, hogy a kenyér átlagos súlya megfelel az előírásnak! H 1: ≠ m 0 H 1: > m 0 H 1: < m 0 -t /2 <tsz<t /2 tsz<t tsz>-t DF=n-1
Példa megoldása n=25 H 0: = 1 kg H 1: < 1 kg Kritikus érték (5%, DF=24): -1, 711 Elfogadási tartomány: tsz>-t Mivel a számított érték (-5) kisebb, mint a kritikus (-1, 711), az elutasítási tartományba esik, a nullhipotézist elutasítjuk ezen a szignifikancia szinten.
Példa – Feladatgyűjtemény (27. ) Egy szárazelemeket gyártó vállalatnál megvizsgálták egy új típusú elemfajta élettartamát. A korábbi elemek várható élettartama 299 óra volt. Véletlen mintavétellel kiválasztva 200 új elemet, az átlagos élettartamuk 300 óra volt, 8 óra szórással. Valóban megnőtt az elemek várható élettartama (α=1%)? Megoldás: Egymintás, sokasági várható értékre irányuló próba Bár σ nem ismert, de n>30 egymintás z-próba n=200
Példa – Feladatgyűjtemény (27. ) Hipotézisek: H 0: μ=299 h H 1: μ>299 h q Elfogadási tartomány: ˂ Kritikus érték (α=1%): Mivel zsz<zα, ezért H 0 -t elfogadjuk 99%-os megbízhatósági szinten, azaz nem nőtt meg az elemek élettartama, és az továbbra is várhatóan 299 óra.
Példa – Feladatgyűjtemény (28. ) Egy automata gépsor által töltött dobozokból 10 elemű mintát veszünk. A mintába került 10 doboz grammban kifejezett töltősúlya a következő: 255 g, 242 g, 245 g, 253 g, 249 g, 251 g, 250 g, 255 g, 245 g, 246 g. Ellenőrizzük, hogy a gépsor teljesíti-e a 250 g várható értékű specifikációt 1%-os szignifikancia szinten! Megoldás: Egymintás sokasági várható értékre irányuló próba egymintás t-próba, n<30 n=10 (DF=9)
Példa – Feladatgyűjtemény (28. ) Hipotézisek: H 0: μ=250 H 1: μ≠ 250 Elfogadási tartomány: Kritikus érték: (α/2=0, 5%, DF=9) Mivel a számított érték (-0, 63) a két kritikus érték közé esik (± 3, 25), így a nullhipotézist elfogadjuk, azaz 1%-os szignifikancia szinten elfogadható, hogy a gépsor teljesíti a 250 g-os specifikációt.
Példa – Feladatgyűjtemény (29. ) Egy konzervgyárban burgonyát használnak fel. Csomagolási okok miatt a burgonyák súlya nem szóródhat. Másfelől a gyárat a súlykülönbségek is érdeklik, mert a különböző méretű burgonyákat futószalag-módszerrel tudják kiválogatni. Ezért az átlagos súlykülönbségnek (szóródásnak) 5 grammnak kell lennie. A burgonyák súlyának eloszlására a normális eloszlás feltételezhető, és a tesztelést 1%-os szignifikancia szinten végezzük el. Tegyük fel, hogy két termelő szállítja be a burgonyákat. Az A termelőtől származó burgonyából vett 16 elemű minta alapján a szórás 3, 8 grammra adódott. A B termelő által beszállított burgonyából vett 101 elemű minta alapján a szórás 6, 6 grammra adódott. Teljesítik-e a beszállítók az elvárást? Megoldás: egymintás, sokasági szórásra irányuló próba
Mivel a számított érték az elfogadási tartományba esik, a nullhipotézis elfogadható, az A termelő esetében a burgonyák méretének szórása nem különbözik szignikánsan (1%) a σ=5 termelőgrammtól. esete: Példa – Feladatgyűjtemény (29. ) „A” H 0: σ=5 H 1: σ≠ 5 n=16 s*=3, 8 gr H 1: σ <5 Elfogadási tartomány: Kritikus értékek: (α/2=0, 05%, DF=15) Elfogadási tartomány: Kritikus érték: (α=1%, DF=15) Mivel a számított érték az elfogadási tartományba esik, a nullhipotézis elfogadható, az A termelő esetében a burgonyák méretének szórása nem kisebb szignikánsan (1%), mint 5 gramm.
Mivel a számított érték az elutasítási tartományba esik, a nullhipotézis elutasítható, a B termelő esetében a burgonyák méretének szórása szignikánsan különbözik (1%) a σ=5 grammtól. Példa – Feladatgyűjtemény (29. ) „B” termelő esete: Elfogadási tartomány: H 0: σ=5 Kritikus értékek: (α/2=0, 05%, DF=100) H 1: σ ≠ 5 n=101 s*=6, 6 gr H 1: σ >5 Elfogadási tartomány: Kritikus érték: (α=1%, DF=100) Mivel a számított érték az elutasítási tartományba esik, a nullhipotézis elutasítható, a B termelő esetében a burgonyák méretének szórása szignikánsan (1%) nagyobb, mint 5 gramm.
Példa – Feladatgyűjtemény (30. ) Egy csővágó automata gépnek 1200 mm hosszú csődarabokat kell levágnia. A gyártásközi ellenőrzés feladata, hogy megállapítsa, hogy a gép által gyártott darabok hosszmérete megfelel-e az előírásoknak. Előző adatfelvételekből ismert, hogy a gép által gyártott csődarabok hossza normális eloszlású valószínűségi változó 3 mm szórással. A gyártásközi ellenőrzésre kiválasztottak egy 16 elemű mintát. A csődarabok hossza a mintában: 1208 1195 1205 1187 a) b) 1204 1202 1194 1205 1194 1197 1193 1202 1191 1195 1194 Vizsgálja meg 5%-os szignifikancia szinten, hogy az alapeloszlás szórása nem haladja meg a 3 mm-t! Ellenőrizze, hogy a gyártott darabok hossza megfelel-e az előírásnak!
Példa – Feladatgyűjtemény (30. ) Vizsgálja meg 5%-os szignifikancia szinten, hogy az alapeloszlás szórása nem haladja meg a 3 mm-t a minta alapján! Megoldás: Egymintás szóráspróba n=16 Hipotézisek: H 0: σ=3 H 1: σ>3 Elfogadási tartomány: Kritikus érték: (α=5%, DF=15) 1208 1204 1202 1194 1195 1205 1194 1197 1193 1205 1202 1191 1195 1194 Mivel a számított érték az elutasítási tartományba esik, így a 1187 nullhipotézist 5%-os szignifikancia szinten elvetjük. A csődarabok hosszának szórása 5%-os szignifikancia szinten meghaladja a 3 mm-t.
Példa – Feladatgyűjtemény (30. ) Ellenőrizze, hogy a gyártott darabok hossza megfelel-e az előírásnak (1200 mm, 5%)! Megoldás: Egymintás t-próba (n<30) H 0: μ=1200 H 1: μ≠ 1200 Elfogadási tartomány: Kritikus érték: (α/2=2, 5%, DF=15) 5%-os szignifikancia szinten a csővágó automata teljesíti az 1200 mm várható értékű specifikációt, így elfogadjuk a nullhipotézist.
Paraméteres próbák Kétmintás próbák
Kétmintás próbák q q q A kétmintás próbák – ideértve a speciális páros mintás próbákat is – annak a kérdésnek a vizsgálatára használhatók, hogy két meghatározott szempontból eltérő (pl. különböző műszakok, gépek stb. ) sokaságban a vizsgált paraméterek (várható értékek, szórások) is különböznek-e egymástól. A kétmintás próbák két sokaság egymással való összehasonlítását szolgálják. A sokaságok időben, térben vagy bármilyen más tekintetben különbözhetnek egymástól. – Kétmintás, a sokasági varianciák egyezésére irányuló próba – Páros mintás, a várható értékek különbségére irányuló próba – Két, független mintás, várható értékek egyezésére irányuló z-, ill. t- próba
Kétmintás próbák – a sokasági szórások összehasonlítására irányuló próba q q Alkalmazási feltétel: normális eloszlású, független alapsokaságok Nullhipotézis: Ellenhipotézis: H 1: 12> 22 A próbafüggvény F-eloszlású (DF 1, DF 2, DF 1, 2=n 1, 2 -1) ahol s 1*2>s 2*2 q q Táblázataink is egyoldali próbára vonatkoznak (F , DF 1, DF 2 kritikus értékeit adják meg) A két alapeloszlásból vett n 1 és n 2 elemű minták korrigált tapasztalati szórásai torzítatlan becslései az alapsokasági szórásoknak.
Példa Egy fodrászatba férfiak és nők egyaránt járnak. 12 véletlenszerűen kiválasztott férfi és 15 véletlenszerűen kiválasztott nő esetében mérjük a szolgáltatás időtartamát, amelynek eloszlása normális. A férfiak esetében a szolgáltatás igénybevételének átlagos ideje 35 perc, 26 perc szórással. A nők esetében a frizura elkészítésének átlagos ideje 48 perc, 30 perc szórással. Teszteljük 5%-os szignifikancia szinten, hogy van-e különbség a szolgáltatási idő szórása között a férfiak és nők esetében! Megoldás: kétmintás, sokasági szórások vizsgálatára irányuló próba Hipotézisek felállítása:
Példa Számított érték meghatározása: Kritikus érték meghatározása: α=5% DFnő=15 -1=14=DF 1 DFférfi=12 -1=11=DF 2 Mivel a számított érték (1, 33), kisebb, Fkrit=2, 72 mint a kritikus érték (2, 72), így a nullhipotézist 5%-os szignifikancia szinten nincs jogunk elutasítani, vagyis a férfiak és nők kiszolgálási idejének szórása között nincs szignifikáns különbség.
Példa Pluszpont szerzési lehetőség! – beadás óra végén (1 pont) Szinte havonta röppen fel a hír, hogy eddig nem ismert, új Shakespeare darabra bukkantak, de többségük hamisítványnak bizonyul. Az eredetiség megállapításának egyik eszköze, hogy a művet összehasonlítják egy eredeti, hasonló műfajú Shakespeare művel, és véletlenszerűen kiválasztott, azonos hosszúságú részeket vizsgálnak, hányszor fordul elő egy-egy jellegzetes kifejezése, vagy akár vesszői. Egy újonnan felfedezett művet hasonlítanak össze a Hamlettel. Mindkét szövegből kiválasztanak véletlenszerűen 100 -100 egyenlő hosszúságú szövegrészletet és azt vizsgálják, hányszor fordul elő az „ezért” szó. Az eredmények: A vizsgált szövegrészletben a kifejezés számának Új szöveg Hamlet Átlaga 3, 1 2, 4 Szórása 1, 1 0, 9 1%-os szignifikancia szinten ellenőrizze, hogy a keresett kifejezés („ezért”) szórásai egyeznek-e a két szövegben!
Példa Kritikus érték meghatározása (1%, DF 1=99, DF 2=99): 1, 53 A számított érték kisebb, mint a kritikus, elfogadási tartományba esik, 5%-os szignifikancia szinten elfogadjuk a nullhipotézist, nincs szignifikáns különbség a két szövegben az „ezért” kifejezés szóródásának.
Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák FÜGGETLEN MINTÁK Az alkalmazási feltételek függvényében kétféle próba: – kétmintás z-próba § – ha ismerjük az alapsokasági szórásokat ( 1 és 2), vagy ha nem ismerjük, de nagy mintával dolgozunk (n 1, 2>30 és az ismeretlen alapsokasági szórásokat a korrigált tapasztalati szórásokkal becsüljük) kétmintás t-próba § ha nem ismerjük az alapsokasági szórásokat, és kis mintáink vannak Nullhipotézis: H 0: 1= 2 (vagyis a két sokasági várható érték egyenlő) Lehetséges ellenhipotézisek: H 1: 1 ≠ μ 2 H 1: 1 > μ 2 H 1: 1 < μ 2
Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák q q Kétmintás z-próba Alkalmazás feltétele: normális eloszlású alapsokaságok, ismert alapsokasági varianciák Nullhipotézis: H 0: 1= 2 Lehetséges ellenhipotézisek és elfogadási tartományok: H 1: 1 ≠ 2 H 1: 1 > 2 H 1: 1 < 2 q -z /2 <zsz<z /2 zsz<z zsz>-z A próbafüggvény N(0, 1) eloszlású:
Példa Egy tejüzemben két gépen töltenek literes dobozokba tejet. A gyártásközi ellenőrzés során mindkét gépről véletlen mintát vettek. A mintavétel eredményei: I. gép II. gép Mintaelemszám 100 Átlagos töltési mennyiség 995 ml 999 ml Töltési mennyiség szórása 11 ml 12 ml A töltési térfogat mindkét gépen normális eloszlású. Hasonlítsuk össze, hogy azonosnak tekinthető-e a két gépen töltött tej mennyiségének várható töltési térfogata! (5%) Megoldás: Mivel mindkét minta esetében a mintaelemszám nagyobb, mint 30, továbbá feltételezhető a töltési térfogat normális eloszlása, így kétmintás z-próbát használhatunk.
Példa Hipotézisek: H 0: 1= 2 H 1: 1≠ 2 q q Mivel a számított érték nem az elfogadási tartományba esik, így szignifikáns különbség van 5%-os szignifikancia szinten a két gép által töltött várható töltési térfogat között. Számított érték meghatározása: Kritikus értékek meghatározása: α=5% zα/2=± 1, 96 q
Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák q q Kétmintás t-próba Alkalmazás feltétele: normális eloszlású alapsokaságok, ismeretlen alapsokasági varianciák – q q q kis minták esetén akkor kezelhető, ha az ismeretlen szórásokról tudjuk, hogy azok egyenlőek (F-PRÓBA) Nullhipotézis: H 0: 1= 2 Lehetséges ellenhipotézisek és elfogadási tartományok: H 1: 1 ≠ 2 -t /2 <tsz<t /2 H 1: 1 > 2 tsz<t H 1: 1 < 2 tsz>-t A próbafüggvény Student eloszlású (DF=n 1+n 2 -2):
Példa Korábbi fodrászatos példánk (lásd sokasági szórások egyezésére irányuló próba) vizsgáljuk meg, hogy van-e különbség a kiszolgálási idő várható értéke között a férfiak és a nők esetében 5%-os szignifikancia szinten! nnő=15 nférfi=12 A kétmintás t-próba alkalmazási feltételei: q az alapsokaságok eloszlásának normalitása (nevezetesen a szolgáltatási idő eloszlása mind a férfiak, mind a nők esetében normális, ezt feltételeztük már az F-próba elvégzésénél is) q nő és férfi nem ismert és nnő<30 és nférfi<30 q nő = férfi, ezt már bizonyítottuk F-próbával korábban
Példa Mivel a számított érték az elfogadási tartományba esik, így a H 0 hipotézist elfogadjuk, azaz 5%-os szignifikancia szinten nincs különbség a férfiak és a nők kiszolgálási idejének várható értéke között. Hipotézisek felállítása: H 0: nő= férfi H 1: nő≠ férfi q Számított érték meghatározása: q Kritikus érték meghatározása: α=5% DF=15+12 -2=25 t 0, 975=± 2, 06 q
Példa Hipotézisek felállítása: H 0: nő= férfi H 1: nő> férfi q Számított érték meghatározása: q Kritikus érték meghatározása: α=5% Mivel tsz=1, 185<1, 708, így a H 0 -t DF=15+12 -2=25 elfogadjuk, azaz nincs különbség a két várható érték között 5%-os szignifikancia t 0, 95=1, 708 q szinten.
Példa – Feladatgyűjtemény (32. ) Kétféle oldat (A és B) p. H értékét szeretnénk összehasonlítani. Hatelemű mintát elemezve az A oldatból 7, 52 -es átlagos p. H értéket kaptunk 0, 024 szórással. Ötelemű minta alapján a B oldat átlagos p. H értéke 7, 49 volt 0, 032 szórással. Vizsgálja meg, hogy van-e különbség a két oldat p. H értékében (α=5%)! Megoldás: kétmintás sokasági várható értékekre irányuló t-próba (n<30), amely előtt F-próbát kell végeznünk: H 0: A= B H 1: A< B α=5% DFszámláló=4 DFnevező=5 Fkrit=5, 19 H 0 -t 95%-os megbízhatósági szinten elfogadjuk, rátérhetünk a tpróbára.
Példa – Feladatgyűjtemény (32. ) Kétmintás t-próba: H 0: A= B H 1: A B q Kritikus érték meghatározása: α=0, 05 DF=6+5 -2=9 t /2=± 2, 26 Mivel a számított érték (1, 78) az elfogadási tartományba esik, H 0 -t 95%-os megbízhatósági szinten elfogadjuk, azaz nincs különbség a két oldat p. H értéke között. q
Kétmintás próbák – a sokasági várható értékek összehasonlítására irányuló próbák q PÁROS MINTÁK Páros mintáknál az egyik minta elemeinek kiválasztása maga után vonja a másik minta elemeinek kiválasztását. n=n 1=n 2 a két páros minta összetartozó elemeinek di=yi-xi különbségeit képezzük egy n elemű minta Nullhipotézis: H 0: μ 1=μ 2 vagy H 0: μd=δ 0 Ellenhipotézis: egyoldali vagy kétoldali q Próbafüggvény Student eloszlást követ (DF=n-1): q q q
Példa Egy speciális diéta hatásosságát vizsgálják. Ehhez minden vizsgálati személy testsúlyát megmérték a diéta előtt és után. A hipotetikus kísérlet eredménye 9 kísérleti személyen a következő táblázatban látható. Vizsgáljuk meg 1%-os szignifikancia szinten, hogy hatásos volt-e a diéta! Megoldás: Páros mintáról van szó, hiszen ugyanazon diétában résztvevő személyek testsúlyát mérték meg a diéta megkezdése előtt és után. A vizsgált személy sorszáma 1 2 3 4 5 6 7 8 9 Testsúly a diéta előtt Testsúly a diéta után 95 75 110 81 92 83 94 88 105 90 72 100 75 88 83 93 82 99
Példa q A diéta megkezdése előtt a 9 résztvevő testsúlyának átlaga: Hipotézisek: H 0: μe=μu (μe-μu=0) H 1: μe>μu (μe-μu>0) q A vizsgált személy sorszáma 1 2 3 4 5 6 7 8 9 Testsúly a diéta előtt Testsúly a diéta után 95 75 110 81 92 83 94 88 105 90 72 100 75 88 83 93 82 99
Példa q Számított érték Mivel a számított érték (4, 55) nagyobb, mint a kritikus érték (2, 896), így a nullhipotézist elutasítjuk, vagyis van meghatározása: szignifikáns különbség a páciensek testsúlyában a diéta előtt és után. Kritikus érték: α=1% tα=2, 896 q Elfogadási tartomány: tsz< tα q A vizsgált személy sorszáma 1 2 3 4 5 6 7 8 9 Testsúly a diéta előtt után 95 75 110 81 92 83 94 88 105 90 72 100 75 88 83 93 82 99 di 5 3 10 6 4 0 1 6 6
Példa – Feladatgyűjtemény (31. ) Egy liter „A” márkájú benzin felhasználásával öt hasonló gépkocsi azonos feltételek mellett 11, 5, 12, 3, 10, 2, 11, 7 és 10, 8 km-t tett meg. Ugyanezek az autók a „B” márkájú benzinnel 10, 3, 9, 8, 11, 4, 10, 1 és 10, 7 km-t mentek. Vizsgálja meg, hogy az 1 l-rel megtehető km-ek számát tekintve az „A” márka jobb-e, mint a „B”? Megoldás: Páros minta, kétmintás, sokasági várható értékek egyezésének vizsgálata Hipotézisek: H 0: μA=μB (μd=0) H 1: μ A>μB (μ d>0)
Példa – Feladatgyűjtemény (31. ) q Számított érték meghatározása: A benzin B benzin 11, 5 12, 3 10, 2 11, 7 10, 8 Kritikus érték meghatározása: DF=4 α=5% tkrit=2, 13 q Elfogadási tartomány: tsz< tα q 10, 3 9, 8 11, 4 10, 1 10, 7 di különbség 1, 2 2, 5 -1, 2 1, 6 0, 1 Mivel a próbafüggvény értéke az elfogadási tartományba esik, így H 0 -t elfogadjuk 95%-os megbízhatósági szinten, vagyis a két benzinmárka között nincsen különbség, az autók átlagos futásteljesítménye nem tér el egymástól.
Tesztelendő Alkalmazási feltételek paraméter Sokasági mindkét sokaság várható érték normális eloszlású, 1 és 2 ismert v. n 1 és n 2>30, a minták függetlenek mindkét sokaság normális eloszlású, 1 és 2 nem ismert v. n 1 és n 2<30 1= 2, a minták függetlenek a sokaság normális eloszlású, páros minta Sokasági variancia Mindkét sokasági eloszlás normális Hipotézisek H 0: 1= 2 H 1: (1) 1 ≠ 2 (2) 1 > 2 (3) 1 < 2 Próbafüggvény eloszlása standard normális (z) Student teloszlás (DF=n 1+n 2 -2) H 0: 1= 2 (H 0: μd=δ 0) H 1: (1) 1 ≠ 2 (μd ≠ δ 0) (2) 1 > 2 (μd > δ 0) (3) 1 < 2 (μd < δ 0) Student teloszlás (DF=n-1) , ahol s 1*2 > s 2*2 F-eloszlás (DF 1=n 1 -1; DF 2=n 2 -1)
Többmintás próbák A többmintás próbák annak a kérdésnek a vizsgálatára használhatók, hogy több – meghatározott szempontból eltérő (pl. különböző műszakok, gépek stb. ) – sokaságban a vizsgált paraméterek (várható értékek, szórások) is különböznek-e egymástól. A többmintás próbák kettőnél több sokaság egymással való összehasonlítására szolgálnak. – – Több sokasági szórás (variancia) összehasonlítása Több sokaság várható értékének összehasonlítása (varianciaanalízis)
Többmintás próbák – több sokasági szórás összehasonlítása q q q q Cochran próba: azt dönthetjük el, hogy a szórások között talált legnagyobb érték tekinthető-e a többivel azonos eloszlásból származónak. Alkalmazási feltétel: normális eloszlású alapsokaságok, azonos n elemszámú minták (r db sokaságból r db mintánk van) Nullhipotézis: Ellenhipotézis: H 1: nem minden variancia egyenlő A próbafüggvény: DF=n-1 Elfogadási tartomány: gsz < gkrit
Példa – Cochran próba Egy áruházláncnál megvizsgálták, hogy 3 boltjukban azonos-e az egy vásárlásnál fizetett összeg. Minden boltban kiválasztottak 6 véletlen mintát. A vásárláskor fizetett összegeket az alábbi táblázat mutatja (dollárban): 1. bolt 12, 05 23, 94 14, 63 25, 78 17, 52 18, 45 2. bolt 3. bolt 15, 17 9, 48 18, 52 6, 92 19, 57 10, 47 21, 4 7, 63 13, 59 11, 90 20, 57 5, 92 Feltételezve, hogy a kifizetések normális eloszlásúak, van-e különbség a szórás tekintetében a 3 üzlet között 5%-os szignifikancia szinten?
Példa – Cochran próba Hipotézisek felállítása: H 0: H 1: nem minden variancia egyenlő q 1. bolt 12, 05 23, 94 14, 63 25, 78 17, 52 18, 45 Számított érték meghatározása: szükségünk van a korrigált tapasztalati szórásokra! q 2. bolt 3. bolt 15, 17 9, 48 18, 52 6, 92 19, 57 10, 47 21, 4 7, 63 13, 59 11, 90 20, 57 5, 92
Példa – Cochran próba Kritikus érték meghatározása: α=5% n=6 (egy-egy minta azonos elemszáma) DF=n-1=6 -1=5 r=3 (a minták száma) gkrit=0, 73 q Döntés a nullhipotézisről: Mivel a számított érték (0, 653) kisebb, mint a kritikus érték (0, 73), a nullhipotézist elfogadjuk 5%-os szignifikancia szinten, azaz a sokasági szórások egyezése feltételezhető. q
Példa – Cochran próba Egy egészségügyi kutatóközpont öt különböző fogyókúra eljárást kíván összehasonlítani. A vizsgálatra 25 túlsúlyos személyt kértek fel, akiket 5 csoportba soroltak be. Egy hónapon keresztül alkalmazták az egyes eljárásokat. Feltételezve a súlycsökkenés normális eloszlását vizsgáljuk meg, hogy van-e különbség a fogyókúrás terápiák által eredményezett súlycsökkenések varianciája között (α=5%)! Megoldás: Eljárás A B C D E 13 7 12 6 9 Súlyveszteség (kg) 16 16 15 4 7 8 8 6 9 10 5 7 11 13 11 H 1: nem minden variancia egyenlő 15 9 10 7 11
Példa – Cochran próba Minden fogyókúrás eljárásra ki kell számolnunk a súlycsökkenések átlagát és korrigált tapasztalati szórását: Eljárás Súlyveszteség (kg) 5%-os szignifikancia szinten a A 13 16 16 15 15 különböző fogyókúrás eljárások B 7 4 7 8 9 C eredményeként előálló 12 8 6 9 10 D súlycsökkenések varianciája között 6 10 5 7 7 E nincs különbség, mivel a számított 9 11 13 11 11 érték kisebb, mint a kritikus. Kritikus érték: α=5%, r=5, DF=n-1=4, gkrit=0, 56
Pluszpont szerzési lehetőség! – Beadás óra végén – 1 pont Egy kutatás során azt vizsgálták, hogy az üzleti környezetet hogyan ítélik meg az egyes vállalkozások vezetői. A kérdőíves vizsgálat során a vállalkozások mérete alapján 3 csoportba (A, B, C) sorolták a megkérdezett vezetőket, akik válaszait egy 100 pontos skálán értékelték. Az értékelési skálán kapott pontszámok normális eloszlásúnak tekinthetők. A vizsgálat során mindhárom kategóriában 8 vállalkozást kérdeztek meg. Vizsgálja meg, hogy a vállalatméret szerinti csoportok tekintetében van-e eltérés a pontszámok szórása között! (1%) Átlag s* A. Kis- és mikrovállalkozások 45 39 52 43 51 43 47 48 46 4, 375 B. Közepes vállalatok 63 66 61 68 72 64 58 60 64 4, 567 C. Nagyvállalatok 62 65 61 74 69 66 70 69 67 4, 342 r - sokaságok száma n – minták azonos elemszáma
Példa megoldása H 1: nem minden variancia egyenlő Kritikus érték (1%, r=3, DF=7): 0, 75 Mivel a számított érték az elfogadási tartományba esik, a nullhipotézist elfogadjuk, a pontszámok szórásának egyezése ezen a szignifikancia szinten elfogadható.
Több sokaság várható értékének összehasonlítása - varianciaanalízis q q Alkalmazási feltétel: független minta, normális eloszlású alapsokaságok, a sokasági szórások egyezése feltételezhető (lásd Cochran próba) Nullhipotézis: – – q Ellenhipotézis: H 1: bármely két várható érték nem egyenlő egymással – q a nullhipotézis fennállása azt jelenti, hogy nincs kapcsolat az X mennyiségi ismérv és a sokaságokat megkülönböztető minőségi ismérv között a próba a vegyes kapcsolat tesztelésének is tekinthető, a nullhipotézis elfogadása esetén a minőségi ismérv nem befolyásolja a mennyiségi ismérv alakulását, a két ismérv független egymástól H 1 fennállása azt jelenti, hogy van kapcsolat az adott két ismérv között A szórásnégyzet-felbontás módszerére épül (lásd heterogén sokaság vizsgálata)
Több sokaság várható értékének összehasonlítása - varianciaanalízis q Menete: – Főátlag számítása: – Teljes négyzetösszeg: – Csoportok közötti négyzetösszeg: • – a csoportok közti eltéréseket magyarázza, méri Csoportokon belüli négyzetösszeg: • a csoportokon belüli eltéréseket, a véletlen hatásokat mutatja
Több sokaság várható értékének összehasonlítása - varianciaanalízis q q q SST = SSK + SSB SSK: a csoportosítás hatása a szóródásra Varianciahányados: H 2=SSK/SST SSB: a szóródás azon része, amelyet a csoportosítás nem magyaráz – q a csoportosító ismérven kívül egyéb tényezők magyaráznak A varianciaanalízis éppen arra keresi a választ, hogy a csoportosító ismérvnek köszönhető eltérésnégyzet-összeg (SSK) szignifikáns nagyságrendű-e.
Több sokaság várható értékének összehasonlítása - varianciaanalízis q Ha H 0 igaz: – – – q a csoporton belüli négyzetösszeg (SSB) 2 -eloszlású n-r szabadságfokkal a csoportok közötti négyzetösszeg (SSK) 2 -eloszlású r-1 szabadságfokkal a négyzetösszegek és a megfelelő szabadságfokok hányadosából képzett ún. külső (sk 2), ill. belső (sb 2) szórásnégyzetek egymástól függetlenek a közös várható értékük az ismeretlen, de egyenlő alapsokasági szórás: M(sk 2)=M(sb 2)=. A két szórás egyezésének vizsgálatával így ellenőrizhetjük eredeti hipotézisünket: a várható értékek azonosságát A próbastatisztika (r-1, n-r) paraméterű F-eloszlású:
Több sokaság várható értékének összehasonlítása - varianciaanalízis q ANOVA tábla Négyzetösszeg neve Négyzetösszegek Szabadságfok Szórás F érték becslése p-érték Csoportok közötti * r-1 sk 2/sb 2 p Csoporton belüli ** n-r sb 2 - - Teljes n-1 - - -
Példa - Varianciaanalízis Egy áruházláncnál megvizsgálták, hogy 3 boltjukban azonos-e az egy vásárlásnál fizetett összeg. Minden boltban kiválasztottak 6 véletlen mintát. A vásárláskor fizetett összegeket az alábbi táblázat mutatja (dollárban): 1. bolt 2. bolt 3. bolt 12, 05 23, 94 14, 63 25, 78 17, 52 18, 45 15, 17 18, 52 19, 57 21, 4 13, 59 20, 57 9, 48 6, 92 10, 47 7, 63 11, 90 5, 92 Feltételezve, hogy a kifizetések normális eloszlásúak, van-e különbség az eladások várható értékeinek tekintetében a 3 üzlet között 5%-os szignifikancia szinten? A varianciaanalízis alkalmazási feltételei között szerepel a sokasági szórások egyezése, ezt már igazoltuk Cochran-próbával, továbbá feltételeztük az értékesítések értékének normalitását.
Példa - Varianciaanalízis Hipotézisek felállítása: H 0: H 1: bármely két várható érték nem egyenlő egymással q Számított érték meghatározása: n 1=n 2=n 3=6 r=3 q 1. bolt 12, 05 23, 94 14, 63 25, 78 17, 52 18, 45 2. bolt 3. bolt 15, 17 9, 48 18, 52 6, 92 19, 57 10, 47 21, 4 7, 63 13, 59 11, 90 20, 57 5, 92
Példa - Varianciaanalízis
Példa - Varianciaanalízis Négyzet- Szabadságfok összegek r-1=3 -1=2 Csoportok közötti 378, 4 Csoporton belüli 214, 05 n-r=18 -3=15 17 Teljes 592, 45 Szórás becslése 189, 2 14, 3 - F érték 13, 23 - Mivel Fsz>>Fkr, a nullhipotézist 5%-os szignifikancia szinten elutasítjuk, azaz az átlagok, ill. legalább egy átlag szignifikánsan különbözik a többitől. =0, 05 Esetünkben ez értelemszerűen a 3. bolt, A számláló szabadságfoka (DF 1) = 2 ahol az egy vásárlásnál kifizetett összeg A nevező szabadságfoka (DF 2) = 15 nagysága átlagosan kevesebb, mint a fele a A kritikus érték: Fkr=3, 68 másik két bolt átlagánál.
Példa A Cochran-próbával is tesztelt fogyókúrás eljárásokat nézzük újra, és ellenőrizzük, hogy van-e különbség az egyes eljárások között a hatékonyság szempontjából 5%-os szignifikancia szinten! (vagyis van-e olyan, amelyik nagyobb átlagos súlycsökkenéssel jár, mint a többi? ) Eljárás A B C D E 13 7 12 6 9 Súlyveszteség (kg) 16 16 15 4 7 8 8 6 9 10 5 7 11 13 11 15 9 10 7 11 átlagok 15 7 9 7 11 szórások 1, 22 1, 87 2, 36 1, 87 1, 41 Tegyük fel, hogy feltételezhető az eljárások okozta súlyveszteségek varianciájának azonossága, így folytathatjuk a várható értékek egyezésének vizsgálatával.
Példa q Főátlag: α=5% DF 1=4 DF 2=20 Fkrit=2, 87 Mivel a számított érték nagyobb, mint a kritikus H 1: bármely két várható érték nem egyenlő egymással érték, így a nullhipotézist elutasítjuk. 5%-os szignifikancia szinten van különbség az egyes fogyókúrás eljárások által eredményezett súlycsökkenések várható értéke között, azaz valószínűleg van olyan, amelyik hatásosabb a másiknál. Eljárás A B C D E 13 7 12 6 9 Súlyveszteség (kg) 16 16 15 4 7 8 8 6 9 10 5 7 11 13 11 15 9 10 7 11 átlagok 15 7 9 7 11 s*2 1, 22 1, 87 2, 36 1, 87 1, 41
Példa – Feladatgyűjtemény (37. ) Egy betongyárban 4 cementgyárból (A, B, C, D) vásárolnak cementet. A cement minőségét próbakockák gyártásával ellenőrzik. A beérkező „ 500 -as cement” szállítmányokból mintát véve a próbakockák nyomószilárdság adatai [kg/cm 2 -ben] az alábbiak A szállító: 512, 716, 668, 726, 580 B szállító: 516, 664, 614, 586, 590 C szállító: 542, 684, 722, 600, 642 D szállító: 566, 744, 546, 610, 672. Van-e különbség a szállítók között? (Vagyis van-e különbség a különböző cementgyártók által beszállított cement(kockák) nyomószilárdságának várható értékei között? ) Varianciaanalízis, előtte Cochran próba!
Példa – Feladatgyűjtemény (37. ) A sokasági varianciák egyezőségének vizsgálata – Cochran próba Hipotézisek: H 0: A= B= D= C H 1: a legnagyobb szórású különbözik q Beszállító Minta A 512, 716, 668, 726, 580 B 516, 664, 614, 586, 590 C 542, 684, 722, 600, 642 D 566, 744, 546, 610, 672 Mintaátlag 640, 4 594 638 627, 6 Korr. tap. szórás 92, 113 53, 5 70, 44 81, 06
Példa – Feladatgyűjtemény (37. ) q q Cochran próba Számított érték meghatározása Beszállító Minta A 512, 716, 668, 726, 580 B 516, 664, 614, 586, 590 C 542, 684, 722, 600, 642 D 566, 744, 546, 610, 672 Mintaátlag 640, 4 594 638 627, 6 Korr. tap. szórás 92, 113 53, 5 70, 44 81, 06 Kritikus érték: α=5% n=5 DF=4 r=4 gkrit=0, 63 Döntés: mivel a számított érték kisebb, mint a kritikus érték, így a nullhipotézist elfogadjuk, 5%-os szignifikancia szint mellett a sokasági szórások megegyeznek.
Példa – Feladatgyűjtemény (37. ) Varianciaanalízis q Hipotézisek: H 0: A= B= C= D H 1: bármelyik kettő nem egyenlő q Beszállító Minta A 512, 716, 668, 726, 580 B 516, 664, 614, 586, 590 C 542, 684, 722, 600, 642 D 566, 744, 546, 610, 672 Mintaátlag 640, 4 594 638 627, 6 Korr. tap. szórás 92, 113 53, 5 70, 44 81, 06
Példa – Feladatgyűjtemény (37. ) q Varianciaanalízis Beszállító Minta A 512, 716, 668, 726, 580 B 516, 664, 614, 586, 590 C 542, 684, 722, 600, 642 D 566, 744, 546, 610, 672 Mintaátlag 640, 4 594 638 627, 6 Korr. tap. szórás 92, 113 53, 5 70, 44 81, 06
Mivel Fsz=0, 4<Fkrit=3, 24 H 0 -t elfogadjuk 95%-os megbízhatósági szinten, azaz a beszállítóktól származó próbakockák minősége (nyomószilárdsági adatai) között nincs különbség. Példa – Feladatgyűjtemény (37. ) q ANOVA tábla Négyzet- Szabadságfok Szórás összegek becslése r-1=4 -1=3 2290, 75 Csoportok közötti 6872, 25 Csoporton belüli 91518, 32 N-r=20 -4=16 5719, 9 98390, 57 N-1=19 Teljes - F érték 0, 4 - =0, 05 DF 1 =3 DF 2 = 16 A kritikus érték: Fkr=3, 24
Összefoglalás q q A zárthelyin számonkérésére kerülő próbák Nemparaméteres próbák: – – – q Illeszkedésvizsgálat Homogenitásvizsgálat Függetlenségvizsgálat Paraméteres próbák: – Egymintás • • – Kétmintás • • – Sokasági szórásra irányuló próba Várható értékre irányuló próbák (egymintás z- vagy t-próba) Sokasági szórásokra irányuló próba (F-próba) Várható értékekre irányuló próba (kétmintás z-, vagy t-próba, páros mintás próba) Többmintás • • Sokasági szórásokra (Cochran-próba) Várható értékekre irányuló próba (varianciaanalízis)
- Slides: 76