Kvantitatv mdszerek Hipotzisvizsglatok Paramteres prbk Paramteres prbk q
Kvantitatív módszerek Hipotézisvizsgálatok Paraméteres próbák
Paraméteres próbák q q A paraméteres próbák szigorúbb alkalmazási feltételeket igényelnek Arány-, ill. intervallum szintű mérési skáláról származó adatok állnak rendelkezésre Erősségük (a hamis nullhipotézis elutasításának valószínűsége) nagyobb Csoportosításuk: – – – Egymintás, kétmintás, többmintás Független és páros mintás Várható értékre, szórásra, sokasági arányra irányuló
Egymintás próbák q q q Az egymintás próbák mindig egy adott sokaság valamely jellemzőjére vonatkozó feltevések helyességének ellenőrzésére szolgálnak. Ennek érdekében a rendelkezésre álló egyetlen mintából meghatározott jellemzőt (átlag, tapasztalati szórás) valamely feltételezett, vagy kívánatosnak tartott állapothoz viszonyítjuk. Így annak a kérdésnek a megválaszolására alkalmasak, hogy az a sokaság, amelyből a minta származik lehet-e olyan, mint amilyennek mi azt a nullhipotézisben feltételezzük. Tanult próbák: – – q Egymintás várható értékre irányuló próba Egymintás sokasági szórásra irányuló próba Új próba: – Egymintás sokasági arányra irányuló próba
Tesztelendő paraméter Alkalmazási feltételek Hipotézisek Sokasági várható érték Sokasági eloszlás normális sokasági szórás ismert Sokasági eloszlás normális sokasági szórás nem ismert Sokasági eloszlás normális H 0: = m 0 H 1: (1) ≠ m 0 (2) > m 0 (3) < m 0 H 0: σ = σ0 H 1: (1) σ ≠ σ0 (2) σ > σ0 (3) σ < σ0 Sokasági variancia (szórás) Próbafüggvény Próbafüggv ény eloszlása standard normális (z) Student teloszlás (DF=n-1) χ2 -eloszlás (DF=n-1)
Egymintás próbák – sokasági arányra irányuló próba q P: adott tulajdonsággal rendelkező egyedek aránya a sokaságban p=adott tulajdonsággal rendelkező egyedek aránya a mintában Nullhipotézis: H 0: P=P 0 Lehetséges ellenhipotézisek: H 1: P ≠ P 0 H 1: P > P 0 H 1: P < P 0 Alkalmazás feltétele: nagy minta q A próbafüggvény N(0, 1) eloszlású: q q
Példa Mivel a számított érték kisebb, mint a kritikus érték (vagyis elutasítási Egy diákszervezet feltételezi, hogy a következő diáktanácstartományba esik), a nullhipotézist választáson a szavazatok legalább 30%-át biztosan megkapják. elutasítjuk, vagyis 5%-os Visszautasítható-e ez a feltételezés 5%-os szignifikancia szinten úgy, hogy egy 65 elemű mintában 12 -en szavaztak erre a visszautasítható az a feltételezés, szervezetre? hogy a szavazatok 30%-át Megoldás: H 0: P=0, 3 H 1 megkapják. : P < 0, 3 Elég nagy-e a minta? A kritikus érték: zα=-1, 64.
Példa Egy olvadó biztosítékokat gyártó cég feltételezi, hogy a működésképtelen biztosítékok aránya legfeljebb 10%. Ezt a feltevést egy 144 elemű mintán vizsgáljuk 5%-os szignifikancia szinten. A mintában talált selejtes termékek száma 25. q q H 0: P=0, 1 H 1: P>0, 1 A kritikus érték: zα=1, 64. Mivel a számított érték nagyobb, mint a kritikus érték (vagyis elutasítási tartományba esik), a nullhipotézist elutasítjuk, vagyis 5%-os szignifikancia szinten nem fogadható el, hogy a selejtarány legfeljebb 10%.
Kétmintás próbák q A kétmintás próbák – ideértve a speciális páros mintás próbákat is – annak a kérdésnek a vizsgálatára használhatók, hogy két meghatározott szempontból eltérő (pl. különböző műszakok, gépek stb. ) sokaságban a vizsgált paraméterek (várható értékek, szórások) is különböznek-e egymástól. q A kétmintás próbák két sokaság egymással való összehasonlítását szolgálják. A sokaságok időben, térben vagy bármilyen más tekintetben különbözhetnek egymástól. Tanult próbák: q q – – – q Kétmintás, a sokasági varianciák egyezésére irányuló próba Páros mintás, a várható értékek különbségére irányuló próba Két, független mintás, várható értékek egyezésére irányuló z-, ill. t- próba, Welchpróba Új próba: – Kétmintás, a sokasági arányok egyezésére irányuló próba
Tesztelendő Alkalmazási feltételek paraméter Sokasági mindkét sokaság várható érték normális eloszlású, 1 és 2 ismert v. n 1 és n 2>30, a minták függetlenek mindkét sokaság normális eloszlású, 1 és 2 nem ismert v. n 1 és n 2<30 1= 2, a minták függetlenek a sokaság normális eloszlású, páros minta Sokasági variancia Mindkét sokasági eloszlás normális Hipotézisek H 0: 1= 2 H 1: (1) 1 ≠ 2 (2) 1 > 2 (3) 1 < 2 Próbafüggvény eloszlása standard normális (z) Student teloszlás (DF=n 1+n 2 -2) H 0: 1= 2 (H 0: μd=δ 0) H 1: (1) 1 ≠ 2 (μd ≠ δ 0) (2) 1 > 2 (μd > δ 0) (3) 1 < 2 (μd < δ 0) Student teloszlás (DF=n-1) , ahol s 1*2 > s 2*2 F-eloszlás (DF 1=n 1 -1; DF 2=n 2 -1)
Kétmintás aránypróba q q q Alkalmazási feltétele: nagy minták Nullhipotézis: H 0: P 1=P 2 Lehetséges ellenhipotézisek és elfogadási tartományok: H 1: P 1 ≠ P 2 H 1: P 1 > P 2 H 1: P 1 < P 2 q -z /2 <zsz<z /2 zsz<z zsz>-z A próbafüggvény N(0, 1) eloszlású:
Példa Egy közvélemény-kutató cég 1000 elemű, állítása szerint az ország teljes felnőtt lakosságát reprezentáló FAE mintákkal dolgozik. Két – időben egymást két hónappal követő – közvélemény-kutatás eredménye szerint az egyik politikust a lakosság 62, ill. 68%-a tartotta rokonszenvesnek. 5%-os szignifikancia szinten állítható-e, hogy a lakosság rokonszenve növekedett az adott politikus iránt? Megoldás: H 0: P 1=P 2 H 1: P 1<P 2 z = – 1, 645 Mivel zsz<– 1, 645, ezért a H 0 hipotézist 5%-os szignifikancia szinten elutasítjuk, vagyis a lakosság rokonszenve az adott politikus iránt növekedett.
Példa Egy multinacionális vállalatnál az ügyfélszolgálaton dolgozók prémiumának egy részét a szolgáltatások elégedettség vizsgálatához kötik. Minden hónapban véletlenszerűen kiválasztott 1500 ügyfelet hív fel egy automata, kérdéseket tesz fel, a válaszokat rögzítik, és összesítik. Az egyik hónapban 75%-os, a rákövetkezőben pedig 78%os volt az elégedettség, ezért a prémium összegét növelték. Jogos volte ez a lépés 5%-os szignifikancia szinten? Megoldás: H 0: P 1=P 2 H 1: P 1<P 2 Elfogadási tartomány: zsz > – 1, 64 Mivel zsz>– 1, 64, ezért a H 0 hipotézist 5%os szignifikancia szinten elutasítjuk, vagyis a vevők elégedettsége növekedett, így jogos a prémium összegének növelése.
Többmintás próbák A többmintás próbák annak a kérdésnek a vizsgálatára használhatók, hogy több – meghatározott szempontból eltérő (pl. különböző műszakok, gépek stb. ) – sokaságban a vizsgált paraméterek (várható értékek, szórások) is különböznek-e egymástól. A többmintás próbák kettőnél több sokaság egymással való összehasonlítására szolgálnak. – – Több sokasági szórás (variancia) összehasonlítása Több sokaság várható értékének összehasonlítása (varianciaanalízis)
Többmintás próbák – több sokasági szórás összehasonlítása q q q q Cochran próba: azt dönthetjük el, hogy a szórások között talált legnagyobb érték tekinthető-e a többivel azonos eloszlásból származónak. Alkalmazási feltétel: normális eloszlású alapsokaságok, azonos n elemszámú minták (r db sokaságból r db mintánk van) Nullhipotézis: Ellenhipotézis: H 1: nem minden variancia egyenlő A próbafüggvény: DF=n-1 Elfogadási tartomány: gsz < gkrit
Példa – Cochran próba Egy egészségügyi kutatóközpont öt különböző fogyókúra eljárást kíván összehasonlítani. A vizsgálatra 25 túlsúlyos személyt kértek fel, akiket 5 csoportba soroltak be. Egy hónapon keresztül alkalmazták az egyes eljárásokat. Feltételezve a súlycsökkenés normális eloszlását vizsgáljuk meg, hogy van-e különbség a fogyókúrás terápiák által eredményezett súlycsökkenések varianciája között (α=5%)! Megoldás: Eljárás A B C D E 13 7 12 6 9 Súlyveszteség (kg) 16 16 15 4 7 8 8 6 9 10 5 7 11 13 11 H 1: nem minden variancia egyenlő 15 9 10 7 11
Példa – Cochran próba Minden fogyókúrás eljárásra ki kell számolnunk a súlycsökkenések átlagát és korrigált tapasztalati szórását: Eljárás Súlyveszteség (kg) 5%-os szignifikancia szinten a A 13 16 16 15 15 különböző fogyókúrás eljárások B 7 4 7 8 9 C eredményeként előálló 12 8 6 9 10 D súlycsökkenések varianciája között 6 10 5 7 7 E nincs különbség, mivel a számított 9 11 13 11 11 érték kisebb, mint a kritikus. Kritikus érték: α=5%, r=5, DF=n-1=4, gkrit=0, 56
Többmintás próbák – több sokasági szórás összehasonlítása q q q Bartlett próba Alkalmazási feltétel: normális eloszlású alapsokaságok, nem egyforma elemszámú minták állnak rendelkezésre a sokaságokból Nullhipotézis: H 0: Ellenhipotézis: H 1: nem minden variancia egyenlő r db minta, az elemszámok: n 1, n 2, . . , nr, a j-edik minta átlaga korrigált tapasztalati szórásnégyzete A próbafüggvény (DF=r-1):
Példa – Bartlett próba Egy élelmiszerbolt tulajdonosa feltételezi, hogy a hétfői és szombati napokon nem ugyanannyi sajt fogy, mint a hét más napjain. Ezért a sajt rendelésének jobb megalapozása céljából 6 -6 egymástól függetlenül és véletlenszerűen kiválasztott hétfői és szombati napon, valamint 10 ugyancsak véletlenszerűen kiválasztott egyéb napon gondosan feljegyzi, hogy mennyi sajtot adott el. A megfigyelés kg-ra kerekített eredményét az alábbi táblázat tartalmazza. Ellenőrizzük 5%-os szignifikancia szinten azt a nullhipotézist, hogy a napi sajtforgalom szórása a hét háromféle napján egyforma! Nap Megfigyelt Eladott Az eladott Hétfő Egyéb hétköznap Szombat Összesen napok száma sajtmennyiség 6 10 30, 40, 54, 34, 44, 50 49, 43, 30, 59, 35, 46, 42, 35, 36, 43 52, 58, 57, 70, 54, 53 6 22 mennyiség átlaga 42 41, 8 mennyiség varianciája 84, 8 70, 4 57, 33 46, 09 43, 87 110, 47
Példa – Bartlett próba H 1: nem minden variancia egyenlő Mivel a számított érték kisebb, mint a kritikus, így a sokasági varianciák egyezőségére vonatkozó feltételezés elfogadható 5%-os szignifikancia szinten a kritikus érték r-1=3 -1=2 szabadságfok mellett: 5, 99
Példa – Bartlett próba Egy egészséges életmóddal foglalkozó kutatóintézet olyan személyeket vizsgált, akik egyszer le-, majd visszaszoktak a dohányzásra. Egyszerű véletlen mintákat vettek az erősen stresszes, közepesen stresszes és nyugodt körülmények között dolgozók közül, és azt vizsgálták, hogy ki hány hónapig bírta ki cigaretta nélkül. A mintaelemszámok 4, 6 és 5, az eloszlások normalitása feltételezhető. Vizsgáljuk meg 5%-os szignifikancia szinten, hogy van-e különbség a cigaretta nélkül töltött idők szórása között! Munkahely Meddig bírta ki cigaretta nélkül (hónap) Erősen 7, 9, 10, 14 stresszes Közepesen 6, 8, 10, 11, 14, 17 stresszes Nyugodt 6, 14, 20, 24, 26 H 1: nem minden variancia egyenlő
Példa – Bartlett próba Döntés a nullhipotézisről: mivel a számított érték nagyobb, mint a kritikus érték, így 5%-os szignifikancia szinten nem tehető fel a sokasági varianciák egyezése. 5%-os szignifikancia szinten a kritikus érték r-1=3 -1=2 szabadságfok mellett: 5, 99
Több sokaság várható értékének összehasonlítása - varianciaanalízis q q Alkalmazási feltétel: független minta, normális eloszlású alapsokaságok, a sokasági szórások egyezése feltételezhető (lásd Cochran v. Bartlett próba) Nullhipotézis: – – q Ellenhipotézis: H 1: bármely két várható érték nem egyenlő egymással – q a nullhipotézis fennállása azt jelenti, hogy nincs kapcsolat az X mennyiségi ismérv és a sokaságokat megkülönböztető minőségi ismérv között a próba a vegyes kapcsolat tesztelésének is tekinthető, a nullhipotézis elfogadás esetén a minőségi ismérv nem befolyásolja a mennyiségi ismérv alakulását, a két ismérv független egymástól H 1 fennállása azt jelenti, hogy van kapcsolat az adott két ismérv között A szórásnégyzet-felbontás módszerére épül (lásd heterogén sokaság vizsgálata)
Több sokaság várható értékének összehasonlítása - varianciaanalízis q Menete: – Főátlag számítása: – Teljes négyzetösszeg: – Csoportok közötti négyzetösszeg: • – a csoportok közti eltéréseket magyarázza, méri Csoportokon belüli négyzetösszeg: • a csoportokon belüli eltéréseket, a véletlen hatásokat mutatja
Több sokaság várható értékének összehasonlítása - varianciaanalízis q q q SST = SSK + SSB SSK: a csoportosítás hatása a szóródásra Varianciahányados: H 2=SSK/SST SSB: a szóródás azon része, amelyet a csoportosítás nem magyaráz – q a csoportosító ismérven kívül egyéb tényezők magyaráznak A varianciaanalízis éppen arra keresi a választ, hogy a csoportosító ismérvnek köszönhető eltérésnégyzet-összeg (SSK) szignifikáns nagyságrendű-e.
Több sokaság várható értékének összehasonlítása - varianciaanalízis q Ha H 0 igaz: – – – a csoporton belüli négyzetösszeg (SSB) 2 -eloszlású n-r szabadságfokkal a csoportok közötti négyzetösszeg (SSK) 2 -eloszlású r-1 szabadságfokkal a négyzetösszegek és a megfelelő szabadságfokok hányadosából képzett ún. külső (sk 2), ill. belső (sb 2) szórásnégyzetek egymástól függetlenek a közös várható értékük az ismeretlen, de egyenlő alapsokasági szórás: M(sk 2)=M(sb 2)=. A két szórás egyezésének vizsgálatával így ellenőrizhetjük eredeti hipotézisünket: a várható értékek azonosságát A próbastatisztika (r-1, n-r) paraméterű F-eloszlású:
Több sokaság várható értékének összehasonlítása - varianciaanalízis q ANOVA tábla Négyzetösszeg neve Négyzetösszegek Szabadságfok Szórás F érték becslése p-érték Csoportok közötti * r-1 sk 2/sb 2 p Csoporton belüli ** n-r sb 2 - - Teljes n-1 - - -
Példa Bartlett próbával már beláttuk, hogy az eladott sajtmennyiség a hét háromféle napján azonos szórású normális eloszlást követ. Most ellenőrizzük 5%-os szignifikancia szinten azt a nullhipotézist, hogy a hét elején, közben és a hét végén eladott mennyiség várható értéke azonos! Nap Megfigyelt napok száma Eladott sajtmennyiség Hétfő Egyéb hétköznap Szombat Összesen 6 10 30, 40, 54, 34, 44, 50 49, 43, 30, 59, 35, 46, 42, 35, 36, 43 52, 58, 57, 70, 54, 53 6 22 Az eladott mennyiség átlaga 42 41, 8 Az eladott mennyiség varianciája 84, 8 70, 4 57, 33 46, 09 43, 87 110, 47
Példa H 1: bármely két várható érték nem egyenlő egymással Nap Megfigyelt napok száma Eladott sajtmennyiség Hétfő Egyéb hétköznap Szombat Összesen 6 10 30, 40, 54, 34, 44, 50 49, 43, 30, 59, 35, 46, 42, 35, 36, 43 52, 58, 57, 70, 54, 53 6 22 Az eladott mennyiség átlaga 42 41, 8 Az eladott mennyiség varianciája 84, 8 70, 4 57, 33 46, 09 43, 87 110, 47
Példa α=5%, DF 1=2, DF 2=19 Fkrit=3, 52 Mivel a számított érték nagyobb, mint a kritikus érték, ezért a nullhipotézist elutasítjuk 5%-os szignifikancia szinten. A hét vizsgált típusú napjain tehát valószínűleg nem egyforma az eladott sajtmennyiség várható értéke. A szóródás oka Négyzetösszegek milyen nap 1042, 92 hiba 1276, 95 teljes 2319, 87 Szabadságfok 2 19 21 Szórás becslése 521, 46 67, 21 - F érték 7, 76 -
Példa A Cochran-próbával is tesztelt fogyókúrás eljárásokat nézzük újra, és ellenőrizzük, hogy van-e különbség az egyes eljárások között a hatékonyság szempontjából 5%-os szignifikancia szinten! (vagyis van-e olyan, amelyik nagyobb átlagos súlycsökkenéssel jár, mint a többi? ) Eljárás A B C D E 13 7 12 6 9 Súlyveszteség (kg) 16 16 15 4 7 8 8 6 9 10 5 7 11 13 11 15 9 10 7 11 átlagok 15 7 9 7 11 szórások 1, 22 1, 87 2, 36 1, 87 1, 41 Tegyük fel, hogy feltételezhető az eljárások okozta súlyveszteségek varianciájának azonossága, így folytathatjuk a várható értékek egyezésének vizsgálatával.
Példa q Főátlag: α=5% DF 1=4 DF 2=20 Fkrit=2, 87 Mivel a számított érték nagyobb, mint a kritikus H 1: bármely két várható érték nem egyenlő egymással érték, így a nullhipotézist elutasítjuk. 5%-os szignifikancia szinten van különbség az egyes fogyókúrás eljárások által eredményezett súlycsökkenések várható értéke között, azaz valószínűleg van olyan, amelyik hatásosabb a másiknál. Eljárás A B C D E 13 7 12 6 9 Súlyveszteség (kg) 16 16 15 4 7 8 8 6 9 10 5 7 11 13 11 15 9 10 7 11 átlagok 15 7 9 7 11 szórások 1, 22 1, 87 2, 36 1, 87 1, 41
Összefoglalás q q A zárthelyin számonkérésére kerülő próbák Nemparaméteres próbák: – – – q Illeszkedésvizsgálat Kolmogorov próbával Sorozatpróba Rangösszegpróba Paraméteres próbák: – Egymintás • – Kétmintás • • – Sokasági aránypróba Kétmintás sokasági aránypróba Welch-próba Többmintás • • • Cochran próba Bartlett próba Varianciaanalízis
- Slides: 32