Hipotzisvizsglat v az adatforrs mkdsi mechanizmust egy vletlen

  • Slides: 33
Download presentation
Hipotézisvizsgálat v az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi v az adatok ismeretében

Hipotézisvizsgálat v az adatforrás működési “mechanizmusát” egy véletlen eloszlás jellemzi v az adatok ismeretében megfogalmazódnak bizonyos hipotézisek erre az eloszlásra nézve v ellenőrizzük, hogy az adatok mennyire támasztják alá a hipotéziseket

A hibák táblázata v Adott próbastatisztika mellett az első ill. másodfajú hiba csak egymás

A hibák táblázata v Adott próbastatisztika mellett az első ill. másodfajú hiba csak egymás rovására csökkenthető. Az elsőfajút írjuk elő kicsinek, ezért az elutasítás a szignifikáns eredmény

Megvalósítás v próbastatisztika: az adatok függvénye v elutasítási (kritikus) vs. elfogadási tartomány nem tipikus

Megvalósítás v próbastatisztika: az adatok függvénye v elutasítási (kritikus) vs. elfogadási tartomány nem tipikus értékek vs. tipikus értékek v szignifikancia szint = az elsőfajú hibát előírtan alacsony szinten kívánom tartani

A p-érték fogalma elfogadási tartomány van egy olyan legkisebb szignifikanciaszint, amelyen már biztosan el

A p-érték fogalma elfogadási tartomány van egy olyan legkisebb szignifikanciaszint, amelyen már biztosan el kell fogadnunk a nullhipotézist Ez az ún. p-érték a p-érték nagy H 0 -t elfogadjuk a p-érték kicsi H 0 -t elvetjük

Statisztikai próbák t-próba F-próba

Statisztikai próbák t-próba F-próba

t-próba v Ismert m várható érték és szórás mellett a normális eloszlású minta standardizált

t-próba v Ismert m várható érték és szórás mellett a normális eloszlású minta standardizált átlaga standard normális eloszlású lesz. v m-et a H 0 hipotézisben feltételezett értékével, -t a tapasztalati szórásnégyzettel (ez már valváltozó) helyettesítve Student féle t eloszlást kapunk - ennek kritikus értéke felett utasítunk el

A normális eloszlás és a Student-féle t-eloszlás standard normális eloszlás 1 szabadsági fokú Student-

A normális eloszlás és a Student-féle t-eloszlás standard normális eloszlás 1 szabadsági fokú Student- eloszlás 3 szabadsági fokú Student- eloszlás

Az F-eloszlás

Az F-eloszlás

Hotelling féle 2 T próba v A normális eloszlású minta standardizált átlagának négyzete egy

Hotelling féle 2 T próba v A normális eloszlású minta standardizált átlagának négyzete egy 2 n eloszlású változó n-edrészével egyező eloszlású v Ennek analógiájára, normális eloszlású vektor értékű mintából elkészítjük az v statisztikát, melynek eloszlása Hotelling féle T 2 lesz - ennek kritikus értéke felett utasítunk el

Hatások vizsgálata Szórásanalízis Regresszió Y (ANOVA) X

Hatások vizsgálata Szórásanalízis Regresszió Y (ANOVA) X

Szóráselemzés v Azt vizsgáljuk, hogy egy bizonyos faktornak (körülménynek) van-e hatása a kimeneti változó

Szóráselemzés v Azt vizsgáljuk, hogy egy bizonyos faktornak (körülménynek) van-e hatása a kimeneti változó (válasz) várható értékére v a faktort különböző szintekre állitjuk be és méréseket végzünk v nullhipotézis: a faktornak nincs hatása, azaz a várható értékek egyenlőek v az adatok alapján ezt megpróbáljuk megcáfolni

Egy faktor esete Az adatok: Yi, j Az adat sorszáma a i= csoporton belül

Egy faktor esete Az adatok: Yi, j Az adat sorszáma a i= csoporton belül (egy rögzített faktorbeállítás melletti mérések) 1 , . . . , Nj A csoport sorszáma j = 1 , . . . , k (a faktor különböző beállításai, szintjei)

A Nullhipotézis v A modell szerint a mért érték az elméleti érték + a

A Nullhipotézis v A modell szerint a mért érték az elméleti érték + a megfigyelési zaj összegeként adódik v A zaj független értékű, normális eloszlású v Yi, j = mj +ei, j v A nullhipotézisben az elméleti (várható) értékek egyenlőségét feltételezük (a faktor nem hat) v H 0 : m 1=. . . = mk v Ennek elutasítása a szignifikáns eredmény

A döntés elve v v v A várható értékek egyenlőségéről döntünk a szórások elemzésének

A döntés elve v v v A várható értékek egyenlőségéről döntünk a szórások elemzésének segítségével. Ha valóban n független azonos eloszlású mintánk van az egyes csoportokban, akkor a csoportátlagok szórásnégyzete a minta szórásnégyzetének n-edrésze. Ha igaz a nullhipotézis, akkor ugyanez a becsült szórásnégyzetekre is áll - szorozzuk be tehát őket n-nel és teszteljük az egyenlőségüket. Független normális eloszlású minták szórásnégyzeteinek egyenlőségét F-próbával tesztelhetjük. A Fisher-Cohran tétel biztosítja, hogy az átlagokból számolt tapasztalati szórásnégyzet független legyen az összevont mintából származó tapasztalati szórásnégyzettől - de ez csak normális eloszlású minta esetén igaz!

A négyzetösszegek felosztása Az átlagok felbontása: A négyzetösszegek felbontása:

A négyzetösszegek felosztása Az átlagok felbontása: A négyzetösszegek felbontása:

A négyzetösszegek felosztása Másképpen: SSössz = SScsb +SScsk A “szabadsági fokok”:

A négyzetösszegek felosztása Másképpen: SSössz = SScsb +SScsk A “szabadsági fokok”:

Az F-próba A H 0 mellett a “csk” csoportok közötti és “csb” csoporton belüli

Az F-próba A H 0 mellett a “csk” csoportok közötti és “csb” csoporton belüli szórásnégyzetek aránya kicsi és az eloszlása ismert: MScsk (n-k)SScsk = MScsb (k-1)SScsb eloszlása Fdfcsk, dfcsb

Egy példa ipari alkalmazások közül v. A gyártmány súlyának elemzése a keverék sűrűségének függvényében.

Egy példa ipari alkalmazások közül v. A gyártmány súlyának elemzése a keverék sűrűségének függvényében. Különböző sűrűségbeállítások mellett 10 -10 próbagyártást végeztek, és mérték a súlyt. A kapott eredmények láthatóak az ábrán. A kék pont az adott beállítás melletti átlag. v A gyártmány súlya a keverék sűrűségének függvényében

A szórások v. Az egyes oszlopokra elkészít- jük a mintaátlagokat. (Kék). v. Becsüljük a

A szórások v. Az egyes oszlopokra elkészít- jük a mintaátlagokat. (Kék). v. Becsüljük a mintaátlagokból a teljes minta szórásnégyzetét. v. Majd a zöld oszlopokra számítjuk a négyzetösszegeket, ezeket összeadjuk és osztunk a szabadsági fokkal – Újra a sárga összevont minta szórásnégyzetét becsüljük. v. A kétféleképp számított szórásnégyzet eltérésének szignifikanciáját F-próbával teszteljük.

MINITAB-os elemzés eredménye v v One-way ANOVA: Wt 3 versus Mix Source DF SS

MINITAB-os elemzés eredménye v v One-way ANOVA: Wt 3 versus Mix Source DF SS MS F P Mix 6 569. 8 95. 0 4. 60 0. 001 Error 63 1301. 2 20. 7 Total 69 1871. 0 Szabadsági fokok: 7 Mix csoport van: => k=7 dfcsk=k-1=6 Összesen 70 megfigyelésünk van : => N=70, dfcsb=N-k=63 A csoportok átlagainak az összevont átlagtól vett négyzetes eltéréseinek összege SScsk = 569. 8 ebből a négyzetes hiba: MScsk=SScsk/dfcsk=94. 966 Ugyanígy: A csoportokon belüli átlagoktól vett négyzetes eltérések összege (a csoportokra is összeadva) SScsb = 1301. 2 ebből a négyzetes hiba: MScsb=SScsb/dfcsb= 20. 653

Az F-próba v A fenti két mennyiség MScsk /MScsb hányadosa az F-statisztika értéke: 4.

Az F-próba v A fenti két mennyiség MScsk /MScsb hányadosa az F-statisztika értéke: 4. 598 v Ez adja az adott dfcsk , dfcsbszabadságfokok szerinti F-eloszlásból F(dfcsk, dfcsb) a 0. 001 -es p értéket

Multi-Faktor ANOVA Egy tipikus kísérletben nem csak egyetlen hanem több faktort is figyelembe kell

Multi-Faktor ANOVA Egy tipikus kísérletben nem csak egyetlen hanem több faktort is figyelembe kell veni. Ezen faktorok hatását kell ellenőrzés alatt tartani.

A kísérleti eredmények változékonyságának négy forrását ismerhetjük fel ebben az esetben: (1) hiba –

A kísérleti eredmények változékonyságának négy forrását ismerhetjük fel ebben az esetben: (1) hiba – azaz a csoporton belüli változékonyság, (2) 1 típusú csoport tagságból adódó változékonyság (3) 2 típusú csoport tagságból változékonyság (4) kölcsönhatás

Az F-próba A H 0 eldöntésére az F próbát éppúgy alkalmazhatjuk mint az előzőekben:

Az F-próba A H 0 eldöntésére az F próbát éppúgy alkalmazhatjuk mint az előzőekben: MScsk MScsb = (n-k)SScsk (k-1)SScsb eloszlása Fdfcsk, dfcsb

Szóráselemzés tábla v Ha elutasítjuk H 0 -t, akkor mely csoportok különböznek? A változékonyság

Szóráselemzés tábla v Ha elutasítjuk H 0 -t, akkor mely csoportok különböznek? A változékonyság négy lehetséges forrása ( 2 főhatás + kölcsönhatás + hiba) közül melyek hatnak és mennyire? v Megtehetjük, hogy mind a három lehetséges faktor (csoport tagság, nemek, kölcsönhatás) szerint szóráselemzést végzünk és ennek segítségével döntünk a ható faktorokról

Többváltozós szóráselemzés Multivariate ANOVA = MANOVA Most is azt vizsgáljuk, hogy egy bizonyos faktornak

Többváltozós szóráselemzés Multivariate ANOVA = MANOVA Most is azt vizsgáljuk, hogy egy bizonyos faktornak (körülménynek) van-e hatása a kimeneti változó (válasz) várható értékére, de a válasz most vektor értékű, tehát többféle mennyiséget mérünk v Ekkor nem szórásunk, hanem szórásmátrixunk van. v Ha a nullhipotézis fennáll, a csoportátlagokból számolt szórásmátrix becslés a teljes mintából számolt n-edrésze (+ a becslési ingadozás) v Ezért egyik szorozva a másik inverzével közel az egységmátrixot kell hogy adja - de ezt hogyan teszteljük? v

MANOVA próbák v A szorzatmátrix sajátértékeinek kell 1 -hez közelinek lennie v Ezt tesztelik

MANOVA próbák v A szorzatmátrix sajátértékeinek kell 1 -hez közelinek lennie v Ezt tesztelik a – Wilk – Lawley- Hotelling – Pillai – Roy próbák v Nincs közöttük egyenletesen legerősebb és ilyet nem is lehet konstruálni

Lineáris regresszió

Lineáris regresszió

A legkisebb négyzetek módszere Y 289. 931 12. 8776 1. 16013 X 59. 4174

A legkisebb négyzetek módszere Y 289. 931 12. 8776 1. 16013 X 59. 4174

Regresszió v Az Y eredményváltozó (függő változó) közelítése az X faktorokkal (magyarázó változók). Általában

Regresszió v Az Y eredményváltozó (függő változó) közelítése az X faktorokkal (magyarázó változók). Általában lineáris regressziót keresünk (ekkor a magyarázó változók lineáris függvényével közelítünk). v Azt az egyenest keressük, amelyre az egyenes által adott közelítés és a ténylegesen megfigyelt pontok közötti négyzetes eltérés minimális. A megoldás: v Ez a hatásos becslés is, ha a modellbeli hiba független, azonos, normális eloszlású.

A becslés standard hibája v A független, azonos, normális eloszlású hiba esetén sok minden

A becslés standard hibája v A független, azonos, normális eloszlású hiba esetén sok minden jól számolható, például az egyenes együtthatóinak standard hibája: ahol v Ebből a becsült regressziós együtthatók szignifikanciáját tpróbával vizsgálhatjuk.

Az illeszkedés mérőszáma v Ez igen lényeges, mert hiba lenne valójában nem illeszkedő modellből

Az illeszkedés mérőszáma v Ez igen lényeges, mert hiba lenne valójában nem illeszkedő modellből következtetéseket levonni. Az illeszkedés mérőszáma az R 2 statisztika, ill. ennek korrigált változata, (adjusted R 2) amikor a magyarázó változók számát is figyelembe vesszük.

„Lack of fit” teszt v Az illesztett regressziós egyenes, illetve az átlag, mint vízszintes

„Lack of fit” teszt v Az illesztett regressziós egyenes, illetve az átlag, mint vízszintes egyenes körüli szórásokat hasonlítjuk össze. A szórások egyezését F-próbával teszteljük. v Amennyiben a lineáris kapcsolat ténylegesen jelen van, úgy az egyenes körüli szórás kisebb, tehát a szórások egyezését elutasítjuk.