Hipotzis vizsglatok Debrecen 2008 A normlis eloszls mint
Hipotézis vizsgálatok Debrecen 2008
A normális eloszlás mint modell n Ez a modell jól leírja a mérési értékeknek a középérték (várható érték) körüli szóródását. n Jelölése N(μ, σ). (μ = elméleti középérték, σ = elméleti szórás). Standard normális eloszlás: N(0, 1)
Hisztogram
Sűrűségfüggvény
Középérték és szórás n Számtani közép n Szórás
Variancia gyakorlati meghatározása Előnye: Csak az x és x négyzetet kell tárolni és összegezni
Normáleloszlásfüggvénye
Eloszlásfüggvény
Standardizálás
Standard normáleloszlás sűrűségfüggvénye μ , medián, módusz
Standard normális eloszlás sűrűségfüggvénye
Standard normáleloszlásfüggvénye
Standard normális eloszlásfüggvénye
A normál eloszlás nevezetes értékei α% μ±σ 5 1, 96 1 2, 58 0, 1 3, 29
Standard normáleloszlás 95%-os valószínűségei
A középérték megbízhatósági tartománya Ismert σ: Ismeretlen σ:
Az eloszlás alakjának jellemzése Ferdeség (skewness, normális eloszlás=0 körüli érték) n Csúcsosság (kurtosis, normális eloszlás=0 körüli érték) n
Jobbra és balra ferde eloszlás
Csúcsos és lapos eloszlás
Kolmogorov-Smirnov teszt
Kolmogorov-Smirnov teszt eredménye
Egyéb normalitás vizsgálat n Kolmogorov-Smirnov és Shapiro-Wilk próba
Grafikus normalitás vizsgálat 1.
Grafikus normalitás vizsgálat 2.
A statisztikai próba 1. n n n A munka-hipotézisek (Ha) nem igazolhatók közvetlen úton Ellenhipotézis, null hipotézis felállítása (H 0): μ 1= μ 2, vagy μ 1 - μ 2=0 A munka-hipotézist indirekt módon bizonyítjuk A minta a nullhipotézist alátámasztja-e? Az olyan eljárást, amelyik a minták alapján dönt, statisztikai próbának nevezik Próbafüggvény előállítása
A statisztikai próba 2. n A próbafüggvény kiszámított értékéhez megadható egy P, valószínűségi érték. Ez megadja, hogy milyen valószínűséggel várható a próbafüggvénynek a kiszámítottal azonos vagy annál nagyobb értéke, ha a nullhipotézis igaz, azaz μ 1= μ 2
Két középérték különbségének tesztelése Feltételek: n Független minták n Normális eloszlásúak n Azonos szórás
Két normál eloszlású, független minta különbségének szórása
Elsőfajú hiba n n n (H 0): μ 1= μ 2, vagy μ 1 - μ 2=0 igaz A minta alapján elvetjük a nullhipotézist, tévesen valódi különbséget állapítunk meg Mi ennek a valószínűsége? α (alfa), melyet a statisztikai próba elvégzése előtt kell megválasztani Szokásos értékei: 10; 5; 1; ritkán 0, 1%
Másodfajú hiba n n (Ha): μ 1 nem egyenlő μ 2, vagy μ 1 - μ 2 nem egyenlő 0 igaz A minta alapján megtartjuk a nullhipotézist, tévesen egyformaságot állapítunk meg Mi ennek a valószínűsége? β (béta), melynek értékét csak a statisztikai próba elvégzése után lehet meghatározni
A döntés és az elkövethető hibák
A statisztikai próba ereje A valódi különbség kimutatásának valószínűsége n P=1 - β n n n Gyakorlatilag egy igaz munkahipotézis vagy alternatív hipotézis elfogadásának valószínűsége Minél kisebb az α, annál ritkább, hogy H 0 -t tévesen elutasítjuk, de annál gyakoribb, hogy H 0 -t tévesen elfogadjuk (másodfajú hiba)
29, 5% 6, 2% 1, 96 Alfa és béta hiba 95% -4 -2 0 2 4 6 8 10
Egymintás t-teszt n n Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum nagyságát is. H 0 : 1 = 0 n Feltétel: n Próbastatisztika: (DF = n-1 ) – Normális eloszlású populáció, szigma ismeretlen és n>30.
Az első- és másodfajú hiba csökkentése Minta elemszámának növelése n Pontosabb mintavételezés (szórás csökken) n Lehet-e az első- és másodfajú hibát nullára csökkenteni? n NEM n A véletlen hatásokat nem tudjuk kiiktatni n
Kétmintás t-teszt (szórás azonos) n n n Származhat-e a két független megfigyelés, minta azonos középértékű populációból? H 0 : 1 = 2 Próbastatisztika: (DF = n 1 + n 2 – 2)
Kétmintás t-teszt (nem azonos szórás) n Ha a két csoport szórása szignifikánsan különbözik, ilyenkor a két összehasonlítandó csoport varianciáját súlyozni kell a variancia becsléséhez (separate variancia). A módosított variancia becslés az alábbi: n A próba valószínűségi változója ebben az esetben nem teloszlású, ezért nem a t-táblázatot, hanem a Bonferronimódosított szignifikancia értékeket kell használni a középértékek különbözőségének elbírálásakor
Párosított t-próba n n Két összefüggő minta középértékének összehasonlítására szolgál H 0: dátlag = 0 n Próbastatisztika: (DF = n 1 – 1) n sd a párosított minták különbségének szórása, becslése a minta alapján
Párosított t-próba eredmény táblázatai
Megfigyelések száma középérték különbségek becslésére ahol n 1 = n 2 = n z = az elsőfajú hiba kritikus értéke az adott szignifikancia-szinten (kétoldali szimmetrikus) z = a másodfajú hiba kritikus értéke az adott szignifikancia-szinten (egyoldali) s 2 = a minták varianciája h 2 = a tényleges különbség négyzete LOTHAR SACHS, 1985
Megfigyelések száma középérték különbségek becslésére Excelben
Lineáris modell yij = + i + eij ahol: yij i eijk a függő változó értéke a kísérlet főátlaga, fix hatás hiba, vagy eltérés
A variancia-analízis alkalmazásának feltételei a sokaság elemei függetlenek legyenek egymástól n csak normális eloszlású sokaságok hasonlíthatók össze n a sokaságok szórásai a mintán belül egyformák n
Mikor szignifikáns az Fpróba? n Ha létezik legalább egy szignifikáns kontraszt a csoportok között.
Kontrasztok n A kontrasztok az egyes csoportok várható értékeinek lineáris kombinációi g = cg 1 x 1. + cg 2 x 2. +. . . + cgpxp. és ha teljesül a cg 1 + cg 2 +. . . cgp = 0
A kísérlet n Megfelelő elméleti megalapozás után kialakított elgondolás, következtetés helyes vagy helytelen voltának mérésekkel történő ellenőrzése.
Kísérletek csoportosítása Kísérletek Egytényezős kísérletek Kéttényezős kísérletek Három- és többtényezős kísérletek Teljesen véletlen elrendezés Véletlen blokk elrendezés Osztott parcellás (split-plot) Kétszeresen osztott parcellás (split-spit -plot) Nemteljes blokkelrendezés (nagy kezelés szám esetén, 25 -ön felül) Sávos elrendezés Latin négyzet Kiegyensúlyozott elrendezés Nem kiegyensúlyozott elrendezés
Egytényezős véletlen blokk elrendezés Műtrágyázás 3 5 1 2 IV. 5 4 2 3 1 III. 3 5 1 2 4 II. 1 2 3 4 5 I. ismétlés 4
Kéttényezős sávos elrendezés I. ismétlés A B II. ismétlés C B 1 3 2 A C
Kéttényezős osztott parcellás elrendezés (split-plot) I. ismétlés Osztó terület A B C 1 2 3 2 1 1 3 3 2 Fő parcella B A C Osztó terület Fő parcella II. ismétlés 3 2 1 1 3 2 2 1 3
Háromtényezős kétszeresen osztott parcellás elrendezés (split-plot) I. ism. Fő parcella Osztó terület A II. ism. B B A 1 2 2 1 1 2 a d c b a d b b d a b b c c a d c c d a b c d a Osztó területek
A pontosság fokozása n a kísérlet pontosabb kivitelezésével n az ismétlésszám növelésével n a parcellák csoportosításával, blokkképzéssel
Torzítás n n randomizáció az adott kísérleti elrendezésnek és elméleti modellnek megfelelő statisztikai értékelés (Sváb, 1981)
- Slides: 53