ANALZA ROZPTYLU PREDNKA 6 p o je ANOVA

  • Slides: 30
Download presentation
ANALÝZA ROZPTYLU

ANALÝZA ROZPTYLU

PREDNÁŠKA 6 p Čo je ANOVA, základné pojmy p Hypotézy pri ANOVA p Model

PREDNÁŠKA 6 p Čo je ANOVA, základné pojmy p Hypotézy pri ANOVA p Model ANOVA p Jednofaktorová ANOVA - vyvážený pokus p Prijatie rozhodnutia v ANOVA p Predpoklady ANOVA p Metódy viacnásobného porovnávania p Jednofaktorová ANOVA - nevyvážený pokus p Dvojfaktorová ANOVA - bez opakovania 2

Čo je ANOVA n n analysis of variance - analýza rozptylu ¨ metóda na

Čo je ANOVA n n analysis of variance - analýza rozptylu ¨ metóda na porovnávanie stredných hodnôt (priemerov) niekoľkých ZS ¨ hľadanie rozdielov medzi priemermi sa zakladá na analýze rôznych foriem rozptylu praktické využitie ¨ počet predaných výrobkov v závislosti od umiestnenia výrobku v regáli, atď. 3

Čo je ANOVA n n V praxi sa AR používa vtedy, ak skúmame vplyv

Čo je ANOVA n n V praxi sa AR používa vtedy, ak skúmame vplyv jedného, resp. viacerých faktorov (ošetrení) na skúmaný štatistický znak Faktory budeme označovať A, B, …a v AR ich budeme zohľadňovať len ako kvalitatívne znaky s rôznymi obmenami - úrovňami faktora výsledný štatistický znak bude kvantitatívny a označíme ho Y najčastejšie sa AR používa pri vyhodnocovaní biologických experimentov 4

Čo je ANOVA n Úrovňou faktora budeme označovať: určité množstvo kvantitatívneho faktora, napr. množstvo

Čo je ANOVA n Úrovňou faktora budeme označovať: určité množstvo kvantitatívneho faktora, napr. množstvo dávok čistých živín pri hnojení, rôzne príjmové skupiny domácností, ¨ určitý druh kvalitatívneho faktora, napr. rôzne odrody tej istej plodiny, spôsoby umiestnenia výrobkov v predajni, ¨ n n AR je zovšeobecnením Studentovho t-testu pre nezávislé výbery AR zároveň skúma vplyv kvalitatívneho faktora (faktorov) na výsledný kvantitatívny znak - teda analyzuje vzťahy medzi znakmi 5

Čo je ANOVA n n v praxi sa ANOVA používa vtedy, ak skúmame vplyv

Čo je ANOVA n n v praxi sa ANOVA používa vtedy, ak skúmame vplyv jedného, resp. viacerých faktorov (ošetrení) na skúmaný štatistický znak pojmy ¨ skúmaný štatistický znak n výsledný kvantitatívny znak n napr. počet predaných výrobkov ¨ faktor n je kvalitatívna (kvantitatívna) premenná jednotlivé obmeny sa nazývajú úrovne faktora n napr. umiestnenie tovaru hore, v strede, resp. dolu v regáli n 6

Čo je ANOVA n rozdelenie: v 1. podlľa počtu skúmaných faktorov: jednofaktorová ANOVA -

Čo je ANOVA n rozdelenie: v 1. podlľa počtu skúmaných faktorov: jednofaktorová ANOVA - skúmame vplyv jedného faktora na kvantitatívnu premennú 2. viacfaktorová ANOVA - skúmame vplyv viacerých faktorov na kvantitatívnu premennú v podľa toho, či majú jednotlivé skupiny rovnaký rozsah n vyvážená ANOVA – rovnaký počet opakovaní nevyvážená ANOVA – rozdielny počet opakovaní 1. 2. 7

Čo je ANOVA n pri ANOVA porovnávame priemerné hodnoty kvantitatívnej premennej pri rôznych úrovniach

Čo je ANOVA n pri ANOVA porovnávame priemerné hodnoty kvantitatívnej premennej pri rôznych úrovniach faktora ¨ napríklad porovnávame n priemerné výdavky obyvateľov so základným vzdelaním, priemerné výdavky stredoškolsky vzdelaného obyvateľstva, priemerné výdavky vysokoškolsky vzdelaného obyvateľstva 1 2 3 8

Schéma jednofaktorového experimentu “vyvážený pokus” riadkový súčet opakovania A 1 Úrovne 2 faktora …

Schéma jednofaktorového experimentu “vyvážený pokus” riadkový súčet opakovania A 1 Úrovne 2 faktora … i … m 1 y 11 y 21 yi 1 ym 1 2… j… y 12 y 1 j y 22 y 2 j ………. . yi 2 yij ………. . ym 2 ymj priemer n y 1 n y 2 n Yi. Y 1. Y 2. yi. y 1. y 2. yin Yi. ymn Ym. ym. Y. . y. . Celkový súčet celkový priemer 9

Model pre výslednú napozorovanú hodnotu: kde i = 1, 2, …, m j =

Model pre výslednú napozorovanú hodnotu: kde i = 1, 2, …, m j = 1, 2, …, n Kde: - očakávaná hodnota pre všetky úrovne faktora a napozorované hodnoty, i - efekt i-tej úrovne faktora A eij - náhodná chyba, ktorou je každé meranie zaťažené, resp. výsledok vplyv náhodných činiteľov 10

Hypotézy pri ANOVA alebo Nulovú hypotézu potom môžeme formulovať aj nasledovne: Ho : 1

Hypotézy pri ANOVA alebo Nulovú hypotézu potom môžeme formulovať aj nasledovne: Ho : 1 = 2 =… i = m = 0 t. j. že efekty všetkých úrovni faktora A sú nulové, teda nepreukazné, oproti alternatívnej hypotéze H 1: i 0 pre aspoň jedno i (i = 1, 2…m) efekt i aspoň jednej i - úrovne faktora je preukazný, významne odlišný od nuly 11

Hypotézy pri ANOVA Odhadmi jednotlivých parametrov sú nasledovné výberové charakteristiky: čo môžeme prepísať: 12

Hypotézy pri ANOVA Odhadmi jednotlivých parametrov sú nasledovné výberové charakteristiky: čo môžeme prepísať: 12

Model ANOVA n Typy variability ¨ celková variabilita n ¨ variabilita medzi skupinami (triedami)

Model ANOVA n Typy variability ¨ celková variabilita n ¨ variabilita medzi skupinami (triedami) n ¨ na koľko sa odchyľujú skupinové priemery od celkového priemeru variabilita vnútri skupín n ¨ na koľko sa odchyľujú konkrétne hodnoty v skupinách od celkového priemeru na koľko sa odchyľujú konkrétne hodnoty v skupinách od ich skupinového priemeru čím väčšia je variabilita medzi s variabilitou vnútri skupín, tým väčší je účinok faktora variabilita skupinami v porovnaní medzi skupinami celková variabilita vnútri skupín 13

Princíp ANOVY Podstata analýzy rozptylu spočíva v rozklade celkovej variability výsledného skúmaného znaku Sc

Princíp ANOVY Podstata analýzy rozptylu spočíva v rozklade celkovej variability výsledného skúmaného znaku Sc Celková variabilita S 1 Variabilita medzi úrovňami faktora, spôsobená pôsobením faktora A, “variabilita medzi triedami, riadkami” Sr Variabilita náhodná, reziduálna, “vo vnútri tried 14

Model ANOVA n Ako zistiť vplyv faktora ¨ náhodným výberom z každého vytvoríme výberový

Model ANOVA n Ako zistiť vplyv faktora ¨ náhodným výberom z každého vytvoríme výberový súbor ¨ potom môžeme vypočítať priemer jednotlivých výberových súborov n celkový priemer n 15

Model ANOVA n Typy variability skupinový priemer variabilita vnútri skupín celkový priemer variabilita medzi

Model ANOVA n Typy variability skupinový priemer variabilita vnútri skupín celkový priemer variabilita medzi skupinami celková variabilita 16

Prijatie rozhodnutia v ANOVA variabilita medzi skupinami suma štvorcov medzi úrovňami priemerná suma štvorcov

Prijatie rozhodnutia v ANOVA variabilita medzi skupinami suma štvorcov medzi úrovňami priemerná suma štvorcov medzi úrovňami variabilita vo vnútri skupín suma štvorcov náhodnej chyby priemerná suma štvorcov náhodnej chyby celková variabilita celková suma štvorcov n =F Testovacia štatistika (F) porovnáva variabilitu medzi skupinami a variabilitu vo vnútri skupiny ¨ čím väčšia je variabilita medzi skupinami ¨ tým je vplyv faktora väčší n tým sú väčšie rozdiely medzi skupinovými priemermi n tým viac dôkazov máme prijatie alternatívnej hypotézy n 17

Výsledná tabuľka ANOVY ANOVA Variabilita medzi triedami Reziduálna variabilita Celková variabilita 1 Súčet štvorcov

Výsledná tabuľka ANOVY ANOVA Variabilita medzi triedami Reziduálna variabilita Celková variabilita 1 Súčet štvorcov odchýlok 3 2 Stupne Priemerný voľnosti štvorec (1/2) m-1 S 1 m. (n – 1) 4 F-krité rium s 12 sr 2 Sr Sc N-1= m. n-1 18

Prijatie rozhodnutia v ANOVA n Ak F vyp F. ((m-1, (N-m)) Ho zamietame, v

Prijatie rozhodnutia v ANOVA n Ak F vyp F. ((m-1, (N-m)) Ho zamietame, v takom prípade je aspoň efekt jednej úrovne faktora preukazný, teda priemerná úroveň ukazovateľa sa štatisticky významne líši od ostatných. resp. aspoň jeden efekt i Ak je F vyp F Ho nezamietame štatisticky významne odlišný od nuly. obor prijatia Ho F obor zamietnutia H 0 kritický obor, 19

Metódy viacnásobného porovnávania n Ktoré priemery sú významne rozdielne? ¨ použijeme test kontrastov n

Metódy viacnásobného porovnávania n Ktoré priemery sú významne rozdielne? ¨ použijeme test kontrastov n testy, ktoré robia dve alebo viac porovnaní medzi tromi alebo viacerými priemermi n veľký počet Tukeyho test ¨ Duncanov test ¨ Scheffeho test ¨ 20

Predpoklady ANOVA n Nezávislosť výberových súborov ¨ n Normalita ¨ n štatistická nezávislosť náhodných

Predpoklady ANOVA n Nezávislosť výberových súborov ¨ n Normalita ¨ n štatistická nezávislosť náhodných chýb eij výbery pochádzajú z normálnych rozdelení, narušenie tohto predpokladu nemá podstatnejší vplyv na výsledky AR Homoskedasticita -zhodné reziduálne rozptyly 12 = 22 = …. = 2 , t. j. D(eij) = 2 21

Jednofaktorová ANOVA – nevyvážený pokus Úrovne faktora A 1 2 … i … m

Jednofaktorová ANOVA – nevyvážený pokus Úrovne faktora A 1 2 … i … m riadkový súčet priemer Rôzny počet opakovaní 1 2… j … ni y 11 y 12 y 1 j. . . n 1 y 22 y 2 j. . . n 2 ………. . yi 1 yi 2 yij. . . ni ………. . ym 1 ym 2 ymj. . . nm Kde Yi. Y 1. Y 2. yi. y 1. y 2. Yi. yi. Ym. ym. Y. . y. . celkový priemer 22

Jednofaktorová ANOVA – nevyvážený pokus 3 ANOVA Variabilita medzi triedami Reziduálna variabilita Celková variabilita

Jednofaktorová ANOVA – nevyvážený pokus 3 ANOVA Variabilita medzi triedami Reziduálna variabilita Celková variabilita 2 1 Súčet štvorcov Stupne Priemerný voľnosti štvorec odchýlok (1/2) m-1 s 12 N-m sr 2 S 1 4 F-krité rium Sr N-1 S 23

Dvojfaktorová ANOVA – bez opakovania n n Uvažujme vplyv faktora A, ktorý skúmame na

Dvojfaktorová ANOVA – bez opakovania n n Uvažujme vplyv faktora A, ktorý skúmame na m - úrovniach, i = 1, 2, …. , m ďalej uvažujme faktor B, ktorý sledujeme na n - úrovniach , j = 1, 2, …, n na každej i-tej úrovni faktora A a j-tej úrovni faktora B máme len jedno pozorovanie (opakovanie) yij overujeme tak vplyv dvoch nulových hypotéz 24

Dvojfaktorová ANOVA – bez opakovania Schéma dvojfaktorového experimentu s jedným pozorovaním v každej podtriede

Dvojfaktorová ANOVA – bez opakovania Schéma dvojfaktorového experimentu s jedným pozorovaním v každej podtriede A 1 2 m-úrovní … faktora A i … m B n-úrovní faktora B 1 y 11 y 21 yi 1 ym 1 Y. 1 Stĺpcové súčty stĺpcové priemery y. 1 2 … j … y 12 y 1 j y 22 y 2 j ………. . yi 2 yij ………. . ym 2 ymj riadkové yi. súčty n y 1 n y 2 n Yi. Y 1. Y 2. yin Yi. ymn Ym. ym. Y. 2. . . Y. j. . . Y. 1 y. 2. . . y. j. . . y. 1 Y 1. y 2. Riadkové priemery Y. . y. . celkový priemer 25

Dvojfaktorová ANOVA – bez opakovania Model pre skúmaný znak môžeme zapísať Overujeme platnosť dvoch

Dvojfaktorová ANOVA – bez opakovania Model pre skúmaný znak môžeme zapísať Overujeme platnosť dvoch nulových hypotéz Hypotéza pre faktor A: Ho 1: 1 = 2 =… i = m = 0 t. j. že efekty všetkých úrovni faktora A sú nulové, teda nepreukazné, oproti alternatívnej hypotéze H 11 : i 0 pre aspoň jedno i (i = 1, 2…m) efekt i aspoň jednej i - úrovne faktora je preukazný, významne odlišný od nuly 26

Dvojfaktorová ANOVA – bez opakovania Hypotéza pre faktor B: Ho 2: 1 = 2

Dvojfaktorová ANOVA – bez opakovania Hypotéza pre faktor B: Ho 2: 1 = 2 =… j = n = 0 t. j. že efekty všetkých úrovni faktora B sú nulové, teda nepreukazné, oproti alternatívnej hypotéze H 12 : j 0 pre aspoň jedno j (j = 1, 2…m) efekt j aspoň jednej j - úrovne faktora B je preukazný, významne odlišný od nuly 27

Dvojfaktorová ANOVA – bez opakovania DAR Variabilita medzi riadkami 1 Súčet štvorcov odchýlok S

Dvojfaktorová ANOVA – bez opakovania DAR Variabilita medzi riadkami 1 Súčet štvorcov odchýlok S 1 Variabilita medzi stĺpcami S 2 Reziduálna variabilta Sr Celková variabilita Sc 2 Stupne voľnosti 3 4 Priem. štvorec (1/2) F-kritérium m-1 s 12 n-1 s 22 (m-1)(n-1) sr 2 m. n -1 28

Dvojfaktorová ANOVA – bez opakovania Rozklad celkovej variability skúmaného znaku: Sc= S 1 +

Dvojfaktorová ANOVA – bez opakovania Rozklad celkovej variability skúmaného znaku: Sc= S 1 + S 2 + S r Variabilita medzi riadkami, vplyv faktora A Variabilita medzi stĺpcami, vplyv faktora B Reziduálna variabilita Celková variabilita 29

ĎAKUJEM ZA POZORNOSŤ 30

ĎAKUJEM ZA POZORNOSŤ 30