Univerzitet u Beogradu Filozofski fakultet MULTIVARIJACIONE METODE MANOVA
Univerzitet u Beogradu Filozofski fakultet MULTIVARIJACIONE METODE MANOVA MULTIVARIJACIONA ANALIZA VARIJANSE Oliver Tošković
ANALIZA VARIJANSE • ANOVA (Analysis of Variance) • Faktorijalni nacrt • 1 ili više kategoričkih varijabli sa 2 ili više nivoa (grupa) – nezavisne • 1 numerička varijabla – zavisna
Suma kvadriranih odstupanja - total Suma kvadriranih odstupanja – između grupa F test: Odnos EFEKATA i GREŠKE Suma kvadriranih odstupanja – unutar grupa Intenzitet: kolike su razlike
MULTIVARIJACIONA ANALIZA VARIJANSE • MANOVA • Faktorijalni nacrt • 1 ili više kategoričkih varijabli sa 2 ili više nivoa (grupa) – nezavisne • 2 ili više numeričkih varijabli – zavisnih
MANOVA • Teorijski konstrukt je razvio Samual S. Wilks 1932. godine • proširenje ANOVA-e ako su ZV povezane • MANOVA pokazuje: • da li se grupe definisane NV razlikuju na linearnoj kombinaciji ZV • Ima li interakcije nezavisnih varijabli u pogledu linearnog kompozita ZV • Da li su značajni univarijatni efekti NV na svaku ZV
Linearni kompozit • Varijable– sastojci • Ponderi određuju količinu sastojaka b 1* b 0 b 2* + b 1*x 1 + b 2*x 2. . = y b 1* b 2*
MANOVA • u ANOVA-i: SS kao skalarna veličina • u MANOVA-i: SSCP – matrica suma kvradrata i kros produkata – uzimaju se u obzir korelacije između ZV – detrminante SSCP matrica su zbirni indeksi varijansi – kao prosečno kvadrirano odstupanje (varijansa) u ANOVA-i
MANOVA Exper Kontrol Blaga MZ Srednja MZ Teška MZ Y 1 Y 2 115 108 100 105 89 78 98 105 95 100 85 107 98 95 98 90 95 90 92 70 80 65 62 85 95 85 68 80 70 80 81 78 82 72 73
Y 111= D 1= T 1= 115 98 107 108 105 98 95. 83 D 2= 96. 50 99, 89 T 2= 96. 33 GM= Y 111 - GM= 88. 83 D 3= 88 82. 67 77. 17 prosečne vrednosti E i K grupe veliki prosek na Y 1 i Y 2 78. 33 78. 11 89. 11 87. 22 115 89. 11 25. 89 108 87. 22 20. 75 (Y 111 - GM)* (Y 111 - GM)’ = 25. 89 20. 75 prosečne vrednosti zaostalosti 25. 89 20. 75 670. 29 537. 99 431. 81
S D= SD*T= 570. 29 761. 72 1126. 78 2. 11 5. 28 52. 78 SD*T+Sw= ST = S w= 2090. 89 1767. 56 1494. 22 544 31 31 539. 33 2. 11 5. 28 544 31 546. 11 36. 28 52. 78 31 539. 33 36. 28 592. 11
SD*T+Sw= 2. 11 5. 28 544 31 546. 11 36. 28 52. 78 31 539. 33 36. 28 592. 11 546. 11 [SD*T+Sw] - determinanta 36. 28 592. 11 • Deljenjem sumi kvadrata sa df – varijansa • Deljenjem krosprodukata sa df – kovarijansa • Determinanta – analog varijanse • ANOVA testira odnose varijansi • MANOVA testira odnose determinanti
n – broj ispitanika u svakoj grupi p – broj zavisnih varijabli veličina efekata
MANOVA • Koristi se kada su ZV umereno korelisane – Ako su korelacije između ZV niske – teško je naći linearni kompozit, nizak komunalitet – Ako su korelacije između ZV jako visoke – prva ZV pokupi svu značajnu varijansu • “Zbog povećanja složenosti i dvosmislenosti rezultata MANOVA-e, najbolje preporuka je: Izbegnite je kad god možete. " (Tabachnick & Fidell, 1983, p. 230)
ANOVA vs MANOVA • ANOVA ne uzima u obzir složaj korelacija između ZV • ANOVA može pokazati da nema razlika dok ih u MANOVA može biti • MANOVA je osetljiva ne samo na razlike proseka već i na smer i intenzitet korelacija ZV
ANOVA vs MANOVA razlike distribucija na svakoj od ZV (Y) kao da ne postoje razlike na kombinaciji ZV su uočljive – razlike između elipsi
ANOVA vs MANOVA • Linearni kompozit čini razlike između grupa najvišim mogućim • Linearni kompozit je ona kombinacija ZV na kojoj se grupe najviše razlikuju
ANOVA vs MANOVA • MANOVA povećava verovatnoću dobijanja razlika • MANOVA smanjuje porast greške tipa I – nivo značajnosti 0. 05 – veliki broj poređenja (pojedinačne ANOVA-e) – porast verovatnoće da odbacimo tačnu Ho
MANOVA PRETPOSTAVKE • Veličina uzorka – u svakoj grupi N veće od broja ZV – 10 ispitanika minimum za svaku ZV • Normalnost raspodele – multvarijatna normalnost , svaka kombinacija ZV ima normalnu raspodelu u svakoj od grupa – univarijatne normalnosti, svaka ZV ima normalnu raspodelu u svakoj od grupa • Linaernost – linearna povezanost svih parova ZV
MANOVA PRETPOSTAVKE • Homogenost matrice kovarijansi i varijansi – Leveneov test (p>0. 05) – Boxov M test (p>0. 05) – slična povezanost ZV na svim nivoima NV – Ako su jednake grupe i veliki uzorak, a značajnost jako ispod nivoa, nije veliki problem • Multikolinearnost i singularnost – srednje korelacije: ne preko 0. 7 (multikolinearnost) ili ispod 0. 3 (singularnost) • Outlier
MANOVA PRETPOSTAVKE NV ZV 4 ZV 1 ZV 3 ZV 2 • ZV 2 – suvišna, pokriva isti varijabilitet koji je već pokriven preostalim ZV • ZV 2 – potencijalni kovarijat
MANOVA PRETPOSTAVKE • Samo za MANCOVA: – homogenost regresije – jednake korelacije svake ZV sa kovarijatom, u svakoj grupi
Multivarijatni testovi • Karakteristični koren λ (svojstvena vrednost matrice, eignevalue) i karakteristični vektor x (eigenvektor) • U matrici interkorelacija – broj za koji umanjene i pomnožene korelacije varijabli po jednoj dijagonali postaju jednak umnošku korelacija po drugoj dijagonali – determinanta sa najvišom eigenvalue sadrži najviše korelacije a 11 a 21 a 12 a 22 a 11 - a 12 a 21 a 22 -
Multivarijatni testovi • Roy-ev max karakteristični koren (eigenvalue) – razlike samo na prvoj linearnoj kombinaciji – osetljiv na kršenje uslova • Wilksova Lambda – razlike na svim linearnim kombinacijama (karakterističnim korenovima) – odnos determinante greške i determinante “totala” (zbira efekata i greške) – procenat neobjašnjenog efekta – što je manji, to je veći efekat
Multivarijatni testovi • Hotellingov trag – razlike na svim linearnim kombinacijama • Pillaijev trag – razlike na svim linearnim kombinacijama – robustniji od lambde, koristi se za male uzorke, nejednake grupe ili nejednake kovarijanse u grupama • Statistička snaga – Pillai > Wilks > Hotelling > Roy • U većini slučajeva svi daju sličan rezultat!
MANOVA - nedostaci • Linearne kombinacije (diskriminantne funkcije) je teško interpretirati • napravljene su da razlikuju grupe a ne konceptualno • Ima puno uslova koje je teško postići • Kako izbeći MANOVA-u – Faktorskom analizom izdovijiti kombinacije ZV pa raditi ANOVA-e
LITERATURA • Howel, D. C. (1997). Statistical methods for psychology (4 th ed. ). Pacific Grove, CA: Duxbury. • Tabachnick, G. Fidell, L. (2007). Using Multivariate Statistics (5 th ed. ). Pearson Education, Inc: Boston.
- Slides: 26