Sltumatud muutujad korreleeruvad omavahel tekib vimalus vahendatud korrelatsiooniks
Sõltumatud muutujad korreleeruvad omavahel - tekib võimalus “vahendatud korrelatsiooniks” - kinganumber ja tarbitud toit – teame, mis mõjutab; - kehasuurus ja mao suurus – ei tea, mis mõjutab; - kaks pidevat muutujat; - pidev ja kategooriline; - kaks kategoorilist - mittetasakaaluline ANOVA: mustad valged isased 20 vaatlust 2 vaatlust emased 3 vaatlust 24 vaatlust
Taime pikkus sõltuvana 1) temperatuurist; 2) niiskusest Mängime, et temperatuur ja niiskus korreleeruvad omavahel, nt elame kuskil kõrbe lõunaserval:
Ühekaupa asja uurides pole kahtlust, et taime pikkus sõltub niiskusest kui ka temperatuurist, aga kas niiskusel on sellist mõju, mis pole temperatuuri mõjuga seletatav? aga kas temperatuuril on sellist mõju, mis pole niiskuse mõjuga seletatav? . . paneme nad nüüd ühte ANOVA mudelisse sõltumatuteks muutujateks, aga mitu eri varianti. . SS jagamine….
Type I analüüs ehk type I sums of squares kannab kogu halli osa selle arvele, kes mudelis esimesena, hindab maksimaalset mõju; tesie faktori suhtes konservatiivne - mis “päriselt kindlasti tema oma”, hindab minimaalset mõju. Niiskus esimeseks: DF niiskus temperatuur Type I SS 1 1 2164 142 F P 32. 30 2. 13 0. 0023 0. 2045 . . ei saa väita, et temperatuuril oleks niiskusest sõltumatu mõju.
Temperatuur esimeseks: Source temperatuur niiskus DF 1 1 Type I SS 1886 420 F p 28. 1 6. 28 0. 0032 0. 0541 Ei saa ka väita niiskuse temperatuurist sõltumatut mõju (kuigi napilt), Ja nüüd type III – konservatiivne mõlema suhtes! DF temperatuur niiskus 1 1 Type III SS 142. 5 420. 8 F 2. 13 6. 28 P 0. 2045 0. 0541
Type I muutujate järjekord olulune, type III mitte! III tüüpi analüüsi oht - see ühine seletav jõud jääb leidmata! Tee enda jaoks mitut moodi, esita aga type III kui see peegeldab tõde adekvaatselt! Muidu pead seletama. Kui ei korreleeru (on tasakaaluline) siis pole vahet! Ka ühefaktorilise puhul mitte! Type II ja IV kah olemas. Väldi kui võimalik, aga alati ei saa!
Kovariatsioonanalüüs katses otsene ja kaudne mõju. Röövikute rühmas elamise mõju liblika viljakusele, kehakaalu kaudu või veel midagi? manipulatsioon: rühmas kasvatamine nuku kaal liblika viljakus Kaalu kaasamine kovariaadiks! Kovariaadi kaasamisel sisuline tähendus – küsimus muutub! Ära tee seda, kui kaalud treati väga erinevad!
Mitmene regressioon pikkus = 0, 597*temp + 0, 089*valgus + 0, 196*niiskus - 0. 12 Mittelineaarne regressioon y = sin(ax + c(log(x))bx - millist siis sobitame? - ette teada? - mida järeldame? - funktsiooni enda omadused, mitte andmete omad. - kirjeldamaks OK. Enamasti piisab, kui uurime, kas hälbib lineaarsusest. - kaasame ruutliikme: positiivne ja negatiivne; - sobitame parabooli.
II tüüpi regressioon: - kui tahame järeldada midagi tõusu väärtusest; - esimest tüüpi regressioon ennustamise tarbeks, mitte tõenäoseima seose hindamise tarbeks; - eri pidi ennustamiseks erinevad sirged! Võrrand ei sõltu sellest, kumb muutuja on kummal teljel! Geometric mean regression - mõlematpidi tõusude geomeetriline keskmine; - kui huvitab vaid seose olemasolu, pole vahet, milline regressioon!
-ANOVA variatsioonid: - hierahiline; - juhuslike faktoritega; - korduvmõõtmistega;
Hierarhiline ANOVA ühe faktori mõjudel “lubatakse” erineda teise faktori eri tasemetel - klass ja kool; üks faktor on teisele allutatud - nested. sulgudesse: B(A), klass(kool) Kas sabasule pikkus sõltub soost: tavaliselt: sugu liik DF Type III SS F 1 1 0. 333 0. 05 P 0. 82 aga nüüd sugu allutatud (. . . nested) liigile liik sugu(liik) 1 2 0. 333 40. 66 0. 16 9. 76 . . alampopulatsioonid, katsedisain, kovariaadid. . 69. 0071
Juhuslike faktoritega dispersioonanalüüs juhuslik (random) faktor on selline muutuja, mille katses esindatud tasemed on vaadeldavad valimina suurest tasemete populatsioonist. - pesakond Fikseeritute kõik tasemed on katses esindatud: - treatment; - sugu. Juhusliku puhul on juhuhajuvus mitmetasandiline: - üksikvaatluste hajuvus ümber pesakonna keskmise; - pesakondade hajuvus ümber pesakondade keskmise.
Uurime tamme lehe suuruse sõltuvust uurimisala temperatuurist. Millised on juhuslikud: - puu isend; - oks puus; - aastaaeg; - metsatukk; - biotoop (mets/ avamaa); - aasta. Võib sõltuda probleemipüstitusest: kas uurime erinevust just nende populatsioonide vahel või tahame tulemusi üldistada kõigile populatsioonidele. Kui on random, on üldistatav!
I ja II tüüpi ja mixed ANOVA ühefaktorilise puhul pole vahet; Kahefakroriline (üks juhuslik ja üks fixed) vahe on enamasti väike, kui koosmõjusid pole; koosmõjudega läheb vahe suureks! - 6 pesakonda, 2: 4, kuidas kogu populatsioonis? Ei tea. erinevus puudutab pigem just seda, mis ise pole juhuslik!
pesakond fikseeritud: Type 3 Tests of Fixed Effects Effect trea pesa trea*pesa Num DF 1 5 5 Den DF 24 24 24 F Value Pr > F 6. 10 23. 70 11. 12 0. 0211 <. 0001
pesakond juhuslik: Type 3 Tests Effect trea pesa trea*pesa Num DF Den DF 1 5 5 24 24 24 F Value 0. 55 2. 13 11. 12 Pr > F 0. 4924 0. 213 <. 0001
pesakond fikseeritud: Type 3 Tests of Fixed Effects Effect trea pesa trea*pesa Num DF Den DF 1 5 5 24 24 24 F Value 7. 76 12. 31 0. 39 Pr > F 0. 0103 <. 0001 0. 8486
pesakond juhuslik: Type 3 Tests Effect trea pesa trea*pesa Num DF Den DF 1 24 24 24 5 5 F Value 19. 74 31. 32 0. 39 Pr > F 0. 0067 0. 0009 0. 8486
- ei ole alati õiget ja valet; - peaks olema palju; - peab ikka grupeerima üksikvaatlusi, mitte vaatlus ise olema!
Korduvmõõtmistega ANOVA - ühte isendit (või muud asja) on mõõdetud mitu korda; Ei tohi tavaliselt: - hindame vabadusastmeid üle – pseudoreplikatsioonid!; - ei võta individuaalsust arvesse. Mõlema vastu aitab REPEATED measurements ANOVA: 1. Sõltuvate valimite t-test 2. Täide kaalu sõltuvus karu karvkatte paksusest. 3. Linde söödetakse eri taimedega ja uuritakse parasiitide ohtrust, iga lindu neli korda mõõdetakse, time*trea koosmõju huvitab.
- Slides: 25