Analsid diskreetsete muutujatega Andmed tekivad loendamise mitte mtmise
- Slides: 17
Analüüsid diskreetsete muutujatega Andmed tekivad loendamise, mitte mõõtmise teel. Ära hakka jõuga allutama pidevate muutujate meetoditele! Ühemõõtmeline sagedustabel, siin 1 x 2, lahtrite arv reas ei mõjuta mõõtmelisust. Ühemõõtmelise puhul testime klasside arvukuse suhte erinemist etteantust, 1: 1 või muu: erineb 1: 1 st: ( = 19, 9; p<0, 0001), ei erine 0, 6: 0, 4 -st, ( = 0, 59; p=0, 44)
Kahemõõtmeline sagedustabel: uurime seost kahe muutuja vahel: enne mõtleme, mida tähendab, et seost ei ole.
Arvutame äärejaotused: seos puudub kui lahtrite sagedused on rea ja veeru sagduste korrutised
Sama absoluutarvudega: Oodatavad sagedused juhuks, kui samade äärejaotuste korral seost poleks, sellises tabelis pole soo ja värvi vahel assotsiatsiooni (mitte korrelatsioon!), tabel on homogeenne.
Hii-ruut-test kahemõõtmelises tabelis testib reaalse tabeli erinevust sellisest samade äärejaotustega tabelist, milles seos puudub. - seega eri asja kui ühemõõtmelises, st assotsiatsiooni olemasolu.
Kahemõõtmeline sagedustabel: uurime seost kahe muutuja vahel: Kahe muutuja vahel on seos, ehk statistiliselt oluline assotsiatsioon, ( = 85, 0; p<0, 0001). Seose tugevust väljendab riskide suhe (odds ratio): (59/103)/(155/28) = 0, 103: musta “risk” olla emane on väiksem.
Odds ratio (riskide suhe) iseloomustab homogeensusest hälbimust, Asi on sama, sõltumata sellest, kumba pidi vaadata, sest: (a/b)/(c/d) = (a/c)/(b/d) = ad/cb kui seost pole, on odds ratio 1, ühe arvuga saab iseloomustada vaid 2 x 2 tabeli puhul. Loomulikult ei pea kõik arvud võrdsed olema, ka siin ei ole: 200 100 50 25
Hii-ruut-testi eeldus: ühegi lahtri oodatav sagedus ei tohi olla alla ühe ja selliseid lahtrid, mille oodatav sagedus on alla viie, ei tohi olla üle 20%.
Eelduste suhtes on vähem tundlik analoogiline G-test, üldse pole tundlik Fisheri test, viimast saab aga vaid erijuhul kasutada, kui äärejaotused on kontrollitavad: - vaid 2 x 2 tabelis.
Kolmemõõtmeline sagedustabel - risttahukas; : 37 39 34 43
Kolmemõõtmeline sagedustabel hii-ruuduga - kas seos on või mitte, aga sellest vähe! Log-lineaarne analüüs ja interaktsioonid:
sugu*para: jaotus parasiteerituteks ja mitteparasiteerituteks pole soost sõltumatu; jaotus emasteks ja isasteks pole parasiteeritusest sõltumatu; sugu*para*aasta: 1) seos aasta ja parasiteerituse vahel pole soost sõltumatu; 2) seos soo ja aasta vahel pole parasiteeritusest sõltumatu; 3) seos soo ja parasiteerituse vahel pole aastast sõltumatu. Puudub jaotus sõltuvaks ja sõltumatuks muutujaks! Seepst pole sageli asjalik - mõttetult keeruline sugu*aasta ei pruugi üldse huvitada!
Enamasti huvitab vaid jaotus ühe tunnuse järgi, seda uurimegi, võtame sõltuvaks muutujaks, ülejäänud sõltumatud! Kui binaarne (kaheväärtuseline) - logistiline regressioon! P=exp(bx+k)/(1+exp(bx+k)) log(P/(1 -P) = bx+k; logit(P) = bx + k.
P=exp(bx+k)/(1+exp(bx+k)) parameetrite tõlgendus (y=0. 5 kohal –k/b):
General linear models (ANOVA, ANCOVA. . ) ja generalized linear model – muud jaotused, võimaldab teha samu asju: - kaasata mitu sõltumatut muutujat; - kaasata interakstioone; - nested, repeated, random. aga palju noorem – pole veel alati programmides; lisaks binaarsele muutujale vaatleme ühte erijuhtu – Poissoni jaotusega muutujat.
Loendamise teel saadud väärtus: - putukaid taimel; kui vähe - diskreetne; kui palju - pidev; vahepeal keerulisem. Poissoni jaotus: viskame teri malelauale, uurime, palju ühes ruudus, vt pilti; väike müü: erilise kujuga; suur müü: läheneb normaaljaotusele. iseloomulik: dispersioon võrdne keskväärtusega. kui ei ole: underdispersed või overdispersed, bioloogilised põhjused.