Analsid diskreetsete muutujatega Andmed tekivad loendamise mitte mtmise

  • Slides: 17
Download presentation
Analüüsid diskreetsete muutujatega Andmed tekivad loendamise, mitte mõõtmise teel. Ära hakka jõuga allutama pidevate

Analüüsid diskreetsete muutujatega Andmed tekivad loendamise, mitte mõõtmise teel. Ära hakka jõuga allutama pidevate muutujate meetoditele! Ühemõõtmeline sagedustabel, siin 1 x 2, lahtrite arv reas ei mõjuta mõõtmelisust. Ühemõõtmelise puhul testime klasside arvukuse suhte erinemist etteantust, 1: 1 või muu: erineb 1: 1 st: ( = 19, 9; p<0, 0001), ei erine 0, 6: 0, 4 -st, ( = 0, 59; p=0, 44)

Kahemõõtmeline sagedustabel: uurime seost kahe muutuja vahel: enne mõtleme, mida tähendab, et seost ei

Kahemõõtmeline sagedustabel: uurime seost kahe muutuja vahel: enne mõtleme, mida tähendab, et seost ei ole.

Arvutame äärejaotused: seos puudub kui lahtrite sagedused on rea ja veeru sagduste korrutised

Arvutame äärejaotused: seos puudub kui lahtrite sagedused on rea ja veeru sagduste korrutised

Sama absoluutarvudega: Oodatavad sagedused juhuks, kui samade äärejaotuste korral seost poleks, sellises tabelis pole

Sama absoluutarvudega: Oodatavad sagedused juhuks, kui samade äärejaotuste korral seost poleks, sellises tabelis pole soo ja värvi vahel assotsiatsiooni (mitte korrelatsioon!), tabel on homogeenne.

Hii-ruut-test kahemõõtmelises tabelis testib reaalse tabeli erinevust sellisest samade äärejaotustega tabelist, milles seos puudub.

Hii-ruut-test kahemõõtmelises tabelis testib reaalse tabeli erinevust sellisest samade äärejaotustega tabelist, milles seos puudub. - seega eri asja kui ühemõõtmelises, st assotsiatsiooni olemasolu.

Kahemõõtmeline sagedustabel: uurime seost kahe muutuja vahel: Kahe muutuja vahel on seos, ehk statistiliselt

Kahemõõtmeline sagedustabel: uurime seost kahe muutuja vahel: Kahe muutuja vahel on seos, ehk statistiliselt oluline assotsiatsioon, ( = 85, 0; p<0, 0001). Seose tugevust väljendab riskide suhe (odds ratio): (59/103)/(155/28) = 0, 103: musta “risk” olla emane on väiksem.

Odds ratio (riskide suhe) iseloomustab homogeensusest hälbimust, Asi on sama, sõltumata sellest, kumba pidi

Odds ratio (riskide suhe) iseloomustab homogeensusest hälbimust, Asi on sama, sõltumata sellest, kumba pidi vaadata, sest: (a/b)/(c/d) = (a/c)/(b/d) = ad/cb kui seost pole, on odds ratio 1, ühe arvuga saab iseloomustada vaid 2 x 2 tabeli puhul. Loomulikult ei pea kõik arvud võrdsed olema, ka siin ei ole: 200 100 50 25

Hii-ruut-testi eeldus: ühegi lahtri oodatav sagedus ei tohi olla alla ühe ja selliseid lahtrid,

Hii-ruut-testi eeldus: ühegi lahtri oodatav sagedus ei tohi olla alla ühe ja selliseid lahtrid, mille oodatav sagedus on alla viie, ei tohi olla üle 20%.

Eelduste suhtes on vähem tundlik analoogiline G-test, üldse pole tundlik Fisheri test, viimast saab

Eelduste suhtes on vähem tundlik analoogiline G-test, üldse pole tundlik Fisheri test, viimast saab aga vaid erijuhul kasutada, kui äärejaotused on kontrollitavad: - vaid 2 x 2 tabelis.

Kolmemõõtmeline sagedustabel - risttahukas; : 37 39 34 43

Kolmemõõtmeline sagedustabel - risttahukas; : 37 39 34 43

Kolmemõõtmeline sagedustabel hii-ruuduga - kas seos on või mitte, aga sellest vähe! Log-lineaarne analüüs

Kolmemõõtmeline sagedustabel hii-ruuduga - kas seos on või mitte, aga sellest vähe! Log-lineaarne analüüs ja interaktsioonid:

sugu*para: jaotus parasiteerituteks ja mitteparasiteerituteks pole soost sõltumatu; jaotus emasteks ja isasteks pole parasiteeritusest

sugu*para: jaotus parasiteerituteks ja mitteparasiteerituteks pole soost sõltumatu; jaotus emasteks ja isasteks pole parasiteeritusest sõltumatu; sugu*para*aasta: 1) seos aasta ja parasiteerituse vahel pole soost sõltumatu; 2) seos soo ja aasta vahel pole parasiteeritusest sõltumatu; 3) seos soo ja parasiteerituse vahel pole aastast sõltumatu. Puudub jaotus sõltuvaks ja sõltumatuks muutujaks! Seepst pole sageli asjalik - mõttetult keeruline sugu*aasta ei pruugi üldse huvitada!

Enamasti huvitab vaid jaotus ühe tunnuse järgi, seda uurimegi, võtame sõltuvaks muutujaks, ülejäänud sõltumatud!

Enamasti huvitab vaid jaotus ühe tunnuse järgi, seda uurimegi, võtame sõltuvaks muutujaks, ülejäänud sõltumatud! Kui binaarne (kaheväärtuseline) - logistiline regressioon! P=exp(bx+k)/(1+exp(bx+k)) log(P/(1 -P) = bx+k; logit(P) = bx + k.

P=exp(bx+k)/(1+exp(bx+k)) parameetrite tõlgendus (y=0. 5 kohal –k/b):

P=exp(bx+k)/(1+exp(bx+k)) parameetrite tõlgendus (y=0. 5 kohal –k/b):

General linear models (ANOVA, ANCOVA. . ) ja generalized linear model – muud jaotused,

General linear models (ANOVA, ANCOVA. . ) ja generalized linear model – muud jaotused, võimaldab teha samu asju: - kaasata mitu sõltumatut muutujat; - kaasata interakstioone; - nested, repeated, random. aga palju noorem – pole veel alati programmides; lisaks binaarsele muutujale vaatleme ühte erijuhtu – Poissoni jaotusega muutujat.

Loendamise teel saadud väärtus: - putukaid taimel; kui vähe - diskreetne; kui palju -

Loendamise teel saadud väärtus: - putukaid taimel; kui vähe - diskreetne; kui palju - pidev; vahepeal keerulisem. Poissoni jaotus: viskame teri malelauale, uurime, palju ühes ruudus, vt pilti; väike müü: erilise kujuga; suur müü: läheneb normaaljaotusele. iseloomulik: dispersioon võrdne keskväärtusega. kui ei ole: underdispersed või overdispersed, bioloogilised põhjused.