Mitmemtmelised meetodid multivariate methods Peakomponentanals principal component analysis

  • Slides: 13
Download presentation
Mitmemõõtmelised meetodid (multivariate methods) Peakomponentanalüüs (principal component analysis). Idee asendame hulk omavahel korreleeruvaid muutujaid

Mitmemõõtmelised meetodid (multivariate methods) Peakomponentanalüüs (principal component analysis). Idee asendame hulk omavahel korreleeruvaid muutujaid vähema arvu muutujatega, teeb elu lihtsamaks. Mispidi andmepilv välja venitatud, sinna telg. Component score – koordinaat sellel uuel teljel. Z 1 = a 1 X 1 + a 2 X 2 + a 3 X 3+. . Uus muutuja vanade lineaarkombinatsioon. Ei testi midagi, eeltöö muudeks testideks.

Olukord, kus arvutame ühe peakomponendi. Loodusest püütud liblika vanus - ei saa otse mõõta.

Olukord, kus arvutame ühe peakomponendi. Loodusest püütud liblika vanus - ei saa otse mõõta. Sellega korreleerub usutavasti, kuid üksi ei iseloomusta: - kulunud olemine; - katki olemine; - kuupäev.

Kõik korreleeruvad ka omavahel. Võtame kokku üheks peakomponendiks. Sellel uuel teljel koordinaat, see ongi

Kõik korreleeruvad ka omavahel. Võtame kokku üheks peakomponendiks. Sellel uuel teljel koordinaat, see ongi hinnatud vanus ja seda kasutame,

PCA annab sellised tulemused: Ehk siis vanus = 0, 56*kulumus+0, 58*katkisus+0, 59*kuupäev+0, 02*suurus. ja

PCA annab sellised tulemused: Ehk siis vanus = 0, 56*kulumus+0, 58*katkisus+0, 59*kuupäev+0, 02*suurus. ja iga vaatluse kohta: 1 2 3 4 5 -2. 48 -2. 74 -0. 64 -0. 28 0. 30 , ära muretse et miinus

Kasutame, kui muutuja väärtus pole mõõdetav - tehnilistel põhjustel; - põhimõtteliselt, nt tuju.

Kasutame, kui muutuja väärtus pole mõõdetav - tehnilistel põhjustel; - põhimõtteliselt, nt tuju.

Peakomponent andmepilve telg, aga noid telgi võib olla mitu, üksteisega risti! Kaks peakomponenti, iseloomuomadused

Peakomponent andmepilve telg, aga noid telgi võib olla mitu, üksteisega risti! Kaks peakomponenti, iseloomuomadused näitena. Objektid: inimesed mõõdetud algmuutujad: 1) hommikuse ärkamise kellaaeg, 2) telefonikõnede arv (päevas), 3) tehtud sammude arv, 4) kirjutatud e-mailide arv, 5) naeratuste arv, 6) sõnaliste konfliktide arv, 7) valitsuse kirumiste arv, 8) kasutatud positiivsete emotikonide arv

Laseme arvutada kaks peakomponenti: aktiivsus positiivsus 1) hommikuse ärkamise kellaaeg, 2) telefonikõnede arv (päevas),

Laseme arvutada kaks peakomponenti: aktiivsus positiivsus 1) hommikuse ärkamise kellaaeg, 2) telefonikõnede arv (päevas), 3) tehtud sammude arv, 4) kirjutatud e-mailide arv, 5) naeratuste arv, 6) sõnaliste konfliktide arv, 7) valitsuse kirumiste arv, 8) kasutatud positiivsete emotikonide arv

Ordination plot:

Ordination plot:

Biplot: naeratused sammud

Biplot: naeratused sammud

Diskriminantanalüüs - objekti kuulumine klassidesse juba ette teada; - milline uus muutuja - mõõdetud

Diskriminantanalüüs - objekti kuulumine klassidesse juba ette teada; - milline uus muutuja - mõõdetud muutujate lineaarkombinatsioon - võimaldab kõige paremini vahet teha. Z 1 = a 1, 1 X 1 + a 1, 2 X 2 + a 1, 3 X 3+. . - selle uue muutuja suhtes koordinaadid igal vaatlusel - ja kriitiline väärtus, mille põhjal otsustatakse uue objekti kuulumine.