Mitmemtmelised meetodid multivariate methods Peakomponentanals principal component analysis

  • Slides: 13
Download presentation
Mitmemõõtmelised meetodid (multivariate methods) Peakomponentanalüüs (principal component analysis). Idee asendame hulk omavahel korreleeruvaid muutujaid

Mitmemõõtmelised meetodid (multivariate methods) Peakomponentanalüüs (principal component analysis). Idee asendame hulk omavahel korreleeruvaid muutujaid vähema arvu muutujatega, teeb elu lihtsamaks. Mispidi andmepilv välja venitatud, sinna telg. Component score – koordinaat sellel uuel teljel. Z 1 = a 1 X 1 + a 2 X 2 + a 3 X 3+. . Uus muutuja vanade lineaarkombinatsioon. Ei testi midagi, eeltöö muudeks testideks.

Olukord, kus arvutame ühe peakomponendi. Loodusest püütud liblika vanus - ei saa otse mõõta.

Olukord, kus arvutame ühe peakomponendi. Loodusest püütud liblika vanus - ei saa otse mõõta. Sellega korreleerub usutavasti, kuid üksi ei iseloomusta: - kulunud olemine; - katki olemine; - kuupäev.

Kõik korreleeruvad ka omavahel. Võtame kokku üheks peakomponendiks. Sellel uuel teljel koordinaat, see ongi

Kõik korreleeruvad ka omavahel. Võtame kokku üheks peakomponendiks. Sellel uuel teljel koordinaat, see ongi hinnatud vanus ja seda kasutame,

PCA annab sellised tulemused: Ehk siis vanus = 0, 56*kulumus+0, 58*katkisus+0, 59*kuupäev+0, 02*suurus. ja

PCA annab sellised tulemused: Ehk siis vanus = 0, 56*kulumus+0, 58*katkisus+0, 59*kuupäev+0, 02*suurus. ja iga vaatluse kohta: 1 2 3 4 5 -2. 48 -2. 74 -0. 64 -0. 28 0. 30 , ära muretse et miinus

Kasutame, kui muutuja väärtus pole mõõdetav - tehnilistel põhjustel; - põhimõtteliselt, nt tuju.

Kasutame, kui muutuja väärtus pole mõõdetav - tehnilistel põhjustel; - põhimõtteliselt, nt tuju.

Peakomponent andmepilve telg, aga noid telgi võib olla mitu, üksteisega risti! Kaks peakomponenti, koosluste

Peakomponent andmepilve telg, aga noid telgi võib olla mitu, üksteisega risti! Kaks peakomponenti, koosluste klassifitseerimine näitena. Objektid: metsalaigud; mõõdetud muutujad: eri taimeliikide ohtrused; hinnatavad muutujad: kasvukoha parameetrid. Olgu neid peamisi kaks – niiskus ja viljakus, arvutame kaks PC ja vastavad PC scored nii: Z 1 = a 1, 1 X 1 + a 1, 2 X 2 + a 1, 3 X 3+. . Z 2 = a 2, 1 X 1 + a 2, 2 X 2 +. . …

Ordination plot: : viljakus niiskus

Ordination plot: : viljakus niiskus

viljakus Biplot: nõges kanarbik niiskus

viljakus Biplot: nõges kanarbik niiskus

Canonical correspondence analysis viljakus CCA biplot niiskus valgustatus

Canonical correspondence analysis viljakus CCA biplot niiskus valgustatus

Diskriminantanalüüs - objekti kuulumine klassidesse juba ette teada; - milline uus muutuja - mõõdetud

Diskriminantanalüüs - objekti kuulumine klassidesse juba ette teada; - milline uus muutuja - mõõdetud muutujate lineaarkombinatsioon - võimaldab kõige paremini vahet teha. Z 1 = a 1, 1 X 1 + a 1, 2 X 2 + a 1, 3 X 3+. . - selle uue muutuja suhtes koordinaadid igal vaatlusel - ja kriitiline väärtus, mille põhjal otsustatakse uue objekti kuulumine.