Korelacijske metode psihologija 1 st 2 letnik 201112
- Slides: 12
Korelacijske metode psihologija (1. st. ) – 2. letnik 2011/12 4. predavanje: multipla regresija in korelacija Nelinarni odnosi in kategorični podatki
Statistično sklepanje pri multipli regresiji (1) Toleranca = % var. napovednika j, ki ga ne pojasnijo drugi napovedniki. Stabilnost modela odvisna od: • multiple korelacije ( ), • velikosti vzorca ( ), • števila napovednikov ( ), • korelacij med napovedniki oz. Tol ( ), • vplivnih točk ( ). b/SE (b) ~ t (N-P-1) Navzkrižna validacija: preizkus stabilnosti modela.
Statistično sklepanje pri multipli regresiji (2) Vzorčni R je pristranska cenilka populacijskega. Razlogi: • omejeno število prostostnih stopenj (zlasti pri majhnem N/P), • izkoriščanje slučajnih odstopanj vzorčnih korelacij od populacijskih. Wherryjev popravek (nepristranska ocena Rpop. ): SPSS: “adjusted R” Zelo približno priporočilo: vsaj 15 -30 oseb na napovednik (odvisno tudi od R, P, Tol in zaželene moči!)
Statistično sklepanje pri multipli regresiji (3) Statistična značilnost R (H 0: Rpop. = 0) df 1 = P df 2 = N - P - 1 Razlika med dvema R (H 0: Rpop. (Y. 1…P) = Rpop. (Y. 1…P+D)) (samo za gnezdene skupine prediktorjev!): df 1 = D df 2 = N-P-D-1 P: prvotno št. prediktorjev; D: št. dodanih prediktorjev
Napovedni intervali = interval, v katerem z določeno verjetnostjo pričakujemo vrednost Y za osebo z določeno kombinacijo vrednosti X 1 -Xp Širina odvisna od: • višine R , • velikosti vzorca , • oddaljenosti osebe od povprečja napovednikov . Pri enem napovedniku:
Nelinearni odnosi Krivuljčen odnos skušamo opisati z vključitvijo nelinearnega člena: Npr. : Yi = a + b 1 Xi + b 2 Xi 2 + ei • V model najprej vključimo linearni člen. • Vključitev X 2 vedno zviša R ! višina in stat. značilnost zvišanja? • Napovedovanje X Y in Y X ni enako natančno. • Pozor pri interpretaciji b 1 in b 2! • Kolinearnost: X centriramo. • Ne ekstrapoliraj! Interakcija/moderacija: Na odnos med X in Y vpliva Z (več o tem prihodnje leto).
Kategorični napovedniki Dihotomni napovedniki: • Pripadnikom skupine 1 napovemo za b višji dosežek kot pripadnikom skupine 2. • Regresija z 1 dihotomnim napovednikom t test za neodvisna vzorca. Npr. : spol in pravičnost nagrajevanja Plača = a + b 1×spol + b 2×kakovost +b 3×zahtevnost + e b 1= 0 pravično nagrajevanje Napačen pristop: razlika med povprečno plačo M in Ž
Ordinalne in nominalne spremenljivke s k vrednostmi: • Izdelamo k-1 dihotomnih indikatorskih spremenljivk (dummy variables). • “Referenčna kategorija”: vse indikatorske spremenljivke = 0. Npr: od česa je odvisen dohodek? -Zahtevnost dela -Kakovost dela -Panoga Plača Zahtev. Kakov. Panoga I 1 I 2 2120 30 35 storitve 1 0 870 -20 -5 industrija 0 1 1050 15 -15 storitve 1 0 1710 5 40 industrija 0 1 1230 35 15 javni s. 0 0 1140 -5 0 javni s. 0 0 … … … Plača = a + b 1×zahtevnost + b 2×kakovost + b 3×I 1 + b 4×I 2 + e
Plača = a + b 1×zahtevnost + b 2×kakovost + b 3×I 1 + b 4×I 2 + e V model vključimo (ali izključimo) vse indikatorske spremenljivke hkrati. b = povprečna razlika med kategorijo i in referenčno kategorijo (pri kontroliranih preostalih prediktorjih) a = povprečje referenčne kategorije (ko preostali prediktorji enaki 0) Npr: • b 3 = povprečna razlika med storitvami in javnim sektorjem za enako zahtevno in enako kakovostno opravljeno delo • če centrirani zahtevnost in kakovost: a = povprečna plača v javnem sektorju pri povprečni zahtevnosti in kakovosti
Kaj navajamo pri poročanju? Regresijske koeficiente (Beta koeficiente) Standardne napake Intervale zaupanja (Popravljeni) koeficient multiple korelacije in determinacije oz. indeks učinkovitosti napovedi F test za multiplo korelacijo (standardno napako napovedi) Pri postopnem vključevanju še spremembo pojasnjene variance.
Primer tabele:
Opomnik – na kaj moramo posebej paziti? Pred analizo: • Linearni model teoretično utemeljen? • Aditivni model teoretično utemeljen? • Vključeni ključni prediktorji? • Velikost vzorca, moč testov? • Merska raven vključenih spremenljivk? • Zanesljivost napovednikov (majhna napaka merjenja)? • Kriterij intervalen, pribl. normalno porazdeljen? • Vzorčenje? Med analizo in po njej: • Predpostavke – normalnost, linearnost, homoscedastičnost? • Vplivne točke? • Korelacije med napovedniki - multikolinearnost? • Stabilnost modela (SEb, Radj. , navzkrižna validacija…)