Muut menetelmt ja aineiston jatkoksittely Jouko Miettunen tutkijatohtori
- Slides: 60
Muut menetelmät ja aineiston jatkokäsittely Jouko Miettunen, tutkijatohtori, FT Psykiatrian klinikka Oulun yliopisto puhelin: 08 -3156923 sähköposti: jouko. miettunen@oulu. fi Kvantitatiivinen tutkimus hoitotieteessä, Oulu 20. 10. 2006 1
Luennon sisältö n n n Luotettavuuden käsitteitä Cronbachin alpha ja muita vastaavia menetelmiä Klusterianalyysi Moniulotteinen skaalaus Aineiston jatkoanalyysi Muuttujien käsittely u Perusmenetelmät u Monimuuttujamenetelmät u 2
Taustaa n Psykologisen mittarin suunnittelu ja testaaminen u mahdolliset osa-asteikot u kysymysten lukumäärä n Menetelmiä u Faktorianalyysit, pääkomponenttianalyysi u Cronbachin Alpha 3
Reliabiliteetin ja validiteetin käsitteitä n Reliabiliteetti Kuinka hyvin mittarilla tehty mittaus on toistettavissa (=stabiliteetti) u kuinka yhdenmukaisesti kaksi mittaria/mittaajaa arvioi samaa asiaa tai kuinka hyvin mittarin kysymykset mittaa samaa asiaa (=konsistenssi) u n Validiteetti u Kuinka hyvin mittari mittaa sitä mitä sen pitäisi mitata 4
• Reliabiliteetti huono • Validiteetti huono • Reliabiliteetti hyvä • Validiteetti huono • Reliabiliteetti hyvä • Validiteetti ei voi olla hyvä, jos reliabiliteetti on huono 5
Reliabiliteetin ja validiteetin käsitteitä n Construct validity (=rakennevaliditeetti) u onko teoriakäsite riittävästi ja onnistuneesti mitattu? u Convergent validity (=yhtenevyys) F onnistuuko käsitteen mittaaminen muulla mittarilla u Discriminant validity (=erottelu) F onnistuuko mittari erottamaan käsitteen muista käsitteistä Blacker & Endicott 2000, Morgan et al. 2001 6
Reliabiliteetin ja validiteetin käsitteitä n Content validity (=sisältövaliditeetti) u Kattaako kysymykset käsitteen riittävästi n Face validity (=näennäisvaliditeetti) u Vaikuttaako mittari mittaavan sitä mitä on tarkoitus Blacker & Endicott 2000, Morgan et al. 2001 7
Reliabiliteetin ja validiteetin käsitteitä n Criterion validity (=kriteerivaliditeetti) u Miten mittari liittyy muihin samaa asiaa mittaaviin kriteereihin, esimerkiksi diagnoosiin u Concurrent F Kuinka hyvin mittari ennustaa henkilön nykyistä tilaa u Predictive F validity (=samanaikaisvaliditeetti) validity (=ennustevaliditeetti) Kuinka hyvin mittari ennustaa henkilön tulevaa tilaa Blacker & Endicott 2000, Morgan et al. 2001 8
Cronbachin alpha n n n Perustuu varianssianalyysiin Kertoo kuinka yhdenmukaisesti mittarin eri kysymykset mittaavat samaa asiaa (internal consistency) Voidaan tehdä koko mittarille ja erikseen jokaiselle osa-asteikolle 9
n DATA ESIMERKKI VAR 1 VAR 2 VAR 3 VAR 4 VAR 5. . . CASE 1 CASE 2 CASE 3 CASE 4 CASE 5. : 0 4 0 2 3 1 5 0 2 1 1 4 1 2 3 0 2 2 0… 3… 3… 10
Cronbachin alphan kaava k = muuttujien lkm = muuttujien välinen varianssi = henkilöiden välinen varianssi 11
Cronbachin alpha n n On esitetty erilaisia raja-arvoja, sille mikä on riittävä alpha 0. 60 – 0. 80, esim. 0. 70 (Nunnally 1978) Alphan suuruuteen vaikuttaa kysymysten lukumäärä, mitä enemmän sitä suurempi alpha Muuttujien vinous ongelma, samoin jos sama vastaaja vastaa kaikkiin kysymyksiin samoin (=varianssi on tärkeä) Nunnally (1978) Psychometric Theory 12
Muita tunnuslukuja n Cronbachin alphan erikoistapaus u Kuder-Richardson Formula 20 F n Spearmanin rho u n Kaksiluokkaisille muuttujille Kysymysparien korrelaatioiden mediaani Inter-item korrelaatio u Kysymyksen korrelaatio mittarin muiden kysymysten kanssa F Tulisi olla positiivinen! 13
Spearman-Brown kerroin eli standardoitu item alpha § SPSS: "Cronbach's alpha based on standardized items” § Tunnusluvulla voi arvioida muuttujien vähentämisen vaikutusta reliabiliteettiin = muuttujien välinen keskikorrelaatio k = muuttujien lkm 14
Split-half menetelmä n Mittari jaetaan kahtia ja testataan eroaako puoliskot toisistaan u Sopii hyvin kun on tarkoitus että kaikki mittarin kysymykset mittaavat samaa asiaa (eli mittari ei sisällä osamittareita) 15
Cronbachin alphan laskeminen SPSSohjelmalla Käskyvalikosta n u ”analyze n / scale / reliability analysis” Valitaan muuttujat 16
Cronbachin alphan laskeminen SPSS-ohjelmalla Valitaan malleista n Alpha (Cronbach) n Split-half u Guttman n Parallel u Strict parallel 17
Esimerkkiaineisto n n Pohjois-Suomen vuoden 1966 syntymäkohortin 31 -vuotisseuranta TCI (Temperament and Character Inventory) u Reward Dependence –faktori F RD 1 – Sentimentality F RD 3 – Attachment F RD 4 – Dependence u Kaksiluokkaisia muuttujia 18
RD – koko asteikko RD 3 – Attachment RD – 1 Sentimentality RD – 4 Dependence 19
RD – koko asteikko 20
RD – koko asteikko 21
RD – koko asteikko 22
RD – 4 Dependence 23
Klusterianalyysi n n n Havaintojen (muuttujat tai henkilöt) väliseen moniulotteisiin välimatkoihin perustuva luokittelumenetelmä Useita erilaisia menetelmiä SPSS ohjelmassa muuttujien klusterointi onnistuu Hierarchical Clustering -menetelmällä Everitt (1974) Cluster analysis. 24
Moniulotteinen skaalaus =multidimensional scaling n n n Kuten klusterianalyysi, perustuu havaintojen välisiin etäisyyksiin Moniulotteinen data tiivistetään 2 -3 ulotteiseksi kuvaksi Suoritettaviss SPSS –ohjelmalla Borg & Groenen (1997) Modern multidimensional scaling. 25
Muuttujien jatkokäsittely n n n Kyselylomakkeesta tai sen osasta (esim. faktorista) saadaan tietoa tiivistettyä useilla tavoin Alkuperäisten muuttujien summat jatkuvana tai luokiteltuna Faktoripisteet jatkuvana tai luokiteltuna u EFA vs. CFA 26
Jatkuva vai luokiteltu muuttuja? n n n Luokittelemalla menetetään tietoa Usein kuitenkin selkeyttää tulosten esittämistä Analyysimenetelmät erilaisia 27
Luokittelutapoja n n n Aiemmat tutkimukset Kliiniset kriteerit Aineistoon perustuvat u. Mediaani, kvarttiilit, senttiilit, … u. Keskiarvo ± 2 keskihajontaa 28
Perusmenetelmät n Luokitellut muuttujat u Jakaumien vertailu ryhmien välillä u Tilastollinen testaaminen F Khiin neliötesti, odds ratio n Jatkuvat muuttujat u Keskiarvojen vertailu F Studentin t-testi u Mediaanien vertailu ryhmien välillä F Mann-Whitneyn U-testi F Kruskal-Wallisin testi 29
Esimerkki n n Kohortti 1986, aleksitymiamittarin (TAS) faktoreiden ennustaminen Kolme faktoria (faktoripisteet) u F 1: vaikeuksia tunteiden tunnistamisessa u F 2: vaikeuksia tunteiden kuvaamisessa u F 3: ulospäin suuntautunut ajattelu n Tutkitaan eroja sukupuolittain ja sosiaaliluokissa 30
Muuttujien jako kvarttiilien mukaan X 2 -testi 31
Keskiarvojen vertailu: ttesti 32
Mediaanien vertailu: Mann-Whitneyn U-testi 33
Mediaanien vertailu: Kruskal-Wallisin H-testi 34
Monimuuttujamenetelmi ä n n n Logistinen regressioanalyysi Lineaarinen regressioanalyysi Varianssianalyysi Rakenneyhtälömallitus Latent class analysis Ynnä paljon muita! 35
Logistinen regressioanalyysi n n Yleisin tapa ottaa huomioon sekoittavat muuttujat, Erityisesti pitkittäistutkimuksissa Vastemuuttuja (outcome) on kaksiluokkainen (esim. kyllä/ei) Altistemuuttujat (exposure) voivat olla sekä kaksiluokkaisia, useampiluokkaisia että jatkuvia Multinomiaalisessa logistisessa regressioanalyysissa vastemuuttujassa voi olla useita luokkia 36
Muuttujien valinta n n n Mittarista esim. faktorianalyysin avulla johdetut muuttujat (esim. faktoripisteet) voivat olla mallissa altisteena (jatkuvana tai luokiteltuna) tai vasteena (kaksiluokkaisena) Muuten altistemuuttujana (kovariaattina) esim. sukupuoli, sosiaaliluokka, ikä, ym. Malliin myös aiemmin tunnetut ennustavat muuttujat Muuttujia ei saa olla liikaa u Riippuu otoskoosta ja muuttujien variaatiosta Mallissa ei kannata olla mukana muuttujia joiden keskinäinen korrelaatio on liian iso 37
Esimerkki Pohjois-Suomen vuoden 1966 syntymäkohortti n n N = 10 934 Runsaasti haastattelu- ja rekisteridataa 38
Esimerkki n n n Mikä psykoottisilla potilailla ennustaa uudestaan joutumista sairaalaan? N = 158 Altistemuuttujat u sukupuoli u Isän sosiaaliluokka (1980) u Sukurasitus u Sairastumisikä u Ensimmäisen sairaalahoidon kesto u diagnoosi (skitsofrenia / muu psykoosi) 39
SPSS Output (1) Categorical Variables Codings Fathers social class 1980 Parent has psychotic dg 1972 -2000 Sex Diagnosis Length of first hospitalization I, II III, IV V no yes male female schizophrenia other psych < 1 month > 1 month Frequency 48 96 14 133 25 93 65 108 50 94 64 Parameter coding (1) (2) , 000 1, 000 , 000 1, 000 40
SPSS Output (2) Variables in the Equation Length of 1 st hospital. (1) Sex(1) Onset age Diagnosis(1) FSC 1980(1) FSC 1980(2) Parental psych(1) Constant B 1, 048 -, 559 -, 047 , 839 S. E. , 375 , 366 , 043 , 385 , 309 , 109 , 612 , 488 , 392 , 647 , 513 1, 100 Wald 7, 805 2, 331 1, 199 4, 740 , 651 , 622 , 028 1, 423 , 197 df 1 1 2 1 1 Sig. , 005 , 127 , 274 , 029 , 722 , 430 , 866 , 233 , 657 Exp(B) 2, 852 , 572 , 954 2, 314 1, 362 1, 115 1, 845 1, 629 95, 0% C. I. for EXP(B) Lower Upper 1, 367 5, 948 , 279 1, 172 , 876 1, 038 1, 087 4, 926 , 632 , 314 , 675 2, 934 3, 960 5, 045 41
Lineaarinen regressioanalyysi n n n Selitetään jatkuvaa (tai ainakin välimatka -asteikollista) muuttujaa Selittäviä muuttujia voi olla useita Muuttujien välinen riippuvuus oletetaan lineaariseksi Selittävät muuttujat ei saa liikaa korreloida keskenään (multikollineaarisuus) Selitettävän muuttujan hajonta ei riipu selittävien muuttujien hajonnasta (homoskedastisuus) 42
Esimerkki n n Kohortti 1986, aleksitymiamittarin (TAS) faktoreiden ennustaminen Kolme faktoria (faktoripisteet) F 1: vaikeuksia tunteiden tunnistamisessa u F 2: vaikeuksia tunteiden kuvaamisessa u F 3: ulospäin suuntautunut ajattelu u n Ennustavat muuttujat Sukupuoli u Sosiaaliluokka u Perhetyyppi u Käyttäytyminen 8 v (Rutter) u 43
Muuttujien jakaumat Alkuperäinen muuttuja Faktoripistemuuttuja Uusi muuttuja: useampi luokkainen (”jatkuvampi”) ja vähemmän vino 44
Muuttujien jakaumat Alkuperäinen muuttuja Faktoripistemuuttuja 45
Muuttujien jakaumat Alkuperäinen muuttuja Faktoripistemuuttuja 46
Esimerkki u. F 1: vaikeuksia tunteiden tunnistamisessa 47
Esimerkki u. F 2: vaikeuksia tunteiden kuvaamisessa 48
Esimerkki u. F 3: ulospäin suuntautunut ajattelu 49
Varianssianalyysi n ANOVA u n MANOVA u n Yksi jatkuva selitettävä eli vastemuuttuja Useita jatkuvia vastemuuttujia Toistettujen mittausten ANOVA = Repeated measurements ANOVA u Samat mittaukset on tehty useaan kertaan samoilta henkilöiltä n ANOVA, MANOVA and r. ANOVA u n Vain luokiteltuja altisteita ANCOVA, MANCOVA, r. ANCOVA u Myös jatkuvia altisteita 50
Esimerkki Erot hippokampuksen koossa n Pohjois-Suomen 1966 syntymäkohortti u Seurantatutkimus 1999 -2001 Skitsofreniapotilaat (N=56) vs. terveet verrokit (N=104) n Toistettujen mittausten ANCOVA n u Oikean ja vasemman puolen hippokampusmittauksia käsitellään toistettuina mittauksia 51
Schizophrenia and Comparison subjects Hippocampus volumes Model 1 Within effect: side Diagnosis Gender Model 2 Within effect: side Covariate: brain vol. Diagnosis Gender Familial psychosis Perinatal risk Handedness F Sig. 20. 3 1. 2 6. 5 < 0. 001 0. 28 0. 01 0. 81 35. 0 < 0. 01 0. 7 1. 9 0. 8 0. 37 < 0. 001 0. 89 0. 41 0. 17 0. 38 0. 61 Tanskanen ym. Schizophrenia Research (2005) 52
Rakenneyhtälömallitus = Structural Equation Modeling n n n Faktorianalyysin ja regressioanalyysin yhdistelmä Jatkuvia ja luokiteltuja altisteita ja vasteita Esitetään mitattujen muuttujien ja piilevien muuttujien suhteet (esim. korrelaatioina) Byrne (2001) Structural Equation Modeling with AMOS: Basic Concepts, Applications, and Programming. 53
Esimerkki: Nursing orientation Orientation to learning nursing Orientation to nursing • male, p=. 002 + • older, p<. 0001 • no children, p=. 048 Caring orientation + (r=. 27) + (r=. 47) + (r=. 64) • Swedish, p<. 0001 • older, p<. 0001 • no children, p=. 036 + Catalyticco-operational nursing + • older, p=. 034 + (r=. 44) Expertise + (r=. 19) orientation Controlling nursing + • Swedish, p<. 0001 • older, p 0. 002 + (r=. 18) + (r=. 11) • Finnish, p=. 020 + • younger, p=. 0003 • sairaanhoit, p=. 020 • no children, p<. 0001 Life orientation + (r=. 22) Confirming nursing + • older, p=. 030 54 Vanhanen-Nuutinen ym. (käsikirjoitus)
Latent class analysis n Kehitetty ryhmittelemään henkilöt valittujen piirteiden mukaan u Luokittelee ihmiset ryhmiin u Kertoo piirteet (säännöt) joilla luokitus tehtiin n Verrattavissa klusterianalyysiin u Klusterianalyysi ei anna sääntöjä luokitukseen (=mallia) Muthén & Muthén (Alcohol Clin Exp Res, 24, 882 -91, 2000) 55
Esimerkki: Antisosiaalinen käyttäytym n n National Longitudinal Survey of Youth (NLSY) Respondent ages between 16 and 23 Background information: age, gender and ethnicity N=7, 326 17 antisocial dichotomously scored behavior items: n n n n Damaged property Fighting Shoplifting Stole <$50 Stole >$50 Use of force Seriously threaten Intent to injure n n n n n Use Marijuana Use other drug Sold Marijuana Sold hard drugs ‘Con’ somebody Stole an Automobile Broken into a building Held stolen goods Gambling Operation Lähde: http: //www. ats. ucla. edu/stat/mplus/seminars/lca/default. htm 56
Example: Anti-Social Behavior Damage Property Fighting Shoplifting Stole <$50 . . . Gambling Male Race C Age 57
Example: Anti-Social Behavior probabilities 58
Relationship between class probabilities and age by gender Females 16 17 18 19 20 Males 21 22 23 (age) 16 17 18 19 20 21 22 23 59
Yleisiä lähteitä tilastomenetelmiin n n Metsämuuronen. Tutkimuksen tekemisen perusteet ihmistieteissä (2003) Nummenmaa et al. Tutkimusaineiston analyysi (1997) Uhari & Nieminen. Epidemiologia & Biostatistiikka (2001) SPSS, SAS, jne. oppaat 60