Muut menetelmt ja aineiston jatkoksittely Jouko Miettunen tutkijatohtori

  • Slides: 60
Download presentation
Muut menetelmät ja aineiston jatkokäsittely Jouko Miettunen, tutkijatohtori, FT Psykiatrian klinikka Oulun yliopisto puhelin:

Muut menetelmät ja aineiston jatkokäsittely Jouko Miettunen, tutkijatohtori, FT Psykiatrian klinikka Oulun yliopisto puhelin: 08 -3156923 sähköposti: jouko. miettunen@oulu. fi Kvantitatiivinen tutkimus hoitotieteessä, Oulu 20. 10. 2006 1

Luennon sisältö n n n Luotettavuuden käsitteitä Cronbachin alpha ja muita vastaavia menetelmiä Klusterianalyysi

Luennon sisältö n n n Luotettavuuden käsitteitä Cronbachin alpha ja muita vastaavia menetelmiä Klusterianalyysi Moniulotteinen skaalaus Aineiston jatkoanalyysi Muuttujien käsittely u Perusmenetelmät u Monimuuttujamenetelmät u 2

Taustaa n Psykologisen mittarin suunnittelu ja testaaminen u mahdolliset osa-asteikot u kysymysten lukumäärä n

Taustaa n Psykologisen mittarin suunnittelu ja testaaminen u mahdolliset osa-asteikot u kysymysten lukumäärä n Menetelmiä u Faktorianalyysit, pääkomponenttianalyysi u Cronbachin Alpha 3

Reliabiliteetin ja validiteetin käsitteitä n Reliabiliteetti Kuinka hyvin mittarilla tehty mittaus on toistettavissa (=stabiliteetti)

Reliabiliteetin ja validiteetin käsitteitä n Reliabiliteetti Kuinka hyvin mittarilla tehty mittaus on toistettavissa (=stabiliteetti) u kuinka yhdenmukaisesti kaksi mittaria/mittaajaa arvioi samaa asiaa tai kuinka hyvin mittarin kysymykset mittaa samaa asiaa (=konsistenssi) u n Validiteetti u Kuinka hyvin mittari mittaa sitä mitä sen pitäisi mitata 4

 • Reliabiliteetti huono • Validiteetti huono • Reliabiliteetti hyvä • Validiteetti huono •

• Reliabiliteetti huono • Validiteetti huono • Reliabiliteetti hyvä • Validiteetti huono • Reliabiliteetti hyvä • Validiteetti ei voi olla hyvä, jos reliabiliteetti on huono 5

Reliabiliteetin ja validiteetin käsitteitä n Construct validity (=rakennevaliditeetti) u onko teoriakäsite riittävästi ja onnistuneesti

Reliabiliteetin ja validiteetin käsitteitä n Construct validity (=rakennevaliditeetti) u onko teoriakäsite riittävästi ja onnistuneesti mitattu? u Convergent validity (=yhtenevyys) F onnistuuko käsitteen mittaaminen muulla mittarilla u Discriminant validity (=erottelu) F onnistuuko mittari erottamaan käsitteen muista käsitteistä Blacker & Endicott 2000, Morgan et al. 2001 6

Reliabiliteetin ja validiteetin käsitteitä n Content validity (=sisältövaliditeetti) u Kattaako kysymykset käsitteen riittävästi n

Reliabiliteetin ja validiteetin käsitteitä n Content validity (=sisältövaliditeetti) u Kattaako kysymykset käsitteen riittävästi n Face validity (=näennäisvaliditeetti) u Vaikuttaako mittari mittaavan sitä mitä on tarkoitus Blacker & Endicott 2000, Morgan et al. 2001 7

Reliabiliteetin ja validiteetin käsitteitä n Criterion validity (=kriteerivaliditeetti) u Miten mittari liittyy muihin samaa

Reliabiliteetin ja validiteetin käsitteitä n Criterion validity (=kriteerivaliditeetti) u Miten mittari liittyy muihin samaa asiaa mittaaviin kriteereihin, esimerkiksi diagnoosiin u Concurrent F Kuinka hyvin mittari ennustaa henkilön nykyistä tilaa u Predictive F validity (=samanaikaisvaliditeetti) validity (=ennustevaliditeetti) Kuinka hyvin mittari ennustaa henkilön tulevaa tilaa Blacker & Endicott 2000, Morgan et al. 2001 8

Cronbachin alpha n n n Perustuu varianssianalyysiin Kertoo kuinka yhdenmukaisesti mittarin eri kysymykset mittaavat

Cronbachin alpha n n n Perustuu varianssianalyysiin Kertoo kuinka yhdenmukaisesti mittarin eri kysymykset mittaavat samaa asiaa (internal consistency) Voidaan tehdä koko mittarille ja erikseen jokaiselle osa-asteikolle 9

n DATA ESIMERKKI VAR 1 VAR 2 VAR 3 VAR 4 VAR 5. .

n DATA ESIMERKKI VAR 1 VAR 2 VAR 3 VAR 4 VAR 5. . . CASE 1 CASE 2 CASE 3 CASE 4 CASE 5. : 0 4 0 2 3 1 5 0 2 1 1 4 1 2 3 0 2 2 0… 3… 3… 10

Cronbachin alphan kaava k = muuttujien lkm = muuttujien välinen varianssi = henkilöiden välinen

Cronbachin alphan kaava k = muuttujien lkm = muuttujien välinen varianssi = henkilöiden välinen varianssi 11

Cronbachin alpha n n On esitetty erilaisia raja-arvoja, sille mikä on riittävä alpha 0.

Cronbachin alpha n n On esitetty erilaisia raja-arvoja, sille mikä on riittävä alpha 0. 60 – 0. 80, esim. 0. 70 (Nunnally 1978) Alphan suuruuteen vaikuttaa kysymysten lukumäärä, mitä enemmän sitä suurempi alpha Muuttujien vinous ongelma, samoin jos sama vastaaja vastaa kaikkiin kysymyksiin samoin (=varianssi on tärkeä) Nunnally (1978) Psychometric Theory 12

Muita tunnuslukuja n Cronbachin alphan erikoistapaus u Kuder-Richardson Formula 20 F n Spearmanin rho

Muita tunnuslukuja n Cronbachin alphan erikoistapaus u Kuder-Richardson Formula 20 F n Spearmanin rho u n Kaksiluokkaisille muuttujille Kysymysparien korrelaatioiden mediaani Inter-item korrelaatio u Kysymyksen korrelaatio mittarin muiden kysymysten kanssa F Tulisi olla positiivinen! 13

Spearman-Brown kerroin eli standardoitu item alpha § SPSS: "Cronbach's alpha based on standardized items”

Spearman-Brown kerroin eli standardoitu item alpha § SPSS: "Cronbach's alpha based on standardized items” § Tunnusluvulla voi arvioida muuttujien vähentämisen vaikutusta reliabiliteettiin = muuttujien välinen keskikorrelaatio k = muuttujien lkm 14

Split-half menetelmä n Mittari jaetaan kahtia ja testataan eroaako puoliskot toisistaan u Sopii hyvin

Split-half menetelmä n Mittari jaetaan kahtia ja testataan eroaako puoliskot toisistaan u Sopii hyvin kun on tarkoitus että kaikki mittarin kysymykset mittaavat samaa asiaa (eli mittari ei sisällä osamittareita) 15

Cronbachin alphan laskeminen SPSSohjelmalla Käskyvalikosta n u ”analyze n / scale / reliability analysis”

Cronbachin alphan laskeminen SPSSohjelmalla Käskyvalikosta n u ”analyze n / scale / reliability analysis” Valitaan muuttujat 16

Cronbachin alphan laskeminen SPSS-ohjelmalla Valitaan malleista n Alpha (Cronbach) n Split-half u Guttman n

Cronbachin alphan laskeminen SPSS-ohjelmalla Valitaan malleista n Alpha (Cronbach) n Split-half u Guttman n Parallel u Strict parallel 17

Esimerkkiaineisto n n Pohjois-Suomen vuoden 1966 syntymäkohortin 31 -vuotisseuranta TCI (Temperament and Character Inventory)

Esimerkkiaineisto n n Pohjois-Suomen vuoden 1966 syntymäkohortin 31 -vuotisseuranta TCI (Temperament and Character Inventory) u Reward Dependence –faktori F RD 1 – Sentimentality F RD 3 – Attachment F RD 4 – Dependence u Kaksiluokkaisia muuttujia 18

RD – koko asteikko RD 3 – Attachment RD – 1 Sentimentality RD –

RD – koko asteikko RD 3 – Attachment RD – 1 Sentimentality RD – 4 Dependence 19

RD – koko asteikko 20

RD – koko asteikko 20

RD – koko asteikko 21

RD – koko asteikko 21

RD – koko asteikko 22

RD – koko asteikko 22

RD – 4 Dependence 23

RD – 4 Dependence 23

Klusterianalyysi n n n Havaintojen (muuttujat tai henkilöt) väliseen moniulotteisiin välimatkoihin perustuva luokittelumenetelmä Useita

Klusterianalyysi n n n Havaintojen (muuttujat tai henkilöt) väliseen moniulotteisiin välimatkoihin perustuva luokittelumenetelmä Useita erilaisia menetelmiä SPSS ohjelmassa muuttujien klusterointi onnistuu Hierarchical Clustering -menetelmällä Everitt (1974) Cluster analysis. 24

Moniulotteinen skaalaus =multidimensional scaling n n n Kuten klusterianalyysi, perustuu havaintojen välisiin etäisyyksiin Moniulotteinen

Moniulotteinen skaalaus =multidimensional scaling n n n Kuten klusterianalyysi, perustuu havaintojen välisiin etäisyyksiin Moniulotteinen data tiivistetään 2 -3 ulotteiseksi kuvaksi Suoritettaviss SPSS –ohjelmalla Borg & Groenen (1997) Modern multidimensional scaling. 25

Muuttujien jatkokäsittely n n n Kyselylomakkeesta tai sen osasta (esim. faktorista) saadaan tietoa tiivistettyä

Muuttujien jatkokäsittely n n n Kyselylomakkeesta tai sen osasta (esim. faktorista) saadaan tietoa tiivistettyä useilla tavoin Alkuperäisten muuttujien summat jatkuvana tai luokiteltuna Faktoripisteet jatkuvana tai luokiteltuna u EFA vs. CFA 26

Jatkuva vai luokiteltu muuttuja? n n n Luokittelemalla menetetään tietoa Usein kuitenkin selkeyttää tulosten

Jatkuva vai luokiteltu muuttuja? n n n Luokittelemalla menetetään tietoa Usein kuitenkin selkeyttää tulosten esittämistä Analyysimenetelmät erilaisia 27

Luokittelutapoja n n n Aiemmat tutkimukset Kliiniset kriteerit Aineistoon perustuvat u. Mediaani, kvarttiilit, senttiilit,

Luokittelutapoja n n n Aiemmat tutkimukset Kliiniset kriteerit Aineistoon perustuvat u. Mediaani, kvarttiilit, senttiilit, … u. Keskiarvo ± 2 keskihajontaa 28

Perusmenetelmät n Luokitellut muuttujat u Jakaumien vertailu ryhmien välillä u Tilastollinen testaaminen F Khiin

Perusmenetelmät n Luokitellut muuttujat u Jakaumien vertailu ryhmien välillä u Tilastollinen testaaminen F Khiin neliötesti, odds ratio n Jatkuvat muuttujat u Keskiarvojen vertailu F Studentin t-testi u Mediaanien vertailu ryhmien välillä F Mann-Whitneyn U-testi F Kruskal-Wallisin testi 29

Esimerkki n n Kohortti 1986, aleksitymiamittarin (TAS) faktoreiden ennustaminen Kolme faktoria (faktoripisteet) u F

Esimerkki n n Kohortti 1986, aleksitymiamittarin (TAS) faktoreiden ennustaminen Kolme faktoria (faktoripisteet) u F 1: vaikeuksia tunteiden tunnistamisessa u F 2: vaikeuksia tunteiden kuvaamisessa u F 3: ulospäin suuntautunut ajattelu n Tutkitaan eroja sukupuolittain ja sosiaaliluokissa 30

Muuttujien jako kvarttiilien mukaan X 2 -testi 31

Muuttujien jako kvarttiilien mukaan X 2 -testi 31

Keskiarvojen vertailu: ttesti 32

Keskiarvojen vertailu: ttesti 32

Mediaanien vertailu: Mann-Whitneyn U-testi 33

Mediaanien vertailu: Mann-Whitneyn U-testi 33

Mediaanien vertailu: Kruskal-Wallisin H-testi 34

Mediaanien vertailu: Kruskal-Wallisin H-testi 34

Monimuuttujamenetelmi ä n n n Logistinen regressioanalyysi Lineaarinen regressioanalyysi Varianssianalyysi Rakenneyhtälömallitus Latent class analysis

Monimuuttujamenetelmi ä n n n Logistinen regressioanalyysi Lineaarinen regressioanalyysi Varianssianalyysi Rakenneyhtälömallitus Latent class analysis Ynnä paljon muita! 35

Logistinen regressioanalyysi n n Yleisin tapa ottaa huomioon sekoittavat muuttujat, Erityisesti pitkittäistutkimuksissa Vastemuuttuja (outcome)

Logistinen regressioanalyysi n n Yleisin tapa ottaa huomioon sekoittavat muuttujat, Erityisesti pitkittäistutkimuksissa Vastemuuttuja (outcome) on kaksiluokkainen (esim. kyllä/ei) Altistemuuttujat (exposure) voivat olla sekä kaksiluokkaisia, useampiluokkaisia että jatkuvia Multinomiaalisessa logistisessa regressioanalyysissa vastemuuttujassa voi olla useita luokkia 36

Muuttujien valinta n n n Mittarista esim. faktorianalyysin avulla johdetut muuttujat (esim. faktoripisteet) voivat

Muuttujien valinta n n n Mittarista esim. faktorianalyysin avulla johdetut muuttujat (esim. faktoripisteet) voivat olla mallissa altisteena (jatkuvana tai luokiteltuna) tai vasteena (kaksiluokkaisena) Muuten altistemuuttujana (kovariaattina) esim. sukupuoli, sosiaaliluokka, ikä, ym. Malliin myös aiemmin tunnetut ennustavat muuttujat Muuttujia ei saa olla liikaa u Riippuu otoskoosta ja muuttujien variaatiosta Mallissa ei kannata olla mukana muuttujia joiden keskinäinen korrelaatio on liian iso 37

Esimerkki Pohjois-Suomen vuoden 1966 syntymäkohortti n n N = 10 934 Runsaasti haastattelu- ja

Esimerkki Pohjois-Suomen vuoden 1966 syntymäkohortti n n N = 10 934 Runsaasti haastattelu- ja rekisteridataa 38

Esimerkki n n n Mikä psykoottisilla potilailla ennustaa uudestaan joutumista sairaalaan? N = 158

Esimerkki n n n Mikä psykoottisilla potilailla ennustaa uudestaan joutumista sairaalaan? N = 158 Altistemuuttujat u sukupuoli u Isän sosiaaliluokka (1980) u Sukurasitus u Sairastumisikä u Ensimmäisen sairaalahoidon kesto u diagnoosi (skitsofrenia / muu psykoosi) 39

SPSS Output (1) Categorical Variables Codings Fathers social class 1980 Parent has psychotic dg

SPSS Output (1) Categorical Variables Codings Fathers social class 1980 Parent has psychotic dg 1972 -2000 Sex Diagnosis Length of first hospitalization I, II III, IV V no yes male female schizophrenia other psych < 1 month > 1 month Frequency 48 96 14 133 25 93 65 108 50 94 64 Parameter coding (1) (2) , 000 1, 000 , 000 1, 000 40

SPSS Output (2) Variables in the Equation Length of 1 st hospital. (1) Sex(1)

SPSS Output (2) Variables in the Equation Length of 1 st hospital. (1) Sex(1) Onset age Diagnosis(1) FSC 1980(1) FSC 1980(2) Parental psych(1) Constant B 1, 048 -, 559 -, 047 , 839 S. E. , 375 , 366 , 043 , 385 , 309 , 109 , 612 , 488 , 392 , 647 , 513 1, 100 Wald 7, 805 2, 331 1, 199 4, 740 , 651 , 622 , 028 1, 423 , 197 df 1 1 2 1 1 Sig. , 005 , 127 , 274 , 029 , 722 , 430 , 866 , 233 , 657 Exp(B) 2, 852 , 572 , 954 2, 314 1, 362 1, 115 1, 845 1, 629 95, 0% C. I. for EXP(B) Lower Upper 1, 367 5, 948 , 279 1, 172 , 876 1, 038 1, 087 4, 926 , 632 , 314 , 675 2, 934 3, 960 5, 045 41

Lineaarinen regressioanalyysi n n n Selitetään jatkuvaa (tai ainakin välimatka -asteikollista) muuttujaa Selittäviä muuttujia

Lineaarinen regressioanalyysi n n n Selitetään jatkuvaa (tai ainakin välimatka -asteikollista) muuttujaa Selittäviä muuttujia voi olla useita Muuttujien välinen riippuvuus oletetaan lineaariseksi Selittävät muuttujat ei saa liikaa korreloida keskenään (multikollineaarisuus) Selitettävän muuttujan hajonta ei riipu selittävien muuttujien hajonnasta (homoskedastisuus) 42

Esimerkki n n Kohortti 1986, aleksitymiamittarin (TAS) faktoreiden ennustaminen Kolme faktoria (faktoripisteet) F 1:

Esimerkki n n Kohortti 1986, aleksitymiamittarin (TAS) faktoreiden ennustaminen Kolme faktoria (faktoripisteet) F 1: vaikeuksia tunteiden tunnistamisessa u F 2: vaikeuksia tunteiden kuvaamisessa u F 3: ulospäin suuntautunut ajattelu u n Ennustavat muuttujat Sukupuoli u Sosiaaliluokka u Perhetyyppi u Käyttäytyminen 8 v (Rutter) u 43

Muuttujien jakaumat Alkuperäinen muuttuja Faktoripistemuuttuja Uusi muuttuja: useampi luokkainen (”jatkuvampi”) ja vähemmän vino 44

Muuttujien jakaumat Alkuperäinen muuttuja Faktoripistemuuttuja Uusi muuttuja: useampi luokkainen (”jatkuvampi”) ja vähemmän vino 44

Muuttujien jakaumat Alkuperäinen muuttuja Faktoripistemuuttuja 45

Muuttujien jakaumat Alkuperäinen muuttuja Faktoripistemuuttuja 45

Muuttujien jakaumat Alkuperäinen muuttuja Faktoripistemuuttuja 46

Muuttujien jakaumat Alkuperäinen muuttuja Faktoripistemuuttuja 46

Esimerkki u. F 1: vaikeuksia tunteiden tunnistamisessa 47

Esimerkki u. F 1: vaikeuksia tunteiden tunnistamisessa 47

Esimerkki u. F 2: vaikeuksia tunteiden kuvaamisessa 48

Esimerkki u. F 2: vaikeuksia tunteiden kuvaamisessa 48

Esimerkki u. F 3: ulospäin suuntautunut ajattelu 49

Esimerkki u. F 3: ulospäin suuntautunut ajattelu 49

Varianssianalyysi n ANOVA u n MANOVA u n Yksi jatkuva selitettävä eli vastemuuttuja Useita

Varianssianalyysi n ANOVA u n MANOVA u n Yksi jatkuva selitettävä eli vastemuuttuja Useita jatkuvia vastemuuttujia Toistettujen mittausten ANOVA = Repeated measurements ANOVA u Samat mittaukset on tehty useaan kertaan samoilta henkilöiltä n ANOVA, MANOVA and r. ANOVA u n Vain luokiteltuja altisteita ANCOVA, MANCOVA, r. ANCOVA u Myös jatkuvia altisteita 50

Esimerkki Erot hippokampuksen koossa n Pohjois-Suomen 1966 syntymäkohortti u Seurantatutkimus 1999 -2001 Skitsofreniapotilaat (N=56)

Esimerkki Erot hippokampuksen koossa n Pohjois-Suomen 1966 syntymäkohortti u Seurantatutkimus 1999 -2001 Skitsofreniapotilaat (N=56) vs. terveet verrokit (N=104) n Toistettujen mittausten ANCOVA n u Oikean ja vasemman puolen hippokampusmittauksia käsitellään toistettuina mittauksia 51

Schizophrenia and Comparison subjects Hippocampus volumes Model 1 Within effect: side Diagnosis Gender Model

Schizophrenia and Comparison subjects Hippocampus volumes Model 1 Within effect: side Diagnosis Gender Model 2 Within effect: side Covariate: brain vol. Diagnosis Gender Familial psychosis Perinatal risk Handedness F Sig. 20. 3 1. 2 6. 5 < 0. 001 0. 28 0. 01 0. 81 35. 0 < 0. 01 0. 7 1. 9 0. 8 0. 37 < 0. 001 0. 89 0. 41 0. 17 0. 38 0. 61 Tanskanen ym. Schizophrenia Research (2005) 52

Rakenneyhtälömallitus = Structural Equation Modeling n n n Faktorianalyysin ja regressioanalyysin yhdistelmä Jatkuvia ja

Rakenneyhtälömallitus = Structural Equation Modeling n n n Faktorianalyysin ja regressioanalyysin yhdistelmä Jatkuvia ja luokiteltuja altisteita ja vasteita Esitetään mitattujen muuttujien ja piilevien muuttujien suhteet (esim. korrelaatioina) Byrne (2001) Structural Equation Modeling with AMOS: Basic Concepts, Applications, and Programming. 53

Esimerkki: Nursing orientation Orientation to learning nursing Orientation to nursing • male, p=. 002

Esimerkki: Nursing orientation Orientation to learning nursing Orientation to nursing • male, p=. 002 + • older, p<. 0001 • no children, p=. 048 Caring orientation + (r=. 27) + (r=. 47) + (r=. 64) • Swedish, p<. 0001 • older, p<. 0001 • no children, p=. 036 + Catalyticco-operational nursing + • older, p=. 034 + (r=. 44) Expertise + (r=. 19) orientation Controlling nursing + • Swedish, p<. 0001 • older, p 0. 002 + (r=. 18) + (r=. 11) • Finnish, p=. 020 + • younger, p=. 0003 • sairaanhoit, p=. 020 • no children, p<. 0001 Life orientation + (r=. 22) Confirming nursing + • older, p=. 030 54 Vanhanen-Nuutinen ym. (käsikirjoitus)

Latent class analysis n Kehitetty ryhmittelemään henkilöt valittujen piirteiden mukaan u Luokittelee ihmiset ryhmiin

Latent class analysis n Kehitetty ryhmittelemään henkilöt valittujen piirteiden mukaan u Luokittelee ihmiset ryhmiin u Kertoo piirteet (säännöt) joilla luokitus tehtiin n Verrattavissa klusterianalyysiin u Klusterianalyysi ei anna sääntöjä luokitukseen (=mallia) Muthén & Muthén (Alcohol Clin Exp Res, 24, 882 -91, 2000) 55

Esimerkki: Antisosiaalinen käyttäytym n n National Longitudinal Survey of Youth (NLSY) Respondent ages between

Esimerkki: Antisosiaalinen käyttäytym n n National Longitudinal Survey of Youth (NLSY) Respondent ages between 16 and 23 Background information: age, gender and ethnicity N=7, 326 17 antisocial dichotomously scored behavior items: n n n n Damaged property Fighting Shoplifting Stole <$50 Stole >$50 Use of force Seriously threaten Intent to injure n n n n n Use Marijuana Use other drug Sold Marijuana Sold hard drugs ‘Con’ somebody Stole an Automobile Broken into a building Held stolen goods Gambling Operation Lähde: http: //www. ats. ucla. edu/stat/mplus/seminars/lca/default. htm 56

Example: Anti-Social Behavior Damage Property Fighting Shoplifting Stole <$50 . . . Gambling Male

Example: Anti-Social Behavior Damage Property Fighting Shoplifting Stole <$50 . . . Gambling Male Race C Age 57

Example: Anti-Social Behavior probabilities 58

Example: Anti-Social Behavior probabilities 58

Relationship between class probabilities and age by gender Females 16 17 18 19 20

Relationship between class probabilities and age by gender Females 16 17 18 19 20 Males 21 22 23 (age) 16 17 18 19 20 21 22 23 59

Yleisiä lähteitä tilastomenetelmiin n n Metsämuuronen. Tutkimuksen tekemisen perusteet ihmistieteissä (2003) Nummenmaa et al.

Yleisiä lähteitä tilastomenetelmiin n n Metsämuuronen. Tutkimuksen tekemisen perusteet ihmistieteissä (2003) Nummenmaa et al. Tutkimusaineiston analyysi (1997) Uhari & Nieminen. Epidemiologia & Biostatistiikka (2001) SPSS, SAS, jne. oppaat 60