Tilastomenetelmt psykiatrisessa epidemiologiassa Jouko Miettunen FT 9 10

  • Slides: 78
Download presentation
Tilastomenetelmät psykiatrisessa epidemiologiassa Jouko Miettunen, FT 9. 10. 2007 Psykiatrian klinikka

Tilastomenetelmät psykiatrisessa epidemiologiassa Jouko Miettunen, FT 9. 10. 2007 Psykiatrian klinikka

Esitelmän aiheet Perusmenetelmiä n Ristiintaulukkojen testaaminen n Jakaumien tunnusluvut ja testaaminen n Korrelaatiokertoimet Monimuuttujamenetelmiä

Esitelmän aiheet Perusmenetelmiä n Ristiintaulukkojen testaaminen n Jakaumien tunnusluvut ja testaaminen n Korrelaatiokertoimet Monimuuttujamenetelmiä n Regressioanalyysit n Elinaika-analyysi n Varianssianalyysit n Faktorianalyysit n Muita menetelmiä (Luotettavuuden arviointi) Tilasto-ohjelmat Kirjallisuutta 2

Perusmenetel miä 3

Perusmenetel miä 3

Luokitellut muuttujat n Jakaumien vertailu ryhmien välillä n Tilastollinen testaaminen u Khiin neliötesti, OR,

Luokitellut muuttujat n Jakaumien vertailu ryhmien välillä n Tilastollinen testaaminen u Khiin neliötesti, OR, RR Jatkuvat muuttujat n Keskiarvojen vertailu ryhmien välillä u Studentin t-testi n Mediaanien vertailu ryhmien välillä u Mann-Whitneyn U-testi u Kruskal-Wallisin testi n Korrelaatiokertoimet 4

Jatkuva vai luokiteltu muuttuja? n n n Luokittelemalla menetetään tietoa Usein kuitenkin selkeyttää tulosten

Jatkuva vai luokiteltu muuttuja? n n n Luokittelemalla menetetään tietoa Usein kuitenkin selkeyttää tulosten esittämistä Analyysimenetelmät erilaisia 5

Luokittelutapoja n n n Aiemmat tutkimukset Kliiniset kriteerit Aineistoon perustuvat Mediaani, kvartiilit, alin/ylin 10%,

Luokittelutapoja n n n Aiemmat tutkimukset Kliiniset kriteerit Aineistoon perustuvat Mediaani, kvartiilit, alin/ylin 10%, jne. u Keskiarvo ± 2 keskihajontaa u 6

Ristiintaulukkojen testaaminen n n c 2 –testi Fisherin tarkka testi (Fisher’s exact test) Epidemiologiassa

Ristiintaulukkojen testaaminen n n c 2 –testi Fisherin tarkka testi (Fisher’s exact test) Epidemiologiassa erityisesti käytössä n vetosuhde, ristitulosuhde (odds ratio) n riskisuhde (risk ratio) 7

Esimerkki n n n Pohjois-Suomen 1966 syntymäkohortti Seisomaan oppiminen ja myöhempi psykoottinen sairaus Jatkoanalyysi

Esimerkki n n n Pohjois-Suomen 1966 syntymäkohortti Seisomaan oppiminen ja myöhempi psykoottinen sairaus Jatkoanalyysi psykoosipotilaiden joukossa u Onko sukurasituksella merkitystä? 8

Age at standing unsupported * Psychotic disorder until 2001 c 2 –testi Age at

Age at standing unsupported * Psychotic disorder until 2001 c 2 –testi Age at standing unsupported - 10 months 11 months 12 months + Total Count Psychotic disorder until 2001 healthy any psychosis 4074 40 Total 4114 99, 0% 100, 0% 2430 35 2465 98, 6% 1, 4% 100, 0% 2970 60 3030 98, 0% 2, 0% 100, 0% 9474 135 9609 98, 6% 1, 4% 100, 0% 9

Fisherin tarkka testi Age at standing unsupported * Any psychotic 1 st degree relative

Fisherin tarkka testi Age at standing unsupported * Any psychotic 1 st degree relative no Age at standing unsupported - 10 months 11 months 12 months + Total - Pienille otoksille - Jos väh. 25 prosentissa soluista odotettu Count yes Total 9 8 1 88, 9% 11, 1% 100, 0% 16 2 18 88, 9% 11, 1% 100, 0% 23 6 29 79, 3% 20, 7% 100, 0% 47 9 56 83, 9% 16, 1% 100, 0% 10

Assosiaation mittaaminen epidemiologiassa n Absoluuttinen u Riskiero (risk difference) F n Altistunut – ei-altistunut

Assosiaation mittaaminen epidemiologiassa n Absoluuttinen u Riskiero (risk difference) F n Altistunut – ei-altistunut Suhteellinen Riskisuhde (risk ratio, relative risk, RR) u Ristitulosuhde tai vetosuhde (odds ratio, OR) u F n Altistunut / ei-altistunut Eivät kerro sellaisenaan kausaliteetista 11

Tauti Kyllä Ei Kyllä a b a+b Ei c d c+d a+c b+c a+b+c+d

Tauti Kyllä Ei Kyllä a b a+b Ei c d c+d a+c b+c a+b+c+d Altiste Yhteensä a / (a + b) c / (c + d) Riskisuhde, RR = Odds Ratio, OR = Yhteensä a/b c/d = ad bc 12

Lapsella psykoosi Vanhemmalla psykoosi Kyllä Ei Yhteensä RR = OR = Kyllä Ei Yhteensä

Lapsella psykoosi Vanhemmalla psykoosi Kyllä Ei Yhteensä RR = OR = Kyllä Ei Yhteensä 24 (5. 0%) 459 132 (1. 3%) 10319 10451 10934 156 483 24 / (24 + 459) = 3. 9 132 / (132 + 10319) 24 / = 4. 1 132 / 459 13

Odds Ratio (OR) vai Risk Ratio (RR)? n n RR tarkempi riskin tunnuslukuna Mikäli

Odds Ratio (OR) vai Risk Ratio (RR)? n n RR tarkempi riskin tunnuslukuna Mikäli yleinen sairaus tulisi käyttää RR: ää OR: ssä on helpompi ottaa huomioon sekoittavat tekijät Mikäli harvinainen sairaus ja iso aineisto OR ≈ RR 14

Jatkuvat muuttujat 15

Jatkuvat muuttujat 15

Keskiarvo vai mediaani? n n Keskiarvo soveltuu likimain normaalijakautuneelle aineistolle Mikäli aineistossa on paljon

Keskiarvo vai mediaani? n n Keskiarvo soveltuu likimain normaalijakautuneelle aineistolle Mikäli aineistossa on paljon poikkeavia arvoja tai se on huomattavan vino, mediaani kuvaa muuttujan jakaumaa paremmin 16

Normaaliuden arviointi n n n Mikäli mediaani ja keskiarvo eroavat huomattavasti toisistaan, jakauma ei

Normaaliuden arviointi n n n Mikäli mediaani ja keskiarvo eroavat huomattavasti toisistaan, jakauma ei ole normaalijakautunut Huipukkuus (kurtosis) ja vinous (skewness) kuvaavat normaalisuutta Normaaliuden testit eivät ole tehokkaita Kolmogorov-Smirnov testi u Shapiro-Wilk testi (kun N<50) u n Tärkein on kuitenkin visuaalinen arvio! 17

Muuttujien erilaisia jakaumia B on normaalijakautunut. A on positiivisesti huipukas jakauma C negatiivisesti huipukas

Muuttujien erilaisia jakaumia B on normaalijakautunut. A on positiivisesti huipukas jakauma C negatiivisesti huipukas Havainnot on kasaantunut oikealle (jakauma on negatiivisesti vino eli vino vasemmalle) 18

Keskiarvojen vertailu: ttesti 19

Keskiarvojen vertailu: ttesti 19

Mediaanien vertailu: Mann-Whitneyn U-testi Pohjois-Suomen 1986 syntymäkohortti 15 -16 v. : Toronto Alexithym 20

Mediaanien vertailu: Mann-Whitneyn U-testi Pohjois-Suomen 1986 syntymäkohortti 15 -16 v. : Toronto Alexithym 20

Mediaanien vertailu: Kruskal-Wallisin H-testi Pohjois-Suomen 1966 syntymäkohortti: masennusoireet (SCL-2 - Ei testaa varsinaisesti mediaaneja

Mediaanien vertailu: Kruskal-Wallisin H-testi Pohjois-Suomen 1966 syntymäkohortti: masennusoireet (SCL-2 - Ei testaa varsinaisesti mediaaneja vaan koko jakauman sijaintia (suositelta - Varsinaisesti mediaaneja testataan esim. jakamalla koko aineisto mediaanis kahteen osaan ja verrataan jakaumia ry välillä (esim. tässä koulutuksen mukaan c 2 –testillä. 21

Korrelaatiokertoimet n Pearsonin korrelaatiokerroin u. Normaalijakautuneille muuttujille n Spearmanin korrelaatiokerroin u Ei-normaalijakautuneille n muuttujille

Korrelaatiokertoimet n Pearsonin korrelaatiokerroin u. Normaalijakautuneille muuttujille n Spearmanin korrelaatiokerroin u Ei-normaalijakautuneille n muuttujille u Järjestyskorrelaatiokerroin (mean rank) Tuloksia voi graafisesti esittää korrelaatiodiagrammin avulla 22

Korrelaatiodiagram mi r = 0. 75 23

Korrelaatiodiagram mi r = 0. 75 23

Monimuuttujamenete lmät 24

Monimuuttujamenete lmät 24

Lineaarinen regressioanalyysi n n Selitetään jatkuvaa (tai ainakin välimatka-asteikollista) muuttujaa Selittäviä muuttujia voi olla

Lineaarinen regressioanalyysi n n Selitetään jatkuvaa (tai ainakin välimatka-asteikollista) muuttujaa Selittäviä muuttujia voi olla useita u Jatkuvia tai kaksiluokkaisia muuttujia n n n Muuttujien välinen riippuvuus oletetaan lineaariseksi Selittävät muuttujat ei saa liikaa korreloida keskenään (multikollineaarisuus) Selitettävän muuttujan hajonta ei riipu selittävien muuttujien hajonnasta (homoskedastisuus) 25

Esimerkki n n n Kohortti 1966, 31 v. seuranta Alkoholin käytön (g/pv) ennustaminen Ennustavat

Esimerkki n n n Kohortti 1966, 31 v. seuranta Alkoholin käytön (g/pv) ennustaminen Ennustavat muuttujat u Sukupuoli u Siviilisääty (naimaton tai eronnut, ei/kyllä) u Masennus F Jatkuva muuttuja (SCL- masennusoireet) u Syntymäpaino F Jatkuva muuttuja (g) 26

Esimerkki 27

Esimerkki 27

Logistinen regressioanalyysi n n Yleisin tapa ottaa huomioon sekoittavat muuttujat, Erityisesti pitkittäistutkimuksissa Vastemuuttuja (outcome)

Logistinen regressioanalyysi n n Yleisin tapa ottaa huomioon sekoittavat muuttujat, Erityisesti pitkittäistutkimuksissa Vastemuuttuja (outcome) on kaksiluokkainen (esim. kyllä/ei) Altistemuuttujat (exposure) voivat olla sekä kaksiluokkaisia, useampiluokkaisia että jatkuvia Multinomiaalisessa logistisessa regressioanalyysissa vastemuuttujassa voi olla useita luokkia 28

Muuttujien valinta, esim. n n n Aiemman tiedon tai ko. aineiston perusteella Sosiodemograafiset muuttujat,

Muuttujien valinta, esim. n n n Aiemman tiedon tai ko. aineiston perusteella Sosiodemograafiset muuttujat, esim. sukupuoli, sosiaaliluokka? Malliin mukaan aiemmin tunnetut sekoittavat tekijät? u n Mukana ei saa olla liikaa muuttujia u n Erityisesti jos vaikuttavat tuloksiin Riippuu aineiston koosta ja muuttujien jakaumista Mukana ei kannata olla keskenään liikaa korreloivia muuttujia 29

Esimerkki Pohjois-Suomen vuoden 1966 syntymäkohortti n n N = 10 934 Runsaasti haastattelu- ja

Esimerkki Pohjois-Suomen vuoden 1966 syntymäkohortti n n N = 10 934 Runsaasti haastattelu- ja rekisteridataa 30

Esimerkki n n n Mikä psykoottisilla potilailla ennustaa uutta sairaalahoitoa? N = 158 Altistemuuttujat

Esimerkki n n n Mikä psykoottisilla potilailla ennustaa uutta sairaalahoitoa? N = 158 Altistemuuttujat u sukupuoli u Isän sosiaaliluokka (1980) u Sukurasitus u Sairastumisikä u Ensimmäisen sairaalahoidon kesto u diagnoosi (skitsofrenia / muu psykoosi) Miettunen ym. Nord J Psychiatry 2006; 60: 286 -93. 31

SPSS Output - muuttujat Categorical Variables Codings Fathers social class 1980 Parent has psychotic

SPSS Output - muuttujat Categorical Variables Codings Fathers social class 1980 Parent has psychotic dg 1972 -2000 Sex Diagnosis Length of first hospitalization I, II III, IV V no yes male female schizophrenia other psych < 1 month > 1 month Frequency 48 96 14 133 25 93 65 108 50 94 64 Parameter coding (1) (2) , 000 1, 000 , 000 1, 000 32

SPSS Output - tulokset Variables in the Equation Length of 1 st hospital. (1)

SPSS Output - tulokset Variables in the Equation Length of 1 st hospital. (1) Sex(1) Onset age Diagnosis(1) Father’s Social Class 1980 FSC 1980(1) FSC 1980(2) Parental psychosis(1) Constant B 1, 048 -, 559 -, 047 , 839 S. E. , 375 , 366 , 043 , 385 , 309 , 109 , 612 , 488 , 392 , 647 , 513 1, 100 Wald 7, 805 2, 331 1, 199 4, 740 , 651 , 622 , 028 1, 423 , 197 df 1 1 2 1 1 Sig. , 005 , 127 , 274 , 029 , 722 , 430 , 866 , 233 , 657 Exp(B) 2, 852 , 572 , 954 2, 314 1, 362 1, 115 1, 845 1, 629 95, 0% C. I. for EXP(B) Lower Upper 1, 367 5, 948 , 279 1, 172 , 876 1, 038 1, 087 4, 926 , 632 , 314 , 675 2, 934 3, 960 5, 045 33

Varianssianalyysi n n Verrataan ryhmien sisäistä ja välistä variaatiota ANOVA u n MANOVA u

Varianssianalyysi n n Verrataan ryhmien sisäistä ja välistä variaatiota ANOVA u n MANOVA u n Yksi jatkuva selitettävä eli vastemuuttuja Useita jatkuvia vastemuuttujia Toistettujen mittausten ANOVA = Repeated measurements ANOVA u Samat mittaukset on tehty useaan kertaan samoilta henkilöiltä n ANOVA, MANOVA and r. ANOVA u n Vain luokiteltuja altisteita ANCOVA, MANCOVA, r. ANCOVA u Myös jatkuvia altisteita 34

Esimerkki Erot hippokampuksen koossa n Pohjois-Suomen 1966 syntymäkohortti u Seurantatutkimus 1999 -2001 Skitsofreniapotilaat (N=56)

Esimerkki Erot hippokampuksen koossa n Pohjois-Suomen 1966 syntymäkohortti u Seurantatutkimus 1999 -2001 Skitsofreniapotilaat (N=56) vs. terveet verrokit (N=104) n Toistettujen mittausten ANCOVA n u Oikean ja vasemman puolen hippokampusmittauksia käsitellään toistettuina mittauksia 35

Schizophrenia and Comparison subjects Hippocampus volumes Model 1 Within effect: side Diagnosis Gender Model

Schizophrenia and Comparison subjects Hippocampus volumes Model 1 Within effect: side Diagnosis Gender Model 2 Within effect: side Covariate: brain vol. Diagnosis Gender Familial psychosis Perinatal risk Handedness F Sig. 20. 3 1. 2 6. 5 < 0. 001 0. 28 0. 01 0. 81 35. 0 < 0. 01 0. 7 1. 9 0. 8 0. 37 < 0. 001 0. 89 0. 41 0. 17 0. 38 0. 61 Tanskanen ym. Schizophrenia Research (2005) 36

Elinaikaanalyysi (Survival analysis) 37

Elinaikaanalyysi (Survival analysis) 37

Elinaika-analyysi n Tutkitaan aikaa kahden tapahtuman välissä, esim. Syntymästä sairastumiseen u Sairastumisesta kuolemaan u

Elinaika-analyysi n Tutkitaan aikaa kahden tapahtuman välissä, esim. Syntymästä sairastumiseen u Sairastumisesta kuolemaan u Uloskirjoittautumisesta uuteen sairaalahoitoon u n n Kaplan-Meierin mallilla arvioidaan tapahtumien todennäkoisyyksiä eri aikapisteissä Käytössä usein kohorttitutkimuksissa 38

Elinaika-analyysiin tarvittava tieto n n Tapahtuma (0, 1) Aika tapahtumaan (päiviä, kuukausia, …) tai

Elinaika-analyysiin tarvittava tieto n n Tapahtuma (0, 1) Aika tapahtumaan (päiviä, kuukausia, …) tai sensurointiin u Aineisto voi sensuroitua Seuranta loppuu F Menetetään yhteys tutkittavaan (esim. muuttaa muualle) F Seurattava henkilö kuolee muusta syystä kuin mikä on tutkimuksen kohteena F 39

Esimerkki Pohjois-Suomen 1966 Syntymäkohortti n n n Mikä ennustaa itsemurhan tekoikää? Otos Suomessa asuvat

Esimerkki Pohjois-Suomen 1966 Syntymäkohortti n n n Mikä ennustaa itsemurhan tekoikää? Otos Suomessa asuvat 16 -vuotiaana (N=10, 934) Seuranta vuoden 2001 loppuun 58 (0. 5%) itsemurhaa u 140 (1. 3%) muuta kuolemaa u 10, 736 (98. 2%) elossa u n Ennustajamuuttuja u Perhetyyppi syntymähetkellä (parisuhteessa, yksin) 40

Käyrät voivat kuvata eloonjäämistä (survival) tai toisinpäin piirrettynä vaa Test Statistics for Equality of

Käyrät voivat kuvata eloonjäämistä (survival) tai toisinpäin piirrettynä vaa Test Statistics for Equality of Survival Distributions log rank test, p=0. 002 41

n Ryhmien välisen eron, tai trendin erossa, tulisi olla suurinpiirtein sama seurannan ajan u

n Ryhmien välisen eron, tai trendin erossa, tulisi olla suurinpiirtein sama seurannan ajan u käyrien ei tulisi ainakaan mennä ristiin, jos halutaan testata tilastollisesti n n Otoskoko voi olla suhteellisen pieni Viitteitä, esim. Parmar & Machin: Survival analysis. A practical approach. John Wiley & Sons, 1995. 42

Sekoittavien tekijöiden huomiointi Itsemurhan ikä ja perhetyyppi n Mahdollisia sekoittavia tekijöitä u sukupuoli u

Sekoittavien tekijöiden huomiointi Itsemurhan ikä ja perhetyyppi n Mahdollisia sekoittavia tekijöitä u sukupuoli u sosiaaliluokka 1966 (I-II, III-IV, V) u kouluarvosanojen keskiarvo (14 -v. ) u psykiatrinen diagnoosi (ei, kyllä) u rikos (ei, ei-väkivaltainen, väkivaltainen) n Coxin regressioanalyysi 43

SPSS Output - muuttujat Categorical Variable Codings Sex 1=male 2=female Psych dg 0=healthy 1=any

SPSS Output - muuttujat Categorical Variable Codings Sex 1=male 2=female Psych dg 0=healthy 1=any dg Fathers Social 1=I, II Class 1966 2=III, IV 3=V Family type 1=single 1966 2=full Criminality 0=no crimes 1=violent 2=nonviolent Frequency 5425 5222 10197 450 783 7823 2041 1975 8672 10019 200 428 (1) (2) 1 0 0 1 0 1 0 0 0 1 44

SPSS Output - tulokset Variables in the Equation B SEX PSYCH DG FAM TYPE

SPSS Output - tulokset Variables in the Equation B SEX PSYCH DG FAM TYPE FSC 1966(1) FSC 1966(2) SCHOOL MARK CRIMES(1) CRIMES(2) , 812 2, 463 , 728 SE , 340 , 303 , 287 , 451 , 536 -, 276 , 715 , 436 , 164 , 239 -1, 011 , 454 , 625 Wald 5, 720 66, 085 6, 429 1, 514 , 398 1, 513 2, 825 3, 398 , 276 2, 613 df 1 1 1 2 1 1 Sig. , 017 , 000 , 011 , 469 , 528 , 219 , 093 , 183 , 600 , 106 Exp(B) 2, 253 11, 740 2, 072 95, 0% CI for Exp(B) Lower Upper 1, 158 4, 383 6, 483 21, 260 1, 180 3, 637 1, 570 1, 710 , 759 , 386 , 727 , 550 6, 377 4, 018 1, 047 1, 269 , 364 , 521 , 107 3, 093 1, 239 45

Faktorianalyy si 46

Faktorianalyy si 46

Kyselylomakkeen kehittäminen n n n Psykologia, psykiatria, hoitotiede, kasvatustiede, sosiologia, … Lomakkeissa usein liki

Kyselylomakkeen kehittäminen n n n Psykologia, psykiatria, hoitotiede, kasvatustiede, sosiologia, … Lomakkeissa usein liki samoja asioita mittaavia kysymyksiä Etsitään muuttujien yhdistelmistä selittävää mallia, tiivistetään tietoa Etsitään tärkeimpiä muuttujia Kysymysten lukumäärä lomakkeessa u Mikä on sopiva (riittävä) määrä? Mahdolliset osa-asteikot 47

Piilevät muuttujat n n n Monia asioita ei voida mitata suoraan Tarvitaan useita samaa

Piilevät muuttujat n n n Monia asioita ei voida mitata suoraan Tarvitaan useita samaa ilmiötä mittaavia muuttujia Esim. älykkyys, sosiaalisuus, konservatiivisuus 48

Faktorianalyysit Eksploratiivinen faktorianalyysi (ja pääkomponenttianalyysi) [EFA (PCA)] u vanhimpia monimuuttujamenetelmiä (Spearman 1904) u etsitään

Faktorianalyysit Eksploratiivinen faktorianalyysi (ja pääkomponenttianalyysi) [EFA (PCA)] u vanhimpia monimuuttujamenetelmiä (Spearman 1904) u etsitään muuttujien kombinaatioista selitettävää mallia n Konfirmatorinen faktorianalyysi [CFA] u tutkitaan valmista mallia ja varmistetaan antaako aineisto tukea ko. mallille n 49

Esimerkkinä on psykoosioireita mittaavan PANSS (Positive and Negative Syndrome Scale) -asteikon rakenne (30 muuttujaa)

Esimerkkinä on psykoosioireita mittaavan PANSS (Positive and Negative Syndrome Scale) -asteikon rakenne (30 muuttujaa) n Mittarista on esitetty useita erilaisia faktoriratkaisuja n Aineistona on Pohjois-Suomen vuoden 1966 syntymäkohortin psykoottisia henkilöitä jotka osallistuivat haastatteluun 1999 -2001 n Pieni aineisto (N=85) u Muuttujat likert-asteikolla (1 -7) u Muuttujissa on vaihtelua u 50

- (taulukossa lataus, vain jos >0. 3) 51

- (taulukossa lataus, vain jos >0. 3) 51

Muita menetelmiä n n Structural Equation Modelling (Rakenneyhtälomallitus) Latent Class Analysis 52

Muita menetelmiä n n Structural Equation Modelling (Rakenneyhtälomallitus) Latent Class Analysis 52

Rakenneyhtälömallitus n n n Faktorianalyysin ja regressioanalyysin yhdistelmä Jatkuvia ja luokiteltuja altisteita ja vasteita

Rakenneyhtälömallitus n n n Faktorianalyysin ja regressioanalyysin yhdistelmä Jatkuvia ja luokiteltuja altisteita ja vasteita Esitetään mitattujen muuttujien ja piilevien muuttujien suhteet (esim. korrelaatioina) Byrne (2001) Structural Equation Modeling with AMOS: Basic Concepts, Applications, and Programming. 53

Esimerkki: Mistä hyvinvointi koostuu? 54 Mc. Gartland Rubio ym. 20

Esimerkki: Mistä hyvinvointi koostuu? 54 Mc. Gartland Rubio ym. 20

Latent class analysis n Kehitetty ryhmittelemään henkilöt valittujen piirteiden mukaan u Luokittelee ihmiset ryhmiin

Latent class analysis n Kehitetty ryhmittelemään henkilöt valittujen piirteiden mukaan u Luokittelee ihmiset ryhmiin u Kertoo piirteet (säännöt) joilla luokitus tehtiin n Verrattavissa klusterianalyysiin u Klusterianalyysi ei anna sääntöjä luokitukseen (=mallia) Muthén & Muthén (Alcohol Clin Exp Res, 24, 882 -91, 2000) 55

Esimerkki: Antisosiaalinen käyttäytym n n National Longitudinal Survey of Youth (NLSY) Respondent ages between

Esimerkki: Antisosiaalinen käyttäytym n n National Longitudinal Survey of Youth (NLSY) Respondent ages between 16 and 23 Background information: age, gender and ethnicity N=7, 326 17 antisocial dichotomously scored behavior items: n n n n Damaged property Fighting Shoplifting Stole <$50 Stole >$50 Use of force Seriously threaten Intent to injure n n n n n Use Marijuana Use other drug Sold Marijuana Sold hard drugs ‘Con’ somebody Stole an Automobile Broken into a building Held stolen goods Gambling Operation Lähde: http: //www. ats. ucla. edu/stat/mplus/seminars/lca/default. htm 56

Esimerkki: Antisosiaalinen käyttäytyminen Damage Property Fighting Shoplifting Stole <$50 . . . Gambling Male

Esimerkki: Antisosiaalinen käyttäytyminen Damage Property Fighting Shoplifting Stole <$50 . . . Gambling Male Race C Age 57

Esimerkki: Antisosiaalinen käyttäytyminen 58

Esimerkki: Antisosiaalinen käyttäytyminen 58

Relationship between class probabilities and age by gender Females 16 17 18 19 Males

Relationship between class probabilities and age by gender Females 16 17 18 19 Males 20 21 22 23 16(age) 17 18 19 20 21 22 59

Luotettavuuden arviointi 60

Luotettavuuden arviointi 60

Reliabiliteetin ja validiteetin käsitteitä n Reliabiliteetti u Kuinka hyvin mittarilla tehty mittaus on toistettavissa

Reliabiliteetin ja validiteetin käsitteitä n Reliabiliteetti u Kuinka hyvin mittarilla tehty mittaus on toistettavissa (=stabiliteetti) u kuinka yhdenmukaisesti kaksi mittaria/mittaajaa arvioi samaa asiaa tai kuinka hyvin mittarin kysymykset mittaa samaa asiaa (=konsistenssi) n Validiteetti u Kuinka hyvin mittari mittaa sitä mitä sen pitäisi mitata Psykiatriassa reliabiliteetti ja validiteetti on usein vaikeampi saavuttaa kuin somaattisella puolella! 61

 • Reliabiliteetti huono • Validiteetti huono • Reliabiliteetti hyvä • Validiteetti huono •

• Reliabiliteetti huono • Validiteetti huono • Reliabiliteetti hyvä • Validiteetti huono • Reliabiliteetti hyvä • Validiteetti ei voi olla hyvä, jos reliabiliteetti on huono 62

Reliabiliteetin ja validiteetin käsitteitä n Construct validity (=rakennevaliditeetti) u u onko teoriakäsite riittävästi ja

Reliabiliteetin ja validiteetin käsitteitä n Construct validity (=rakennevaliditeetti) u u onko teoriakäsite riittävästi ja onnistuneesti mitattu? Convergent validity (=yhtenevyys) F onnistuuko käsitteen mittaaminen muulla mittarilla u Discriminant validity (=erottelu) F onnistuuko mittari erottamaan käsitteen muista käsitteistä Blacker & Endicott 2000, Morgan et al. 2001 63

Reliabiliteetin ja validiteetin käsitteitä n Content validity (=sisältövaliditeetti) u n Kattavatko kysymykset käsitteen riittävästi

Reliabiliteetin ja validiteetin käsitteitä n Content validity (=sisältövaliditeetti) u n Kattavatko kysymykset käsitteen riittävästi Face validity (=näennäisvaliditeetti) u Vaikuttaako mittari mittaavan sitä mitä on tarkoitus Blacker & Endicott 2000, Morgan et al. 2001 64

Reliabiliteetin ja validiteetin käsitteitä n Criterion validity (=kriteerivaliditeetti) u u Miten mittari liittyy muihin

Reliabiliteetin ja validiteetin käsitteitä n Criterion validity (=kriteerivaliditeetti) u u Miten mittari liittyy muihin samaa asiaa mittaaviin kriteereihin, esimerkiksi diagnoosiin Concurrent validity (=samanaikaisvaliditeetti) F Kuinka hyvin mittari ennustaa henkilön nykyistä tilaa u Predictive validity Blacker & Endicott 2000, Morgan et al. 2001 (=ennustevaliditeetti) 65

Luotettavuuden testaaminen n Luokiteltu muuttuja u Kappa, yhdenmukaisuus n Jatkuva muuttuja u Intraclass korrelaatio

Luotettavuuden testaaminen n Luokiteltu muuttuja u Kappa, yhdenmukaisuus n Jatkuva muuttuja u Intraclass korrelaatio (arvioiden tai mittausten yhdenmukaisuus) u Cronbachin Alpha (kysymyslomakkeen sisäinen yhdenmukaisuus) n Voidaan testata joko arvioijien välillä (interrater) tai saman arvioijan kahden eri arvion välillä (test-retest) 66

Diagnostiseen testiin liittyviä käsitteitä n Positiivisen tuloksen ennustearvo (positive predictive value, PPV) u n

Diagnostiseen testiin liittyviä käsitteitä n Positiivisen tuloksen ennustearvo (positive predictive value, PPV) u n Negatiivisen tuloksen ennustearvo (negative predictive value, NPV) u n Testillä oikein terveiksi todettujen osuus kaikista testinegatiivisista Herkkyys (sensitivity, se) u n Testillä oikein sairaaksi todettujen osuus kaikista testipositiivisista Testillä oikein tautia sairastaviksi todettujen osuus kaikista kyseistä tautia sairastavista Tarkkuus (specificity, sp) u Testillä oikein terveiksi todettujen osuus kaikista kyseistä terveistä Uhari. Duodecim 2004; 120: 935 -41. 67

 Arvioija B Arvioija A Kyllä Ei Yhteensä Kyllä a b Ei g 2

Arvioija B Arvioija A Kyllä Ei Yhteensä Kyllä a b Ei g 2 c d Yhteensä f 1 f 2 g 1 N Reliabiliteetti Havaittu yksimielisyys po = (a+d) / N Sattuman mukaan odotettu yksimielisyys pe = (f 1 g 1+f 2 g 2) / N 2 Kappa = (po-pe) / (1 -pe) Validiteetti (Arvioija B on oikeassa eli “kultainen standardi”, Arvioijan A validiteettia arvioijaan) Sensitiivisyys Spesivisyys Positiivinen ennustearvo Negatiivinen ennustearvo Se = a / f 1 Sp = d / f 2 PPV = a / g 1 NPV = d / g 2 68

Arvioija A Kyllä Ei Yhteensä Kyllä 35 15 50 Ei 125 150 25 Yhteensä

Arvioija A Kyllä Ei Yhteensä Kyllä 35 15 50 Ei 125 150 25 Yhteensä 60 140 200 Reliabiliteetti Havaittu yksimielisyys po = (35+125) / 200 = 0. 80 (80%) Sattuman mukaan odotettu yksimielisyys pe = (50*60+140*150) / 2002 = 0. 60 (60%) Kappa = (0. 8 -0. 6) / (1 -0. 6) = 0. 50 Validiteetti (Arvioija B on oikeassa eli “kultainen standardi”, Arvioijan A validiteettia arvioijaan) Sensitiivisyys Spesivisyys Positiivinen testituloksen ennustearvo Se = 35 / 60 = 0. 58 (58%) Sp = 125 / 140 = 0. 89 (89%) PPV = 35 / 50 = 0. 70 69

ROC -käyrä Sensitivity Receiver Operating Characteristic (ROC) 1 - Specificity 70

ROC -käyrä Sensitivity Receiver Operating Characteristic (ROC) 1 - Specificity 70

Cronbachin alpha n n n Perustuu varianssianalyysiin Kertoo kuinka yhdenmukaisesti mittarin eri kysymykset mittaavat

Cronbachin alpha n n n Perustuu varianssianalyysiin Kertoo kuinka yhdenmukaisesti mittarin eri kysymykset mittaavat samaa asiaa (internal consistency) Voidaan tehdä koko mittarille ja erikseen jokaiselle osa-asteikolle 71

n DATA ESIMERKKI VAR 1 VAR 2 VAR 3 VAR 4 VAR 5. .

n DATA ESIMERKKI VAR 1 VAR 2 VAR 3 VAR 4 VAR 5. . . CASE 1 0 1 2 0 … CASE 2 4 5 4 3 3 … CASE 3 0 0 1 0 0 … CASE 4 2 2 2 3 … CASE 5 3 1 2 3 … . : 72

Cronbachin alpha n n On esitetty erilaisia raja-arvoja, sille mikä on riittävä alpha 0.

Cronbachin alpha n n On esitetty erilaisia raja-arvoja, sille mikä on riittävä alpha 0. 60 – 0. 80, esim. 0. 70 (Nunnally 1978) Alphan suuruuteen vaikuttaa kysymysten lukumäärä, mitä enemmän sitä suurempi alpha Muuttujien vinous ongelma, samoin jos sama vastaaja vastaa kaikkiin kysymyksiin samoin (=varianssi on tärkeä) Nunnally (1978) Psychometric Theory 73

Esimerkkiaineisto n n Pohjois-Suomen vuoden 1966 syntymäkohortin 31 -vuotisseuranta TCI (Temperament and Character Inventory)

Esimerkkiaineisto n n Pohjois-Suomen vuoden 1966 syntymäkohortin 31 -vuotisseuranta TCI (Temperament and Character Inventory) u Reward Dependence –alaskaala F RD 1 – Sentimentality F RD 3 – Attachment F RD 4 – Dependence u Kaksiluokkaisia muuttujia 74

RD – koko asteikko RD 3 – Attachment RD – 1 Sentimentality RD –

RD – koko asteikko RD 3 – Attachment RD – 1 Sentimentality RD – 4 Dependence 75

Tilasto-ohjelmia n n n n SPSS (www. spss. com) SAS (www. sas. com) STATA

Tilasto-ohjelmia n n n n SPSS (www. spss. com) SAS (www. sas. com) STATA (www. stata. com) R+ (cran. r-project. org) SUDAAN (www. rti. org/sudaan) Mplus (www. statmodel. com) Stats. Direct (www. camcode. com) Meta. Win (www. metawinsoft. com) 76

Käsitteitä Incidence Ratio / Case Fatality Rate Ratio u Kahden ilmaantuvuuden / tapauskuoleisuuden suhde

Käsitteitä Incidence Ratio / Case Fatality Rate Ratio u Kahden ilmaantuvuuden / tapauskuoleisuuden suhde n Stanzardized Mortality Ratio u Havaitut kuolemat / odotetut kuolemat n Lisäriski (Attributable Risk, AR) u Riskimuuttujan omaavien henkilöiden lisäriski sairauteen n Väestön lisäriski (Population Attributable Risk, PAR) u Sairaiden osuus väestössä mikä johtuu riskimuuttujasta n Attributable Risk Reduction, ARR u Riskin väheneminen joka saadaan esim. Tutkittavalla hoidolla tai kun riskimuuttujan vaikutus poistettaisiin n Number Needed to Treat, NNT u Kuinka paljon pitäisi potilaita pitäisi hoitaa jotta vältyttäisiin yhdeltä vastetapahtumalta (esim. http: //www. vetmed. wsu. edu/courses-jmgay/Gloss. Clin. Epi. EBM. htm 77 kuolema) n

Yleisiä lähteitä tilastomenetelmiin suomeksi n n n Metsämuuronen. Tutkimuksen tekemisen perusteet ihmistieteissä (2003). Nummenmaa

Yleisiä lähteitä tilastomenetelmiin suomeksi n n n Metsämuuronen. Tutkimuksen tekemisen perusteet ihmistieteissä (2003). Nummenmaa ym. Tutkimusaineiston analyysi (1997). Uhari. Biostatistiikan taskutieto (2002). Uhari & Nieminen. Epidemiologia & Biostatistiikka (2001). SPSS, SAS, jne. Oppaat 78