Tre hovedtyper ml p variabler n Fysiologiske ml

Tre hovedtyper mål på variabler n Fysiologiske mål n EEG, PET-scan, puls, øyebevegelser m. m n Faktisk atferd n Frekvens (antall): Antall trykk på knapp, hjelper andre/hjelper ikke o. l n Latenstid: reaksjonstid, persepsjonstid o. l. n Selv-rapportering n Den som testes oppgir selv. n Spørreskjema, intelligens- og personlighetstester, holdninger, atferd (selvrapportert) m. m.

Måling av variabler n Psykologiske variabler er ofte (abstrakte) begreper som ikke kan observeres direkte n Angst, aggresjon, intelligens, depresjon, holdninger m. m. n For å måle disse begrepene, må de “oversettes” til observerbare forhold

Eksempel: Operasjonalisering av angst Er anspent og urolig Er lettskremt Angst Bekymrer seg for fremtiden Bekymrer seg for ting som kan gå galt Kan i dette tilfellet måles gjennom observasjon/intervju eller selvrapportering (man vurderer seg selv)

Krav til måleinstrumenter n De må være reliable (pålitelige) n De må være valide (at de måler det de er tiltenkt å måle) n Hvis ikke disse er oppfylt i rimelig grad, er studiet meningsløst

Ulike former for reliabilitet til et måleinstrument n Reliabilitet til et måleinstument n Inter-rater reliabilitet (reliabilitet til bedømmelser gjort av observatører)

Reliabilitet = pålitelighet i måling Observert skåre = sann skåre + målefeil Eks. en person tar samme evnetest mange ganger: sann skåre 1. gang 2. gang 3. gang 105 116 109 110 = sann skåre Avvik fra 110 er målefeil

Ulike metoder å estimerer reliabiliteten til et måleinstrument på Test-retest n Finner korrelasjonen mellom to målinger av samme test på forskjellig tidspunkt. n Ulemper: endring over tid, kan huske svar fra 1. gangs måling Alternativ form n Lager to versjoner av samme test. Lik mht innhold, men har ikke identiske spørsmål. n Finner korrelasjonen mellom de to versjonene n Ulempe: endring over tid, ikke gitt at de to versjonene er like Split-half n En test splittes i to like deler. n Administrer testen en gang, finn korrelasjonen mellom de delene n Ulempe: ikke sikkert at de to halvdelene er like Indre konsistens n Tar utgangspunkt i korrelasjoner mellom spørsmål/items i testen n Hvis de måler samme egenskap, skal spørsmålene være korrelerte med hverandre n Høy inter-item korrelasjon = god reliabilitet n Beregnes med Cronbach’s alpha koeffisient

Bedømmer-reliabilitet (interrater reliability) n Benyttes hvis andre observere en person eller tolker testresultatet n Eksempel: skåring av aggressiv atferd/ikke aggressiv atferd, Rorschach ”blekk-klatt test”, Thematic app. Test tat. ppt Flere muligheter: n Prosent enighet mellom observatører n Cohen’s kappa (kap. 7, 202 -203) K=(Po- Pc)/(1 - Pc) n Beregne korrelasjonen mellom flere observatørers skåre av de samme subjektene (best når gradvise skåringer er benyttet)

Validitetens mange ansikter n Validitet av slutninger fra resultater: intern og ekstern validitet (gjennomgått forrige forelesning) n Validitet av målinger (måleinstrument)

Målingsvaliditet – måler vi det vi ønsker å måle? ”Face” validity Innhold (content) Begreps (construct) Kriterie validitet Målingsvaliditet Samtidig (concurrent) Prediktiv (predictive)

Face- og innholdsvaliditet Face validity - Vurderes av de som man skal gjennomføre målingen på - Ser testen ut til å måle det den skal? (forutsetter at man har gitt forsøkpersonene informasjon om dette) - Ikke så viktig form for validitet - Mest viktig for å unngå at de som deltar i undersøkelsen skal få en negativ innstiling Innholdsvaliditet - Vurderes teoretisk av forskere 1. Lag en beskrivelse av det som testen skal måle 2. Går det klart frem hvilket område hvert item/spørsmål måler? 3. Er utvalget av items/spørsmål representative for den egenskap vi ønsker å måle? Dess mer nøyaktig beskrivelse av det man ønsker å måle, dess større tiltro til validiteten - men ingen garanti

Kriterievaliditet 3. Samtidig validitet (concurrent) - det praktiske 4. Prediktiv validitet (predictive) idealet. Sammenheng mellom testskåre og andre kriterier som er tilstede på samme tid. Sammenheng mellom skåre på test og skåre på andre mål tatt på et senere tidspunkt Eksempel: Har de med redusert oppmerksomhet større problemer med å ferdes i trafikken enn andre? Eksempel: Har de med redusert oppmerksomhet større sjanse for å bli involvert i ulykke på et senere tidspunkt?

Begrepsvaliditet (construct) Det begrep vi ønsker å måle er som regel ikke direkte observerbart n n Ser om måleinstrumentet ”oppfører” seg som forventet i forhold til andre mål - dette baseres på teori n Vurderes statistisk og teoretisk opp i mot mål vi forventer at måleinstrumentet skal korrelere med og mål testen ikke skal korrelere med Dominerer i lek Eksempel: Positiv korrelasjon Aggresjon (skolebarn) Ingen korrelasjon Lyver, holder tilbake informasjon

Sammenhengen mellom reliablitet og validitet n Reliabilitet er en forutsetning for måleinstrumentets validitet n n En test kan være reliabel, uten å være valid Men en test kan ikke mangle reliabilitet og være valid samtidig n Måleinstrumentets validitet er en forutsetning for slutningsvaliditet (intern og ekstern validitet)

Målenivå på variabler n Nominal (nome betyr navn) n Tallverdi kun en ”merkelapp” uten å si noe om mengde av egenskap. F eks kjønn (Kvinne = 1, mann =2). Får behandling = 1, får ikke behandling = 2 n Ordinal: n n n Rangering av egenskap, men ikke samme avstand mellom tallverdier Aldri (1)– sjelden (2)– av og til (3) – ofte (4) Grunnskole (1), Høyskole (2), Bachelor (3), Master (4), Doktor (5) n Intervall n fast avstand mellom tallverdier, men ikke absolutt nullpunkt n IQ 75 80 85 90 95 100 105 110 115 120 125 n Rationivå/forholdstall – har et absolutt nullpunkt n Reaksjonstid, alder, antall ganger man utfører en atferd Mest egnet for videre statistiske analyser

Andre forhold ved måleinstrumenter n Sensitivitet i skåringer. n Viktig å skåre på en måte som gjør det mulig å differensiere best mulig. F eks Unngå ”ja” og ”nei” spørsmål n ”Tak” og ”gulv” effekter. n Vil helst unngå disse. Hvis alle som tar testen skårer likt, er det liten hensikt å benytte test. Problematisk for statistiske analyser n Tilpasning av måleinstrumentet til de som skal ta testen n Sjekk at språk og svarkategorier er lett å forstå, at instrukser ikke misforstås og lignende n Slike problem kan lett avdekkes gjennom å prøve ut måleinstrumentet på et lite utvalg først (pilot-studie) n Økologisk validitet – tilsvarer vårt mål det folk gjør i det faktiske liv?

Reaktivitet i psykologiske målinger Deltagerne påvirkes av å bli observert, påvirker reliabilitet og/eller validitet n Innstilling til forsøkspersoner n Holdning til å bli undersøkt n Faking good/bad n Experimentor bias (den som leder undersøkelsen/samler inn data påvirker resultatene n Noen tiltak mot reaktivitet: n n n Single-blind design Double-blind design Kontrollspørsmål