Siste forelesning er i morgen n Oppsummeringsforelesning den

Utvalg og populasjon Populasjon: alle enhetene i universet vi definerer, f eks: - Alle

Eksempel: IQ gjennomsnittsskårer i populasjon og utvalg n I populasjonen er og s =

Utvalgsfeil (sampling error) n Utvalgets gjennomsnittsverdi (evt. prosentverdi) vil sannsynligvis avvike fra den ”sanne”

Utvalgsfordeling og standardfeil n Utvalgsfordeling (Sampling distribution): n fordeling over gjennomsnittsverdier til et uendelig

Normalfordelig og utvalgsfeil 50 % av utvalgenes gjennomsnittsverdier ligger under populasjonsgjennomsnittet 13, 6% 0,

Standardfeil ved ulike utvalgsstørrelser Utgangspunktet for eksempelet er at alle utvalg er trukket fra

Utvalgsfordeling med ulike utvalgsstørrelser Alle utvalg er trukket fra samme populasjon N = 100

IQ og morsmelk n Populasjonsgjennomsittet på IQ for 12 åringer er 100 og standardavviket

Hypotesetesting Nullhypotese (H 0): Det er ingen forskjell i IQ i populasjonen mellom barns

Normalfordelig og utvalgsfeil Utvalgets 13, 6% 0, 1 % 34, 1% 13, 6% 2,

Signifikanstesting - Hvor sannsynlig det er at resultatet skyldes en tilfeldighet ved utvalget (utvalgsfeil)?

Type I og type II feil Aldri 100% sikre på at vi gjør riktig

Enhalet og tohalet hypotesetest n En enhalet hypotesetest er retningsbestemt H 1 : Barn

Hypotesetesting II Eksempel: Vi sammenligner et utvalg menn (N = 36) med et utvalg

Parametriske hypotesetester n Eksemplene vi har gjennomgått nå er såkalt parametrisk statistikk. Dette forutsetter

Eksempler på parametriske tester n Z-test n er et utvalgs gjennomsnittsverdi forskjellig fra populasjonsgjennomsnittet?

Ikke-parametriske tester n Benyttes ofte når vi har variabler som er målt på nominal

Eksempel på ikke-parametrisk test n Er det lettere for en person med lys hudfarge

Signifikansnivå og praktisk betydning n Et signifikant resultat er ikke nødvendigvis av stor praktisk

Slides: 22

Download presentation

Siste forelesning er i morgen! n Oppsummeringsforelesning den 5. mai flyttes til fredag 29. april kl. 15 -17. 00 n Holdes i dette auditoriet

Slutningsstatistikk PSY 1010

Utvalg og populasjon Populasjon: alle enhetene i universet vi definerer, f eks: - Alle over 18 år i Norge (3, 5 mill) Utvalg: avgrenset del av populasjonen - 200 personer over 18 år Populajson Utvalg

Eksempel: IQ gjennomsnittsskårer i populasjon og utvalg n I populasjonen er og s = 15 n Du trekker tre utvalg á 25 tilfeldige personer fra denne populasjonen og beregner : Utvalgsfeil (tilfeldigheter) Utvalg 1: Utvalg 2 Utvalg 3 101 98 103 -100 = 3 101 -100 = 1 98 -100 = -2

Utvalgsfeil (sampling error) n Utvalgets gjennomsnittsverdi (evt. prosentverdi) vil sannsynligvis avvike fra den ”sanne” verdien i populasjonen n Vi må derfor regne med at en viss usikkerhet i de verdiene vi har regnet oss fram til basert på utvalget n Vi må ta hensyn til denne feilmarginen hvis vi vil slutte noe om populasjonen ut i fra utvalget

Utvalgsfordeling og standardfeil n Utvalgsfordeling (Sampling distribution): n fordeling over gjennomsnittsverdier til et uendelig antall utvalg trukket fra en populasjon n Standardavviket i en utvalgsfordeling kalles standardfeil (standard error) n Gir et mål på størrelsen på statistisk usikkerhet n Standardfeilen (SX) er en funksjon av to ting: n n S : Hvor stort standardavviket i populasjonen er N: Størrelsen på utvalget

Normalfordelig og utvalgsfeil 50 % av utvalgenes gjennomsnittsverdier ligger under populasjonsgjennomsnittet 13, 6% 0, 1 % 50 % ligger over 34, 1% 13, 6% 2, 2 % -3 s. X -2 s. X -1 s. X X +1 s. X +2 s. X 0, 1 % +3 s. X

Standardfeil ved ulike utvalgsstørrelser Utgangspunktet for eksempelet er at alle utvalg er trukket fra en populasjon med et standardavvik (s) på 15 n. N=9 n N = 25 n N = 100 Altså: Størrelsen på utvalget påvirker hvor størrelsen på standardfeilen

Utvalgsfordeling med ulike utvalgsstørrelser Alle utvalg er trukket fra samme populasjon N = 100 N = 25 Uendelig antall utvalg med: N=9 85 90 95 100 105 110 115

IQ og morsmelk n Populasjonsgjennomsittet på IQ for 12 åringer er 100 og standardavviket er 15 n En forsker har en hypotese om at morsmelk bidrar til høyere IQ n Et 25 utvalg på 12 -åringer som er blitt ammet fram til 2 års alder har i snitt en IQ skåre på 103 n Hvor sannsynlig er det at disse har fått en ren tilfeldighet? = 103 ved

Hypotesetesting Nullhypotese (H 0): Det er ingen forskjell i IQ i populasjonen mellom barns om er ammet fram til 2 års alder og de som ikke er det Dvs: forskjell skyldes utvalgsfeil / tilfeldigheter Forskningshypotese (H 1): Det er en forskjell i IQ i populasjonen mellom barns som er ammet fram til 2 årsalder og andre barn Hvor sannsynlig er det at en forskjell på 3 poeng eller mer skyldes en tilfeldighet? Denne benevnes som p-verdi

Normalfordelig og utvalgsfeil Utvalgets 13, 6% 0, 1 % 34, 1% 13, 6% 2, 2 % -3 s. X 91 34, 1% = 103 -2 s. X 94 -1 s. X 97 X +1 s. X +2 s. X 100 103 106 0, 1 % +3 s. X 109

Signifikanstesting - Hvor sannsynlig det er at resultatet skyldes en tilfeldighet ved utvalget (utvalgsfeil)? - I vårt eksempel: en på 103 eller høyere forekommer i 15, 9 % av tilfellene vi trekker utvalg med N=25 fra populasjonen (p= 0. 159) - Grense for å forkaste nullhypotesen kalles signifikansnivå ( ) : - Vanlig grense: mindre enn 5 % sannsynlighet for at resultatet skyldes en tilfeldighet ( = 0. 05) - Kan også være strengere f eks mindre enn 1 % ( = 0. 01) - Hvis sjansen for at resultatet skyldes en tilfeldighet er større en signifikansnivået, beholdes nullhypotesen (H 0)

Type I og type II feil Aldri 100% sikre på at vi gjør riktig beslutning om å beholde eller forkaste nullhypotesen: I “virkeligheten”: Funnet skyldes en Funnet skyldes ikke en tilfeldighet, er reelt Behold nullhypotesen Riktig beslutning Type II-feil Forkast nullhypotesen Type I-feil (α) Riktig beslutning

Enhalet og tohalet hypotesetest n En enhalet hypotesetest er retningsbestemt H 1 : Barn som ammes fram til 2 år har høyere IQ enn andre n En tohalet hypotesetest er ikke retningsbestemt H 1 : Barn som ammes fram til 2 år har forskjellig IQ enn andre (dette betyr at de kan har lavere IQ eller høyere IQ enn populasjonen)

En-halet og to-halet test 1. 65 -1. 96

Hypotesetesting II Eksempel: Vi sammenligner et utvalg menn (N = 36) med et utvalg kvinner (n = 36) på en test for sosial intelligens. Vi får følgende Nullhypotese (H 0): Det er ingen forskjell mellom menn og kvinner I populasjonen (forskjellen skyldes utvalgsfeil) Forskningshypotese (H 1): Det er en forskjell i sosial IQ mellom menn og kvinner i populasjonen Hvor sannsynlig er det at forskjellen på 5 poeng skyldes en tilfeldighet? Denne benevnes som p-verdi

Parametriske hypotesetester n Eksemplene vi har gjennomgått nå er såkalt parametrisk statistikk. Dette forutsetter at: n Utvalget er tilfeldig trukket fra populasjonen n Utvalgsfordelingen er normalfordelt rundt populasjonsgjennomsnittet Et tilleggskriterium (kan dog korrigeres for): n Hvis to eller flere utvalg sammenlignes, skal spredingen innen utvalgene være like

Eksempler på parametriske tester n Z-test n er et utvalgs gjennomsnittsverdi forskjellig fra populasjonsgjennomsnittet? n t-test n Er det forskjell i gjennomsnittsverdi mellom to utvalg? n ANOVA (analysis og varians) n Forskjell i gj. snittsverdi mellom tre eller flere utvalg? n To-veis ANOVA

Ikke-parametriske tester n Benyttes ofte når vi har variabler som er målt på nominal eller ordinalnivå n Eller når forutsetningene for en parametrisk test ikke er oppfylt n Benytter ellers samme logikk som tidligere, dvs. tar hensyn til utvalgsfeil/tilfeldighetenes spill og vurderer resultatene opp i mot dette

Eksempel på ikke-parametrisk test n Er det lettere for en person med lys hudfarge å bli frikjent enn en med mørk hudfarge for en voldsforbrytelse? n Begge variablene (hudfarge og frikjent/dømt) er variabler som vi ikke kan regne gjennomsnitt på Frikjent Dømt Lys hudfarge 7 3 Mørk hudfarge 2 8 n I dette tilfellet benyttes en kji- kvadrat test ( 2) for å avgjøre om forskjellen er tilfeldig eller ikke

Signifikansnivå og praktisk betydning n Et signifikant resultat er ikke nødvendigvis av stor praktisk betydning n Dette er først og fremst fordi signifikanstesting er sterkt påvirket av utvalgets/utvalgenes størrelse n Store utvalg = lettere å få signifikant resultat (forkaste H 0) n Et alternativ er å inkludere mål på effekt isteden, n n f eks hvor stor andel kvinner har høyere sosial IQ enn menn Eller hvor mange standardavvik skårer kvinner over menn