Siste forelesning er i morgen n Oppsummeringsforelesning den

  • Slides: 22
Download presentation
Siste forelesning er i morgen! n Oppsummeringsforelesning den 5. mai flyttes til fredag 29.

Siste forelesning er i morgen! n Oppsummeringsforelesning den 5. mai flyttes til fredag 29. april kl. 15 -17. 00 n Holdes i dette auditoriet

Slutningsstatistikk PSY 1010

Slutningsstatistikk PSY 1010

Utvalg og populasjon Populasjon: alle enhetene i universet vi definerer, f eks: - Alle

Utvalg og populasjon Populasjon: alle enhetene i universet vi definerer, f eks: - Alle over 18 år i Norge (3, 5 mill) Utvalg: avgrenset del av populasjonen - 200 personer over 18 år Populajson Utvalg

Eksempel: IQ gjennomsnittsskårer i populasjon og utvalg n I populasjonen er og s =

Eksempel: IQ gjennomsnittsskårer i populasjon og utvalg n I populasjonen er og s = 15 n Du trekker tre utvalg á 25 tilfeldige personer fra denne populasjonen og beregner : Utvalgsfeil (tilfeldigheter) Utvalg 1: Utvalg 2 Utvalg 3 101 98 103 -100 = 3 101 -100 = 1 98 -100 = -2

Utvalgsfeil (sampling error) n Utvalgets gjennomsnittsverdi (evt. prosentverdi) vil sannsynligvis avvike fra den ”sanne”

Utvalgsfeil (sampling error) n Utvalgets gjennomsnittsverdi (evt. prosentverdi) vil sannsynligvis avvike fra den ”sanne” verdien i populasjonen n Vi må derfor regne med at en viss usikkerhet i de verdiene vi har regnet oss fram til basert på utvalget n Vi må ta hensyn til denne feilmarginen hvis vi vil slutte noe om populasjonen ut i fra utvalget

Utvalgsfordeling og standardfeil n Utvalgsfordeling (Sampling distribution): n fordeling over gjennomsnittsverdier til et uendelig

Utvalgsfordeling og standardfeil n Utvalgsfordeling (Sampling distribution): n fordeling over gjennomsnittsverdier til et uendelig antall utvalg trukket fra en populasjon n Standardavviket i en utvalgsfordeling kalles standardfeil (standard error) n Gir et mål på størrelsen på statistisk usikkerhet n Standardfeilen (SX) er en funksjon av to ting: n n S : Hvor stort standardavviket i populasjonen er N: Størrelsen på utvalget

Normalfordelig og utvalgsfeil 50 % av utvalgenes gjennomsnittsverdier ligger under populasjonsgjennomsnittet 13, 6% 0,

Normalfordelig og utvalgsfeil 50 % av utvalgenes gjennomsnittsverdier ligger under populasjonsgjennomsnittet 13, 6% 0, 1 % 50 % ligger over 34, 1% 13, 6% 2, 2 % -3 s. X -2 s. X -1 s. X X +1 s. X +2 s. X 0, 1 % +3 s. X

Standardfeil ved ulike utvalgsstørrelser Utgangspunktet for eksempelet er at alle utvalg er trukket fra

Standardfeil ved ulike utvalgsstørrelser Utgangspunktet for eksempelet er at alle utvalg er trukket fra en populasjon med et standardavvik (s) på 15 n. N=9 n N = 25 n N = 100 Altså: Størrelsen på utvalget påvirker hvor størrelsen på standardfeilen

Utvalgsfordeling med ulike utvalgsstørrelser Alle utvalg er trukket fra samme populasjon N = 100

Utvalgsfordeling med ulike utvalgsstørrelser Alle utvalg er trukket fra samme populasjon N = 100 N = 25 Uendelig antall utvalg med: N=9 85 90 95 100 105 110 115

IQ og morsmelk n Populasjonsgjennomsittet på IQ for 12 åringer er 100 og standardavviket

IQ og morsmelk n Populasjonsgjennomsittet på IQ for 12 åringer er 100 og standardavviket er 15 n En forsker har en hypotese om at morsmelk bidrar til høyere IQ n Et 25 utvalg på 12 -åringer som er blitt ammet fram til 2 års alder har i snitt en IQ skåre på 103 n Hvor sannsynlig er det at disse har fått en ren tilfeldighet? = 103 ved

Hypotesetesting Nullhypotese (H 0): Det er ingen forskjell i IQ i populasjonen mellom barns

Hypotesetesting Nullhypotese (H 0): Det er ingen forskjell i IQ i populasjonen mellom barns om er ammet fram til 2 års alder og de som ikke er det Dvs: forskjell skyldes utvalgsfeil / tilfeldigheter Forskningshypotese (H 1): Det er en forskjell i IQ i populasjonen mellom barns som er ammet fram til 2 årsalder og andre barn Hvor sannsynlig er det at en forskjell på 3 poeng eller mer skyldes en tilfeldighet? Denne benevnes som p-verdi

Normalfordelig og utvalgsfeil Utvalgets 13, 6% 0, 1 % 34, 1% 13, 6% 2,

Normalfordelig og utvalgsfeil Utvalgets 13, 6% 0, 1 % 34, 1% 13, 6% 2, 2 % -3 s. X 91 34, 1% = 103 -2 s. X 94 -1 s. X 97 X +1 s. X +2 s. X 100 103 106 0, 1 % +3 s. X 109

Signifikanstesting - Hvor sannsynlig det er at resultatet skyldes en tilfeldighet ved utvalget (utvalgsfeil)?

Signifikanstesting - Hvor sannsynlig det er at resultatet skyldes en tilfeldighet ved utvalget (utvalgsfeil)? - I vårt eksempel: en på 103 eller høyere forekommer i 15, 9 % av tilfellene vi trekker utvalg med N=25 fra populasjonen (p= 0. 159) - Grense for å forkaste nullhypotesen kalles signifikansnivå ( ) : - Vanlig grense: mindre enn 5 % sannsynlighet for at resultatet skyldes en tilfeldighet ( = 0. 05) - Kan også være strengere f eks mindre enn 1 % ( = 0. 01) - Hvis sjansen for at resultatet skyldes en tilfeldighet er større en signifikansnivået, beholdes nullhypotesen (H 0)

Type I og type II feil Aldri 100% sikre på at vi gjør riktig

Type I og type II feil Aldri 100% sikre på at vi gjør riktig beslutning om å beholde eller forkaste nullhypotesen: I “virkeligheten”: Funnet skyldes en Funnet skyldes ikke en tilfeldighet, er reelt Behold nullhypotesen Riktig beslutning Type II-feil Forkast nullhypotesen Type I-feil (α) Riktig beslutning

Enhalet og tohalet hypotesetest n En enhalet hypotesetest er retningsbestemt H 1 : Barn

Enhalet og tohalet hypotesetest n En enhalet hypotesetest er retningsbestemt H 1 : Barn som ammes fram til 2 år har høyere IQ enn andre n En tohalet hypotesetest er ikke retningsbestemt H 1 : Barn som ammes fram til 2 år har forskjellig IQ enn andre (dette betyr at de kan har lavere IQ eller høyere IQ enn populasjonen)

En-halet og to-halet test 1. 65 -1. 96

En-halet og to-halet test 1. 65 -1. 96

Hypotesetesting II Eksempel: Vi sammenligner et utvalg menn (N = 36) med et utvalg

Hypotesetesting II Eksempel: Vi sammenligner et utvalg menn (N = 36) med et utvalg kvinner (n = 36) på en test for sosial intelligens. Vi får følgende Nullhypotese (H 0): Det er ingen forskjell mellom menn og kvinner I populasjonen (forskjellen skyldes utvalgsfeil) Forskningshypotese (H 1): Det er en forskjell i sosial IQ mellom menn og kvinner i populasjonen Hvor sannsynlig er det at forskjellen på 5 poeng skyldes en tilfeldighet? Denne benevnes som p-verdi

Parametriske hypotesetester n Eksemplene vi har gjennomgått nå er såkalt parametrisk statistikk. Dette forutsetter

Parametriske hypotesetester n Eksemplene vi har gjennomgått nå er såkalt parametrisk statistikk. Dette forutsetter at: n Utvalget er tilfeldig trukket fra populasjonen n Utvalgsfordelingen er normalfordelt rundt populasjonsgjennomsnittet Et tilleggskriterium (kan dog korrigeres for): n Hvis to eller flere utvalg sammenlignes, skal spredingen innen utvalgene være like

Eksempler på parametriske tester n Z-test n er et utvalgs gjennomsnittsverdi forskjellig fra populasjonsgjennomsnittet?

Eksempler på parametriske tester n Z-test n er et utvalgs gjennomsnittsverdi forskjellig fra populasjonsgjennomsnittet? n t-test n Er det forskjell i gjennomsnittsverdi mellom to utvalg? n ANOVA (analysis og varians) n Forskjell i gj. snittsverdi mellom tre eller flere utvalg? n To-veis ANOVA

Ikke-parametriske tester n Benyttes ofte når vi har variabler som er målt på nominal

Ikke-parametriske tester n Benyttes ofte når vi har variabler som er målt på nominal eller ordinalnivå n Eller når forutsetningene for en parametrisk test ikke er oppfylt n Benytter ellers samme logikk som tidligere, dvs. tar hensyn til utvalgsfeil/tilfeldighetenes spill og vurderer resultatene opp i mot dette

Eksempel på ikke-parametrisk test n Er det lettere for en person med lys hudfarge

Eksempel på ikke-parametrisk test n Er det lettere for en person med lys hudfarge å bli frikjent enn en med mørk hudfarge for en voldsforbrytelse? n Begge variablene (hudfarge og frikjent/dømt) er variabler som vi ikke kan regne gjennomsnitt på Frikjent Dømt Lys hudfarge 7 3 Mørk hudfarge 2 8 n I dette tilfellet benyttes en kji- kvadrat test ( 2) for å avgjøre om forskjellen er tilfeldig eller ikke

Signifikansnivå og praktisk betydning n Et signifikant resultat er ikke nødvendigvis av stor praktisk

Signifikansnivå og praktisk betydning n Et signifikant resultat er ikke nødvendigvis av stor praktisk betydning n Dette er først og fremst fordi signifikanstesting er sterkt påvirket av utvalgets/utvalgenes størrelse n Store utvalg = lettere å få signifikant resultat (forkaste H 0) n Et alternativ er å inkludere mål på effekt isteden, n n f eks hvor stor andel kvinner har høyere sosial IQ enn menn Eller hvor mange standardavvik skårer kvinner over menn