BED3083 Introduksjon til noen korte undervisningsvideoer Forenklet fremstilling

BED-3083: Introduksjon til noen korte undervisnings-videoer • Forenklet fremstilling av noen poenger i kvantitativ metode. • Ikke erstatning for å lese pensum, men et hjelpemiddel for repetisjon av noen viktige og kanskje litt vriene emner. • Filmsnuttene bygger på hverandre og bør første gang ses i nummerert rekkefølge. • Gi meg gjerne tilbakemelding til baard. h. borge@uit. no på dette tiltaket. • Hilsen Baard

Del 1: Variablers målenivå • Hva er en variabel? • 1 Nominal • 2 Ordinal • 3 Forholdstall (NB! også 0 -1 variabler hører med her) • Viktig, fordi målenivået avgjør hvilke statistiske mål og teknikker vi kan bruke i analysen. • Gjelder både uni-, bi- og multivariat analyse. • Eksempler: • Kan vi finne gjennomsnittsverdien til en nominalvariabel? • Kan vi bruke korrelasjon for å studere sammenhengen mellom én ordinal- og én nominalvariabel?

Del 2: Samvariasjon og korrelasjon • I prinsippet akkurat det samme. • Analyseformen vi velger avhenger av de to variablenes målenivå. • Enkleste form: Krysstabell, der vi ser på prosentdifferanser. • Chi / kji, unormert mål for samvariasjon. • Pearson’s r (korrelasjons-koeffisienten), varierer mellom ÷ 1 og 1.

Del 3: Utvalgsteori • Utvalg og populasjon. • Representativitet. • Sannsynlighetsutvalg. • Ikke-sannsynlighetsutvalg. • Sannsynlighetsutvalg i prinsippet en forutsetning for statistisk generalisering.

Del 4: Statistisk generalisering. • Trekke slutninger om en populasjon basert på data om et utvalg. • Det vil alltid være en sjanse for å ta feil, men vi vet hvor stor den er. • Grunnlaget for statistisk generalisering er at de fleste sannsynlighetsutvalg «treffer» noenlunde bra. • Utvalgsfordelingen er normalfordelt. • Det betyr at utvalgsfunn som avviker fra «sannheten» i populasjonen blir mindre og mindre sannsynlige jo større avviket deres er. • To former: Statistisk hypotesetesting og estimering.

Del 5: Signifikans • Gjelder statistisk hypotesetesting. • Eksempel: «Menn er oftere EU-tilhengere enn kvinner. » og «Brusdrikking avtar med stigende alder» . • Signifikansen (p) er en sannsynlighet, og varierer derfor alltid mellom 0 og 1. • Signifikans er knyttet til et mål for samvariasjon eller korrelasjon, for eksempel Chi/Kji og Pearson’s r. • Det er da sig. som avgjør om hypotesen vår blir avkreftet eller ikke. • Når vi lar et statistikkprogram (som SPSS) beregne sig. , forteller den hvor sannsynlig det er at de to variablene ikke samvarierer/korrelerer i populasjonen. • Vanligvis vil en sig. > 0, 05 medføre at vi forkaster hypotesen vår.

6: Chi-testen • Den enkleste sig. testen. • To variabler på nominalnivå, som begge har få verdier. • Sammenhengen kan dermed studeres i en enkel tabell, som ofte bare har 4 felter (celler). • H 0 ( «H-null» ) betyr i alle sig. tester «ingen samvariasjon/korrelasjon i populasjonen» . • Spørsmålet i testen er: Kan vi forkaste H 0, eller må vi beholde den? • NB! Forkaster vi den er sjansen for å ta feil lik sig. • Eksempler: • Chi = 15, 9. Sig. til chi-verdien er 0, 08. • Chi = 23, 4. Sig. til chi-verdien er 0, 04.

7: Andre sig. tester • Et eksempel: Har vi to variabler på forholdstallsnivå (evt. ordinalvariabler med minst 5 verdier) kan vi teste hypoteser om sammenheng mellom dem ved hjelp av korrelasjon (Pearson’s r). • Logikken er akkurat den samme som i chi-testen. • Hvis sig. til r-verdien vi får er > 0, 05 må vi beholde null-hypotesen (H 0). • Vi konkluderer da med at korrelasjonen i utvalget ikke er sterk nok til at vi kan generalisere til populasjonen. • Eksempler: • r = ÷ 0, 22. Sig. til r er 0, 08. • r = ÷ 0, 41. Sig. til r er 0, 003.

8: Estimering, første del av to. • Dette er den andre formen for statistisk generalisering. • Vi har fortsatt data basert på et utvalg, men ønsker å si noe om populasjonen. • Også her med en kjent sannsynlighet for å «bomme» . • Her dreier seg om hvor mange prosent som har en eller annen egenskap, f eks som er tilhengere av norsk EU-medlemskap. • I utvalget er det f eks 42 %. • Det tallet kaller vi et estimat. • Spørsmålet er nå: Hva kan det prosenttallet fortelle oss om populasjonen?

9: Estimering, andre og siste del. • Svaret finner vi ved å slå opp i en tabell som viser såkalte feilmarginer. • Vi kan velge mellom to tabeller, en for 95 % og en for 99 % sikkerhet. • I tabellen er det to variabler, dvs. hvor høyt er prosenttallet vi fant (42) og hvor stort var utvalget (f eks 1000). • Vi finner da at feilmarginen er f eks 2 % - i hver retning. • Har vi valgt 95 % sikkerhet, betyr at vi kan være 95 % sikre på at tallet i populasjonen ligger mellom 40 og 44 prosent. • Intervallet vi nå kom frem til (40 -44) kalles konfidensintervallet. • En «nøtt» til slutt: Hva om vi hadde valgt 99 % sikkerhet, ville feilmarginen da ha vært mindre eller større …?

10: T-testen

11: Spuriøse sammenhenger

12: Hvordan prosentuere en krysstabell?