MET 2211 Statistikk og dataanalyse Forelesning 25 09

  • Slides: 14
Download presentation
MET 2211 Statistikk og dataanalyse Forelesning 25. 09. 2003 Repetisjon, del I Metode MET

MET 2211 Statistikk og dataanalyse Forelesning 25. 09. 2003 Repetisjon, del I Metode MET 2211 - Fred Wenstøp

Hovedparadigme Populasjon ********** ********** 31. 10. 2020 Tilfeldig utvalg MET 2211 - Fred Wenstøp

Hovedparadigme Populasjon ********** ********** 31. 10. 2020 Tilfeldig utvalg MET 2211 - Fred Wenstøp Stikkprøve ******** 2

Konfidensintervall for medianen 1. Bestem konfidensnivået For eksempel: 1 – 2 a = 95

Konfidensintervall for medianen 1. Bestem konfidensnivået For eksempel: 1 – 2 a = 95 % 2. Finn c i tabell 3 b 3. Finn x(c) og x(c) ** |* *** *** | * 31. 10. 2020 MET 2211 - Fred Wenstøp 3

Ensidige og tosidige konfidensintervall Tosidig intervall Høyregrenseintervall Venstregrenseintervall ** |* *** *** | *

Ensidige og tosidige konfidensintervall Tosidig intervall Høyregrenseintervall Venstregrenseintervall ** |* *** *** | * a a ** * **** *** | * a ** |* *** *** * a Sannsynligheten for å havne utenfor en grense: a 31. 10. 2020 MET 2211 - Fred Wenstøp 4

Tellinger og målinger w Dr. Salks observasjoner w Målinger gir verdier på en tallinje

Tellinger og målinger w Dr. Salks observasjoner w Målinger gir verdier på en tallinje er et eksempel på tellinger xx 31. 10. 2020 MET 2211 - Fred Wenstøp x x 5

Objektivitet w Spørsmålsformulering bør være så objektiv som mulig w En objektiv fremstilling danner

Objektivitet w Spørsmålsformulering bør være så objektiv som mulig w En objektiv fremstilling danner holdninger eller oppfatninger hos mottakeren som ikke forandres dersom man tar med flere faktiske opplysninger 31. 10. 2020 MET 2211 - Fred Wenstøp 6

Måleskalaer w Nominalskala n n Kategorisk variabel Tellinger l Eks. : kjønn w Ordinalskala

Måleskalaer w Nominalskala n n Kategorisk variabel Tellinger l Eks. : kjønn w Ordinalskala n Rangering l Eks. : Hva foretrekker du? w Intervallskala n Metrisk skala 31. 10. 2020 MET 2211 - Fred Wenstøp 7

Binomialfordelingen w Sannsynligheten for å få nøyaktig a vellykkete utfall i en serie på

Binomialfordelingen w Sannsynligheten for å få nøyaktig a vellykkete utfall i en serie på n identiske og uavhengige forsøk der sannsynligheten for at et tilfeldig forsøk skal bli vellykket er p 31. 10. 2020 MET 2211 - Fred Wenstøp 8

Den hypergeometriske fordeling w n elementer trekkes uordnet og uten tilbakelegning fra en populasjon

Den hypergeometriske fordeling w n elementer trekkes uordnet og uten tilbakelegning fra en populasjon med N elementer hvorav A er Riktige og resten Gale. Sannsynligheten for å få nøyaktig a Riktige i utvalget er: 31. 10. 2020 MET 2211 - Fred Wenstøp 9

Hypoteseprøving w Nullhypotese H 0 n Skeptikerens utgangspunkt. Den hypotesen som skal prøves w

Hypoteseprøving w Nullhypotese H 0 n Skeptikerens utgangspunkt. Den hypotesen som skal prøves w Alternativ hypotese H 1 n Det spennende alternativet som vi kanskje kan bli overbevist om w Signifikansnivå (for eksempel 5%) n n Den maksimale sannsynlighet for å feilaktig forkaste nullhypotesen Denne fastsettes av oss, Ensidig test a = 5%, tosidig test 2 a = 5% w Testobservator: T = den størrelse som observeres n Vi må kjenne Ts fordeling når H 0 er riktig w Kritisk verdi c: T må overskride c (nede eller oppe) for å forkaste H 0 w Signifikanssannsynlighet = p-verdi n n Ensidig test: Halesannsynligheten fra og med T Tosidig test: 2´Halesannsynligheten fra og med T w Forkast H 0 hvis p-verdien er mindre enn signifikansnivået 31. 10. 2020 MET 2211 - Fred Wenstøp 10

Hypoteseprøving grafisk Kurven viser fordelingen til T under H 0 Under H 0 venter

Hypoteseprøving grafisk Kurven viser fordelingen til T under H 0 Under H 0 venter vi at T skal havne et sted på midten. Havner den langt til venstre, (ensidig test) er det vanskelig å tro på nullhypotesen. a p-verdi c Eksperiment 1: T 2: T H 0 forkastes H 0 beholdes c er kritisk verdi, bestemt av signifikansnivået a 31. 10. 2020 MET 2211 - Fred Wenstøp T 11

Aktuelle ikkeparametriske tester w Binomisk test n n n Data: Ja-er og Nei-er Én

Aktuelle ikkeparametriske tester w Binomisk test n n n Data: Ja-er og Nei-er Én kategorisk variabel med to kategorier H 0: p = p 0. T er binomial-fordelt under H 0 (Antall JA) w Mediantesten n Data: n målinger av x Svarer til binomisk test med p 0 = 1/2 Data: n plusser og minuser Svarer til binomisk test med p 0 = 1/2 31. 10. 2020 n n w Fortegnstesten n w Wilcoxons tegnrangtest Data: n differanser Fra to relaterte stikkprøver En sterkere test enn fortegnstesten Tabell 8 b w Mann-Whitneytesten n MET 2211 - Fred Wenstøp Data: to uavhengige stikkprøver med målinger Sammenligner to medianer Tabell 4 b 12

Mindre aktuelle ikkeparametriske tester w Kruskal-Wallis n n w Fisher Data n uavhengige stikkprøver

Mindre aktuelle ikkeparametriske tester w Kruskal-Wallis n n w Fisher Data n uavhengige stikkprøver med målinger En direkte utvidelse av Mann. Whitneytesten som bare har to stikkprøver n n H 0: p 1 = p 2. Dvs røykeandelen er lik hos jenter og gutter. Vi skal senere lære en tilnærmelse til Fishers eksakte test som kan brukes når vi har mange observasjoner w Fishers eksakte test n Data: 2´ 2 -tabeller med tellinger l Vi har for eksempel en tabell over hvor mange som røyker og ikke røyker av henholdsvis jenter og gutter, og ønsker å finne ut om det er signifikant sammenheng mellom kjønn og røyking. Det kreves ikke operative kunnskaper om disse testene men du skal vite når de er aktuelle 31. 10. 2020 MET 2211 - Fred Wenstøp 13

Oppgaver w 7 -4 Studenters røykevaner, våre data w 7 -6 Dekktrykk w 8

Oppgaver w 7 -4 Studenters røykevaner, våre data w 7 -6 Dekktrykk w 8 -1 Priser på bilverksted w 8 -2 Menn og kvinners puls, og med våre data w 8 -6 Bruktbilpriser 31. 10. 2020 MET 2211 - Fred Wenstøp 14