MET 2211 Statistikk og dataanalyse Forelesning 23 09

  • Slides: 14
Download presentation
MET 2211 Statistikk og dataanalyse Forelesning 23. 09. 2003 Kapittel 8: Ikke-parametriske tester MET

MET 2211 Statistikk og dataanalyse Forelesning 23. 09. 2003 Kapittel 8: Ikke-parametriske tester MET 2211 - Fred Wenstøp

Hypoteseprøving i et nøtteskall 1. Studer testobservatoren T n Reflekter over hva det innebærer

Hypoteseprøving i et nøtteskall 1. Studer testobservatoren T n Reflekter over hva det innebærer om T har meget høy eller meget lav verdi l l 2. Ved ensidig test, må du fokusere på det som er aktuelt. Det er som regel greiest å definere T slik at du ser etter signifikant lave verdier To ekvivalente fremgangsmåter: 1. 2. Finn kritisk verdi og forkast H 0 hvis testobservator har en mer ekstrem verdi Beregn p-verdien og forkast H 0 hvis den er mindre enn det valgte signifikansnivået l l 09. 03. 2021 Ensidig test: signifikansnivå kalles a. p-verdi = halesannsynligheten fra og med observasjonen Tosidig test: signifikansnivå kalles 2 a. p-verdi = 2´halesannsynligheten fra og med observasjonen MET 2211 - Fred Wenstøp 2

p-verdi og kritisk verdi T p-verdi (areal) Kritisk verdi for T: c = 3

p-verdi og kritisk verdi T p-verdi (areal) Kritisk verdi for T: c = 3 Hvis p-verdi < a, må også T være mer ekstrem enn c 09. 03. 2021 MET 2211 - Fred Wenstøp 3

Binomisk test Eksempel: tekopper Data: n Ja/Nei-er 12 tekopper Nullhypotese H 0: p =

Binomisk test Eksempel: tekopper Data: n Ja/Nei-er 12 tekopper Nullhypotese H 0: p = p 0 P(bomme) = p = 0, 5. Hun gjetter. Alternativ H 1: p < ¹ > p 0 p < 0, 5 Hun kjenner forskjell Signifikansnivå: a , 2 a, a a = 5 % (ensidig test) Testobservator T: #JA eller #NEI Min(#JA, #NEI) T = antall bom = 2 (Forkast H 0 når T er liten nok) c eller p-verdi: c: tab. 3 b, Statark SPSS, Statark =CRITBINOM(12; 0, 5; 0, 05)=3 =BINOMDIST(2; 12; 0, 5; 1)=0, 019 Konklusjon: Forkast H 0: T<c, p-verdi < sig. nivå H 0 forkastes: T = 2 < c = 3; eller p-verdi = 0, 019 < sig. nivå = 0, 05 09. 03. 2021 MET 2211 - Fred Wenstøp 4

Mediantesten Idegrunnlag w Dataene er målinger w Nullhypotesen er at populasjonsmedianen er lik et

Mediantesten Idegrunnlag w Dataene er målinger w Nullhypotesen er at populasjonsmedianen er lik et bestemt tall w Ideen er at n n Hvis nullhypotesen er riktig, venter vi at halvparten av observasjonene faller på hver side av Da er vi med andre ord tilbake til et spesialtilfelle av den binomiske test, der p 0 = ½ 09. 03. 2021 MET 2211 - Fred Wenstøp 5

Mediantesten Guttepulser H 03 T = 39 09. 03. 2021 C =56 MET 2211

Mediantesten Guttepulser H 03 T = 39 09. 03. 2021 C =56 MET 2211 - Fred Wenstøp 6

Mediantesten Guttepulser (data h 03) Data: n målinger Nullhypotese H 0: = 70, 5

Mediantesten Guttepulser (data h 03) Data: n målinger Nullhypotese H 0: = 70, 5 (landsmedianen) Alternativ H 1: Signifikansnivå: 131 guttepulser < 70, 5 (de er sprekere enn vanlig) a , 2 a, a a = 5 % (ensidig test) Testobservator T: # < eller # > Min(# <, # >) T = antall over = 39 (bruk COUNTIF) (Forkast H 0 når T er liten nok) c eller p-verdi: c: tab. 3 b, Statark SPSS, Statark =CRITBINOM(131; 0, 5; 0, 05)= 56 =BINOMDIST(39; 131; 0, 5; 1)=0, 00 Konklusjon: Forkast H 0: T<c, p-verdi < sig. nivå H 0 forkastes: T = 39 < c = 56; eller p-verdi = 0 < sig. nivå = 0, 05 09. 03. 2021 MET 2211 - Fred Wenstøp 7

Hypotesetesting og konfidensintervall n = 131 observasjoner H 0 68 70, 5 * **

Hypotesetesting og konfidensintervall n = 131 observasjoner H 0 68 70, 5 * ** ******] * ** | *** * * ** ** Høyregrenseintervall x(56) = 68 T = 39 observasjoner (funnet med countif) Enten : forkast H 0 hvis det er færre enn 56 observasjoner til høyre for 70, 5. Da må konfidensintervallet bomme. SPSS Eller: forkast H 0 hvis x(56) ligger til venstre for 70, 5. Da bommer konfidensintervallet. Statark 09. 03. 2021 MET 2211 - Fred Wenstøp 8

Fortegnstesten Idegrunnlag w Dataene kommer som regel fra relaterte stikkprøver n n Eksempel: datafil

Fortegnstesten Idegrunnlag w Dataene kommer som regel fra relaterte stikkprøver n n Eksempel: datafil Cornflakes De er opplysning om hvorvidt hvert enkelt observasjonsobjekt har forbedret seg eller blitt verre n plusser og minuser (nuller telles som en halv hver vei) w Nullhypotesen er at medianforbedringen er null n Da venter vi omtrent like mange plusser som minuser i observasjonene w Vi er igjen tilbake til et spesialtilfelle av den binomske test med p = ½ 09. 03. 2021 MET 2211 - Fred Wenstøp 9

Fortegnstesten Eksempel: Cornflakes Data: n fortegn 13 salgsdifferanser Nullhypotese H 0: Hyllehøyde spiller ingen

Fortegnstesten Eksempel: Cornflakes Data: n fortegn 13 salgsdifferanser Nullhypotese H 0: Hyllehøyde spiller ingen rolle Alternativ H 1: Hyllehøyde selger mer Signifikansnivå: a , 2 a, a a = 5 % (ensidig test) Testobservator T: # + eller - > Min(# +, # -) T = antall minuser = 3 (Forkast H 0 når T er liten nok) Kritisk verdi c c fra tabell 3 b 1 – 2 a = 0, 9; c = 4 Konklusjon: Forkast H 0: T<c H 0 forkastes: T = 3 < c = 4 09. 03. 2021 MET 2211 - Fred Wenstøp 10

Wilcoxons tegnrangtest Idegrunnlag og eksempel w Er datagrunnlaget målinger, kaster fortegnstesten bort mye informasjon

Wilcoxons tegnrangtest Idegrunnlag og eksempel w Er datagrunnlaget målinger, kaster fortegnstesten bort mye informasjon w La oss i stedet fortegnene bruke rangene w Da forlater vi binomialfordelingen w Men prinsippet blir det samme T- = 2+3, 5 = 5, 5 T+ = 49, 5 09. 03. 2021 MET 2211 - Fred Wenstøp 11

Wilcoxons tegnrangtest Eksempel: slankekur Data: n differanser 10 vektforbedringer (før - etter) Nullhypotese H

Wilcoxons tegnrangtest Eksempel: slankekur Data: n differanser 10 vektforbedringer (før - etter) Nullhypotese H 0: = 0 (kuren virker ikke) Alternativ H 1: > 0 (man blir slankere) Signifikansnivå: a , 2 a, a a = 5 % (ensidig test) Testobservator T: T+ eller TMin(T+, T-) T - = 5, 5 (Statark eller SPSS) (Forkast H 0 når T er liten nok) c eller p-verdi: c: tab. 8 b, Statark SPSS c = 11 p-verdien finnes kun med SPSS Konklusjon: Forkast H 0: T<c, p-verdi < sig. nivå H 0 forkastes: T - = 5, 5 < c = 11 09. 03. 2021 MET 2211 - Fred Wenstøp 12

Mann-Whitneytesten Idegrunnlag w Datagrunnlaget er to uavhengige stikkprøver n n n 1 og n

Mann-Whitneytesten Idegrunnlag w Datagrunnlaget er to uavhengige stikkprøver n n n 1 og n 2 observasjoner Dataene må kunne sammenlignes l Som oftest målinger w H 0 stikkprøvene trukket fra samme populasjon n dvs at populasjonsmedianene er like w Testobservatorene MW 1 og MW 2 n Antall ganger verdier i den første stikkprøven er større enn i den andre, og omvendt. I alt n 1 ´ n 2 sammenligninger w Hvis H 0 er riktig, venter vi omtrent n 1 ´ n 2 hver vei 09. 03. 2021 MET 2211 - Fred Wenstøp 13

Mann-Whitneytesten Eksempel: slankekur Data: n 1 og n 2 målinger 10 vekter før og

Mann-Whitneytesten Eksempel: slankekur Data: n 1 og n 2 målinger 10 vekter før og 10 vekter etter Nullhypotese H 0: (kuren virker ikke) Alternativ H 1: Signifikansnivå: (man blir slankere) a , 2 a, a a = 5 % (ensidig test) Testobservator T: MW 1 eller MW 2 = 42, 5 (Statark eller SPSS) Min(MW 1 ; MW 2) (Forkast H 0 når MW 2 er liten nok) c eller p-verdi: c: tab. 4 b, Statark SPSS c = 28 p-verdien finnes kun med SPSS Konklusjon: Forkast H 0: T<c, p-verdi < sig. nivå H 0 beholdes: MW 2 = 42, 5 > c = 28 09. 03. 2021 MET 2211 - Fred Wenstøp 14