Anvendt Statistik Lektion 5 Sammenligning af to grupper

  • Slides: 23
Download presentation
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning

Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Motiverende eksempel n Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning n n Køn Stikprøvesørrelse Gennemsnit

Motiverende eksempel n Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning n n Køn Stikprøvesørrelse Gennemsnit Standardafvigelse Mænd 1219 23 32 Kvinder 733 37 16 Der er to variable registeret for hver person q Køn: Forklarende variabel Binær/dikotom (to mulige værdier) q Tid: Afhængig variabel Kontinuert/skala Uafhængige grupper (mænd/kvinder)

Sammenligning af middelværdier n n Mål: q Sammenligne middelværdier m 1 og m 2

Sammenligning af middelværdier n n Mål: q Sammenligne middelværdier m 1 og m 2 for to grupper. Ny parameter q Differencen m 2 - m 1 er en parameter Estimat q y 2 – y 1 er et estimat for m 2 - m 1 Husk: Et 95% konfidensinterval er af typen Punktestimat ± 2 · se hvis punktestimatet er (approks. ) normalfordelt.

Standardfejlen for y 1 -y 2 n Antag vi har to uafhængige stikprøver, og

Standardfejlen for y 1 -y 2 n Antag vi har to uafhængige stikprøver, og at se 1 og se 2 er standardfejlen for hhv. y 1 og y 2. Da er den estimerede standardfejl for y 1 - y 2 hvor n , i = 1, 2. Eksempel: Oprydning/Madlavning

Konfidensinterval for m 1 -m 2 n For uafhængige stikprøver fra to grupper der

Konfidensinterval for m 1 -m 2 n For uafhængige stikprøver fra to grupper der har normale populationsfordelinger er et (1 -a)100% konfidensintervallet for m 1 -m 2 givet ved hvor t har df = n 1 + n 2 - 2 frihedsgrader. n Eksempel: Oprydning/Madlavning

Konfidensintervaller n Konfidensintervallerr for m 2 - m 1 0 Peger i retning af,

Konfidensintervaller n Konfidensintervallerr for m 2 - m 1 0 Peger i retning af, at m 2 er mindre end m 1. Ingen forskel ml. m 1 og m 2 er plausibelt. Peger i retning af, at m 2 er større end m 1.

Hypotesetest for m 2 -m 1 n n Antagelser: Normale populationer Nul-hypotese: q H

Hypotesetest for m 2 -m 1 n n Antagelser: Normale populationer Nul-hypotese: q H 0 : m 2 - m 1 = 0 (ingen forskel) Alternativ hypotese: q H a : m 2 - m 1 0 (en forskel) Teststørrelse: q n n hvor P-værdi Konklusion: q Jo lavere P-værdi jo mindre tror vi på H 0. P-værdien H a : m 2 - m 1 0 -t t

Eksempel n Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning n n n Køn Stikprøvesørrelse Gennemsnit

Eksempel n Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning n n n Køn Stikprøvesørrelse Gennemsnit Standardafvigelse Mænd n 1=1219 y 1=23 s 1=32 Kvinder n 2=733 y 2=37 s 2=16 Hypoteser: H 0: m 2 -m 1 = 0 vs H a : m 2 - m 1 0

SPSS n n SPSS: Analyze → Compare Means → Independent-Sample T Test Variable(s): Afhængig

SPSS n n SPSS: Analyze → Compare Means → Independent-Sample T Test Variable(s): Afhængig variabel Grouping variabel: Forklarende variabel Define Groups: Angiv hvilke værdier af den forklarende variabel, der svarer til de to grupper.

SPSS Output n Opsummering af de to grupper Bemærk: I forhold til forrige slide

SPSS Output n Opsummering af de to grupper Bemærk: I forhold til forrige slide er m 1 og m 2 byttet rundt. Derved får t modsat fortegn. P-værdien er upåvirket af ombtningen, da det er et to-sidet test. t-teststørrelse n Test af forskel i middelværdi: P-værdi to-sidet test n Konfidensinterval:

Sammenligne m 1 og m 2 for afhængige stikprøver n n n Typisk eksempel

Sammenligne m 1 og m 2 for afhængige stikprøver n n n Typisk eksempel på afhængige grupper, er hvor observationer i de to grupper er parrede. Eksempel: Hver af 32 studerende får målt reaktionstider under bilkørsel under to omstændigheder: q 1) Mens de snakker i mobil (gruppe 1) y 1, i Reaktionstider q 2) Uden de snakker i mobil (gruppe 2) y 2, i For hver studerende har vi en forskel i reaktionstid: yd, i = y 2, i - y 1, i

Sammenligne m 1 og m 2 for afhængige stikprøver n n n Lad y

Sammenligne m 1 og m 2 for afhængige stikprøver n n n Lad y 1 og y 2 være gennemsnittet for hhv. gruppe 1 og gruppe 2. Lad yd være gennemsnittet af differencerne. Der gælder Dvs. hvis vi vil teste forskelle er det nok at se på gennemsnittet af differencerne. Et (1 -a)100% konfidensinterval for m 2 - m 1 df = n-1 hvor sd er standardafvigelsen for differencerne.

Signifikanstest for^ p 2^- p 1 (parrede obs. ) Antagelser: Normale populationer n n

Signifikanstest for^ p 2^- p 1 (parrede obs. ) Antagelser: Normale populationer n n Nul-hypotese: q H 0: m d = 0 (ingen effekt) Alternativ hypotese: q H a: m d 0 (en effekt) Teststørrelse: q n n P-værdien H a : md 0 hvor P-værdi Konklusion: q Jo lavere P-værdi jo mindre tror vi på H 0 -t t

Eksempel Uden mobil Med mobil Diff. 604 556 540 522 459 544 : 636

Eksempel Uden mobil Med mobil Diff. 604 556 540 522 459 544 : 636 623 615 672 601 600 : 32 67 75 150 142 56 : n Hypoteser H 0: md= 0 vs Ha: md 0 Gennemsnitsdifferencen n Standardafvigelse for differencerne n Teststørrelse n

SPSS n SPSS: Analyze → Compare Means → Paired-Samples T Test Gruppe 1 Gruppe

SPSS n SPSS: Analyze → Compare Means → Paired-Samples T Test Gruppe 1 Gruppe 2

SPSS: Resultat

SPSS: Resultat

Test direkte på differencerne n Lav et t-test af differencerne n Bemærk at t

Test direkte på differencerne n Lav et t-test af differencerne n Bemærk at t er præcis som før og dermed er Pværdien som før.

Sammenligning af andele n n n Effekten af bøn på udfald af operation: Bøn

Sammenligning af andele n n n Effekten af bøn på udfald af operation: Bøn Komplikationer Ej komplikationer Total Andel kompl. Ja 315 289 604 0. 522 Nej 304 293 597 0. 509 Der er to variable registeret for hver person q Bøn: Forklarende variabel Binær/dikotom (to mulige værdier) q Udfald: Afhængig variabel Binær/dikotom (to mulige værdier) Uafhængige grupper (Bøn/Ej bøn)

Sammenligning af andele n n n Mål: q Sammenligne pop. andelene p 1 og

Sammenligning af andele n n n Mål: q Sammenligne pop. andelene p 1 og p 2 for to grupper. Ny parameter q Differencen p 2 - p 1 er en parameter Estimat ^ – p^ er et estimat for p - p. q p 2 1 Stikprøve-andele n Husk: Et 95% konfidensinterval er af typen Punktestimat ± 2 · se hvis punktestimatet er (approks. ) normalfordelt.

Standardfejlen for^ p 2^- p 1 n Standardfejlen for p^2 - p^ 1 er

Standardfejlen for^ p 2^- p 1 n Standardfejlen for p^2 - p^ 1 er n hvor. Eksempel: Bøn og operation

Konfidensinterval for p 2 - p 1 n n For store stikprøver er et

Konfidensinterval for p 2 - p 1 n n For store stikprøver er et (1 -a)100% konfidensinterval forskellen p 2 - p 1 mellem to populationer Eksempel: Bøn og operation q Et 95% konfidensinterval forskellen i andele: q Da KI’et indeholder 0, er ”ingen forskel” plausibelt.

Signifikanstest for p 2 - p 1 n n Antagelser: Store stikprøver Nul-hypotese: q

Signifikanstest for p 2 - p 1 n n Antagelser: Store stikprøver Nul-hypotese: q H 0 : p 2 - p 1 = 0 (ingen effekt) Alternativ hypotese: q H a : p 2 - p 1 0 (en effekt) Teststørrelse: q n n hvor P-værdi Konklusion: q Jo lavere P-værdi jo mindre tror vi på H 0 p^ er den overordnede andel, når grupper ignoreres.

Test af forskel i andele n n n Effekten af bøn på udfald af

Test af forskel i andele n n n Effekten af bøn på udfald af operation: Bøn Komplikationer Ej komplikationer Total Andel kompl. Ja 315 289 n 1=604 p^ 1=0. 522 Nej 304 293 n 2=597 p^ 2=0. 509 Hypoteser: H 0: p 2 -p 1 = 0 vs H a : p 2 - p 1 0