SIV 1102 1 Repetisjon Kapittel 1 9 9172021

  • Slides: 23
Download presentation
SIV 1102 -1: Repetisjon Kapittel 1 -9 9/17/2021 Fred Wenstøp 1

SIV 1102 -1: Repetisjon Kapittel 1 -9 9/17/2021 Fred Wenstøp 1

SIV 1102 Statistikk og dataanalyse – – – – – 9/17/2021 Repetisjon av kapittel

SIV 1102 Statistikk og dataanalyse – – – – – 9/17/2021 Repetisjon av kapittel 1 -9 Kapittel 10 -1 og 10 -2: z-tester og t-tester Kapittel 10 -3 og 10 -4: To stikkprøver Kapittel 11: Kategoriske variabler og z-tilnærmelsen Kapittel 12: Korrelasjon Kapittel 13: Regresjon Kapittel 14: Variansanalyse Kapittel 15 og 16: Valg av metode, stokastiske variabler Selvtest med flervalgseksamen. Fred Wenstøp 2

Oversikt over statistiske metoder Målenivå Nominal Én stikkprøve Én andel Mediantest 7. 4 t-test

Oversikt over statistiske metoder Målenivå Nominal Én stikkprøve Én andel Mediantest 7. 4 t-test for én stikkprøve 10. 2 Bin. : 7. 1 z: 11. 1 To relaterte stikkprøver Tegntest 8. 2 Wilcoxon 8. 3 Mann-Whitney 8. 4 To uavhengige stikkprøver Flere relaterte stikkprøver Flere uavheng. stikkprøver Samvariasjon 9/17/2021 Ordinal Fisher 8. 6 Kji 2 11. 3 Intervall t-test for to relaterte 10. 3 t-test for to uav hengige 10. 4 ANOVA for gjentatte 14. 2 Kruskal-W 8. 5 ANOVA 14. 1 Spearman 15. 1 Korr. 12. 1 Regresjon 13. 2 Fred Wenstøp 3

Skjema for Binomialtesten 9/17/2021 Fred Wenstøp 4

Skjema for Binomialtesten 9/17/2021 Fred Wenstøp 4

Binomialtesten med SPSS Eksempel: Tanten med tekoppene • Data: Tanten klarte a = 9

Binomialtesten med SPSS Eksempel: Tanten med tekoppene • Data: Tanten klarte a = 9 kopper av n = 12 • Ho: p = ½, H 1: p > ½ • Signifikansnivå = a = 0, 05 • Tilrettelegging av data i SPSS – Data: Lag to variabler: tekopper og antall med verdier som vist ovenfor – Definer variablene i Variable view – tekopper: Type: Numeric, Values: 0=gal 1=riktig, Measure: nominal • Values får du til ved å dobbeltklikke i values-cellen – antall: Velg meny Data > weight cases by antall 9/17/2021 Fred Wenstøp 5

Binomialtesten med SPSS Eksempel: Tanten med tekoppene • Ho: p = ½, H 1:

Binomialtesten med SPSS Eksempel: Tanten med tekoppene • Ho: p = ½, H 1: p > ½ • Signifikansnivå = a = 0, 05 • Beregning av signifikanssannsynligheten i SPSS – Analyze > Non-parametric test. . . > Binomial. . . • Test proportion 0. 5 (Ho) • Test Variable: tekopper • Exact. . . – Exact – Continue • OK • Signifikanssannsynligheten = – 0, 146/2 = 0, 073 (ensidig) 9/17/2021 Fred Wenstøp 6

Binomialtesten med Excel Eksempel: Tanten med tekoppene • Ho: p = ½, H 1:

Binomialtesten med Excel Eksempel: Tanten med tekoppene • Ho: p = ½, H 1: p > ½ • Signifikansnivå = a = 0, 05 • Beregning av signifikanssannsynligheten med Excel – Skriv følgende i en hvilken som helst rute: =BINOMDIST(3; 12; 0. 5; 1) – Resultatet er at rutens verdi blir 0. 072998 som er den ensidige p-verdien • Bemerk – Når p = ½ slik vi forutsetter under nullhypotesen, er binomialfordelingen symmetrisk slik at det ikke spiller noen rolle om vi fokuserer på antall riktige (9) eller antall gale (3) 9/17/2021 Fred Wenstøp 7

Skjema for test på median med ordningsobservatorene 9/17/2021 Fred Wenstøp 8

Skjema for test på median med ordningsobservatorene 9/17/2021 Fred Wenstøp 8

Skjema fortegnstesten 9/17/2021 Fred Wenstøp 9

Skjema fortegnstesten 9/17/2021 Fred Wenstøp 9

Fortegnstesten med SPSS Hyllehøyde-eksemplet • Data – Kopier dataene inn i SPSS datavindu fra

Fortegnstesten med SPSS Hyllehøyde-eksemplet • Data – Kopier dataene inn i SPSS datavindu fra Excelfilen cornflak som to separate varia • Analyze – Nonparametric tests • 2 related samples – Flytt begge variablene over i Test Pair List – Velg Sign • Exact. . . Exact 9/17/2021 Fred Wenstøp 10

Skjema for Wilcoxons tegnrangtest 9/17/2021 Fred Wenstøp 11

Skjema for Wilcoxons tegnrangtest 9/17/2021 Fred Wenstøp 11

Wilxons tegnrangtest med SPSS Hyllehøyde-ekse • Data – Kopier dataene inn i SPSS datavindu

Wilxons tegnrangtest med SPSS Hyllehøyde-ekse • Data – Kopier dataene inn i SPSS datavindu fra Excelfilen cornflak som to separate variabler • Analyze – Nonparametric tests • 2 related samples – Flytt begge variablene over i Test Pair List – Velg Wilcoxon • Exact. . . Exact 9/17/2021 Fred Wenstøp 12

Skjema for Mann-Whitneytesten 9/17/2021 Fred Wenstøp 13

Skjema for Mann-Whitneytesten 9/17/2021 Fred Wenstøp 13

MW-testen med SPSS (1) Eksempel: Lønn i reiselivsbransjen • Data – Kopier dataene fra

MW-testen med SPSS (1) Eksempel: Lønn i reiselivsbransjen • Data – Kopier dataene fra Excelfilen Reiseliv, men legg kvinnelønnene i samme kolonne som mannslønnene. – Kall denne variabelen ”lønn” – Lag en grupperende variabel ”kjønn” med 0 for mann og 1 for kvinne • Kjønn må du opplyse om i variable view ved at du dobbeltklikker i values og gir mann og kvinne hhv verdiene 0 og 1 • Analyze – Non-Parametric tests • 2 independent variables – lønn er testvariabel og kjønn grupperende variabel • Du må definere gruppene (0 og 1) – Velg også eksakt test 9/17/2021 Fred Wenstøp 14

MW-testen med SPSS (1) Eksempel: Lønn i reiselivsbransjen • Tolkning av utskrift – Mann-Whitney

MW-testen med SPSS (1) Eksempel: Lønn i reiselivsbransjen • Tolkning av utskrift – Mann-Whitney U viser det minste av de to MW-tallene • hvis det er mindre enn c, skal nullhypotesen forkastes – Alternativt kan du se på eksakt signifikannsynlighet ( pverdi) – Hvis den er mindre enn det valgte signifikansnivået, skal Ho forkastes – Her er p-verdi = 0, 045 i en tosidig test og 0, 022 ensidig 9/17/2021 Fred Wenstøp 15

Skjema for Fishertesten 9/17/2021 Fred Wenstøp 16

Skjema for Fishertesten 9/17/2021 Fred Wenstøp 16

Fishertesten med SPSS Eksempel Aspirin • Data – Data i oppgave 8 -13 i

Fishertesten med SPSS Eksempel Aspirin • Data – Data i oppgave 8 -13 i læreboken • skriv dem inn i SPSS slik: – Definer variablene i SPSS variable view vindu • • 9/17/2021 variablene ”tilstand” og ”gruppe” defineres som type strengvariabler Pek på tilstandsvariabelen i variable view Velg fra menyen: Data > Weight cases. . Velg ”antall” som frequency variable Fred Wenstøp 17

Fishertesten med SPSS Eksempel Aspirin • Analyze > Descriptive Statistics > Crosstabs – Velg

Fishertesten med SPSS Eksempel Aspirin • Analyze > Descriptive Statistics > Crosstabs – Velg ”tilstand” som Row – Velg ”gruppe” som Column – Trykk på Statistics. . . • Velg Chi-Square • Utskrift – Du får først en tabell maken til tabell 8 -10 i læreboken – Deretter en utskrift hvor det eneste interessante tallet er den ensidige signifikanssannsynligheten i Fishers eksakte test = 0. 034 9/17/2021 Fred Wenstøp 18

Gjennomsnitt og standardavvik til n observasjoner av x • Gjennomsnittet er summen av observasjonene

Gjennomsnitt og standardavvik til n observasjoner av x • Gjennomsnittet er summen av observasjonene delt på antallet • Standardavviket er et slags gjennomsnittlig kvadratavvik – man deler på n-1 når man beregner stikkprøvestandardavvik • Bruk f. eks. Statark vindu II-1 ved mange gjentatte verdier av x. (Grupperte data) • Standardavviket er særlig viktig i forbindelse med normalfordelingen 9/17/2021 Fred Wenstøp 19

Gjennomsnitt og standardavvik til n observasjoner av en dikotom variabel • En variabel kan

Gjennomsnitt og standardavvik til n observasjoner av en dikotom variabel • En variabel kan bare ha to utfall, Ja og Nei, P(Ja)=p • Triks: Ja=1, Nei =0 • Med den opprinnelige definisjonen av s og m m =p s 2 = p(1 - p) • Tilsvarende for stikkprøver der vi observerer a Ja-er ut av n forsøk 9/17/2021 Fred Wenstøp 20

Standardiserte variabler • Du har en populasjon av x-er • Populasjonen har et gjennomsnitt

Standardiserte variabler • Du har en populasjon av x-er • Populasjonen har et gjennomsnitt m og stdavvik s • Lag en ny populasjon av z-er ved å erstatte alle x-ene med: • z er en standardisert variabel • populasjonen av z-er har gjennomsnitt 0 og standardavvik 1 9/17/2021 Fred Wenstøp 21

Normalfordelingen • Standard normalfordelingen har gjennomsnitt 0 og standardavvik 1 • Vi kan finne

Normalfordelingen • Standard normalfordelingen har gjennomsnitt 0 og standardavvik 1 • Vi kan finne sannsynligheter for at en observasjon av en standard normalfordelt variabel z faller mellom to grenser ved hjelp av tabeller regnearkfunksjoner • Det er viktig å kunne utføre dette 9/17/2021 Fred Wenstøp 22

Sentralgrenseteoremet • En variabel som er en sum av mange tilfeldigheter er normalfordelt –

Sentralgrenseteoremet • En variabel som er en sum av mange tilfeldigheter er normalfordelt – Eksempel: økning i aksjekurs • Viktig implikasjon: – Et gjennomsnitt er normalfordelt hvis antall observasjoner er stort nok (>30) • Viktig formel: – z er standard normalfordelt 9/17/2021 Fred Wenstøp 23