RAT 0106 Rannsknaraferir og tlfrileg greining 7 febrar
RAT 0106 Rannsóknaraðferðir og tölfræðileg greining 7. febrúar Tilgátur og tilgátupróf Marktæknihugtakið t-próf óháðra úrtaka (1)
Kenningar og tilgátur • Kenning er fullyrðing sem tengir saman fyrirbæri og segir til um orsök þeirra Kenningar verða aldrei sannaðar • Tilgátur eru leiddar af kenningum með röklegum hætti (ef kenningin er rétt tilgátan er rétt) og eru mælanlegar • Sé einni tilgátu hafnað getur kenningin ekki staðist • Dæmi - Kenning Durkheims um sjálfsvíg: Því traustari sem tengsl einstaklingsins eru við samfélagið þeim mun ólíklegra er að viðkomandi fremji sjálfsvíg T 1: Einhleypingar líklegri en fólk í sambúð T 2: Barnlausir líklegri en foreldrar T 3: Mótmælendur líklegri en Kaþólskir (2)
Tilgátuprófun • Metill (estimator) í úrtaki er notaður til spá fyrir um stika (parameter) í þýði er t. d. notað til að spá fyrir um • Getum ekki sannað hver stikinn er • En við getum afsannað hver hann er – Setjum fram tilgátu (núlltilgátu) sem við höldum að sé ósönn – Reynum að fella þá tilgátu! (sýna framá að það sé ólíklegt að hún geti staðist) – Þar með er andstæð tilgáta um stikann studd (ekki sönnuð) (3)
Núlltilgáta (H 0) Það sem við ætlum að afsanna • • Líkamsþyngd tengist ekki námsárangri Tómstundastarf tengist ekki vímuefnaneyslu Fjölskyldugerð tengist ekki líðan Það er ekki munur á meðallaunum karla og kvenna Núlltilgáta vísar til þýðis, ekki úrtaks laun karla jöfn launum kvenna (4)
Rannsóknartilgáta (H 1) Það sem afsannar núlltilgátuna (gengur gegn henni) • • Líkamsþyngd tengist námsárangri Tómstundastarf tengist vímuefnaneyslu Fjölskyldugerð tengist líðan Það er munur á meðallaunum karla og kvenna Rannsóknartilgáta vísar til úrtaks, ekki þýðis Stefnulaus (nondirectional) laun karla ekki jöfn launum kvenna Stefnuvirk (directional) laun karla hærri en laun kvenna (5)
Líkindi • Grundvöllur úrtaksrannsókna er hugtakið líkindi (probability) • Eigi að álykta um eiginleika þýðis á grundvelli úrtaks verða líkindi hvers tilviks í þýðinu á að lenda í úrtakinu að vera þekkt og vera meiri en núll – Úrtakið sem við vinnum með þarf að vera líkindaúrtak • Ef þetta skilyrði er ekki uppfyllt er ekki hægt að meta hversu líklegt er að niðurstöðurnar um úrtakið eigi einnig við um þýðið – Úrtakið sem við vinnum með má þá ekki vera ólíkindaúrtak (6)
Verkefnið • • Við ætlum að reyna að afsanna núlltilgátuna Það eru hins vegar fjórar mögulegar niðurstöður 1. Núlltilgátan er rétt og við samþykkjum hana • Gott mál 2. Núlltilgátan er rétt en við höfnum henni samt • Vont mál, alfa villa (Type I error) 3. Núlltilgátan er ekki rétt en við samþykkjum hana samt • Vont mál, beta villa (Type II error) 4. Núlltilgátan er ekki rétt og við höfnum henni • Gott mál (7)
α og β villur Niðurstaða rannsóknar eða mælingar Samþykkjum núlltilgátuna Höfnum núlltilgátunni Núlltilgátan er rétt 1 Bravó, við höfum samþykkt núlltilgátuna þegar hún er í raun rétt og það er enginn munur á hópunum sem við erum að skoða 2 Ó nei, við höfum gert hræðileg α mistök og hafnað núlltilgátunni þegar hún var í raun rétt og sagt að það sé munur á hópunum þó svo sé ekki Núlltilgátan er ekki rétt 3 Ó nei, við höfum gert hræðileg β mistök og samþykkt núlltilgátuna þó hún sér röng og sagt að það sé ekki munur á hópunum þó hann sé í raun til staðar 4 Bravó, við höfum hafnað núlltilgátunni þegar hún var í raun röng og sagt réttilega að það sé munur á hópunum (stundum kallað afl eða 1 -β) Hið sanna eðli núlltilgátunnar (8)
Vandamálið • Ef við ætlum að vera algerlega pottþétt á að hafna aldrei réttri núlltilgátu þá munum við samþykkja margar rangar núlltilgátur – Á mannamáli: Ef við ætlum aldrei að lenda í því að segja að það sé munur eða tengsl þó slíkt sé ekki til staðar í þýðinu þá munum við oft lenda í því að segja að sé enginn munur eða tengsl þó slíkt sé til staðar í þýðinu • Ef við ætlum að vera algerlega pottþétt á því að samþykkja aldrei ranga núlltilgátu þá munum við hafna mörgum réttum núlltilgátum – Á mannamáli: Ef við ætlum aldrei að lenda í því að segja að það sé ekki munur eða tengsl þó slíkt sé til staðar í þýðinu þá munum við oft lenda í því að segja að sé munur eða tengsl þó slíkt sé ekki til staðar í þýðinu (9)
Tilviljunarbundnar skekkjur • Það sem við erum að reyna að koma böndum á er að ályktunin sem við drögum og sem byggist á úrtaki eigi líka við í þýðinu • Við vinnum með tvennskonar ályktanir – Mat á stærðum í þýði • Ef þetta er talan í úrtakinu, á hvaða bili ætli sé líklegast að þýðistalan sé? – Mat á tengslum í þýði • Ef þetta er munurinn/fylgnin sem ég mæli í úrtakinu, hversu líklegt ætli sé að þessi munur/fylgni sé ekki til staðar í þýðinu? (10)
Hvað skiptir máli? • Fjöldi í úrtaki skiptir máli – Því stærra úrtak, því minni tilviljunarbundin skekkja • Breytileiki skiptir máli – Því minni breytileiki, því minni tilviljunarbundin skekkja Þetta eru almenn atriði sem eiga við um öll tölfræðileg próf (11)
Skoðum mat á stærðum í þýði • Við erum með úrtak 45 barna úr í 10. bekk grunnskóla – – Meðalþyngd þeirra er 67 kg Staðalfrávik þyngdar er 13 kg Hver ætli sé meðalþyngd barna í 10. bekk? Við getum ekki sannað hver hún er en við getum fundið úr hver er ólíklegt að hún sé Breytileiki Öryggisbil Staðalvilla Öryggismörk Úrtaksstærð (12)
Z er fyrir ztaðlaða normaldreifingu 95% 2, 5% 1, 96 Staðalfrávik 1, 96
Við finnum svo 95% öryggisbil • Forsendur: – – Meðaltalið í úrtakinu = 67 kg Úrtaksstærðin = 45 Staðalfrávikið = 13 kg Öryggismörkin = 95% => z-gildi = 1, 96 • Þetta þýðir: – Til að nefna með 95% vissu bil sem inniheldur þýðistöluna þurfum við að fara 3, 8 upp fyrir og 3, 8 niður fyrir meðaltal úrtaksins 67 + 3, 8 = 63, 2 67 – 3, 8 = 70, 8 (14)
Uppskrift að tilgátuprófun • Setjum fram núlltilgátu og rannsóknartilgátu • Ákveðum marktektarmörk (α mörk), t. d. 0, 05 • Veljum rétt tölfræðilegt próf – Það má ekki gera hvað sem er við hvaða gögn sem er • • Reiknum út prófgildi Finnum vendigildi í viðeigandi töflu Berum saman útreiknaða prófgildið og vendigildið Ákveðum niðurstöðuna – Ef útreiknaða gildið er hærra en vendigildið segjum við yfirleitt að það sé munur eða tengsl – Ef útreiknaða gildið er lægra en vendigildið segjum við yfirleitt að það sé ekki munur eða tengsl (15)
Alfa (α ) og beta (β) villur • Þegar við stækkum öryggisbilið utanum meðaltölin sem við erum að bera saman þá gerist tvennt: – Við minnkum líkurnar á því að við höldum því fram að munur sé á meðaltölunum þó hann sé ekki til staðar í raun og veru – Við aukum líkurnar á því að við segjum að það sé ekki munur á meðaltölunum þó hann sé til staðar í raun og veru • Við þurfum að leita jafnvægis á milli þeirrar áhættu að hafna réttri núlltilgátu (α villa) og að samþykkja ranga núlltilgátu (β villa) • Báðar tegundir að villum er jafn alvarlegt að gera (16)
95% öryggismörk • Það er algeng forsenda í rannsóknum að stilla alfamörkin af við 5% – Af því er dregið orðalagið að vera 95% viss – Það vísar til þess að viljum vera 95% viss um að mynstrið sem við sjáum í gögnunum sé ekki tilkomið fyrir tilviljun (17)
Frígráður? Fisher vs Pearson • Við notum úrtak til að álykta um þýði – Notum til að meta • En hvað ef úrtakið er ekki sérlega stórt? – Þá er hætta á að við vanmetum breytileikann í þýðinu – Við þurfum að taka tillit til þess þegar við metum breytileikann að einu upplýsingarnar sem við höfum um meðaltal þýðisins eru úr úrtakinu Staðalfrávik úrtaks Staðalfrávik þýðis
Hverju munar? Án leiðréttingar Með leiðréttingu
Fjöldi í úrtaki Hlutfallslegt vanmat á breytileika
Má ég kynna: t-dreifing
Af hverju t en ekki z? • t dreifingin er oftast tengd við írska efnafræðinginn Gosset sem benti á það árið 1908 að í litlum úrtökum (færri en 30 stök) er dreifingin flatari en hefðbundin z dreifing • z-próf: Notað til að prófa tilgátur tengdar meðaltalinu þegar þýðismeðaltalið og staðalfrávik þýðisins er þekkt • t-próf: Notað til að prófa tilgátur tengdar meðaltalinu þegar þýðismeðaltalið og staðalfrávik þýðisins er ekki þekkt – Strangt til tekið þarf dreifingin í þýðinu að vera normal en prófið er þó tiltölulega traust gagnvart slíkum frávikum – Fjöldi í úrtaki má vera lítill (jafnvel undir 30) • Líta má á z dreifingu sem t dreifingu með óendanlega mörgum frígráðum
t og z
t-próf fyrir mun á meðaltölum tveggja óháðra hópa • Fjöldi kaffibolla sem drukkinn er annars vegar af kennurum á unglingastigi og hins vegar kennurum yngstu barna – Kennarar á yngstubarnastigi • 8, 6, 9, 7, 10, 8 – Kennarar á unglingastigi • 5, 6, 7, 3, 4 • Er munur á þessum tveimur hópum kennara?
Uppskrift að tilgátuprófun • Setjum fram núlltilgátu og rannsóknartilgátu • Ákveðum marktektarmörk (α mörk), t. d. 0, 05 • Veljum rétt tölfræðilegt próf – Það má ekki gera hvað sem er við hvaða gögn sem er • • Reiknum út prófgildi Finnum vendigildi í viðeigandi töflu Berum saman útreiknaða prófgildið og vendigildið Ákveðum niðurstöðuna – Ef útreiknaða gildið er hærra en vendigildið segjum við yfirleitt að það sé munur eða tengsl – Ef útreiknaða gildið er lægra en vendigildið segjum við yfirleitt að það sé ekki munur eða tengsl (25)
1. Núlltilgáta og rannsóknartilgáta • Það er ekki munur á fjölda kaffibolla sem drukkinn er annars vegar af kennurum á unglingastigi og hins vegar kennurum yngstu barna • Það er munur á fjölda kaffibolla sem drukkinn er annars vegar af kennurum á unglingastigi og hins vegar kennurum yngstu barna
2. Marktektarmörk • Alfamörk (m. v. 95% öryggismörk): • Einhliða eða tvíhliða próf? – Stefnutilgáta => Einhliðapróf – Stefnulaus tilgáta => Tvíhliðapróf – Skoðum það betur síðar
3. Val á tölfræðiprófi Frumbreyta Óstikuð (fá mæligildi) Stikuð (mörg mæligildi) 1 Kí-kvaðrat 3 2 T-próf ANOVA 4 Pearsons r Aðhvarfsgreining Óstikuð (fá mæligildi) Fylgibreyta Stikuð (mörg mæligildi)
t-próf óháðra úrtaka • Fylgibreytan er fjöldi kaffibolla • Mælt á hlutfallskvarða • Maður getur minnst drukkið ekkert kaffi og mest ? – Það að fylgibreytan er á hlutfallskvarða segir okkur að viljum nota stikað próf • Frumbreytan er skólastig • Hópur 1 kennir á yngstubarnastigi • Hópur 2 kennir á unglingastigi • Í þessum skóla kennir enginn á öðru stiginu líka á hinu – Það að við erum með tvo hópa og að þeir eru óháðir segir okkur að viljum nota t-próf
Mismunurinn yfir og staðalvillan undir • Nokkrir gamlir kunningjar – Meðaltöl – Kvaðratsummur – Fjöldi í hópum
4. Útreikningur á prófgildi 8 5 6 6 9 7 7 3 10 4 8 25 48
4. Útreikningur á prófgildi 8 0 0 5 0 0 6 -2 4 6 1 1 9 1 1 7 2 4 7 -1 1 3 2 4 10 2 4 4 1 1 8 0 0 25 48 10 10
4. Útreikningur á prófgildi • Kvaðratsummur: • Meðaltöl
5. Fundið vendigildi • Frígráður: • Vendigildi:
6 og 7. Niðurstaða og samanburður á útreiknuðu gildi og vendigildi • t-gildi: • Vendigildið 2, 26 er lægra en útreiknað t-gildi 3, 323 og því getum við með 95% vissu sagt að munur sé á hópunum sem við vorum að bera saman
Hvernig myndi þetta líta út í SPSS
Niðurstaðan er sú að það er munur á fjölda kaffibolla sem kennarar á yngstubarnastigi drekka (meðaltal 8 bollar og staðalfrávik 1, 6 bollar) og sem kennarar á unglingastigi drekka (meðaltal 5 bollar og staðalfrávik 1, 4 bollar) á þann hátt að kennarar á yngstubarnastigi drekka að meðaltali þremur bollum meira af kaffi en kennarar á unglingastigi (t(9)= 3, 323; p< 0, 05).
Einhverjar spurningar? (38)
- Slides: 38