Hoofdstuk 12 En factor variantie analyse Ttoetsen in

Hoofdstuk 12 Eén factor variantie -analyse

• T-toetsen in hoofdstuk 7 : telkens 2 verwachtingen vergelijken • ANOVA (Analysis

A. Gegevens voor een één-factor variantie-analyse • Voor twee steekproeven : t berekenen •

B. Verwachtingen vergelijken • ANOVA : zijn de verschillen in gemiddelden statistisch significant ?

• Doosdiagrammen tonen gemiddelden en variatie : – Grotere variatie binnen de groepen

C. De twee-steekproeven t-grootheid Grondgedachte van F-grootheid begrijpen op basis van t • Bij

• Als we ANOVA gebruiken voor het vergelijken van twee populaties, is de

D. De hypothesen van ANOVA • In ANOVA : vergelijken van groepen – H

• Als de ANOVA significant is : – Alle verwachtingen zijn verschillend OF

E. Schattingen van de populatieparameters • Op basis van de steekproef schatten van :

• Daarom meestal geen formele toets gebruiken (zie Levene’s test) • Wel vuistregel

F. De ANOVA tabel en de F-toets • Eerst grafisch kijken of de variabele

• Voorbeeld : Is er een verschil in prestaties op een test afhankelijk

• Computeroutput : – Gemiddelden en standaarddeviaties per groep – Sum of squares

– Mean square = sum of square / vrijheidsgraden – F = Mean square

G. Contrasten • We weten dat F significant is maar niet tussen welke groepen

• Contrasten zelf op voorhand ingeven in SPSS • Som van contrasten die

H. Meervoudige vergelijkingen of post-hoc testen • Als de algemene F-toets significant is, en

• Bij post hoc test worden alle paren met elkaar vergeleken en significantie

Slides: 22

Download presentation

Hoofdstuk 12 Eén factor variantie -analyse

• T-toetsen in hoofdstuk 7 : telkens 2 verwachtingen vergelijken • ANOVA (Analysis of Variance) of variantieanalyse bij meer dan 2 groepen vergelijken • Twee soorten : – Één-factor ANOVA : 1 classificatie naar groep – Twee factor of meer factor ANOVA : meer classificaties naar groep

A. Gegevens voor een één-factor variantie-analyse • Voor twee steekproeven : t berekenen • Voor meer dan twee steekproeven : F berekenen • Steeds ook gegevens uit EAS of experiment • 1 afhankelijke variabele : kwantitatief moet normaal verdeeld zijn • 1 onafhankelijke variabele = groepen (3 of meer) : categoriaal

B. Verwachtingen vergelijken • ANOVA : zijn de verschillen in gemiddelden statistisch significant ? – Niet enkel gemiddelden – Ook variatie binnen groepen – Variatie (s/ n) afhankelijke van n • Zij aan zij doosdiagrammen geven goed visueel beeld van gemiddelden en variatie

• Doosdiagrammen tonen gemiddelden en variatie : – Grotere variatie binnen de groepen meer kans op toevallige fluctuaties : niet significant • Maar voor ANOVA niet enkel gemiddelden en variatie ook aantallen per groep nodig

C. De twee-steekproeven t-grootheid Grondgedachte van F-grootheid begrijpen op basis van t • Bij twee steekproeven met dezelfde en gelijke n, is de t-grootheid gelijk aan : t= x–y s 1/n + 1/n t 2 = n/2 (x-y)2 s 2 = n/2 (x-y) s

• Als we ANOVA gebruiken voor het vergelijken van twee populaties, is de F gelijk aan de t 2 • Kijken we naar die t 2 dan zien we dat – De teller de variatie meet TUSSEN de groepen • Wordt groot bij grote n en veel verschil tussen – De noemer de variatie meet BINNEN de groepen • Wordt kleiner bij kleine variatie binnen de groepen => dit geeft het meest significant resultaat

D. De hypothesen van ANOVA • In ANOVA : vergelijken van groepen – H 0 : ALLE populatieverwachtingen zijn gelijk – Bv. µ 1 = µ 2 = µ 3 = … – Ha : niet ALLE populatieverwachtingen zijn gelijk – Dit kan 1 zijn die verschillend is of 2 of 3 ….

• Als de ANOVA significant is : – Alle verwachtingen zijn verschillend OF – Één van de verwachtingen is verschillend – DUS : verder analyseren wat verschillend is met : - contrasten indien er op voorhand reeds hypothesen werden gesteld - meervoudige vergelijkingen als er op voorhang GEEN hypothesen waren

E. Schattingen van de populatieparameters • Op basis van de steekproef schatten van : – Verwachtingen van populatie – Standaardafwijkingen van populatie • Model gaat uit van GELIJKE standaardafwijkingen voor alle groepen (zie t-verdeling) • ANOVA-procedures zijn niet extreem gevoelig voor ongelijke standaard afwijkingen

• Daarom meestal geen formele toets gebruiken (zie Levene’s test) • Wel vuistregel : de verhouding tussen grootste steekproef-standaardafwijking tot de kleinste steekproef-standaardafwijking niet groter dan 2 • Dan wordt automatisch ‘pooled variance’ methode gebruikt

F. De ANOVA tabel en de F-toets • Eerst grafisch kijken of de variabele in de verschillende groepen normaal verdeeld is • Dan kijken of de standaardafwijkingen van de verschillende groepen ongeveer gelijk zijn (vuistregel hoogste – laagste < 2)

• Voorbeeld : Is er een verschil in prestaties op een test afhankelijk van de rijpheid van jongeren: – Vroegrijp : 33 – Gemiddeld : 34 – Laat rijp : 23 32 37 32 H 0 : µ 1 = µ 2 = µ 3 Ha : niet alle µ zijn gelijk 34 43 34 44 39 24 38 43 28

• Computeroutput : – Gemiddelden en standaarddeviaties per groep – Sum of squares : between groups : afwijkingen tussen globaal gemiddelde en groepsgemiddelde within groups : afwijkingen tussen individuele waarneming en zijn groepsgemiddelde totaal : between groups + within groups – Vrijheidsgraden (df) : between groups : aantal groepen –

– Mean square = sum of square / vrijheidsgraden – F = Mean square between Mean square within Met een F-verdeling met twee vrijheidsgraden F (df van teller, df van noemer) F (groep – 1, n – groep) – en kijken naar overschrijdingskans p

G. Contrasten • We weten dat F significant is maar niet tussen welke groepen • Contrasten voor het toetsen van op voorhand gestelde hypothesen • In computer specifieke contrasten opvragen : uitgedrukt in t-waarden en bijhorende p • Contrasten kunnen ook gebruikt worden als algemene F-toets niet significant is

• Contrasten zelf op voorhand ingeven in SPSS • Som van contrasten die je ingeeft steeds gelijk aan NUL – Bv. 2 -1 – Bv. 1 -1 -1 0

H. Meervoudige vergelijkingen of post-hoc testen • Als de algemene F-toets significant is, en er op voorhand GEEN hypothesen zijn over mogelijke verschillen • Post hoc testen : zeer veel verschillende – bv. Bonferroni, Scheffé, Tuckey – Geeft tabel van significanties tussen groepen • Enkel te gebruiken nadat algemene F significant is, dus als nulhypothese al verworpen is

• Bij post hoc test worden alle paren met elkaar vergeleken en significantie wordt gegeven. • Meeste procedures : kans op foutieve verwerping van elk paar verwachtingen op 0. 05 • Beter : kans op minstens één foutieve verwerping onder ALLE gemaakte vergelijkingen niet groter dan 0. 05