ANOVA fr unabhngige Stichproben Evaluation und Forschungsstrategien Wi
ANOVA für unabhängige Stichproben Evaluation und Forschungsstrategien; Wi. Se 19/20 ANNA TRÖGER, SIMONA PETER, ALEXA GRASSMANN, ANNIKA STEINMETZ
Warum ANOVA? Varianzanalyse ANalysis Of Variance Fragestellung: Unterscheiden sich die Mittelwerte einer abhängigen Variable zwischen mehreren unabhängigen Gruppen?
Welche Arten gibt es? UV = Faktor/Treatment → Unterscheidung nach Anzahl der Faktoren Faktor Therapieform Einfaktorielle ANOVA: 1 Faktor mit mehreren Stufen (i. d. R. ab 3) Zielvariable Therapieerfolg Verhaltenstherapie Gesprächstherapie Psychoanalyse 16, 2 14, 5 24, 7 19, 6 12, 4 29, 3 18, 3 21, 2 17, 3
Welche Arten gibt es? Mehrfaktorielle ANOVA: Faktor A: Therapieform 2 oder mehr Faktoren Faktor B: Geschlecht Verhaltenstherapie Zielvariable Therapieerfolg Psychoanalyse m w 17, 4 … … 16, 2 … … 16, 8 … …
Voraussetzungen • AV intervallskaliert (stetig) • Innerhalb der Faktorstufen ist AV normalverteilt • UV i. d. R. nominal-/ ordinalskaliert • Unabhängige Messungen • Varianzhomogenität über alle Gruppen (Faktorstufen) hinweg
Wie überprüfe ich die Voraussetzungen? Normalverteilung der AV → Normalverteilungstests (Kolmogorov-Smirnoff, Shapiro-Wilk-Test) → Q-Q-Diagramme (Quantilplots, Normalverteilungsdiagramme) Varianzhomogenita t → Levene-Test (F-Test)
Lineares Modell der ANOVA • Linearer Zusammenhang zwischen Faktoren ↔ AV • Messwert = Systematische Komponente + Fehlerkomponente Merke: Der Messwert einer beliebigen Person setzt sich zusammen aus I. Populationswert II. Treatmenteffekte III. Individueller Messfehler
Messwert setzt sich zusammen aus: [RUBRIKENNAME] Interaktionseffekt [RUBRIKENNAME ] Effekt der Treatmentstufe von A Effekt der Treatmentstufe von B
Lineares Modell der ANOVA
Warum Quadratsummenzerlegung? Ansatz: Wenn Streuung der Stufen-MW > Fehlerstreuung hat das Treatment einen Effekt! Ziel: Separate Aussagen über die Wirkung der einzelnen Effekte treffen =>Quadratsummenzerlegung
Quadratsummenzerlegung ANOVA findet Unterschiede zwischen Gruppen. Mittelwerten, indem sie die Streuung von Fehler und Treatments miteinander vergleicht!
Berechnung der Quadratsummen Datenstreuung ausgedrückt als Quadratsumme: Mittelwert aller Daten (Grand Mean) Lineares Modell wird in Gleichung eingesetzt:
Berechnung der Quadratsummen Problem: unbekannte Komponenten der Gleichung Lösung: Andere Kennzahlen berechnen (Gesamt-MW, Stufen-MW, Interaktions-MW) Nach Umformung/Einsetzen bekannter Terme erhält man folgende Gleichung :
Formeln QS Interaktion: Keine Interaktion:
QS → Populationsvarianzen Problem: Direkter Vergleich zwischen den Quadratsummen unzulässig Lösung: Transformation der Quadratsummen in Populationsvarianzen, damit der Vergleich stimmt
Berechnung der Populationsvarianzen 1. Freiheitsgraden berechnen 2. Quadratsummen durch jeweilige Freiheitsgerade teilen
Freiheitsgrade n =Anzahl der Personen in einer ANOVA-Zelle p = Anzahl der Stufen von Faktor A q= Anzahl der Stufen von Faktor B
Formeln Zur Berechnung der Populationsvarianzen wird QS durch jeweilige Freiheitsgrade geteilt
QS → Populationsvarianzen Mit den Populationsvarianzen stimmt die zuvor angenommene Beziehung:
Prüfgröße F Annahme: Ohne Effekt eines Treatments kann die Streuung der Stufenmittelwerte nur aus der Fehlerstreuung entstehen
F- Verteilung Häufigkeitsverteilung: Entsteht, wenn man das Experiment unendlich oft durchführen würde Frage: Ab wann ist ein F- Wert “zu unwahrscheinlich”, als dass der Zufall allein für sein Auftreten verantwortlich sein kann?
Interpretation des F-Wertes Aus theoretischer F-Verteilung kann die Wahrscheinlichkeit p(F) für das Auftreten einer bst. Prüfgröße ermittelt werden Ein zu unwahrscheinlicher F-Wert belegt Unterschiede zwischen Treatmentstufen
Interpretation des p- Werts Problem: Wie klein ist “zu klein”, bzw. “zu unwahrscheinlich”? Signifikanzniveau:
Varianzaufklärung Statistische Signifikanz ≠ praktische Bedeutsamkeit →Varianzaufklärung der Treatments bestimmen = Anteil an der Gesamtstreuung, für den das Treatment verantwortlich ist
Varianzaufklärung Aufgeklärte Varianz / QSzwischen / Between-Varianz: Nicht aufgeklärte Varianz/ QSinnerhalb/ Within-Varianz:
Quellen Malte’s Videos http: //www. r-tutor. com/sites/default/files/images/probability-distributions 14 x. png
- Slides: 26