Der tTest Gliederung Statistische Hypothesen Null und Alternativhypothese

  • Slides: 30
Download presentation
Der t-Test Gliederung • Statistische Hypothesen – Null- und Alternativhypothese – Alpha- und Betafehler

Der t-Test Gliederung • Statistische Hypothesen – Null- und Alternativhypothese – Alpha- und Betafehler – Statistische Entscheidungen • Mittelwertsvergleiche mit dem t-Test – – – 06_ttest(1) Überblick: 3 Arten von t-Tests Stichprobenkennwerteverteilung von Mittelwertsdifferenzen Die t-Verteilung Die Interpretation von t-Werten Voraussetzungen des t-Tests 1

Statistische Hypothesen • Die Inferenzstatistik macht Aussagen über eine Population, aus welcher die untersuchten

Statistische Hypothesen • Die Inferenzstatistik macht Aussagen über eine Population, aus welcher die untersuchten Stichproben gezogen wurden. • Dabei werden statistische Hypothesen getestet. • Statistische Hypothesen sind Erwartungen über Unterschiede zwischen (bzw. Zusammenhänge von) Variablen. • Statistische Hypothesen sollten immer vor einer Untersuchung formuliert werden • Beispiele für statistische Hypothesen: – Frauen sind ängstlicher als Männer. – Es besteht ein negativer Zusammenhang zwischen Ängstlichkeit und Optimismus. – Die Selbstsicherheit von Teilnehmer eines Kommunikationstrainigs ist nach dem Training höher als vor dem Training. 06_ttest(1) 2

Statistische Hypothesen Woher kommen die Hypothesen? • Eine psychologische Untersuchung wird immer mit dem

Statistische Hypothesen Woher kommen die Hypothesen? • Eine psychologische Untersuchung wird immer mit dem Ziel durchgeführt, eine bestimmte Forschungsfrage zu beantworten. • Beispiel: Wenn ein neues Therapieprogramm entwickelt wurde, dann muss der Entwickler dieses Programms zeigen, dass es den Teilnehmern nach der Therapie besser geht als vorher. • Je nach Ziel des Programms wird eine Hypothese formuliert: – Beispiel: „Teilnehmer weisen in einem Test zur Depressivität nach der Therapie geringere Werte als vor der Therapie auf. “ 06_ttest(1) 3

Nullhypothese und Alternativhypothese • Bei statistischen Tests werden immer (unabhängig von der Erwartung des

Nullhypothese und Alternativhypothese • Bei statistischen Tests werden immer (unabhängig von der Erwartung des beteiligten Forschers) zwei gegensätzliche Hypothesen formuliert: (a) Die Nullhypothese (H 0) besagt, dass es keinen Unterschied zwischen zwei Populationen (bzw. keinen Zusammenhang zwischen zwei Merkmalen) gibt. (b) Die Alternativhypothese (H 1) besagt dagegen, dass es einen Unterschied (bzw. einen Zusammenhang) gibt. • Es kann also immer nur eine von beiden Hypothesen zutreffen! • Die beiden statistischen Hypothesen (H 0 und H 1) werden unabhängig von den tatsächlichen inhaltlichen Erwartungen formuliert. 06_ttest(1) 4

Nullhypothese und Alternativhypothese Es gibt zwei Formen der Alternativhypothese • Eine ungerichtete Alternativhypothese (H

Nullhypothese und Alternativhypothese Es gibt zwei Formen der Alternativhypothese • Eine ungerichtete Alternativhypothese (H 1) besagt lediglich, dass es einen Unterschied (bzw. einen Zusammenhang) gibt („zweiseitiger Test“). – Diese Hypothese gilt als bestätigt, • wenn Gruppe 1 größere Werte als Gruppe 2 hat • wenn Gruppe 2 größere Werte als Gruppe 1 hat • (bzw. wenn ein pos. oder ein neg. Zusammenhang zwischen zwei Variablen besteht) • Eine gerichtete Alternativhypothese (H 1) spezifiziert die Richtung des Unterschieds (des Zusammenhang) („einseitiger Test“). – Beispiel: Es wird erwartet, • dass Gruppe 1 größere Werte als Gruppe 2 hat. • (bzw. dass ein pos. neg. Zusammenhang zwischen zwei Variablen besteht) 06_ttest(1) 5

Nullhypothese und Alternativhypothese Formale Schreibweise • Ungerichtete Alternativhypothese: – H 1 : μ 1

Nullhypothese und Alternativhypothese Formale Schreibweise • Ungerichtete Alternativhypothese: – H 1 : μ 1 ≠ μ 2 – H 0 : μ 1 = μ 2 • Gerichtete Alternativhypothese (1. Möglichkeit): – H 1 : μ 1 > μ 2 – H 0 : μ 1 ≤ μ 2 • Gerichtete Alternativhypothese (2. Möglichkeit): – H 1 : μ 1 < μ 2 – H 0 : μ 1 ≥ μ 2 • Die H 0 hängt also von der Auswahl der H 1 ab! 06_ttest(1) 6

Statistische Hypothesenprüfung Grundgedanke eines statistischen Tests • Bei der statistischen Hypothesenprüfung berechnet, wie wahrscheinlich

Statistische Hypothesenprüfung Grundgedanke eines statistischen Tests • Bei der statistischen Hypothesenprüfung berechnet, wie wahrscheinlich die empirischen (Mittel-)Werte der Stichprobe sind, wenn in der Population die H 0 gilt. • Beispiel: H 0: μLOT, w = μLOT, m (Mittelwert LOT ist für Frauen und Männer gleich) Gefundenes Ergebnis: Wie wahrscheinlich ist dieses Ergebnis, wenn die H 0 gilt? Problem: Exakte Werte einer kontinuierlichen Wahrscheinlichkeitsverteilung haben immer die Wahrscheinlichkeit 0. – Lösung: Wie Wahrscheinlich ist es, einen Unterschied von 0. 3 oder mehr zu finden, wenn die H 0 gilt? – Wenn dies sehr unwahrscheinlich ist, wird die H 0 verworfen, und die H 1 angenommen – Andernfalls wird die H 0 beibehalten. – – 06_ttest(1) 7

Alphafehler und Betafehler Fehler bei der statistischen Entscheidung • Die statistische Entscheidung für die

Alphafehler und Betafehler Fehler bei der statistischen Entscheidung • Die statistische Entscheidung für die H 0 oder die H 1 wird aufgrund von Wahrscheinlichkeiten gemacht • Daher sind immer Entscheidungsfehler möglich • Je nach der Entscheidung kann man zwei Fehler machen: (1) Man entscheidet sich für die H 1, obgleich zwischen den Populationsmittelwerten kein Unterschied existiert („α-Fehler“ bzw. „Fehler erster Art“). (2) Man entscheidet sich für die H 0, obgleich es auf Populationsebene einen bedeutsamen Unterschied gibt („β-Fehler“ bzw. „Fehler zweiter Art“). • Für Fehlertypen sollte vor einer Untersuchung die gewünschte Wahrscheinlichkeit festgelegt werden (oft geschieht dies aber nur für den Alpha-Fehler) 06_ttest(1) 8

Alphafehler und Betafehler Das α-Niveau • Das α-Niveau gibt die Wahrscheinlichkeit dafür an, dass

Alphafehler und Betafehler Das α-Niveau • Das α-Niveau gibt die Wahrscheinlichkeit dafür an, dass ein Test einen bedeutsamen Effekt anzeigt, obwohl in der Population kein Effekt besteht: – Wenn die Wahrscheinlichkeit für den gefundenen Effekt unter der H 0 kleiner als α ist, wird die H 0 verworfen und die H 1 angenommen. – Mit der Wahrscheinlichkeit α wird also die H 1 fälschlicherweise angenommen. • Konventionen für das α-Niveau: – (p ≤ 0. 10 „marginal signifikantes“ Ergebnis) – p ≤ 0. 05 „signifikantes“ Ergebnis – p ≤ 0. 01 „hoch signifikantes“ Ergebnis 06_ttest(1) 9

Alphafehler und Betafehler Das β-Niveau • Das β-Niveau gibt an, wie wahrscheinlich es ist,

Alphafehler und Betafehler Das β-Niveau • Das β-Niveau gibt an, wie wahrscheinlich es ist, dass ein Test keinen bedeutsamen Effekt anzeigt, obwohl in der Population ein Effekt besteht: – Mit der Wahrscheinlichkeit β wird also die H 0 fälschlicherweise beibehalten. • Konventionen für das β-Niveau… – … gibt es leider nicht – Es gibt jedoch eigentlich keinen Grund warum β>α sein sollte (obwohl das in vielen Untersuchungen der Fall ist). – β kann im Gegensatz zu α nicht frei gewählt werden, sondern ergibt sich aus verschiedenen anderen Größen (u. a. aus dem gewählten α Niveau und der Stichprobengröße) 06_ttest(1) 10

Statistische Entscheidungen In der Population gilt die Testergebnis Entscheidung H 0 H 1 p>α

Statistische Entscheidungen In der Population gilt die Testergebnis Entscheidung H 0 H 1 p>α „H 0“ korrekt β p<α „H 1 “ α korrekt 06_ttest(1) 11

Der t-Test Drei Formen des t-Tests (1) Der t-Test für unabhängige Stichproben – –

Der t-Test Drei Formen des t-Tests (1) Der t-Test für unabhängige Stichproben – – Dieser Test prüft, ob sich die Mittelwerte von zwei Gruppen unterscheiden Beispiel: „Sind Frauen ängstlicher als Männer? “ (2) Der t-Test für abhängige Stichproben – – Dieser Test prüft, ob sich der Mittelwert einer Stichprobe zu zwei Messzeitpunkten unterscheidet Beispiel: „Ist der Mittelwert der Ängstlichkeit nach einer Therapie größer als vor der Therapie“ (3) Der Ein-Gruppen t-Test – – 06_ttest(1) Dieser Test prüft, ob sich der Mittelwert einer Gruppe von einem vorgegeben Wert unterscheidet Beispiel: „Liegt der mittlere IQ einer Gruppe über 100? “ 12

Der t-Test für unabhängige Stichproben • Mit dem t-Test für unabhängige Stichproben wird verglichen,

Der t-Test für unabhängige Stichproben • Mit dem t-Test für unabhängige Stichproben wird verglichen, ob sich zwei Populationsmittelwerte voneinander unterscheiden. • Der t-Test gehört zu den parametrischen Testverfahren. Parametrische Testverfahren setzen eine bestimmte Verteilungsform (in der Regel die Normalverteilung) des untersuchten Merkmals voraus. • Daher bildet die Normalverteilung des untersuchten Merkmals eine Voraussetzung für den t-Tests. 06_ttest(1) 13

Kennwert des t-Tests Der Kennwert des t-Tests • Der Kennwert des t-Tests ist die

Kennwert des t-Tests Der Kennwert des t-Tests • Der Kennwert des t-Tests ist die Differenz der Mittelwerte der beiden Stichproben: • Der t-Test schätzt die bedingte Wahrscheinlichkeit : • Wenn p < α, wird die H 0 verworfen und die H 1 angenommen. 06_ttest(1) 14

Stichprobenkennwerteverteilung Die Stichprobenkennwerteverteilung des t-Tests • Um die Wahrscheinlichkeit zu bestimmen, wird eine theoretische

Stichprobenkennwerteverteilung Die Stichprobenkennwerteverteilung des t-Tests • Um die Wahrscheinlichkeit zu bestimmen, wird eine theoretische Stichprobenkennwerteverteilung der Mittelwertsdifferenzen unter der Nullhypothese gebildet. • Diese Verteilung gibt an, wie sich empirische Mittelwertsdifferenzen verteilen, wenn man sehr oft Stichproben zieht. 06_ttest(1) 15

Stichprobenkennwerteverteilung • Wenn die H 0 gilt, muss die Stichprobenkennwerteverteilung ihren Gipfel bei 0

Stichprobenkennwerteverteilung • Wenn die H 0 gilt, muss die Stichprobenkennwerteverteilung ihren Gipfel bei 0 haben. • Die theoretische Verteilung von Mittelwertsdifferenzen ist bei großen Stichproben normalverteilt. • Bei kleineren Stichproben ergibt sich eine „schmalgipfligere“ Verteilung. • Wenn die Verteilung bekannt ist, kann die Wahrscheinlichkeit für bestimmte Wertebereiche als „Fläche unter der Kurve“ bestimmt werden. 06_ttest(1) 16

Stichprobenkennwerteverteilung Der Standardfehler der Stichprobenkennwerteverteilung • Der Standardfehler der Stichprobenkennwerteverteilung des t-Tests hängt von

Stichprobenkennwerteverteilung Der Standardfehler der Stichprobenkennwerteverteilung • Der Standardfehler der Stichprobenkennwerteverteilung des t-Tests hängt von den Standardabweichungen und den Größen der beiden Teilstichproben ab: • Der Standardfehler wird benötigt, um die gefundene Mittelwertsdifferenz interpretieren zu können 06_ttest(1) 17

Stichprobenkennwerteverteilung Die t-Verteilung • Die empirische Mittelwertsdifferenz wird durch den Standardfehler dividiert. • Der

Stichprobenkennwerteverteilung Die t-Verteilung • Die empirische Mittelwertsdifferenz wird durch den Standardfehler dividiert. • Der resultierende Wert kann nun mit der t-Verteilung verglichen werden. • Die genaue For der t-Verteilung hängt von deren Freiheitsgraden (df = degree of freedom) ab. 06_ttest(1) 18

Freiheitsgrade Die Freiheitsgrade der t-Verteilung • Die Freiheitsgrade der t-Verteilung berechnen sich als: •

Freiheitsgrade Die Freiheitsgrade der t-Verteilung • Die Freiheitsgrade der t-Verteilung berechnen sich als: • Dabei beeinflussen die Freiheitsgrade die Form der t-Verteilung. • Bei vielen Freiheitsgraden (df >120) ist die t-Verteilung nahezu identisch mit der z-Verteilung. • Je weniger Freiheitsgrade gegeben sind, desto schmalgipfliger wird die t-Verteilung. 06_ttest(1) 19

Der t-Test für unabhängige Stichproben Entscheidung über die Nullhypothese • Mittels der t-Tabelle wird

Der t-Test für unabhängige Stichproben Entscheidung über die Nullhypothese • Mittels der t-Tabelle wird der empirische t-Wert interpretiert. • Dazu wird ein kritischer t-Wert aus der t-Tabelle entnommen – Der kritische t-Wert häng dabei ab: • von den Freiheitsgraden, • von dem gewählten Alpha-Nivea • von der Art der Testung (einseitig vs. zweiseitig) – Der kritische t-Wert definiert die Grenze des Bereichs für den empirischen t-Wert, ab dem die H 0 verworfen wird. 06_ttest(1) 20

Der t-Test für unabhängige Stichproben einseitiger Test (gerichtete H 0) zweiseitiger Test (ungerichtete H

Der t-Test für unabhängige Stichproben einseitiger Test (gerichtete H 0) zweiseitiger Test (ungerichtete H 0) 06_ttest(1) 21

Der t-Test für unabhängige Stichproben Entscheidungsregeln • Einseitiger Test: – Wenn temp > tkrit

Der t-Test für unabhängige Stichproben Entscheidungsregeln • Einseitiger Test: – Wenn temp > tkrit wird die H 0 verworfen • Zweiseitiger Test – Wenn |temp| > tkrit wird die H 0 verworfen • In der t-Tabelle werden immer Werte für den einseitigen Test angegeben. • Für einen 2 -seitigen Test muss tkrit so gewählt werden, dass ein Bereich von α/2 „von der Verteilung abgeschnitten wird“ 06_ttest(1) 22

Die t-Verteilung Kritische t-Werte: α =. 05, einseitig, df=100: tkrit(100) = 1. 66 α

Die t-Verteilung Kritische t-Werte: α =. 05, einseitig, df=100: tkrit(100) = 1. 66 α =. 05, zweiseitig, df=100: tkrit(100) = 1. 98 α =. 01, einseitig, df=100: tkrit(100) = 2. 63 06_ttest(1) 23

Der t-Test für unabhängige Stichproben Arbeitsschritte beim t-Test für unabhängige Stichproben: (1) Formulierung der

Der t-Test für unabhängige Stichproben Arbeitsschritte beim t-Test für unabhängige Stichproben: (1) Formulierung der (inhaltlichen und statistische) Hypothesen – (2) (3) (4) (5) (6) (7) gerichtet oder ungerichtet? Erfassung des Merkmals in zwei unabhängigen Stichproben Berechnung der Mittelwerte in beiden Stichproben Schätzung der Populationsvarianz Berechnung des Standardfehlers der Mittelwertsdifferenz Berechnung des empirischen t-Werts Bestimmung des kritischen t-Werts – aus df, α, und Art des Tests (8) Entscheidung für H 0 oder H 1 06_ttest(1) 24

Voraussetzungen des t-Tests für unabhängige Stichproben: (1) Intervallskalenniveau der Variable (2) Normalverteilung des Merkmals

Voraussetzungen des t-Tests für unabhängige Stichproben: (1) Intervallskalenniveau der Variable (2) Normalverteilung des Merkmals in der Grundgesamtheit (3) „Varianzhomogenität“ (Gleiche Varianzen des Merkmals in beiden Populationen) (4) Unabhängigkeit der Stichproben 06_ttest(1) 25

Voraussetzungen Normalverteilung des Merkmals in der Grundgesamtheit • Die Normalverteilungsannahme kann statistisch überprüft werden

Voraussetzungen Normalverteilung des Merkmals in der Grundgesamtheit • Die Normalverteilungsannahme kann statistisch überprüft werden – Dazu dient der Kolmogorov-Smirnov-Test (KS-Test). • Die Verletzung der Normalverteilungsannahme ist vor allem bei kleinen Stichproben problematisch (N<50). • Bei Verletzung der Normalverteilungsannahme sollte ein nichtparametrisches Test verwenden werden (U-Test). – Solche Verfahren haben aber immer eine höhere β-Fehler Wahrscheinlichkeit, d. h. vorhandene Effekte können oft nicht nachgewiesen werden. 06_ttest(1) 26

Voraussetzungen Varianzhomogenität • Auch die Varianzhomogenität kann statistisch überprüft werden (Levene-Test). • SPSS prüft

Voraussetzungen Varianzhomogenität • Auch die Varianzhomogenität kann statistisch überprüft werden (Levene-Test). • SPSS prüft die Varianzhomogenität automatisch bei jedem t-Test für unabhängige Stichproben. • Bei einem signifikanten Ergebnis (p <. 05), werden die Freiheitsgrade des Tests „korrigiert“. 06_ttest(1) 27

Zusammenfassung • Zu Beginn einer empirischen Untersuchung wird die Nullhypothese (H 0) und die

Zusammenfassung • Zu Beginn einer empirischen Untersuchung wird die Nullhypothese (H 0) und die Alternativhypothese (H 1) formuliert. • Ein statistischer Test bezieht sich immer auf die Nullhypothese. • Wenn ein empirisches Ergebnis unter der Nullhypothese sehr unwahrscheinlich ist (p<α), wird diese verworfen und damit die H 1 angenommen. • Mit der Wahrscheinlichkeit α wird also die H 1 fälschlicher-weise angenommen (Fehler erster Art) • Der Fehler zweiter Art (β-Fehler) besteht darin, die H 0 fälschlicherweise anzunehmen. 06_ttest(1) 28

Zusammenfassung • Der t-Test für unabhängige Stichproben dient dazu, die Ausprägung eines Merkmales zwischen

Zusammenfassung • Der t-Test für unabhängige Stichproben dient dazu, die Ausprägung eines Merkmales zwischen zwei Gruppen zu vergleichen. • Unter Annahme der H 0 kann eine theoretische Verteilung für Mittelwertsdifferenzen bestimmt werden. • Der empirische t-Wert ergibt sich als empirische Mittelwertsdifferenz dividiert durch den Standardfehler. • Anhand der Anzahl der Freiheitsgrade und des vorher festgelegten α-Niveaus wird ein kritischer t-Wert aus der Tabelle zur t-Verteilung abgelesen. • Wenn der empirische t-Wert größer als der kritischer t-Wert ist, wird die H 0 verworfen und damit die H 1 angenommen. 06_ttest(1) 29

Zusammenfassung • Voraussetzung für den t-Tests für unabhängige Stichproben sind (a) Intervallskalenniveau der Variable;

Zusammenfassung • Voraussetzung für den t-Tests für unabhängige Stichproben sind (a) Intervallskalenniveau der Variable; (b) Normalverteilung des Merkmals in der Grundgesamtheit (c) „Varianzhomogenität“ und (d) Unabhängigkeit der Stichproben 06_ttest(1) 30