Nonparametrische Testverfahren Gliederung Definition Der Test KolmogorovSmirnovTest berblick

Non-parametrische Testverfahren Gliederung • Definition • Der χ² Test • Kolmogorov-Smirnov-Test • Überblick weitere Verfahren: – – – – Der Fisher-Yates-Test Der Mc. Nemar-Test Cochran-Test (Q-Test) Der Mediantest Der U-Test (Mann-Whitney Test) Vorzeichentest und Vorzeichenrangtest Der Friedman-Test Binominal-Test 11_nonpara 1

Non-parametrische Testverfahren Definition: • Nonparametrische (verteilungsfreie) Testverfahren setzen nicht eine bestimmte Verteilungsformen des erfassten Merkmals (z. B. Normalverteilung) voraus. • Nonparametrische Verfahren werden eingesetzt… ð für die Analyse von Ordinal- oder Nominalskalierten Variablen ð Wenn die Normalverteilungsannahme verletzt ist. • Parametrische Verfahren dürfen nur verwendet werden, wenn die beteiligten Variablen die gefordert Verteilungsform ausweisen (z. B. Normalverteilung für den t-Test). Sie haben in der Regel eine höher statistische Power. 11_nonpara 2

Der χ² -Test • Der χ²-Test („Chi-Quadrat-Test“) dient dem Vergleich von beobachteten und erwarteten Häufigkeiten. Er kann eingesetzt werden, wenn 1 oder 2 nominalskalierte unabhängige Variablen vorliegen. Beispiele: • Leiden Männer und Frauen gleich häufig an einer bestimmten Erkrankung? • Leisten hoch-ängstlich und gering-ängstliche Personen gleich häufig Hilfe in einer Notsituation? 11_nonpara 3

Der χ² -Test Voraussetzung für den χ² -Test (Faustregeln) (1) Weniger als 1/5 aller Zellen hat ein erwartete Häufigkeit kleiner als 5. (2) Keine Zelle weist eine erwartete Häufigkeit kleiner als 1 auf. Wenn diese Voraussetzungen nicht erfüllt sind, sollte alternativ der Fisher-Yates-Test verwendet werden. 11_nonpara 4

Der χ² -Test – Beispiel 1 • Es soll geprüft werden, ob die Verteilung von Männern und Frauen in einer Gruppe signifikant von einer Gleichverteilung abweicht. • N = 76 (Frauen: 56; Männer: 20) • Statistische Hypothesen – H 0: π(Frau) = π(Mann) – H 1: π(Frau) ≠ π(Mann) 11_nonpara 5

Der χ² -Test Schritt 1: • Zunächst werden die nach der H 0 zu erwarteten Häufigkeiten berechnet: • Beobachtet: NF = 56; NM=20 • Erwartet: ? ? ? – Gesamtzahl: 76 – Bei einer Gleichverteilung wären also 38 Männer und 38 Frauen zu erwarten. 11_nonpara 6

Der χ² -Test Schritt 2: • Nun wird der (empirische) χ²-Wert berechnet: mit: • k: • fb, i: • fe, i: 11_nonpara Anzahl der Stufen der beiden Variablen Beobachtete Häufigkeit in der Zelle (i) Erwartete Häufigkeit in der Zelle (i) 7

Der χ² -Test Geschlecht Frau Mann Beobachtet 56 20 76 Erwartet 38 38 76 58 20 78 11_nonpara 8

Der χ² -Test • Schritt 3: Vergleich des empirischen χ²-Werts mit dem kritischen χ²-Wert. • Der kritische χ²-Wert wird in Abhängigkeit von den Freiheitsgraden und dem gewählten α-Niveau aus einer Tabelle zur χ²Verteilung abgelesen (Leonhart, S. 448 f). • Für α=. 05 ergibt sich bei df=1: • Die H 0 muss verworfen werden; folglich kann ein Unterschied nachgewiesen werden. 11_nonpara 9

Der χ² -Test – Beispiel 2 Geschlecht Angst Frau Mann gering 25 14 39 hoch 33 6 39 58 20 78 • Frage: Ist die (relative) Häufigkeit hoher bzw. geringer Ängstlichkeit bei Männern und Frauen gleich? • Statistische Hypothesen – H 0: π(Angst | Frau) = π(Angst | Mann) – H 1: π(Angst | Frau) ≠ π(Angst | Mann) 11_nonpara 10

Der χ² -Test Schritt 1: Zunächst werden aus den Randsummen die nach der H 0 zu erwarteten Häufigkeiten geschätzt: Beobachtet: Geschlecht Angst Frau Mann gering 25 14 39 hoch 33 6 39 58 20 78 Erwartet: 11_nonpara Geschlecht Angst Frau Mann gering 29 10 39 hoch 29 10 39 58 20 78 11

Der χ² -Test Schritt 2: Nun wird der (empirische) χ²-Wert berechnet: mit: • k, l: Anzahl der Stufen der beiden Variablen • fb(i, j): Beobachtete Häufigkeit in der Zelle (i, j) • fe(i, j): Erwartete Häufigkeit in der Zelle (i, j) 11_nonpara 12

Der χ² -Test Beobachtet: Erwartet: Geschlecht Angst Frau Mann gering 25 14 hoch 33 58 11_nonpara Geschlecht Angst Frau Mann 39 gering 29 10 39 6 39 hoch 29 10 39 20 78 58 20 78 13

Der χ² -Test • Schritt 3: Vergleich des empirischen χ²-Werts mit dem kritischen χ²-Wert. • Der kritische χ²-Wert wird in Abhängigkeit von den Freiheitsgraden und dem gewählten α-Niveau aus einer Tabelle zur χ²Verteilung abgelesen (Leonhart, S. 448 f). • Für α=. 05 ergibt sich bei df=1: • Die H 0 muss verworfen werden; folglich kann ein Unterschied nachgewiesen werden. 11_nonpara 14

Der χ² -Test in SPSS 11_nonpara 15

Der χ² -Test in SPSS NPAR TEST /CHISQUARE=sex /EXPECTED=EQUAL 11_nonpara 16

Der χ² -Test in SPSS • SPSS-Ausgabe: sex 1 2 Gesamt Beobachtetes N Erwartete Anzahl Residuum 56 38, 0 18, 0 20 38, 0 -18, 0 76 Statistik für Test sex Chi-Quadrat 17, 053 a df 1 Asymptotische Signifikanz , 000 a. Bei 0 Zellen (. 0%) werden weniger als 5 Häufigkeiten erwartet. Die kleinste erwartete Zellenhäufigkeit ist 38. 0. 11_nonpara 17

Der Kolmogorov-Smirnov-Test • Der Kolmogorov-Smirnov-Test vergleicht eine empirische Verteilung mit einer vorgegebenen theoretischen Verteilung (z. B. Normalverteilung). • Damit ist es möglich, die Voraussetzung parametrischer Testverfahren (z. B. für den t-Test) zu überprüfen. • Statistische Hypothesen: - H 0: Die Variable ist normalverteilt - H 1: Die Variable ist nicht normalverteilt 11_nonpara 18

Der Kolmogorov-Smirnov-Test in SPSS 11_nonpara 19

Der Kolmogorov-Smirnov-Test in SPSS NPAR TESTS /K-S(NORMAL)=freiburg psycho stat. 11_nonpara 20

Der Kolmogorov-Smirnov-Test in SPSS Kolmogorov-Smirnov-Anpassungstest freiburg psycho N 98 98 Parameter der Mittelwert 20, 8163 19, 7908 a Normalverteilung Standardabweichung 1, 89055 3, 04428 Extremste Differenzen Absolut , 182 , 124 Positiv , 104 , 063 Negativ -, 182 -, 124 Kolmogorov-Smirnov-Z 1, 797 1, 225 Asymptotische Signifikanz (2 -seitig) , 003 , 099 a. Die zu testende Verteilung ist eine Normalverteilung. stat 98 16, 5204 3, 15650 , 111 , 057 -, 111 1, 098 , 179 Wenn p<. 05 ist die Normalverteilungsannahme verletzt. 11_nonpara 21

Überblick weitere Verfahren: 11_nonpara 22

Der Fisher-Yates-Test • Der Fisher-Yates Test wird eingesetzt, um Kontingenztabellen auszuwerten, wenn die Voraussetzungen des χ²-Test verletzt sind (d. h. bei geringen erwarteten Häufigkeiten). • Beispiel: Raucher Nichtraucher Frauen 20 40 Männer 3 5 • Berechnung: Siehe Leonhart (2004), Seite 162 f 11_nonpara 23

Mc. Nemar-Test Der Mc. Nemar-Test • Der Mc. Nemar-Test wird für nominalskalierten Daten in zwei abhängigen Stichproben (z. B. Messwiederholung) verwendet. • Die erwarteten Häufigkeiten sollten nicht kleiner als 5 sein. • Beispiel: Veränderung des Rauchverhaltens von der Jugend bis ins Erwachsenenalter. Erwachsene Jugend Nichtraucher Raucher Σ Nichtraucher 33 3 36 Raucher 18 21 39 Σ 51 24 75 • Berechnung: Siehe Leonhart (2004), Seite 163 f 11_nonpara 24

Cochran-Test (Q-Test) Der Cochran-Test (Q-Test) • Der Cochran-Test dient der Auswertung von nominalskalierten Daten in mehr als zwei abhängigen Stichproben. • Beispiel: (NR=Nichtraucher; R=Raucher) Alter (Jahre) Vp 12 16 20 24 28 1 NR R NR 2 NR R R 3 R R R 4 NR NR NR 5 NR NR R • Berechnung: Siehe Leonhart (2004), Seite 165 f 11_nonpara 25

Mediantest Der Mediantest • Der Mediantest dient dem Vergleich der zentralen Tendenz ordinalskalierter Variablen, wenn zwei unabhängige Stichproben vorliegen. • Beispiel: Die Reaktionszeit bei einer Aufgabe soll zwischen Männern und Frauen verglichen werden (Da die Zeiten nicht normalverteilt sind, soll kein t-Test gerechnet werden) • Berechnung: Siehe Leonhart (2004), Seite 162 f 11_nonpara 26

U-Test (Mann-Whitney-Test) Der U-Test (Mann-Whitney-Test) • Der U-Test vergleicht die zentrale Tendenz eines ordinalskalierten Merkmals zwischen zwei unabhängigen Zufallsstichproben. • Anmerkung: Der U-Test hat einer höhere Power als der Mediantest, jedoch ist er empfindlicher gegenüber Ausreißerwerten. • Beispiel: Der Therapieerfolg (Rating 1 bis 5) soll zwischen einer Therapiegruppe und einer „Wartekontrollgruppe“ verglichen werden. • Berechnung: Siehe Leonhart (2004), Seite 169 f 11_nonpara 27

U-Test (Mann-Whitney-Test) 11_nonpara 28

U-Test (Mann-Whitney-Test) NPAR TESTS /M-W= freiburg BY sex(1 2). 11_nonpara 29

U-Test (Mann-Whitney-Test) Ränge freiburg Geschlecht männlich weiblich Gesamt N Mittlerer Rangsumme 21 41, 57 873, 00 75 50, 44 3783, 00 96 Statistik für Testa Mann-Whitney-U Wilcoxon-W Z Asymptotische Signifikanz (2 -seitig) a. Gruppenvariable: Geschlecht freiburg 642, 000 873, 000 -1, 312 , 189 Weil p>. 05 besteht also kein bedeutsamer Rangunterschied. 11_nonpara 30

H-Test (Kruskal & Wallis -Test) Der H-Test (Kruskal & Wallis -Test) • Der U-Test vergleicht die zentrale Tendenz eines ordinalskalierten Merkmals zwischen zwei unabhängigen Zufallsstichproben. • Beispiel: Der Therapieerfolg soll zwischen drei Therapieverfahren sowie einer „Wartekontrollgruppe“ verglichen werden. Wartekontroll. Therapieerfolg Therapie A Therapie B Therapie C gruppe 4 3 4 2 2 4 2 3 4 4 3 3 2 2 1 3 • 11_nonpara Berechnung: Siehe Leonhart (2004), Seite 175 ff 31

Vorzeichentest und Vorzeichenrangtest • Der Vorzeichentest und der Vorzeichenrangtest nach Wilcoxon vergleichen, wie sich die Merkmalsausprägung eines ordinalskalierten Merkmals zwischen zwei abhängigen Stichproben unterscheiden. • Anmerkung: Der Vorzeichenrangtest nach Wilcoxon hat die höhere Power und ist daher generell zu bevorzugen. • Beispiel: Es wird überprüft, ob sich die Arbeitsfähigkeit im Laufe einer Reha-Maßnahme verbessert hat. Dabei wird die Arbeitsfähigkeit als 5 -stufiges Rating vor und nach der Maßnahme erfasst. • Berechnung: Siehe Leonhart (2004), Seite 172 ff 11_nonpara 32

Friedman-Test Der Friedman-Test • Der Friedman-Test vergleicht die Merkmalsausprägung eines ordinalskalierten Merkmals zwischen mehr als zwei abhängigen Stichproben. • Beispiel: Es wird überprüft, ob sich die Arbeitsfähigkeit im Laufe einer Reha-Maßnahme verbessert hat. Dabei wird die Arbeitsfähigkeit als 5 -Stufiges Rating zu 3 Messzeitpunkten erfasst (prä-, post-, follow-up - Erhebung). • Berechnung: Siehe Leonhart (2004), Seite 177 f 11_nonpara 33

Zusammenfassung • Nonparametrische Testverfahren können eingesetzt werden, wenn a) die vorliegenden Daten kein Intervallskalenniveau aufweisen oder b) die Normalverteilungsannahme der parametrischen Tests verletzt ist. • Der χ²-Test überprüft ob beobachtete und erwartete Häufigkeiten signifikant voneinander abweichen. • Der Kolmogorov-Smirnov-Test prüft, ob eine empirische Verteilung mit einer theoretisch vorgegebenen Verteilungsform (Normalverteilung) übereinstimmt. • Der U-Test vergleicht die mittleren Rangplätze zwischen 2 Gruppen. • Weitere Testverfahren können je nach Skalenniveau, Abhängigkeit der Stichprobe und Anzahl der Gruppen ausgewählt werden 11_nonpara 34