EINFHRUNGSKURS STATISTIK Modul 0008 Warum eigentlich Statistik Deskriptive

Warum eigentlich Statistik? • Deskriptive Statistik • Beschreiben der Daten • Suchen nach Trends

Ablauf statistischer Untersuchungen • Wieviele Proben benötige ich? • Welche Stichprobeneinheit soll verwendet werden?

Populationen und Stichproben Definition Population Stichprobe Grundgesamtheit Symbole griechisch Teilmenge einer Grundgesamtheit latein Mittel

Stichproben • Verbundene Stichproben • z. B. wiederholte Messungen am gleichen Versuchsobjekt • Stichprobe

Merkmale / Variablen • Experimente werden normalerweise so gestaltet, um den Einfluss eines oder

Systematische Fehler/Trend (Bias) • Auftretender, meist störender systematischer Effekt mit einer Grundtendenz, der von

Deskriptive Statistik • Eine Methode um Daten zusammenzufassen und darzustellen • Heiko hat 2006

Darstellung von Daten Histogramm Säulendiagramm Scatterplot Boxplot

Parameter einer Verteilung • Lagemaße • Mittelwerte • Median • Modalwert • Quantile •

Lagemaße - Mittelwerte • Arithmetisches Mittel (am häufigsten verwendet) AM=1/n. Sxi • Geometrisches Mittel

Weitere Lagemaße • Median (der Wert, der bei einer Auflistung von Zahlenwerten in der

Streuungsmaße • Spannweite • Maximale Differenz zwischen zugrunde liegenden Daten • Mindestens Ordinaldaten notwendig

Wahrscheinlichkeitsverteilung • Einige Verteilungen, die natürlich vorkommen • Normalverteilung • Poissonverteilung • Binomialverteilung •

Normalverteilung • Häufigste Verteilung für stetige Variablen • Lagemaß: Mittelwert • Streuungsmaß: Varianz •

Poissonverteilung • Einparametrige, diskrete statistische Verteilung • “Verteilung der seltenen Ereignisse • Anzahl von

Binomialverteilung • Zweiparametrige, diskrete statistische Verteilung • Genau zwei Ausprägungsmöglichkeiten des Merkmals möglich: z.

Negative Binomialverteilung • Eine gruppierte Anzahl Darmwürmer pro Igel (aggregierte) Verteilung, die oft verwendet

Hypothesen und Testen von Hypothesen • Signifikanzniveau • Konfidenzintervall • Typ I - und

Das Prinzip der Hypothesen • Die Nullhypothese (H 0) sagt, dass es keine Unterschiede

Ablauf eines statistischen Tests • Aufstellen der Forschungsfrage Entwicklung eines Experiments zum testen der

Signifikanzniveau & Konfidenzintervall =Irrtumswahrscheinlichkeit α α/2 =

Konfidenzintervall & Co. • Konfidenzintervall: Der Bereich in dem der Parameter der Grundgesamtheit mit

Testauswahl: Welche Kriterien nutzen wir? • Skalenniveau das für die Daten passt • Sind

Kreuztabelle • tabellarische Darstellung der gemeinsamen Häufigkeitsverteilung zweier Variablen • Eignet sich vor allem

Frage 1 Trevor möchte wissen ob das Verhältnis der Anzahl von männlichen zu weiblichen

2 x 2 Tabelle Variable I II Total + a b a+b - c

Männchen (m) Weibchen (f) Total Beobachtet (o) 42 38 80 Erwartet (e) 40 80

Frage 2 Trevor möchte wissen ob das Verhältnis von männlichen zu weiblichen Zecken an

Männchen Weibchen Total 31. März 42 38 80 14. März 33 35 68 Total

Frage 3 Trevor möchte wissen ob das Verhältnis von Männchen zu Weibchen aus dem

n x m Tabelle Variable 1 2 Total A n 11 n 21 R

Männchen Weibchen Total 17. März 75 73 148 25. April 13 6 19 27.

SEHR WICHTIG! • Plane dein Experiment von Anfang an immer mit den statistischen Tests

Typ 1 und Typ 2 Fehler • Typ 1: wir lehnen H 0 ab,

t-Test und andere • tdf=� 1 - � 2/Standardfehler • Vergleich von Mittelwerten •

Freiheitsgrade • Stichprobengröße kann die Verteilung der Daten beeinflussen • Je mehr Individuen, desto

Frage • Miriam möchte wissen, ob sich die Anzahl von Retikulozyten bei männlichen und

Die Annahmen des t-Tests • Beobachtungen müssen unabhängig voneinander sein • Stichproben müssen zufälllig

Was machen, wenn die Daten nicht zum Test passen? • Parametrische Tests • Annahme

Parametrisch vs. nicht-parametrisch • Vorteile von parametrischen Tests • Die wahre Verteilung der Daten

Nicht-parametrischer Test für zwei Stichproben • Mann-Whitney U-test • Zwei unabhängige Stichproben • Wilcoxon-Vorzeichen-Rang-Test

Frage • Miriam möchte wissen, ob die Anzahl von Retikulozyten sich bei männlichen und

Varianzanalyse (ANOVA) • Einfach (Einfaktorielle) • z. B. Hämoglobinkonzentration/Igel in drei verschiedenen Gruppen •

1 380 376 360 368 372 366 374 382 2 350 356 358 376

Deskriptive Statistik 1 2 3 4 n 8 10 13 6 � 372, 3

ANOVA (Analysis of Variance) Quelle der df Abweichungen Sums of Mean F squares P

Interpretation • Wir finden Unterschiede zwischen den Gruppen aber wo? • Weitere Tests können

Wo sind die Unterschiede? • LSD und Tukey’s HSD zeigen beide: • 1=4 aber

Hintergrund • Annahmen: wie für den t- Test • Abhängige (Zielvariable) und unabhängige Variablen

Nicht-parametrische Tests für mehr als zwei Stichproben • Kruskal-Wallis Test • Für k unabhängige

Korrelation • Pearson Korrelation (r) • Verwendet tatsächlichen Werte • Rangkorrelation nach Spearman (rs)

Regression • Linear • Nicht-linear • Transformationen wie für den t-Test und die ANOVA

http: //www. methodenberatung. uzh. ch/index. html

Slides: 68

Download presentation

EINFÜHRUNGSKURS STATISTIK Modul 0008

Warum eigentlich Statistik? • Deskriptive Statistik • Beschreiben der Daten • Suchen nach Trends /Mustern • Induktive Statistik • Ziel: Verallgemeinerung der Ergebnisse • Rückschlüsse auf Grundgesamtheit/Population durch Erhebung einer repräsentativen Stichprobe

Ablauf statistischer Untersuchungen

Ablauf statistischer Untersuchungen • Wieviele Proben benötige ich? • Welche Stichprobeneinheit soll verwendet werden? • Skalierung • Welches räumliche Probennahmemuster soll verwendet werden? • z. B. bei Beprobung einer Fläche • Welches zeitlich Probennahmemuster soll verwendet werden? • Adäquate Intervalle

Populationen und Stichproben Definition Population Stichprobe Grundgesamtheit Symbole griechisch Teilmenge einer Grundgesamtheit latein Mittel m � Standardabweichung s s

Stichproben • Verbundene Stichproben • z. B. wiederholte Messungen am gleichen Versuchsobjekt • Stichprobe zu einem Zeitpunkt kann Einfluss auf Stichprobe eines anderen Zeitpunkts haben • Unverbundene Stichproben • Stichproben haben keinen Einfluss aufeinander • z. B. unterschiedliche Populationen, Vergleich unterschiedlicher Individuen

Datentypen Informationsgehalt

Merkmale / Variablen • Experimente werden normalerweise so gestaltet, um den Einfluss eines oder mehrerer Faktoren auf eine Variable zu untersuchen • Feldarbeit kann nie vollständig kontrolliert werden: Verschiedene Faktoren können Einfluss auf Variable haben • see “Nearly right or precisely wrong” by Randolph and Nuttall (1994)

Systematische Fehler/Trend (Bias) • Auftretender, meist störender systematischer Effekt mit einer Grundtendenz, der von den wahren Ergebnissen abweicht • Schätzung von Fischpopulationen mit Netzen einer bestimmten Maschenweite: kleine Fische können immer entkommen • Fangen von Säugetieren: manche Individuen sind “trap happy”, manche sind “trap shy”

Deskriptive Statistik • Eine Methode um Daten zusammenzufassen und darzustellen • Heiko hat 2006 über 68. 000 Zecken gesammelt • H. G. Andrewartha hat in 14 Jahren über 3. 000 Fransenflügler auf Rosen gezählt • Große Datenmengen müssen zusammengefasst werden • Eine numerische Darstellung wird für eine genaue Beschreibung der Daten benötigt • Excel, SPSS, R, …

Darstellung von Daten

Darstellung von Daten Histogramm Säulendiagramm Scatterplot Boxplot

Häufigkeitsverteilungen

Parameter einer Verteilung • Lagemaße • Mittelwerte • Median • Modalwert • Quantile • Streuungsmaße • Spannweite (Minimum bis Maximum) • Varianz • Standardabweichung • Konfidenzintervall (e. g. a=5%=95%KI)

Zentrale Tendenz & Streuung

Lagemaße - Mittelwerte • Arithmetisches Mittel (am häufigsten verwendet) AM=1/n. Sxi • Geometrisches Mittel (für logarithmierte Daten, z. B. Populationswachstum) • Harmonisches Mittel (Mittelwert von Verhältnissen, z. B. Fahrzeit) • AM>GM>HM

Weitere Lagemaße • Median (der Wert, der bei einer Auflistung von Zahlenwerten in der Mitte steht) 4, 1, 37, 2, 1 Median = 2 (1, 1, 2, 4, 37) • Modalwert (Dichtemittel) • 2, 2, 3, 5, 5, 5, 9, 9, 15 • Quantil, Quartil • Die geordnete Reihe der Merkmalsauspra gungen wird in gleichgroße Teile zerlegt

Streuungsmaße • Spannweite • Maximale Differenz zwischen zugrunde liegenden Daten • Mindestens Ordinaldaten notwendig • Varianz • Mittlere quadratische Abweichung der einzelnen Datenwerte vom arithmetischen Mittelwert. • Standardabweichung • Als Standardabweichung bezeichnet man die Wurzel aus der Varianz. Dieses Streuungsmaß besitzt die selbe Einheit wie die Daten und der Mittelwert

Wahrscheinlichkeitsverteilung • Einige Verteilungen, die natürlich vorkommen • Normalverteilung • Poissonverteilung • Binomialverteilung • Negative Binomialverteilung

Normalverteilung • Häufigste Verteilung für stetige Variablen • Lagemaß: Mittelwert • Streuungsmaß: Varianz • Anforderung um parametrische Tests durchzuführen Bei einer Normalverteilung sind Mittelwert und Median gleich

Poissonverteilung • Einparametrige, diskrete statistische Verteilung • “Verteilung der seltenen Ereignisse • Anzahl von Tieren, die auf einem km Straße getötet werden • Anzahl der Personen aus 10 preussischen Armeen, die über den Zeitraum von 20 Jahren durch Pferdetritte getötet werden

Binomialverteilung • Zweiparametrige, diskrete statistische Verteilung • Genau zwei Ausprägungsmöglichkeiten des Merkmals möglich: z. B. weiblich & männlich, verheiratet und ledig

Negative Binomialverteilung • Eine gruppierte Anzahl Darmwürmer pro Igel (aggregierte) Verteilung, die oft verwendet wird um eine Überdispersion z. B. in Parasitenpopulationen anzugeben. • Die Varianz ist normalerweise größer als der Mittelwert • Bsp. : Anzahl von Zecken/ Igel auf 20 Igeln)

Hypothesen und Testen von Hypothesen • Signifikanzniveau • Konfidenzintervall • Typ I - und Typ II - Fehler • Ein- und zweiseitige Tests

Das Prinzip der Hypothesen • Die Nullhypothese (H 0) sagt, dass es keine Unterschiede gibt • Wird H 0 abgelehnt, wird die Alternativhypothese H 1 akzeptiert Statistische Tests untersuchen die Wahrscheinlichkeit ob einer der Hypothesen “richtig” oder “falsch” ist

Ablauf eines statistischen Tests • Aufstellen der Forschungsfrage Entwicklung eines Experiments zum testen der Hypothese • Formulieren von H 0 und H 1: klares Verständnis für Erwartungen • Entscheidung für einen geeigneten statistischen Test und Signifikanzniveau (normalerweise p < 0. 05) • Sammeln der Daten um Hypothese zu testen • Kontrolle der Probenverteilung: wenn nötig alternativer Test oder Datentransformierung • Testanalyse: Berechnung des p-Wertes • Statistische Entscheidung p < 0, 05 => Verwerfen der H 0 und Annehmen der H 1 p ≥ 0, 05 Beibehalten der Nullhypothese (H 0) • Interpretation der Ergebnisse

Signifikanzniveau & Konfidenzintervall =Irrtumswahrscheinlichkeit α α/2 =

Konfidenzintervall & Co. • Konfidenzintervall: Der Bereich in dem der Parameter der Grundgesamtheit mit einer gewissen Wahrscheinlichkeit liegt • Konfidenzintervalle lassen sich nur bestimmen wenn die Verteilung der Grundgesamtheit bekannt ist • Ein Mittelwert ist wenig wert, wenn man nichts über die Verteilung der Daten weiß > Standardabweichung (s) Maß für die Streuung der Werte einer Zufallsvariablen um ihren Erwartungswert > Standardfehler (Streuungsmaß - (s/sqrt(n))) Durchschnittliche Abweichung des geschätzten Parameterwertes vom wahren Parameterwert

Testauswahl: Welche Kriterien nutzen wir? • Skalenniveau das für die Daten passt • Sind die Daten verbunden oder unverbunden? • Sind die Daten normalverteilt? • Anzahl der untersuchten Variablen • Anzahl der Vergleichsgruppen der Variablen • Können eine oder mehrere Faktoren die Werte der Variable beeinflussen? • (univariate oder multivariate Analyse)

Kreuztabelle • tabellarische Darstellung der gemeinsamen Häufigkeitsverteilung zweier Variablen • Eignet sich vor allem für kategorielle Daten • 2 x 2 Tabelle • m x n Tabelle • z. B. Vergleich von Prävalenzen Produkt A Produkt B Summe weiblich männlich Summe 660 440 1100 340 560 900 1000 2000

Frage 1 Trevor möchte wissen ob das Verhältnis der Anzahl von männlichen zu weiblichen Zecken, die er im Garten gesammelt hat, gleich ist.

2 x 2 Tabelle Variable I II Total + a b a+b - c d c+d Total a+c b+d

Männchen (m) Weibchen (f) Total Beobachtet (o) 42 38 80 Erwartet (e) 40 80 40 c 2 1= (om-em)2/em + (of-ef)2/ef Freiheitsgrade (df) = Anzahl untersuchten Gruppen -1 c 2 mit 1 df ist signifikant wenn α=5% wenn größer als >3. 84 c 2 1= 0. 2 nicht signifikant

Frage 2 Trevor möchte wissen ob das Verhältnis von männlichen zu weiblichen Zecken an zwei unterschiedlichen Fangtagen im März das Gleiche ist.

Männchen Weibchen Total 31. März 42 38 80 14. März 33 35 68 Total 75 73 148 c 21=n(lad-bcl-n/2)2/(a+b)(c+d)(a+c)(b+d) n/2 =Yates Korrektur für kleine Stichproben Eine alternative Methode bei kleinen Stichproben ist der Fisher’s exact test http: //www. quantpsy. org/chisq. htm http: //daten-consult. de/forms/cht 2 x 2. html

http: //www. quantpsy. org/chisq. htm

Frage 3 Trevor möchte wissen ob das Verhältnis von Männchen zu Weibchen aus dem Garten im März das gleiche ist wie an zwei Sammeltagen im April.

n x m Tabelle Variable 1 2 Total A n 11 n 21 R 1 B n 12 n 22 R 2 C n 13 n 23 R 3 Total C 1 C 2 N

Männchen Weibchen Total 17. März 75 73 148 25. April 13 6 19 27. April 13 5 18 Total 101 84 185 c 22=4, 64; p=0, 098 df=(c-1)(r-1) Achtung: es gibt keinen signifikanten Unterschiede zwischen den Apriltagen. Vereinigt man die Daten der beiden Apriltage und vergleicht sie mit März c 21=4, 54; p=0, 032

SEHR WICHTIG! • Plane dein Experiment von Anfang an immer mit den statistischen Tests im Hinterkopf • Viele Daten werden gesammelt ohne die spätere statistische Auswertung zu berücksichtigen oft nutzlos!

Typ 1 und Typ 2 Fehler • Typ 1: wir lehnen H 0 ab, obwohl sie wahr ist. Wenn a=0, 05 dann lehnen wir H 0 in 5% der Fälle ab, obwohl sie wahr ist. a, die Wahrscheinlichkeit, mit der wir H 0 ablehnen, wird so definiert. • Typ 2: wir akzeptieren H 0 obwohl sie falsch ist. Die Wahrscheinlichkeit einen Typ 2 Fehler zu machen ist b. 1 -b ist die Wahrscheinlichkeit H 0 abzulehnen obwohl sie in Wirklichkeit richtig ist.

Ein- oder zweiseitige Tests

t-Test und andere • tdf=� 1 - � 2/Standardfehler • Vergleich von Mittelwerten • Zwei unabhängige Stichproben • Gleiche Varianz (Mann-Whitney U-test) • Ungleiche Varianz • Abhängige Stichproben (Wilcoxon signed-ranks test) • Transformationen • * nicht-parametrische Tests

Freiheitsgrade • Stichprobengröße kann die Verteilung der Daten beeinflussen • Je mehr Individuen, desto eher sind die geschätzten Parameter nah an der Realität (Grundgesamtheit). • Dieser Einfluss wird in der Statistik mit aufgenommen (df) • Für eine Population ist df=n, für eine Stichprobe n-1

Frage • Miriam möchte wissen, ob sich die Anzahl von Retikulozyten bei männlichen und weiblichen Igeln unterscheidet • Eventuell saisonal abhängig Mai 2007 für den Test • Zwei Mittelwerte (Männchen, Weibchen) • Stichproben sind unabhängig voneinander

Die Annahmen des t-Tests • Beobachtungen müssen unabhängig voneinander sein • Stichproben müssen zufälllig aus einer normal verteilten Population genommen werden (ggf. Transformation) • Populationen haben (normalerweise) die gleiche Varianz (nicht zwingend notwendig) • Variablen müssen mindestens intervallskaliert sein

Was machen, wenn die Daten nicht zum Test passen? • Parametrische Tests • Annahme der Normalverteilung • Die tatsächlichen Werte werden verwendet • Nicht-parametrische Tests • Keine bestimmte Verteilung wird angenommen • Daten werden für den Test klassifiziert (verlieren damit an Information)

Parametrisch vs. nicht-parametrisch • Vorteile von parametrischen Tests • Die wahre Verteilung der Daten wird in den Test mit einbezogen vorhandene Informationen werden genutzt • Vorhandene Tests können komplexe Interaktionen zwischen Variablen einschätzen • Vorteile von nicht-parametrischen Tests • Können verwendet werden wenn die Stichprobengröße gering ist • Können für Daten verwendet werden, die nicht normalverteilt sind (auch nicht transformiert werden können) • Können auch für nominale oder ordinale Daten verwendet werden

Nicht-parametrischer Test für zwei Stichproben • Mann-Whitney U-test • Zwei unabhängige Stichproben • Wilcoxon-Vorzeichen-Rang-Test • Zwei abhängige Stichproben Beide verwenden klassifizierte Daten

Frage • Miriam möchte wissen, ob die Anzahl von Retikulozyten sich bei männlichen und weiblichen Igeln unterscheiden • Eventuell saisonal abhängig Mai 2007 für den Test • Zwei Mittelwerte (Männchen, Weibchen) Stichproben sind unabhängig voneinander

Varianzanalyse (ANOVA) • Einfach (Einfaktorielle) • z. B. Hämoglobinkonzentration/Igel in drei verschiedenen Gruppen • Mehrfaktoriell: mehr als eine unabhängige Variable • Zwei oder mehr Faktoren können das Ergebnis eines Experiments beeinflussen: die Interaktionen zwischen den unabhängigen Faktoren können bestimmt werden • z. B. Stichproben von 100 Bulinus Schnecken, die sich unter verschiedenen Temperatur- und p. H- Bedingungen entwickelt haben

1 380 376 360 368 372 366 374 382 2 350 356 358 376 338 342 366 350 344 364 3 354 360 362 352 366 372 362 344 342 358 351 348 4 376 344 342 374 360 Breite des Scutums von Haemaphysalis laporis palustris Larven von 4 Kaninchen(mm)

Deskriptive Statistik 1 2 3 4 n 8 10 13 6 � 372, 3 354, 4 355, 3 361, 3 11, 91 8, 91 15, 26 Standard 7, 36 abweichung

ANOVA (Analysis of Variance) Quelle der df Abweichungen Sums of Mean F squares P Zwischen Gruppen 3 1. 807, 7 602, 6 0, 004 Innerhalb der Gruppen Total 33 3. 778, 0 114, 5 36 5. 585, 7 5, 26

Interpretation • Wir finden Unterschiede zwischen den Gruppen aber wo? • Weitere Tests können dies überprüfen (Post-hoc Tests): • Least significant difference (LSD) • Tukey’s HSD

Wo sind die Unterschiede? • LSD und Tukey’s HSD zeigen beide: • 1=4 aber 1> 2 und 3 • 2=3, 4 aber 2>1 • 3= 2, 4 aber 3>1 • 4=1, 2, 3

Hintergrund • Annahmen: wie für den t- Test • Abhängige (Zielvariable) und unabhängige Variablen (Einflussvariable/Faktor) • Der Faktor beeinflusst die Zielvariable • z. B. wie beeinflusst eine bestimmte Dosis eines Medikaments den Blutdruck? Der Blutdruck hängt von der Dosis ab, aber nicht umgekehrt

Nicht-parametrische Tests für mehr als zwei Stichproben • Kruskal-Wallis Test • Für k unabhängige Stichproben • Friedman-Test • Für k abhängige Daten • Beide nutzen klassifizierte Daten

Korrelation • Pearson Korrelation (r) • Verwendet tatsächlichen Werte • Rangkorrelation nach Spearman (rs) • Verwendet klassifizierte Daten • Bestimmtheitsmaß (r 2) • Zwischen 0 und 1 • Zusammenhang zwischen der abhängigen und den unabhängigen Variablen

Retikulozyten Konz.