Hypothesentest Aufg 7 3 HumboldtUniversitt zu Berlin MathematischNaturwissenschaftliche
Hypothesentest (Aufg. 7. 3) Humboldt-Universität zu Berlin Mathematisch-Naturwissenschaftliche Fakultät II Seminar: Didaktik der Stochastik Dozentin: Frau Dr. Warmuth Referenten: Nils Dörholt Patrik Strauch Andreas Walz
Übungsserie 7 , Aufgabe 3 1. Informieren Sie sich zum Thema Stichprobenentnahme bei Wahlhochrechnungen. 2. Lösen Sie die Aufgaben 3 bis 6 aus dem Lehrbuchauszug. Führen Sie dazu geeignete Zufallsgrößen ein. Erläutern Sie, welche Modellannahmen Ihrer Lösung zugrunde liegen. 3. Legen Sie in der Kurzfassung eines Stundenentwurfs dar, wie Sie das Testen von Hypothesen im Zusammenhang mit Wahlen in einer 12. Klasse behandeln würden. Der Kursentwurf soll (mindestens) drei kognitive Ziele beinhalten, die Sie mit der Unterrichtsstunde anstreben.
Aufgabe 7. 3. 1 • Informieren Sie [. . . ] zum Thema Stichprobenentnahmen bei Wahlhochrechnungen.
18 -Uhr-Prognose • Grundlage: Wahltagsbefragung (Befragung von Wählern beim Verlassen des Wahllokals) • Wichtig: Statistisch sinnvolle Anzahl repräsentativ ausgewählter Stimmbezirke (bei Landtagswahlen ca. 250, bei Bundestagswahlen etwa 400)
Repräsentativität • Stichprobe: unter statistischen Gesichtspunkten ein verkleinertes Abbild des jeweiligen Gebietes • Beachtung der wichtigen Merkmale: Region, Ortsgrösse, Altersverteilung, Haushaltsgrößen, Berufsgruppen, Bildungsstruktur in etwa gleichen Anteilen wie in der Gesamtbevölkerung.
Weitere Angaben: • Erfassung statistischer Angaben: Alter, Geschlecht, Berufstätigkeit und Ausbildung, Motive für die Wahlentscheidung 1) Einschätzung der Stichprobenqualität 2) Grundlage für weitere Analysen
„Hochrechnung “ • • • Þ • Mitarbeiter bei öffentlichen Stimmenauszählungen Ergebnis telefonisch ans Institut Wenn Mindestanzahl an Stimmbezirksergebnissen vorliegt 1. Hochrechnung ca. 18. 30 Uhr Varianz („Hochrechnung) < 0, 01
Problem • Grenzen der Exaktheit Beispiel: knappe Entscheidungen um wenige 100 Stimmen
Quelle • Siehe Aufgabenblatt (Aufg. 7. 3. 1) (http: //www. awv-net. de/cms/upload/awv-info/pdf/info 024 Thema-Exakte. Wahlprognosen-3 S. pdf)
Aufgabe 7. 3. 2 • Lösen Sie die Aufgaben 3 bis 6 aus dem Lehrbuch. Führen sie dazu geeignete Zufallsgrößen ein. Erläutern Sie, welche Modellannahmen Ihrer Lösung zugrunde liegen.
Aufgabe • • Eine Partei erreichte bei der letzten Wahl nur 3% der Stimmen. Man vermutet, dass es möglich ist, den Stimmenanteil zu verdoppeln. Bei einer Umfrage gaben von 1000 Wählern 41 an, diese Partei wählen zu wollen. (Lehrbuch „Mathematik – Stochastik“ vom Cornelsen Verlag, 2006, S. 207)
Zufallsgröße: Sn- Anzahl der Personen die für Partei stimmen mit Sn= X 1+…+Xn 1, Stimme für die Partei wobei Xi = 0, keine Stimme für der Partei mit i= 1, 2, 3, …. . , n und Xi- Merkmalsausprägung der i-ten Person
Modellannahmen: • • • Diskreter Wahrscheinlichkeitsraum W- Raum ( Ω, F, P) Binomialverteilung B (n, p) n unabhängige Teilexperimente mit konstanter Trefferwahrscheinlichkeit p n - Stichprobenumfang, Anzahl der unabhängigen Teilexperimente p - Trefferwahrscheinlichkeit k - Anzahl der Treffer
Aufgabe 3: • Wie groß ist die Wahrscheinlichkeit, dass 41 oder mehr Personen diese Partei wählen wollen, wenn sich der Stimmenanteil nicht verändert hat?
Modell: Binomialverteilung • • • n= 1000 p=0, 03 k –Trefferanzahl ( 41 oder mehr) • P( Sn=k)= gesucht: • P(Sn≥ 41)=
Problem • P(Sn≥ 41)= 1 - P(Sn<41)= 1 - P(Sn≤ 40) Berechnung mit Taschenrechner nicht möglich aufgrund des sehr großen „n“.
Lösungsmöglichkeiten: 1. 2. Excel Approximation der Binomialverteilung zur Normalverteilung mithilfe des ZGWS des Moivre Laplace
1. Lösung: Excel • Wert in der Tabelle: P(Sn≥ 41) = 1 - P(Sn<41)= 1 - P(Sn≤ 40) = 1 - 0, 96977918 ≈ 0, 03 • Somit P(Sn≥ 41) ≈ 0, 03
2. Lösung: Normalverteilung/ stetige Verteilung • Zentraler Grenzwertsatz von de Moivre- Laplace: Die Zufallsvariable Sn besitze eine Binomialverteilung mit Parametern n und p, wobei 0<p<1 vorausgesetzt ist. Dann gilt für jede Wahl reeller Zahlen a, b mit a<b: a. ) P b. ) P
Faustregel zur Approximation der Binomialverteilung zur Normalverteilung • np(1 -p) ≥ 9 • Test: n=1000; p= 0, 03 • 1000*0, 03*0, 97=29, 1 ≥ 9 Folglich Approximation benutzbar
Anwendung • P(Sn≥ 41) = 1 - P(Sn<41)= 1 - P(Sn≤ 40) • P(Sn ≤k)= ≈ • P(Sn≤ 40) = = 0, 967843 • Somit ist P( Sn ≥ 41)= 1 - 0, 967843= 0, 032. • Es handelt sich somit um eine gute Näherung für die Binomialverteilung. (geringe Abweichung der Werte)
Aufgabe • Welche kritischen Zahlen ergeben sich für : = 0, 1 und = 0, 05 bei H 0: p=0, 03 und H 1: p= 0, 06 ? Geben Sie jeweils die Fehlerwahrscheinlichkeiten für einen Fehler 1. Art und 2. Art an. Hypothesentest
Hypothesentest • Teste Ho gegen Alternative H 1 1. Festlegung des Signifikanzniveaus 2. Berechnung des Verwerfungsbereichs/ kritische Zahlen 3. Entscheidungsregel aufstellen 4. Fehler 1. Art und 2. Art berechnen • Handelt sich um rechtsseitigen Hypothesentest
Rechtsseitiger Hypothesentest • Ho: p=0, 03 H 1: p=0, 06 1. = 0, 1 und = 0, 05 2. P(Sn ≥ k) ≤ P(Sn≥k)= 1 - P(Sn≤k-1) ≤ P( Sn≤k-1) ≥ 1 -
Lösung • = 0, 1 = 0, 05 P( Sn≤k-1) ≥ 0, 9 P( Sn≤k-1) ≥ 0, 95 P( Sn≤ 37) ≥ 0, 9 P( Sn≤ 39) ≥ 0, 95 V 0= (38, 39, …, 1000) V 1= (40, 41, …, 1000)
Lösung Stichprobe V Entscheidung für Ho Entscheidung für H 1 Ho richtig Entscheidung richtig Entscheidung falsch Fehler 1. Art H 1 richtig Entscheidung falsch Fehler 2. Art Entscheidung richtig
Aufgabentext • 41 von 1000 gaben an die Partei wählen zu wollen. 41 V₀: k=( 38, …, 1000) 41 V₁: k=(40, …, 1000) Nullhypothese Ho wird abgelehnt und H 1 wird angenommen. Fehler 1. Art berechnen ( Ho abgelehnt, obwohl richtig)
Fehler 1. Art • = 0, 1 =0, 05 • Excel: P(Sn>37)= 0, 0857 P(Sn>39)=0, 043 N-Verteilung P(Sn>37)= 0, 09 P(Sn>39)=0, 0474 • Fehler 1. Art ist ca. 8, 5%. Fehler 1. Art ist ca. 4, 3%.
Fehler 2. Art • Ho angenommen und H 1 abgelehnt, obwohl H 1 richtig ist. • Stichprobe 41 eigentlich nicht nötig, da man sich für die Alternative H 1 entscheidet und Ho ablehnt. • Annahme: 41 nicht repräsentativ und nehmen ein Stichprobenergebnis von unter 38 an. In diesem Fall lehnen wir die Alternative ab und stützen uns weiter auf die Nullhypothese H 0. Somit ist ein Fehler 2. Art möglich, falls H 1 richtig ist.
Neuer Fall • Stichprobe ergab 37 Wähler 37 V₀ und V₁ lehnen Alternative ab • Fehler 2. Art lässt sich nur bei Kenntnis des richtigen p berechnen Ho: p=0, 03 ( Nullhypothese) H 1: p=0, 06 (Alternative) Annahme: H 1 mit p=0, 06 ist richtig Mit welcher Wahrscheinlichkeit mache ich Fehler 2. Art, wenn p=0, 06 der richtige Wert ist? • • •
Lösung • Berechnung des Fehlers 2. Art: n=1000; p (neu)=0, 06 = 0, 1 =0, 05 • Normalverteilung P(Sn<38)= 0, 001 P(Sn<40)= 0, 001 • Fehler 2. Art bei 0, 1%
Lösung • Fehler 2. Art bei Annahme p=0, 04 richtiger Wert =0, 1 =0, 05 • Normalverteilung P(X<38)= 0, 315 P(X<40)= 0, 4403 Fehler 2. Art liegt bei 31, 5% Fehler 2. Art liegt bei 44%
Gütefunktion • • Gütefunktion des Tests gibt die Wahrscheinlichkeit für das Ablehnen der Nullhypothese in Abhängigkeit von p an. G(p)=Pp(V) 0≤p≤ 1 Die Operationscharakteristik des Tests gibt den Fehler 2. Art in Abhängigkeit von p an O(p)=Pp(A)=1 -G(p) 0≤p≤ 1 mit A: = Annahmebereich
Aufgabe • Für den Einzug ins Parlament sind 5% der Stimmen nötig. Wie ist die Nullhypothese Ho=: p= 0, 05 zu bewerten? • • • zweiseitiger Hypothesentest für =0, 1 Ho testen gegen Alternative H 1: p = 0, 05 Berechnung mit Normalverteilung P(Sn ≤k) ≥ 0, 95 bei k= 61 P(Sn ≤k) ≤ 0, 05 bei k= 39 Verwerfungsbereich V=(0, 1, …, 39)U( 62, …, 1000) Bei Stichprobe von 41 behalten wir die Nullhypothese bei und lehnen Alternative ab
Fehler 2. Art Für Nullhypothese entschieden, obwohl Alternative richtig ist. • Annahme: p= 0, 06 p= 0, 04 p= 0, 03 • P(39 ≤Sn≤ 61)= 0, 89/ 0, 56/ 0, 037 • Fehler 2. Art beträgt 89%/ 56%/ 3, 7% •
Fehler 2. Art • Fehler 2. Art wird umso kleiner , je weiter der tatsächlich zugrunde liegende Modellparameter von dem Modellparameter unter Ho entfernt liegt sehr unwahrscheinlich, dass wir uns für Ho entscheiden, obwohl p=0, 03 gilt große Wahrscheinlichkeit, dass wir uns für Ho entscheiden, obwohl p=0, 06 richtig ist 56% Wahrscheinlichkeit, dass wir uns für Ho entscheiden, obwohl p= 0, 04 richtig ist Bezug zur 5% Klausel
Aufgabe 7. 3. 3 • Legen Sie in der Kurzfassung eines Stundenentwurfs dar, wie Sie das Testen von Hypothesen im Zusammenhang mit Wahlen in einer 12. Klasse behandeln würden. Der Kurzentwurf soll (mindestens) drei kognitive Ziele beinhalten, die Sie mit der Unterrichtsstunde anstreben.
Lehrplan Berlin Sek. II Leistungskurs -Zufallsexperimente -Wahrscheinlichkeitsbegriff -Rechnen mit Wahrscheinlichkeiten -bedingte Wahrscheinlichkeit und Unabhängigkeit -Satz von BAYES -Zufallsgrößen und deren Wahrscheinlichkeitsverteilung -E(X), Var(X) und Standardabweichung -Binomialverteilung (Formel von BERNOULLI, E(X), Var(X) und Standardabweichung) -Normalverteilung als Grenzfall einer Binomialverteilung -zweiseitige Hypothesentests bei Binomialvert. /Normvert. -Signifikanzbegriff, Fehler 1. und 2. Art „Jahrgangsübergreifende Leistungskurse können eingerichtet werden. Für einen Teil der Schülerinnen und Schüler ergibt sich die Reihenfolge MA-3, MA-4, MA-1, MA-2. In diesem Fall ist die Stochastik vollständig im Kurs MA-4“(Rahmenlehrplan Mathematik, Sek II, 1. Auflage 2006, S. 43 )
Vorhaben • Approximation der Binomialverteilung durch die Standardnormalverteilung • Benötigt: Satz von Moivre-Laplace • Grund: sehr großes n (Stichprobenumfang)
Vorkenntnisse: • • • Unabhängigkeit Zufallsgrößen und deren Wahrscheinlichkeitsverteilung E(X), Var(X) und Standardabweichung Binomialverteilung (Formel von BERNOULLI, E(X), Var(X) und Standardabweichung) Normalverteilung Standardisierung der Normalverteilung
Lernziele: • Die Schüler sollen die Probleme der Anwendbarkeit der Binomialverteilung bei großen Stichprobenumfängen erkennen. • Die Schüler sollen den Satz von Moivre-Laplace verstehen und anwenden können. • Die Schüler sollen prüfen können, ob der Satz von Moivre-Laplace in einer bestimmten Situation anwendbar ist.
Stundenentwurf • Leistungskurs, 12. Klasse • Doppelstunde/ zwei Einzelstunden
1. Einführung • • einführendes Gespräch über Wahlprognosen (außermathematische Motivation, Brücke zur Lebenswelt) Aufgabe: Eine Partei erreichte bei der letzten Wahl nur 3% der Stimmen. Man vermutet, dass es möglich ist, den Stimmenanteil zu verdoppeln. Bei einer Umfrage gaben von 1000 Wählern 41 an, diese Partei wählen zu wollen. Wie groß ist die Wkt. , dass 41 oder mehr Personen diese Partei wählen wollen, wenn sich der Stimmenanteil nicht verändert hat? Frage: Wo tauchen bei dieser Aufgabe Probleme auf? Lasst uns bitte diese gemeinsam besprächen. 15 -20 Min.
Erwartungen • • • X~B(n, p) Parameter: n=1000, p=0, 03 Ergebnis: ohne Computer zu aufwendig
Satz von Moivre-Laplace • • frei Recherche zum Satz (PC, Bücher usw. ) 20 -25 Min.
Erwartungen • Satz von Moivre-Laplace: Es sei eine binomialverteilte Zufallsvariable mit den Parametern n und p: 0<p<1, dann gilt. • Verständnis bzw. konkrete Fragen bezüglich der Argumente. • Faustregel: np(1 -p) > 9 bzw.
Besprechung • • • Besprechung des Satzes in seiner Bedeutung bzw. der Faustregel an der Tafel (möglichst Schülergespräch) kurze wiederholende Besprechung der N(0, 1)-Verteilung 10 -15 Min.
Umsetzung der Aufgabe • • Die Schüler sollen die Aufgabe nun in kleinen Gruppen (2 -4 Schüler) rechnen. 10 -15 Min.
Präsentation • • Vorstellung der Aufgabe von einer der Gruppen 10 Min.
Fragen, Diskussion • • Form: Unterrichtsgespräch/Schülergespräch (wenn möglich, sonst geleitetes Unterrichtsgespräch/ Lehrergespräch) 10 Min.
- Slides: 50