3 Gesamtbeschreibung empirischer Verteilungen 31 3 Gesamtbeschreibung empirischer
3 Gesamtbeschreibung empirischer Verteilungen 31
3 Gesamtbeschreibung empirischer Verteilungen 3. 1 Tabellarische Darstellungsmöglichkeiten 33 3. 1. 1 Elementare Begriffe und Notation 33 3. 1. 2 Häufigkeitstabellen bei Urlisten 35 3. 1. 3 Häufigkeitstabellen bei klassierten Daten 37 3. 2 Grafische Darstellungsmöglichkeiten 39 3. 2. 1 Kreis-, Säulen- und Balkendiagramme 39 3. 2. 2 Stamm-Blatt-Diagramme 42 3. 2. 3 Histogramme (Häufigkeitsdichten) 44 3. 2. 4 Boxplots 48 3. 3 Empirische Verteilungsfunktion (EVF) 53 3. 3. 1 Häufigkeitsfunktion und EVF bei Urlisten 53 3. 3. 2 Häufigkeitsdichtefunktion und EVF bei klassierten Daten 57
3. 1 Tabellarische Darstellungsmöglichkeiten 3. 1. 1 Elementare Begriffe und Notation ● Urliste und Stichprobenumfang ● > Urliste: Nichtmanipulierte ursprünglich Beobachtungswerte > Stichprobenumfang: Anzahl an Beobachtungswerten; notiert mit n ● Merkmale und Ausprägungsmöglichkeiten ● > Merkmal (Variable): Interessierende Eigenschaft von Person, Objekt oder Vorgang. Variable betont die Variabilität hinsichtlich verschiedener Ausprägungsmöglichkeiten, meist notiert mit Großbuchstaben X, Y, Z, . . . 33
3. 1 Tabellarische Darstellungsmöglichkeiten 34
3. 1 Tabellarische Darstellungsmöglichkeiten 3. 1. 2 Häufigkeitstabellen bei Urlisten ● Absolute und relative Häufigkeiten ● > Beispiel: > Allgemein gilt: ● Tabellarische Darstellung der Häufigkeitsverteilung ● 35
3. 1 Tabellarische Darstellungsmöglichkeiten 36
3. 1 Tabellarische Darstellungsmöglichkeiten 3. 1. 2 Häufigkeitstabellen bei klassierten Daten ● Größenklassierung ● > Angenommen, bei einer Erhebung wurde die monatliche Absatzmenge einer bestimmten Brötchensorte in 30 Filialen eines Bäckereibetriebs erhoben: > Einteilung in Größenklassen mit jeweils „ähnlich großen“ Werten > Beispiel: ● Absolute und relative Klassenhäufigkeiten ● Beispiel: 37
3. 1 Tabellarische Darstellungsmöglichkeiten 38
3. 2 Grafische Darstellungsmöglichkeiten 3. 2. 1 Kreis-, Säulen- und Balkendiagramme ● Kreis- und Ringdiagramme ● ● Säulendiagramme ● 39
3. 2 Grafische Darstellungsmöglichkeiten 40
3. 2 Grafische Darstellungsmöglichkeiten ● Balkendiagramme ● 41
3. 2 Grafische Darstellungsmöglichkeiten 3. 2. 2 Stamm-Blatt-Diagramme Hier nochmals die Urliste 42
3. 2 Grafische Darstellungsmöglichkeiten 43
3. 2 Grafische Darstellungsmöglichkeiten 3. 2. 3 Histogramme ● Konzept und Beispiel ● > Säulendiagramm über Größenklassen, dessen Flächen den relativen Klassenhäufigkeiten entsprechen > Es gilt: Säulenhöhe = Relative Klassenhäufigkeit / Klassenbreite 44
3. 2 Grafische Darstellungsmöglichkeiten > Beispiel anhand von Größenklasse 3, d. h. j = 3 45
3. 2 Grafische Darstellungsmöglichkeiten ● Problem der Klassenwahl ● 46
3. 2 Grafische Darstellungsmöglichkeiten ● Regeln zur Klassenwahl ● > Nur einige sehr elementarge Regeln: 1. Nach Möglichkeit sollten Klassen ohne Werte („leere Klassen“) vermieden werden. 2. Die Werte sollten innerhalb der Klassen möglichst gleichmäßig verteilt sein. 3. Nach Möglichkeit sollten gleich breite Klassen gewählt werden (erleichtert die Interpretation). > Theorie zur Konstruktion „optimaler“ Histogramme in nichtparametrischer Statistik im Rahmen der Dichteschätzung > Implementierung von Algorithmen zur Konstruktion „optimaler“ Histogramme in Software-Pakete 47
3. 2 Grafische Darstellungsmöglichkeiten 3. 2. 4 Boxplots ● Konzept und Beispiel ● „firstchi“ 48
3. 2 Grafische Darstellungsmöglichkeiten > Oberer (unterer) Anrainer: nicht weiter als das 1. 5 -fache des Interquartilsabstands vom oberen (unteren) Boxende entfernt 49
3. 2 Grafische Darstellungsmöglichkeiten ● Deutung ● ● Für Vergleichszwecke geeignet ● 50
3. 2 Grafische Darstellungsmöglichkeiten 51
3. 2 Grafische Darstellungsmöglichkeiten 52
3. 3 Empirische Verteilungsfunktion 3. 3. 1 Häufigkeitsfunktion und EVF bei Urlisten ● Häufigkeitsfunktion ● Die Häufigkeitsfunktion ordnet jedem beliebigen Wert x die relative Häufigkeit seines Auftretens in der Urliste zu, z. B. 53
3. 3 Empirische Verteilungsfunktion ● > Kumulatives Aufsummieren der Häufigkeitsfunktion > Gibt für jeden beliebigen Wert x an, wie groß der relative Anteil der Werte ist, die kleiner oder gleich x sind 54
3. 3 Empirische Verteilungsfunktion > Beispiele: 55
3. 3 Empirische Verteilungsfunktion 56
3. 3 Empirische Verteilungsfunktion 3. 3. 2 Häufigkeitsdichtefunktion und EVF bei klassierten Daten ● Häufigkeitsdichtefunktion ● Die Häufigkeitsdichtefunktion ordnet jedem beliebigen Wert x die Häufigkeitsdichte an der Stelle x zu (klassierte Daten), z. B. 57
3. 3 Empirische Verteilungsfunktion ● EVF an den Klassengrenzen ● > EVF für klassierte Daten soll kumulativen Anteil von Werten bis zu einem bestimmten Wert angeben. > Kumulatives Integrieren der Häufigkeitsdichtefunktion > Sie ordnet einem beliebigen Wert x die Fläche unterhalb der Häufigkeitsdichtefunktion bis zu diesem Wert zu > An einer Klassengrenze entspricht der Wert der EVF genau der kumulierten Summe der relativen Klassenhäufigkeiten bis zu dieser Klassengrenze 58
3. 3 Empirische Verteilungsfunktion 59
3. 3 Empirische Verteilungsfunktion ● Approximation innerhalb der Klassen ● Für einen Wert x innerhalb der j-ten Klasse gilt (als Approximation): 60
3. 3 Empirische Verteilungsfunktion ● 1. Ableitung der EVF ● 61
- Slides: 31