Betrachtung der Realitt aus der Sicht der Statistik
Betrachtung der Realität aus der Sicht der Statistik TABELLEN UND HÄUFIGKEITSVERTEILUNGEN Übersetzung: / Tradotto da: Scuola Second 1°grado; Argomento: Leggiamo - Tabelle (30. 14); Pacchetto: S 1 A. 3
INHALT 1) Häufigkeitstabellen mit Prozentwerten 2) Absolute Häufigkeitstabelle: Erstellung 3) Vergleichbarkeit von Verteilungen 4) Konzeptualisierung einfache Verteilung 5) Kreuztabellen 6) Konzeptualisierung doppelte Verteilung
Häufigkeitstabellen mit Prozentwerten Tab. 1 – Personen im Alter von 6 Jahren und mehr nach Häufigkeit der Internetnutzung Jahr 2012 (je 100 Personen mit 6 Jahren und mehr) Häufigkeit der Internetnutzung Jeden Tag Einmal oder mehrmals in der Woche Ein paar Mal im Monat Ein paar Mal im Jahr nie Keine Angabe Insgesamt Personen mit 6 Jahren und mehr 29, 5 18, 7 3, 3 1, 0 45, 6 1, 9 100, 0 Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012 Die Tabelle mit prozentuellen Häufigkeiten ist am weitesten verbreitet, da sie leicht verständlich ist: Die Werte werden mit dem Gesamten in Beziehung gesetzt (das gleich 100 ist). Wie liest man die Tabelle?
Häufigkeitstabellen mit Prozentwerten: lesen Tab. 1 – Personen im Alter von 6 Jahren und mehr nach Häufigkeit der Internetnutzung Jahr 2012 (je 100 Personen mit 6 Jahren und mehr) Häufigkeit der Internetnutzung Jeden Tag Einmal oder mehrmals in der Woche Ein paar Mal im Monat Ein paar Mal im Jahr nie Keine Angabe Insgesamt Personen mit 6 Jahren und mehr 29, 5 18, 7 3, 3 1, 0 45, 6 1, 9 100, 0 Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012 … fast 30% der Bevölkerung das Internet jeden Tag verwenden … 45, 6% das Internet nicht nutzen Berücksichtigt man die gesamte italienische Bevölkerung im Alter von 6 Jahren und mehr, sagt uns die Tabelle zum Beispiel das… Wie erstellt man die Tabelle?
Häufigkeitstabellen mit Prozentwerten: erstellen a) Man berücksichtigt absolute Häufigkeitstabelle b) Man berechnet die relativen Häufigkeiten c) Man berechnet die prozentuellen Häufigkeiten Die relative Häufigkeit ist das Verhältnis zwischen absoluter Häufigkeit und Summe Die prozentuelle Die absolute Häufigkeit gibt an, Häufigkeit ist die wie oft sich die Ausprägung relative Häufigkeit eines Merkmals in der Grundmultipliziert mit 100 gesamtheit wiederholt Tab. 2 - Personen im Alter von 6 Jahren und mehr nach Häufigkeit der Internetnutzung - Jahr 2012 Personen mit 6 Jahren und mehr Häufigkeit der Internetnutzung (Werte in 1. 000) (je 1 Person mit 6 (je 100 Personen mit 6 Jahren und mehr) Jeden Tag 16. 819 / 57. 019 x 100 Einmal oder mehrmals in der Woche 10. 640 / 57. 019 x 100 Ein paar Mal im Monat 1. 871 / 57. 019 x 100 Ein paar Mal im Jahr 597 / 57. 019 x 100 nie Keine Angabe Insgesamt 26. 008 / 57. 019 x 100 1. 084 / 57. 019 x 100 57. 019 / 57. 019 x 100 Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012 Die Tabelle mit den relativen und prozentuellen Häufigkeiten erhält man ausgehend von der absoluten Häufigkeitstabelle. Wie erhält man aber die absolute Häufigkeitstabelle?
Absolute Häufigkeitstabelle: erstellen (1/4) Die absolute Häufigkeitstabelle erhält man ausgehend von der Verteilung nach Einheit: für jede Einheit wird die Ausprägung des Merkmals angegeben.
Absolute Häufigkeitstabelle: erstellen (2/4) In Excel mit der Schaltfläche fx (Funktion einfügen) die Funktion „Zählenwenn“ auswählen und mit Ok bestätigen.
Absolute Häufigkeitstabelle: erstellen (3/4) Den Zellbereich eingeben, der gezählt werden soll, und die Suchkriterien, also die Bedingung, mit der die Zellen definiert werden, die gezählt werden sollen. Dann mit Ok bestätigen.
Absolute Häufigkeitstabelle: erstellen (4/4) So erhält man die absoluten Häufigkeiten In Excel lassen sich die relativen Häufigkeiten berechnen: und die prozentuellen Häufigkeiten: (dieselben wie in Tabelle 2). So erhält man alle Berechnungen, die in Tabelle 2 gemacht wurden:
Vergleichbarkeit von Verteilungen (1/2) Frage: wie stark ist die tägliche Internetnutzung zwischen 2009 und 2012 gestiegen? Tab. 3 - Personen mit 6 Jahren und mehr nach Häufigkeit der Internetnutzung (Werte in 1. 000) Personen mit 6 Jahren und mehr Häufigkeit der Internetnutzung Jahr 2009 Jahr 2012 12. 251 16. 819 9. 632 2. 233 864 29. 540 1. 712 56. 232 10. 640 1. 871 597 26. 008 1. 084 57. 019 Jeden Tag Einmal oder mehrmals in der Woche Ein paar Mal im Monat Ein paar Mal im Jahr Nie Keine Angabe Insgesamt Quelle: Istat, I. Stat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012 Der Vergleich der Verteilungen der absoluten Häufigkeiten ergibt, dass die Zahl der Personen im Alter von 6 Jahren und mehr von 12. 251 Tausend im Jahr 2009 auf 16. 819 Tausend im Jahr 2012 gestiegen ist… … aber der Vergleich ist ungültig, da die beiden Grundgesamtheiten unterschiedlich groß sind.
Vergleichbarkeit von Verteilungen (2/2) Um Vergleiche zu ziehen, müssen die Verteilungen der relativen oder prozentuellen Häufigkeiten verwendet werden, wo jede Grundgesamtheit gleich groß ist. Tab. 4 - Personen mit 6 Jahren und mehr nach Häufigkeit der Internetnutzung (je 100 Personen mit 6 Jahren und mehr) Häufigkeit der Internetnutzung Personen mit 6 Jahren und mehr Jahr 2009 Jahr 2012 21, 8 29, 5 17, 1 4, 0 1, 5 52, 5 3, 0 100, 0 18, 7 3, 3 1, 0 45, 6 1, 9 100, 0 Jeden Tag Einmal oder mehrmals in der Woche Ein paar Mal im Monat Ein paar Mal im Jahr Nie Keine Angabe Insgesamt Quelle: Istat, I. Stat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012 Der Vergleich der Verteilungen der prozentuellen Häufigkeiten erlaubt die Aussage, dass im Jahr 2009 21, 8 von 100 Personen im Alter von 6 Jahren und mehr täglich das Internet genutzt haben (also 21, 8 Prozent). 2012 haben 29, 5 von 100 Personen im Alter von 6 Jahren und mehr täglich das Internet genutzt (also 29, 5 Prozent).
Konzeptualisierung der einfachen Verteilung in der Sprache der Statistiker… Die Sprache der Statistiker verwendet bestimmte Symbole… Tab. 5 – Einfache Häufigkeitsverteilung K modalità del carattere Tabellenkopf Spalte mit Ausprägungen Schauen wir uns die Summen an… Die Summe der absoluten Häufigkeiten entspricht der Grundgesamtheit Die Summe der relativen Häufigkeiten ist 1 Die Summe der prozentuellen Häufigkeiten ist 100
Kreuztabelle Tab. 6 – Personen mit 6 Jahren und mehr nach Häufigkeit der Internetnutzung und Region Jahr 2012 (je 100 Personen mit 6 Jahren und mehr in derselben Region) REGIONEN Häufigkeit der Internetnutzung Einmal oder Ein paar Keine Jeden Tag mehrmals Mal im Jahr Angabe in der Monat Woche Piemont 30, 6 17, 9 3, 9 Aosta 30, 8 23, 3 Ligurien 31, 2 19, 3 2, 9 Lombardei 33, 2 21, 0 3, 5 Trentino-Südtirol 30, 3 23, 2 4, 9 Südtirol 29, 7 24, 9 5, 3 Trentino 31, 1 21, 6 4, 6 Venetien 32, 8 20, 3 4, 3 Friaul-Julisch Venetien 31, 1 17, 9 3, 6 Emilia-Romagna 34, 0 18, 4 3, 3 Toskana 30, 8 19, 4 3, 6 Umbrien 28, 8 19, 9 2, 3 Marken 31, 8 18, 6 2, 4 Latium 33, 0 18, 5 3, 4 Abruzzen 28, 1 16, 0 4, 2 Molise 27, 1 14, 2 3, 0 Kampanien 23, 0 15, 9 2, 5 Apulien 22, 0 17, 4 2, 4 Basilikata 22, 5 16, 7 2, 3 Kalabrien 23, 9 17, 3 2, 2 Sizilien 24, 5 17, 6 3, 0 Sardinien 29, 5 18, 4 2, 8 Italien 29, 5 18, 7 3, 3 Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012 Nie Es gibt 2 Merkmale Insgesamt 1, 3 0, 8 1, 4 1, 2 1, 6 2, 1 1, 2 0, 9 1, 6 2, 5 2, 0 0, 9 3, 1 2, 3 3, 4 1, 4 44, 7 39, 2 43, 1 40, 2 36, 8 35, 7 38, 0 40, 3 100, 0 100, 0 1, 6 1, 5 0, 9 1, 3 1, 4 0, 8 0, 6 1, 3 0, 4 1, 1 0, 7 0, 9 1, 6 1, 0 2, 4 2, 5 0, 8 2, 4 3, 2 3, 5 1, 3 1, 6 4, 0 2, 1 2, 6 1, 9 43, 7 40, 4 42, 7 46, 8 43, 4 41, 0 47, 6 53, 1 56, 8 55, 5 53, 4 53, 9 51, 5 46, 2 45, 6 100, 0 100, 0 100, 0 100, 0 Schauen wir uns an einem Beispiel an, wie man die Tabelle liest
Kreuztabelle: lesen Tab. 6 - Personen mit 6 Jahren und mehr nach Häufigkeit der Internetnutzung und Region Jahr 2012 (je 100 Personen mit 6 Jahren und mehr in derselben Region) REGIONEN Piemont Aosta Ligurien Lombardei Trentino-Südtirol Trentino Venetien Friaul-Julisch Venetien Emilia-Romagna Toskana Umbrien Marken Latium Abruzzen Molise Kampanien Apulien Basilikata Kalabrien Sizilien Sardinien Italien Jeden Tag Häufigkeit der Internetnutzung Einmal oder Ein paar Keine Mal im mehrmals Mal im Jahr Angabe in der Monat Woche Nie Insgesamt 30, 6 30, 8 31, 2 33, 2 30, 3 29, 7 31, 1 32, 8 17, 9 23, 3 19, 3 21, 0 23, 2 24, 9 21, 6 20, 3 3, 9 3, 3 2, 9 3, 5 4, 9 5, 3 4, 6 4, 3 1, 3 0, 8 1, 4 1, 2 1, 6 2, 1 1, 2 0, 9 1, 6 2, 5 2, 0 0, 9 3, 1 2, 3 3, 4 1, 4 44, 7 39, 2 43, 1 40, 2 36, 8 35, 7 38, 0 40, 3 100, 0 100, 0 31, 1 34, 0 30, 8 28, 8 31, 8 33, 0 28, 1 27, 1 23, 0 22, 5 23, 9 24, 5 29, 5 17, 9 18, 4 19, 9 18, 6 18, 5 16, 0 14, 2 15, 9 17, 4 16, 7 17, 3 17, 6 18, 4 18, 7 3, 6 3, 3 3, 6 2, 3 2, 4 3, 4 4, 2 3, 0 2, 5 2, 4 2, 3 2, 2 3, 0 2, 8 3, 3 1, 6 1, 5 0, 9 1, 3 1, 4 0, 8 0, 6 1, 3 0, 4 1, 1 0, 7 0, 9 1, 6 1, 0 2, 4 2, 5 0, 8 2, 4 3, 2 3, 5 1, 3 1, 6 4, 0 2, 1 2, 6 1, 9 43, 7 40, 4 42, 7 46, 8 43, 4 41, 0 47, 6 53, 1 56, 8 55, 5 53, 4 53, 9 51, 5 46, 2 45, 6 100, 0 100, 0 100, 0 100, 0 Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012 Fast 30% der Bevölkerung Italiens nutzen jeden Tag das Internet… …aber es gibt große räumliche Unterschiede 45, 6% der Bevölkerung Italiens mit 6 Jahren und mehr nutzt nicht das Internet… … aber es gibt große räumliche Unterschiede
Kreuztabelle: erstellen (1/5) Tab. 7 - Personen mit 6 Jahren und mehr nach Häufigkeit der Internetnutzung und Region Jahr 2012 (Werte in 1. 000) REGIONEN Piemont Aosta Ligurien Lombardei Trentino-Südtirol Trentino Venetien Friaul-Julisch Venetien Emilia-Romagna Toskana Umbrien Marken Latium Abruzzen Molise Kampanien Apulien Basilikata Kalabrien Sizilien Sardinien Italien Jeden Tag 1. 281 37 477 3. 101 294 141 154 1. 517 361 1. 418 1. 091 246 469 1. 780 357 82 1. 256 846 125 452 1. 158 468 16. 819 Häufigkeit der Internetnutzung Einmal oder Ein paar Keine mehrmals Mal im Angabe in der Monat Jahr Woche 749 165 54 67 28 4 1 3 295 44 22 31 1. 965 330 109 80 225 48 16 30 118 25 10 11 107 23 6 17 940 200 41 63 207 769 687 170 275 1. 001 203 43 870 668 93 327 832 292 10. 640 42 138 127 20 36 185 53 9 138 92 13 41 141 44 1. 871 19 62 32 11 20 45 7 4 24 43 6 13 43 25 597 Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012 23 101 90 7 35 174 45 4 69 63 22 39 121 25 1. 084 Nie Insgesamt 1. 873 47 659 3. 751 357 169 188 1. 865 4. 189 120 1. 528 9. 336 970 474 495 4. 626 507 1. 688 1. 512 400 640 2. 215 604 161 3. 102 2. 138 297 1. 021 2. 439 732 26. 008 1. 159 4. 176 3. 539 854 1. 475 5. 400 1. 269 303 5. 459 3. 850 556 1. 893 4. 734 1. 586 57. 019 Wie erstellt man in Excel eine Kreuztabelle? Wie bei der einfachen Tabelle wird die Tabelle mit den absoluten Häufigkeiten, also die Tabelle nach Einheiten, verwendet
Kreuztabelle: erstellen (2/5) Doppelte Verteilung je Einheit: für jede Einheit die Ausprägungen von zwei Merkmalen: In Excel: im Menü Einfügen Pivottabelle auswählen. Es öffnet sich das Fenster «Pivottabelle erstellen» , in dem Folgendes spezifiziert werden muss: a) die Daten, die analysiert werden (gesamte Datenmatrix auswählen), b) wo der Pivot. Chart-Bericht positioniert wird. Dann auf ok klicken.
Kreuztabelle: erstellen (3/5) Aus Pivot. Table-Feldliste die Felder in die untenstehenden Bereiche ziehen: Spaltenbeschriftung – Zeilenbeschriftung - Ʃ Werte.
Kreuztabelle: erstellen (4/5) Um die Tabelle 7 zu nachzubauen: ‘Internetnutzung’ in die Spaltenbeschriftungen ziehen, ‘Region’ in die Zeilenbeschriftungen und ‘Einheit’ in das Feld Ʃ Werte (Einstellungen Feld Werte – Zusammenfassung Werte nach - Zählung)
Kreuztabelle: erstellen (5/5) Um die Tabelle 6 nachzubauen: ‘Internetnutzung’ in die Spaltenbeschriftungen ziehen, ‘Region’ in die Zeilenbeschriftungen und ‘Einheit’ in das Feld Ʃ Werte (Einstellungen Feld Werte – Zusammenfassung Werte nach - Zählung; zeige Werte als % der Zeilensumme)
Konzeptualisierung doppelte Verteilung in der Sprache der Statistiker… (1/4) z Ausprägung des Merkmals y Tab. 8 – Doppelte Verteilung der absoluten Häufigkeiten k modalità del carattere X Tabellenkopf ni 0 ist die Häufigkeit der Einheiten, bei denen das Merkmal X in der Ausprägung xi vorhanden ist Spalte mit Ausprägungen nij ist die Häufigkeit der Einheiten, bei denen das Merkmal X in der Ausprägung xi und das Merkmal Y in der Ausprägung yj vorhanden ist. n 0 j ist die Häufigkeit der Einheiten, bei denen das Merkmal Y in der Ausprägung yj vorhanden ist die Anzahl der Grundgesamtheit
Konzeptualisierung doppelte Verteilung in der Sprache der Statistiker … (2/4) In einer Kreuztabelle können drei verschiedene Arten von relativen (oder prozentuellen) Häufigkeiten berechnet werden: 1. Doppelte Verteilung von gesamten relativen Häufigkeiten. Diese erhält man, indem man jede absolute Häufigkeit durch die Gesamtanzahl n dividiert (multipliziert mit 100 ergibt das die gesamten prozentuellen Häufigkeiten). Tab. 9 – Doppelte Verteilung der gesamten prozentuellen Häufigkeiten wobei:
Konzeptualisierung doppelte Verteilung in der Sprache der Statistiker … (3/4) 2. Verteilung der relativen Häufigkeiten der Spalte. Diese erhält man, indem man jede absolute Häufigkeit durch die Summe der jeweiligen Spalte dividiert (multipliziert mit 100 ergeben sich die prozentuellen Häufigkeiten der Spalte). So kann, bei gleicher Anzahl der einzelnen Ausprägungen des Merkmals X, die unterschiedliche Zusammensetzung der Einheiten nach den Ausprägungen des Merkmals Y verglichen werden. Tab. 10 – Doppelte Verteilung der prozentuellen Häufigkeiten der Spalte wobei:
Konzeptualisierung doppelte Verteilung in der Sprache der Statistiker … (4/4) 3. Verteilung von relativen Häufigkeiten der Zeile. Diese erhält man, indem man jede absolute Häufigkeit durch die Summe der jeweiligen Zeile dividiert (multipliziert mit 100 ergeben sich die prozentuellen Häufigkeiten der Zeile). So kann, bei gleicher Anzahl der einzelnen Ausprägungen des Merkmals Y, die unterschiedliche Zusammensetzung der Einheiten nach den Ausprägungen des Merkmals X verglichen werden. Tab. 11 – Doppelte Verteilung der prozentuellen Häufigkeiten der Zeile wobei:
Einfache Tabelle: Erstellung mit Pivot-Tabelle Da wir jetzt das Instrument Pivot-Tabelle kennen, können wir es auch verwenden, um einfache Tabellen (mit nur einem Merkmal) zu erstellen. Um die absoluten Häufigkeiten der Tabelle 2 zu erstellen: ‘Internetnutzung’ in die Zeilenbeschriftungen und ‘Einheit’ in das Feld Σ Werte ziehen (Einstellungen Feld Werte - Zusammenfassung Werte nach - Zählung) Um die prozentuellen Häufigkeiten der Tabelle 2 zu erstellen: ‘Internetnutzung’ in die Zeilenbeschriftungen und ‘Einheit’ in das Feld Σ Werte ziehen (Einstellungen Feld Werte – Zusammenfassung Werte nach - Zählung; zeige Werte als % der Spaltensumme)
…und jetzt… Gute Arbeit! Übersetzung: / Tradotto da: Rete per la promozione della cultura statistica
- Slides: 25