Verarbeitung geographischer Daten SS 2002 Diskriminanzanalyse Referentinnen Florentina
Verarbeitung geographischer Daten SS 2002 Diskriminanzanalyse Referentinnen: Florentina Dobre, Iulia Pascu, Nikola Sander
1. Einleitung 2. Das Verfahren 2. 1 Definition der Gruppen und Variablen 2. 2 Formulierung der Diskriminanzfunktion 2. 3 Schätzung der Diskriminanzfunktion 2. 4 Prüfung der Diskriminanzfunktion 2. 5 Prüfung der Merkmalsvariablen 2. 6 Klassifizierung von neuen Elementen 3. Mehr Gruppen – mehr Variablen Fall 4. Die Anwendung des SPSS-Programms
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS „Die Diskriminanzanalyse ist eine Methode zur Überprüfung von Gruppen - und Klassenunterschieden. “ (Bahrenberg 1992, 316) Merkmale: • Erklärung von abhängigen durch unabhängige Variablen • Zusammenhänge zwischen Variablen • konfirmatorisches Verfahren
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS Fragestellungen: • Ist die Gruppierung die bestmögliche? • Zu welcher Gruppe gehört ein bisher nicht klassifiziertes Element? • Gibt es signifikante Gruppenunterschiede hinsichtlich der Variablen?
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS Diskriminanzanalyse in der Geographie: • Trennung von Raumeinheiten • Zuordnung nicht klassifizierter Raumeinheiten • Überprüfung einer erstellten Raumgliederung • Analyse der Unterschiede zwischen Raumtypen
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS Voraussetzungen: • metrisch skalierte Variablen • Normalverteilung der Daten • kein Element darf mehreren Gruppen angehören • STP-Umfang mind. Doppelt so groß wie Anzahl der Variablen • Gruppenanzahl kleiner als Variablenanzahl
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS zwei Gruppen – zwei Variablen Fall • Anwendungsproblem • vorgeschaltete Analyse • Festlegung der Gruppenanzahl • Beispiel: 23 Klimastationen in 2 Gruppen laut Clusteranalyse
1. Tunesien 2. Beispiel Klimastation Gruppe A Gruppe B http: //dev. lib. utexas. edu/maps/africa/ tunisia_pol_1990. jpg (Stand: 09. 06. 2002)
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS • Projektion der Gruppenelemente auf die beiden Merkmalsachsen -> Überschneidungsbereiche Abb. 1 Trennung durch die Ausgangsvariablen x 1 und x 2 Quelle: Bahrenberg 1992, 319.
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS • Funktion (Achse) zur optimalen Trennung der Gruppen zu bestimmen -> Diskriminanzachse Abb. 2 Trennung durch verschiedene Diskriminanzachsen Quelle: Bahrenberg 1992, 321
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS Diskriminanzfunktion Y Linearkombination der beiden Merkmalsvariablen X 1 und X 2 Y = v 1 x 1 + v 2 x 2 Y = Diskriminanzvariable (Funktion) x 1, x 2 = Merkmalsvariablen v 1, v 2 = Diskriminanzkoeffizienten für die Merkmalsvariablen
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS Annahme: Die Diskriminanzachse verläuft durch den Ursprung allein die Steigung bestimmt die Qualität der Trennung durch folgendes Verhältnis: v 2 x 2 = v― x 1 1 v 1 und v 2 sind aufgrund der Daten der Merkmalsausprägungen zu schätzen
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS Diskriminanzkriterium Messung der Unterschiedlichkeit der Gruppen Berücksichtigt auch die Streuung innerhalb der Gruppen Verhältnis von erklärter und nicht erklärter Streuung
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS Komponenten des Diskriminanzkriteriums: 1. Maximierung der Streuung zwischen den Gruppen (erklärte Streuung): _ _ d² = (y. A – y. B)² _ _ - y. A und y. B - Gruppenmittelpunkte 2. Minimierung der Streuung innerhalb der Gruppen (nicht erklärte Streuung): n. A _ n. B _ s² = Σ (y. Aj – y. A)² + Σ (y. Bj – j=1 y. B)²
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS Maximierung des Diskriminanzkriteriums Bedingung für möglichst kleine Überschneidungebereiche d² γ = — max s²
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS Durch partielle Differentiation von γ nach v 1 und v 2 erhält man folgende Bestimmungsgleichungen: v 1*s 11+v 2*s 12=d 1 v 1*s 12+v 2*s 22=d 2 d 1, d 2 – Mittelwertabweichungen s 11, s 22 – Varianz der beiden Variablen s 12 - Kovarianz Benötigt zur Berechnung der Diskriminanzfunktion Beispiel: y = 0, 414*x 1 -0, 037*x 2
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS Messung der Unterschiedlichkeit der Gruppen Analyse der Trennkraft der Funktion Zwei Möglichkeiten der Prüfung: 1. Vergleich mit dem Kritischen Diskriminanzwert 2. Betrachtung des Diskriminanzkriteriums
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS 1. Vergleich mit kritischem Diskriminanzwert • Berechnung eines Wertes auf der Diskriminanzachse für jedes Element j yj = v 1 x 1 j + v 2 x 2 j Berechnung des kritischen Diskriminanzwertes: arithmetisches Mittel (gleichgroße Cluster) gewichtetes arithmetisches Mittel • (unterschiedlich große Cluster)
_ _ 1. Vergleich mit kritischem Diskriminanzwert n Ay A + n By B y. T = n + n A B = 1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS 17 * 14, 34 + 6 * 13, 29 17 + 6 = 14, 06 Einteilung der Diskriminanzwerte in Gruppen wenn: yj > y. T: Zuordnung zu Gruppe A yj < v. T: Zuordnung zu Gruppe B yj = y. T: Keine Zuordnung möglich Vergleich im Beispiel: fehlerhafte Zuordnung der Klimastationen Kairouan und El Djem
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS 1. Vergleich mit kritischem Diskriminanzwert Quantitative Aussage über die Trennkraft der Diskriminanzfunktion anhand der Klassifikationsmatrix Gruppenzugehörigkeit nach der Diskriminanzanalyse Cluster A Vorgegebene Gruppenzugehörigkeit Cluster A Cluster B ∑ 15 (88, 24%) 0 15 Cluster B 2 (11, 76%) ∑ 17 6 (100%) 8 6 23 Trefferquote: Aussage über tatsächliche Trennkraft der Diskriminanzfunktion
1. Tunesien 2. Beispiel Klimastation Gruppe A Gruppe B http: //dev. lib. utexas. edu/maps/africa/ tunisia_pol_1990. jpg (Stand: 09. 06. 2002)
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS 2. Betrachtung des Diskriminanzkriteriums Eigenwert γ (Maximalwert des Diskriminanzkriteriums): Maß für die Trennkraft / Güte der Diskriminanzfunktion Nachteil: nicht auf Werte zwischen Null und Eins normiert zwei Alternativen
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS 2. Betrachtung des Diskriminanzkriteriums ●Kanonischer Korreltationskoeffizient c. K = γ 1+γ Im zwei Gruppen – zwei Variablen Fall ist CK = B Je größer der kanonische Korrelationskoeffizient, desto höher ist die Trennkraft der Diskriminanzfunktion Beispiel: CK = 0, 7158
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS 2. Betrachtung des Diskriminanzkriteriums • Wilks`Lambda 1 Lk = 1+γ Inverses Gütemaß: je kleiner die Werte desto höher die Trennkraft Beispiel: Lk = 0, 4875 Ermöglicht eine statistische Signifikanzprüfung der Diskriminanzfunktion durchzuführen
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS Überprüfung des Einflusses der Variablen auf die Zuordnung der Elemente • Wichtig: Erklärung der Gruppenunterschiedlichkeit Entfernung nicht aussagekräftiger Variablen • • Betrachtung der Diskrimianzkoeffizienten v Skalierungsabhängig Standardisierung
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS C 1 = s X 1* v 1 = 1, 1427 * 0, 414 = 0, 473 C 2 = sx 2* v 2 = 1, 760 * -0, 037 = -0, 065 • je größer das Ergebnis, desto stärker der Einfluss • das Vorzeichen der Werte ist unwichtig
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS • Klassifizierung neuer Elemente mit Hilfe der Diskriminanzfunktion • Einsetzen der Merkmalsvariablen des neuen Elements in die Diskriminanzfunktion • Vergleich des Wertes mit kritischem Diskriminanzwert • Einteilung in eine Gruppe Je nachdem, ob neuer Wert größer oder kleiner als kritischer Diskriminanzwert ist
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS Mehr Gruppen – mehr Variablen Fall • Praxisbezogen • Ermittlung mehrerer Diskriminanzfunktionen (Achsen) • mehrere Methoden der Klassifizierung neuer Elemente 1. Distanzkonzept (min. Abstand zwischen Elementen und Gruppencentroid) 2. Wahrscheinlichkeitskonzept (höchste Wahrscheinlichkeit der Gruppenzugehörigkeit)
1. Einleitung 2. Verfahren 2. 1. Gruppendefinition 2. 2 Funktionsformulierung 2. 3 Funktionsschätzung 2. 4 Funktionsprüfung 2. 5 Variablenprüfung 2. 6 Zuordnung neuer Elemente 3. Mehr. Gruppen mehr. Variablen Fall 4. SPSS • Geeignet für den Mehr Gruppen – Mehr Variablen Fall • Notwendigkeit, eine Spalte für die Gruppen (als abhängige Variable) zu erstellen
• im Menu „Statistiken“ „Klassifizieren“ „Diskriminanzanalyse“
• abhängige und unabhängige Variablen wählen • Bereich definieren • zwischen „unabhängige Variable zusammen aufnehmen“ und „schrittweise Methode verwenden“ wählen • „Auswählen“: Analyse auf bestimmte Fälle beschränken
• „Statistik“ Deskriptivstatistiken zusätzliche Funkionskoeffizienten Kovrianz- und Korrelationsmatrizen innerhalb der Gruppen und der Gesamtstichprobe • Minimalprogramm folgende Optionen aktivieren
• Bei „Speichern“ lassen sich folgende Ergebnisse als neue Variablen speichern:
Ende
- Slides: 34