Multidimensionale Datenstrukturen semantische und logische Modellierung Teilvortrag logische

  • Slides: 24
Download presentation
Multidimensionale Datenstrukturen semantische und logische Modellierung Teilvortrag: logische Modellierung Matthias Ansorg FH Gießen-Friedberg Seminarvortrag

Multidimensionale Datenstrukturen semantische und logische Modellierung Teilvortrag: logische Modellierung Matthias Ansorg FH Gießen-Friedberg Seminarvortrag 2004 -06 -02

Inhalt Einführung Vergleichende Darstellung der logischen Modelle Schlussgedanken

Inhalt Einführung Vergleichende Darstellung der logischen Modelle Schlussgedanken

Einführung : : Inhalt Einführung Einordnung logischer Modelle Definitionen zu multidim. Datenstrukturen

Einführung : : Inhalt Einführung Einordnung logischer Modelle Definitionen zu multidim. Datenstrukturen

Einführung : : Einordnung logischer Modelle (1) Datenabstraktion bei OLTP und Data Warehouse Sichten

Einführung : : Einordnung logischer Modelle (1) Datenabstraktion bei OLTP und Data Warehouse Sichten konzeptionelle Ebene logische Ebene physische Ebene

Einführung : : Einordnung logischer Modelle (2) Aufgabe logischer Modellierung: Abbildung des konzeptionellen Schemas

Einführung : : Einordnung logischer Modelle (2) Aufgabe logischer Modellierung: Abbildung des konzeptionellen Schemas für das Ziel-DBVS Berücksichtigung des Datenmodells des Ziel-DBVS Verlustfreie Abbildung der Semantik Besonderheiten bei multidim. Modellen optimiert für Endbenutzer optimiert auf effiziente OLAP-Abfragen

Einführung : : Definitionen zu multidim. Datenstrukturen

Einführung : : Definitionen zu multidim. Datenstrukturen

Vergleichende Darstellung : : Inhalt Vergleichende Darstellung Überblick Kriterienkatalog Einzelne Modelle Flat Schema Star

Vergleichende Darstellung : : Inhalt Vergleichende Darstellung Überblick Kriterienkatalog Einzelne Modelle Flat Schema Star Schema Snowflake Schema Constellation Schema und Galaxy Schema Vergleichende Zusammenfassung der Ergebnisse

Vergleichende Darstellung : : Überblick (1) Multidimensionalität im relationalen Datenmodell Grundlage aller logischen Modelle

Vergleichende Darstellung : : Überblick (1) Multidimensionalität im relationalen Datenmodell Grundlage aller logischen Modelle Dimension analog Attribut: Attribute einer Dimension spannen einen multidimensionalen Raum auf Kennzahl analog Attribut: Attribut als Information, die mit einem Punkt im multidimensionalen Raum assoziiert ist.

Vergleichende Darstellung : : Überblick (2)

Vergleichende Darstellung : : Überblick (2)

Vergleichende Darstellung : : Kriterienkatalog (1) Verständlichkeit für Endbenutzer » de facto «-Anforderung Unterschied

Vergleichende Darstellung : : Kriterienkatalog (1) Verständlichkeit für Endbenutzer » de facto «-Anforderung Unterschied zum Entwurf operativer Datenbanken Effizienz typischer Abfragen On-Line Analytical Processing Abbildung für reichhaltige Semantik Dimensionen Hierarchien Kennzahlen Aggregationen, Aggregationsverhalten

Vergleichende Darstellung : : Kriterienkatalog (2) Orientierung am Zieldatenbanksystem Beschreibungselemente sollen kompatibel mit dessen

Vergleichende Darstellung : : Kriterienkatalog (2) Orientierung am Zieldatenbanksystem Beschreibungselemente sollen kompatibel mit dessen Datenmodell sein Wartbarkeit Werkzeugunterstützung

Vergleichende Darstellung : : Einzelne Modelle : : Flat Schema eine einzige Tabelle (»

Vergleichende Darstellung : : Einzelne Modelle : : Flat Schema eine einzige Tabelle (» flat «) Analogie zum Relationenmodell: Dimensionen und Kennzahlen als Attribute vollständige Denormalisierung (» alle Joins vorberechnet «) minimale Zahl an Fakttabellen Probleme fehlerhafte Aggregationen möglich hohe Elementkomplexität

Vergleichende Darstellung : : Einzelne Modelle : : Star Schema (1)

Vergleichende Darstellung : : Einzelne Modelle : : Star Schema (1)

Vergleichende Darstellung : : Einzelne Modelle : : Star Schema (2)

Vergleichende Darstellung : : Einzelne Modelle : : Star Schema (2)

Vergleichende Darstellung : : Einzelne Modelle : : Star Schema (3) das » beliebteste

Vergleichende Darstellung : : Einzelne Modelle : : Star Schema (3) das » beliebteste denormalisierte Schema « Star Joins nicht mehr vorberechnet Dimensionstabellen und Fakttabellen verständlicher durch diese Konzepttrennung fehlende Semantik Dimensionshierarchien nur implizit Fakttabellenhierarchien nicht modelliert

Vergleichende Darstellung : : Einzelne Modelle : : Snowflake Schema (1) ein Star Schema

Vergleichende Darstellung : : Einzelne Modelle : : Snowflake Schema (1) ein Star Schema mit expliziten Dimensionshierarchien durch normalisierte Dimensionstabellen zusätzliche Joins (deshalb tw. abgelehnt) besser verständlich durch explizite Modellierung Parallelhierarchien möglich

Vergleichende Darstellung : : Einzelne Modelle : : Snowflake Schema (2)

Vergleichende Darstellung : : Einzelne Modelle : : Snowflake Schema (2)

Vergleichende Darstellung : : Einzelne Modelle : : Constellation Schema und Galaxy Schema (1)

Vergleichende Darstellung : : Einzelne Modelle : : Constellation Schema und Galaxy Schema (1)

Vergleichende Darstellung : : Einzelne Modelle : : Constellation Schema und Galaxy Schema (2)

Vergleichende Darstellung : : Einzelne Modelle : : Constellation Schema und Galaxy Schema (2) Möglichkeiten, einzelne Schemata zu konsolidieren einzelnes Schema pro Datenwürfel Schematypen der einzelnen Schemata beliebig gemeinsame Dimensionen werden einmal angelegt und gemeinsam genutzt Fakttabellenhierarchien modellierbar Unterschiede Constellation Schema modelliert Fakttabellenhierarchien Galaxy Schema ist allgemeiner: Fakttabellenbeziehungen nicht zwingend

Vergleichende Darstellung : : Einzelne Modelle : : Constellation Schema und Galaxy Schema (3)

Vergleichende Darstellung : : Einzelne Modelle : : Constellation Schema und Galaxy Schema (3)

Vergleichende Darstellung : : Vergleichende Zusammenfassung der Ergebnisse

Vergleichende Darstellung : : Vergleichende Zusammenfassung der Ergebnisse

Kritische Schlussbemerkung : : Inhalt Kritische Schlussbemerkung zum Einsatz der logischen Modelle Wartungsproblematik im

Kritische Schlussbemerkung : : Inhalt Kritische Schlussbemerkung zum Einsatz der logischen Modelle Wartungsproblematik im Data Warehouse Wartungsfreiheit durch Data Marts mit Cache. Struktur?

Kritische Schlussbemerkung : : Wartungsproblematik im Data Warehouse Wartung am logischen Schema ist notwendig:

Kritische Schlussbemerkung : : Wartungsproblematik im Data Warehouse Wartung am logischen Schema ist notwendig: . . . wenn sich die Datenstrukturen der Quellschichten ändern. . wenn sich die aktuellen Analyseanforderungen der Benutzer ändern. logischer Entwurf manuell, ebenso die Schema-Evolution keine Lösung: Verzicht auf multidimensionale Datenstrukturen auf logischer Ebene das allumfassende logische Schema

Kritische Schlussbemerkung : : Wartungsfreiheit durch Data Marts mit Cache-Struktur? Ausgangsarchitektur multidim. logische Schemata

Kritische Schlussbemerkung : : Wartungsfreiheit durch Data Marts mit Cache-Struktur? Ausgangsarchitektur multidim. logische Schemata nur in Data Marts Cache-Paradigma optimierter Zwischenspeicher (OLAP-Analysen, Endbenutzer-Tauglichkeit) Transparenz (nur redundante Daten und Datenstrukturen) mögliche multidimensionale Sichten definiert durch Metadaten im Data Warehouse Wartung durch Administratoren der OLTP-Datenbanken benutzerdefinierte Würfelstruktur (per GUI) manuelle Schema-Evolution unnötig