Logischer DBEntwurf Prof Dr T Kudra 1 Entwurf
Logischer DB-Entwurf Prof. Dr. T. Kudraß 1
Entwurf eines relationalen DB-Schemas • Ziel: – Regeln für die Umsetzung eines ER-Modells in ein Relationenschema – theoretische Grundlagen für den Entwurf eines “guten“ relationalen DB-Schemas Ø Normalisierungslehre Ø Entwurfstheorie • Was macht einen schlechten DB-Entwurf aus? – – – • Redundanzen schlechte Handhabbarkeit Löschanomalien Potentielle Inkonsistenz (Änderungsanomalien) Einfügeanomalien Ø Oft hervorgerufen durch “Vermischung“ von Entities Normalisierung von Relationen – Hilft, einen gegebenen Entwurf zu verbessern Prof. Dr. T. Kudraß 2
Funktionale Abhängigkeiten • Funktionale Abhängigkeit (Functional Dependency) FD Die FD X Y gilt (X bestimmt Y funktional), wenn für alle Relationen r des Relationenschemas R gilt: Zwei Tupel, deren Wert in X übereinstimmt, stimmen auch in Y überein. X und Y sind Mengen von Attributen. Formal: u R v R (u[X] = v[X]) (u[Y] = v[Y]) Graphische Notation Abhängigkeitsdiagramme: NAME PNR Prof. Dr. T. Kudraß BERUF PNR PROJNR DAUER 3
Grundbegriffe bei funktionalen Abhängigkeiten Triviale FD: X X Volle funktionale Abhängigkeit: A 1, A 2, . . , An B 1, B 2, . . . , Bm B = { B 1, B 2, . . . , Bm } ist voll funktional abhängig von A = {A 1, A 2, . . . , An}, wenn B funktional abhängig von A, aber nicht funktional abhängig von einer echten Teilmenge von A ist. Beispiel: PNR PROJNR DAUER A B ist eine partielle Abhängigkeit, wenn ein Attribut Ai in A existiert, so daß ( A - {Ai}) B gilt: Beispiel: PNR PROJNR Prof. Dr. T. Kudraß NAME 4
Ableiten von funktionalen Abhängigkeiten (Inferenz) • Implikation: Aus einer Menge von gegebenen FDs F können meist weitere FDs f abgeleitet werden: – angestellter stufe, stufe gehalt impliziert angestellter gehalt – F+ = Hülle (closure) von F ist die Menge aller FDs, die durch F impliziert werden • • Armstrongsche Axiome (X, Y, Z sind Mengen von Attributen): – Reflexivität: Wenn X Y, dann X Y – Erweiterbarkeit: Wenn X Y, dann XZ YZ für beliebige Z – Transitivität: Wenn X Y und Y Z, dann X Z Armstrongsche Axiome sind klare und vollständige Inferenzregeln für FDs! Prof. Dr. T. Kudraß 5
Unnormalisierte Relation • Beispiel: ANG-U (ANGNR, NAME, ORT, ABTNR, ABTNAME, PROJNR, PROJNAME, DAUER) 3740 Kunz K 35 Produktion 4711 4713 3817 Hinz M 40 Forschung 4711 MM-PC 3 3819 Jansen B 35 Produktion 4711 MM-PC enthält Attribute, die selbst aus Werten zusammengesetzt sind • MM-PC PII-BOARD 12 4713 8 2 4715 6 4715 Chipsatz 18 Chipsatz 12 PII-BOARD Vorteile: – Clusterbildung – Darstellung von komplexen Objekten (hierarchische Sichten) • Nachteile – – Prof. Dr. T. Kudraß hohe Redundanzen (bei n: m-Beziehungen) erhöhter Speicherplatzbedarf erschwerte Handhabung durch unterschiedliche Anzahl von Elementen Anomalien bei Aktualisierung 6
Anomalien • • • Einfüge-Anomalie Bei Einfügen neuer Projekte können Informationen darüber nicht gespeichert werden, solange es keine Angestellten zu diesem Projekt gibt; ANGRNR ist Primärschlüssel in ANG-U Änderungs-Anomalie Eine Abteilung erhält neue Aufgaben und wird daher umbenannt. Gesamte Relation muß durchsucht, und es müssen u. U. zahl-reiche Sätze geändert werden, obwohl sich nur eine Information ändert. Lösch-Anomalie Bei Beendigung von Projekten (z. B. 4711, 4713) sollen die Informationen hierüber gelöscht werden. Wenn ein Angestellter (z. B. Kunz) nur an diesen Projekten beteiligt war, gehen automatisch auch die Informationen über diesen Angestellten verloren. Prof. Dr. T. Kudraß 7
1. Normalform • Alle Attributwerte sind atomar (d. h. bestehen nicht aus mehreren Elementen). ANG-1 (ANGNR, NAME, ORT, ABTNR, ABTNAME, PROJNR, PROJNAME, DAUER) 3740 Kunz K 35 Produktion 4711 3740 Kunz K 35 Produktion 4713 3817 Hinz M 40 Forschung 4711 3817 Hinz M 40 Forschung 3819 Jansen B 35 Produktion 4711 3819 Jansen B 35 Produktion • MM-PC PII-Board MM-PC 4713 8 2 12 PII-BOARD 4715 MM-PC 4715 Chipsatz 6 Chipsatz 18 12 Vorteile: – Wegfall mehrwertiger Attribute • Nachteile – gleiche Nachteile wie bei unnormalisierter Relation (Anomalien etc. ) Prof. Dr. T. Kudraß 8
2. Normalform (2 NF) • • • Eine Relation ist in 2. Normalform (2 NF), wenn sie in 1 NF ist und jedes Nicht-Schlüsselattribut voll funktional abhängig ist vom Primärschlüssel. Beispiel: ANGR NAME (ANGR, PROJNR) PROJNAME /Projekt-Nr. allein bestimmt den Projektnamen, keine volle funktionale Abhängigkeit / Vorgehensweise: 1. Lagere alle Attribute aus der ursprünglichen Relation aus, die nicht voll funktional abhängig vom gesamten Primärschlüssel sind. 2. Definiere für jede logisch zusammengehörige Attributkombination (idealerweise = Entity-Typ) eine neue Relation. 3. Mache für jede gefundene Attributkombination, die von einem Schlüsselteil abhängt, diesen Schlüssel zum Primärschlüssel der neuen Relation. Prof. Dr. T. Kudraß 9
2. Normalform (Beispiel) ANG-2 (ANGNR, NAME, ORT, ABTNR, ABTNAME) 3740 Kunz K 35 3817 Hinz M 40 3819 Jansen B 35 Produktion Forschung Produktion ANGPROJ (ANGNR, PROJNR, DAUER) 3740 4711 3740 4713 3817 4711 3817 4713 3817 4715 3819 4711 3919 4715 12 3 18 6 12 8 2 ^^^^ PROJEKT (PROJNR, PROJNAME) 4711 MM-PC 4713 PII-BOARD 4715 Chipsatz Prof. Dr. T. Kudraß 10
3. Normalform (3 NF) • Eine Relation ist genau dann in 3. Normalform (3 NF), wenn sie in 2 NF ist und keine transitiven Abhängigkeiten aufweist. – • • 3 NF ist verletzt, wenn es eine funktionale Abhängigkeit N A gibt, mit N, A = Nichtschlüsselattribut. Somit gilt auch X N A (mit X=Primärschlüssel), da Relation in 2 NF ist. Beispiel: ANGNR ABTNAME Vorgehensweise: 1. Lagere zunächst alle Nichtschlüsselattribute aus der ursprüng-lichen Relation aus, die funktional von Nichtschlüsselattributen abhängen. 2. Definiere für jedes Nichtschlüsselattribut, von dem andere Nichtschlüsselattribute abhängen, eine neue Relation. 3. Mache das Nichtschlüsselattribut, das die anderen Nichtschlüssel-attribute bestimmt, zum Primärschlüssel der neuen Relation. 4. Lasse den Primärschlüssel der neuen Relation als Fremdschlüssel in der ursprünglichen Relation bestehen. Prof. Dr. T. Kudraß 11
3. Normalform (Beispiel) ANG-3 (ANGNR, NAME, ORT, ABTNR) 3740 Kunz K 3817 Hinz M 3819 Jansen B ABTEILUNG (ABTNR, ABTNAME) 35 Produktion 40 Forschung ANG-PROJ (ANGNR, PROJNR, DAUER) 3740 4711 3740 4713 3817 4711 3817 4713 3817 4715 3819 4711 3819 4715 Prof. Dr. T. Kudraß 35 40 35 8 2 PROJEKT (PROJNR, PROJNAME) 4711 4713 12 3 18 6 12 MM-PC PII-BOARD 4715 Chipsatz 12
Abschließende Bemerkungen • • • Rekonstruktion der ursprünglichen Daten und Beziehungen mittels Verbund (Join) möglich. Nachteil von Normalisierung: hoher Verknüpfungsaufwand bei übergreifenden Anfragen (Performance). Weitere ^Normalformen in der Literatur beschrieben (z. B. Boyce-Codd-Normalform) – Prof. Dr. T. Kudraß höhere Normalformen in der Praxis nicht relevant 13
- Slides: 13