SQL Claus Andersen Heiko Weber Datum 30 06
SQL Claus Andersen Heiko Weber Datum : 30. 06. 04 Seminar Programmiersprachenkonzepte
Gliederung Einführung in das Relationenmodell l Einführung in SQL : DDL und IQL l Transaktionen l Synchronisation l verteilte Datenbanken l Aufbau eines Oracle – DB – Systems l SQL*Plus l PL/SQL l Trigger l Constraints vs. Trigger l
Relationenmodell (1) l l l Das Relationenmodell wurde 1970 von Codd eingeführt Es ist das am weitesten verbreitete Datenbankmodell, das in der Praxis eingesetzt wird. Einfachheit und Exaktheit des Relationenmodells hat weitreichende Ergebnisse in der Datenbankforschung ermöglicht.
Relationenmodell (2) Datenbankschema besteht aus: l einer Menge von Relationenschemata – – l Die zu modellierende Anwendungswelt wird durch Relationenschemata beschrieben. Sie bestehen aus einer Menge von Attributen Relationen – Menge von Tupel mit Attributwerten der Attribute der Relationenschemata
Schlüssel ● Primärschlüssel einer ● Minimale Menge von Attributen, deren Werte ein Tupel Relation eindeutig identifizieren Fremdschlüssel Attributmenge, die in einer anderen Relation (Primär)Schlüssel ist
Aufbau von Tabellen Die Datenbank besteht aus einer Menge von Relationen, die nach den Relationenschemata gebildet werden.
Beispiel Tabellen
Geschichte und Standards von SQL (1) 1970 wurde das relationale Datenbankmodell von Codd eingeführt ● 1974 wurde vom IBM-Forschungszentrum in San Jose eine erste Datenbanksprache Sequel (Structured English QUEry Language) entwickelt und 1976 zur Sprache Sequel 2 weiter entwickelt ● In den ersten verfügbaren relationalen Datenbanksystemen wurde eine Untermenge von Sequel 2 implementiert, die SQL genannt wurde ●
Geschichte und Standards von SQL (2) 1982 bis 86 wurde SQL von der ANSI (American National Standards Institute) genormt und üblicherweise mit SQL-86 bezeichnet ● darauf folgte die von der ISO genormte Version SQL-89 ● 1992 erschien die von der ANSI und ISO genormte Version SQL-92 (SQL 2) ● SQL 3 war das letzte Normungsprojekt der ANSI und ISO und wurde in gewissen Anteilen in den Standard SQL -99 überführt ●
Was ist SQL (Structured Query Language) ist die Norm. Datenbanksprache für relationale Datenbanksysteme. Teilsprachen von SQL • • DDL (Data Definition Language) SSL (Storage Structure Language) IQL (Interactive Query Language) DML (Data Manipulation Language)
SQL-DDL Was ist SQL-DDL ● ist eine Datendefinitionssprache zur Umsetzung des Datenbankschemas ● ist Teil der Standardsprache für relationale Datenbanksysteme (SQL)
Anforderungen an SQL-DDL sollte mindestens folgende Bestandteile definieren können: Attribute ● Wertebereiche ● Relationenschemata ● Primärschlüssel ● Fremdschlüssel ●
Konzepte für SQL-DDL(1) create table, alter table und drop table Definition von Relationenschemata create table basisrelationenname (spaltenname_1 wertebereich_1, . . . spaltenname_k werteberich_k) Mit alter table kann man die angelegten Relationenschemata ändern und mit drop table können Relationenschemata aus der Datenbank entfernt werden. create view, drop view ähnlich
Konzepte für SQL-DDL(2) create domain, alter domain und drop domain Definition von benutzerdefinierten Wertebereichen create domainname Datentyp default Datenwert
SQL als Anfragesprache (1) Der SFW-Block Die select-Klausel ● gibt die Projektionsliste an ● integriert auch arithmetische Operationen und Aggregatfunktionen
SQL als Anfragesprache (2) Die from-Klausel ● spezifiziert zu verwendende Relationen ● führt eventuelle Umbenennungen durch ● verwendetete Relationen werden mittels eines kartesischen Produkts verknüpft
SQL als Anfragesprache (3) Die where-Klausel ● spezifiziert Selektionsbedingungen ● Verbundbedingungen, um aus dem kartesischen Produkt einen Gleichverbund zu machen ● Geschachtelte Anfragen sind in der where-Klausel erlaubt
SQL als Anfragesprache (4) l Beispiel SELECT S. Name FROM Schauspieler S, Darsteller D WHERE S. PNR = D. PNR
Einige Erweiterungen von SQL-92 gegenüber SQL-89 (1) Neue Datentypen (z. B. Intervall) ● Domänenkonzept (create domain, alter domain) ● Änderung des Datenbankschemas (alter table, drop table) ● allgemeine Integritätsbedingungen über mehrere Tabellen ● Der Verbund join ist als eigener Operator vorhanden und wird in diversen Varianten angeboten : cross join, join und using, natural join ● Die Beschreibungen von Embedded SQL und Dynamic SQL sind Teil der Norm ●
Einige Erweiterungen von SQL 3 gegenüber SQL-92 abstrakte Datentypen (ADTs) ● Objekt- Identifikatoren ● ADT und Tabellen Hierarchien ● Definition von Funktionen von ADTs ● Komplexe Datentypen wie Mengen, Multimengen und Listen ● Rekursive Anfragen (with recursive und union) ●
Transaktionen l Definition: – Eine Transaktion ist eine ununterbrechbare Folge von DML-Befehlen, die Datenbank von einem logisch konsistenten in einen (neuen) logisch konsisten Zustand überführt
Transaktionen (2) l Transaktionen sollten dabei die ACIDEigenschaften besitzen – Atomarität l l – Die Transaktion ist die kleinste, nicht mehr zerlegbare Einheit „alles-oder-nichts“-Prinzip Consistency l l l Hinterlässt nur konsistenten Datenbankzustand Zwischenzustände der Transaktionen dürfen jedoch inkonsistent sein Endzustand muss den Integritätsbedingungen erfüllen
Transaktionen (3) – Isolation l Nebenläufig ausgeführte Transaktionen dürfen sich nicht beeinflussen
Transaktionen (4) – Durability l l l Wirkung einer erfolgreich abgeschlossener Transaktion bleibt dauerhaft in der Datenbank Auch nach einem Systemfehler muss die Wirkung gewährleistet sein Die Wirkung einer erfolgreich abgechlossenen Transaktion kann nur durch eine kompensierende Transaktion aufgehoben werden
Synchronisation (Mehrbenutzerbetrieb) • im Einbenutzerbetrieb werden Transaktionen immer hintereinander ausgeführt • im Mehrbenutzerbetrieb kann es vorkommen, dass mehrere Transaktionen gleichzeitig (nebenläufig) ablaufen • dies kann zu verschiedenen Problemen führen
Synchronisation (2) Dirty Read: T 1 T 2 Read(A); A : = A + 100; Write(A) Read(A); Read(B); B : = B + A; Write(B); Commit; Abort;
Sychronisation (3) Non – Repeatable – Read: Lesetransaktion SELECT Gehalt INTO : gehalt FROM Pers WHERE Pnr = 2345; summe : = summe + gehalt SELECT Gehalt INTO : gehalt FROM Pers WHERE Pnr = 3456; summe : = summe + gehalt; Änderungstransaktion DB-Inhalt (Pnr, Gehalt) 2345 39. 000 3456 48. 000 UPDATE Pers SET Gehalt = Gehalt + 1000 WHERE Pnr = 2345; 2345 40. 000 UPDATE Pers SET Gehalt = Gehalt + 2000 WHERE Pnr = 3456; 3456 50. 000
Synchronisation (4) Phantom - Problem: Lesetransaktion SELECT SUM(Gehalt) INTO : summe FROM Pers WHERE Anr = 17; SELECT Gehaltssumme INTO : gsumme FROM Abt WHERE Anr = 17; IF gsumme <> summe THEN <Fehlerbehandlung>; Änderungstransaktion INSERT INTO Pers (Pnr, Anr, Gehalt) VALUES (4567, 17, 55. 000); UPDATE Abt SET Gehaltssumme = Gehaltsumme + 55. 000 WHERE Anr = 17;
Synchronisation (5) Konsistenzebenen in SQL: Konsistenzebenen Dirty Read Non–Repeatable Read Phantome Read Uncommitted + + + Read Committed - + + Repeatable – Read - - + Serializable - - - SET TRANSACTION READ ONLY, ISOLATION LEVEL READ COMMITTED
Client-Server Prinzip Zentraler Datenbestand auf den mehrere Clients Zugriff haben
Verteilte Datenbanken Der Datenbestand wird in verteilten Datenbank Management Systemen (VDBMS) physisch auf mehrer Knote (Rechnern) verteilt
Zwei-Phasen-Commit-Protokoll l l Ausgehend von verteilten Transaktionen auf unterschiedlichen Knoten im Netz sollen nach dem “alles oder nichts“-Prinzip entweder alle Transaktionen oder keine Transaktion durchgeführt werden. Dies wird in verteilten Datenbanken durch das Zwei-Phasen -Commit-Protokoll unterstützt
Oracle – DB - System • Oracle Version 1 erschien 1979 • derzeit aktuell: Version 10 g • das Oracle System besteht aus dem Oracle – Server und verschiedenen Tools zur Steuerung und Erzeugung von Oracle – Datenbanken • Oracle Precompiler wie PRO*C oder PRO*COBOL die den Zugriff auf Oracle – DBs aus anderen Programmier – sprachen unterstützen • Oracle unterstützt direkt PL/SQL und Java
lauffähiges System • ein Oracle – DB – System setzt sich aus den unabhängigen Teilsystemen Instanz und Datenbank zusammen • auf einem Server können mehrere Instanzen und Datenbanken gleichzeitig aktiv sein • ein lauffähiges System besteht aber immer aus einer Instanz und einer angeschlossenen Datenbank
Zusammensetzung einer Instanz • System Global Area (SGA) • Serverprozesse • Hintergrundprozesse - Database Writer - Process Monitor
System Global Area (SGA) • prozessübergreifender Speicherbereich • 3 Komponenten: - Database Buffer Cache zum Zwischenspeichern von Datenbankblock-Kopien (zur Performance-Steigerung) - Redo Log Buffer zur Protokollierung von Änderungen auf dem Database Buffer Cache - Shared Pool enthält geparste SQL-Anweisungen, kompilierte PL/SQL-Anweisungen und Datenbank-Trigger
Data Dictionary • besondere Tabellen in der Datenbank • bei Erzeugen einer neuen DB legt Oracle System und DB-Informationen als Tabellen in der Datenbank selbst ab • enthält Informationen über Benutzer und alle zur Funktionsfähigkeit der Datenbank notwendigen Informationen
SQL*Plus • von Oracle entwickeltes interaktives Werkzeug zum Zugriff auf Oracle - Datenbanken • in Oracle - System integriert (seit Version 3), Vorgänger war UFI (User. Friendly. Interface) • äquivalent zu "isql" in Sybase and SQLServer, "db 2" in IBM DB 2, "mysql" in My. SQL
Benutzung von SQL*Plus • aus dem Betriebssystem wird mit dem Kommando SQLPLUS [Benutzer[/Paßwort][@Datenbankname]] [Dateiname [Parameter 1. . . ]] die interaktive Umgebung gestartet und an der angegebenen Datenbank angemeldet • nach dem Anmelden erscheint eine Eingabeaufforderung ‘SQL>‘ und das System ist zur Annahme von Anweisungen bereit
Benutzung von SQL*Plus (2) • es können alle SQL – Anweisungen verwendet werden • es können auch Dateien aufgerufen werden, die bereits SQL – Anweisungen enthalten • anonyme PL/SQL – Blöcke können eingegeben werden und werden sofort ausgeführt • es können auch PL/SQL – Dateien und Stored. Procedures aufgerufen und ausgeführt werden • Transaktionen beginnen mit der ersten SQL – Anweisung und enden mit dem Schlüsselwort COMMIT
SQL*Plus Befehlspuffer • SQL*Plus legt jede aktuell eingebene SQL – Anweisung bzw. jeden PL/SQL – Block im Befehlspuffer ab • der Inhalt des Befehlspuffers läßt sich anzeigen und editieren • die zuletzt eingegebene Zeile wird als aktuelle Zeile betrachtet und mit einem ‘*‘ markiert
Beispiel SQL*Plus Befehlspuffer SQL> run 1 select name 2 from person 3* where nname like 'MOR%'; ERROR at line 3: ORA-00904: invalid column name SQL> c/nname/name 3* where name like 'MOR%' SQL>run 1 select name 2 from person 3 where name like 'MOR%'; NAME ------------------MORLEY MOROSCO. . .
Procedural Language / SQL (PL/SQL) • integraler Bestandteil von Oracle seit Version 6 • Erweiterung von SQL durch prozedurale Elemente • Syntax ähnelt Ada • ist in allen Oracle-Produkten verfügbar • lässt sich auch in Client-Programmen in anderen Programmiersprachen einsetzen (C, C++, Ada, Cobol, Fortran, Pascal) • erlaubt DML - Befehle aber keine DDL - Befehle
PL/SQL Code Beispiel declare anzahl number(3); begin SELECT count(*); INTO anzahl FROM person; end; --------------------------------PL/SQL procedure successfully completed
Verarbeitung von PL/SQL • Entwicklung und Aufruf von PL/SQL-Blöcken erfolgt z. B. in interaktiven Umgebungen wie SQL*Plus • Verarbeitung erfolgt durch PL/SQL-Prozessor im Server oder im Client • aus anderen Programmiersprachen heraus wird über RPC der Code an den PL/SQL-Prozessor im Server übergeben • SQL-Anweisungen im PL/SQL-Code werden an den SQLProzessor weitergegeben, der das Ergebnis zurückgibt
Einschub : Variablen - Typen • PL/SQL unterstützt folgende elementare Datentypen: - char, varchar, number, boolean, date, rowid, raw • und folgende strukturierte Datentypen: - PL/SQL Table: eine Tabellenspalte mit einem bestimmten Datentyp - Record • Datentyp von Variablen muss vor der Verwendung bekannt sein
Elemente von PL/SQL • anonyme Blöcke • Prozeduren • Funktionen • Packages • Trigger Stored Procedures
Anonymer Block • kann nicht aus anderen PL/SQL-Programmen aufgerufen werden • wird nicht in der Datenbank abgelegt • wird direkt nach Eingabe ausgeführt declare begin exception end; /*Deklarationsteil*/ /*Anweisungsteil*/ /*Exceptionteil*/
Prozeduren / Funktionen • wie anonyme Blöcke, besitzen aber Definitionsteil function | procedure | trigger Name [Parameterliste] /*Definitionsteil*/ is /*Deklarationsteil*/ begin /*Anweisungsteil*/ exception /*Exceptionteil*/ end;
Prozeduren / Funktionen (2) • sind jederzeit aufrufbar und besitzen ein Parameterliste zur Übergabe von Aufrufparametern • mit dem Schlüsselwort CREATE können Prozeduren und Funktionen in der Datenbank erzeugt und kompiliert gespeichert werden (Stored. Procedures)
Packages • dienen zur Strukturierung von umfangreichem Programmtext • Zusammenfassung von logisch zusammengehörigen Variablen, Typdefinitionen, Prozeduren und Funktionen Diese können von anderen PL/SQL-Objekten referenziert werden • objektorientiert: Definition von öffentlichen und privaten Objekten, dadurch Kapselung von Daten
Stored. Procedures • da Funktionen und Prozeduren kompiliert in der Datenbank vorliegen, entfällt die Übersetzungszeit beim Aufruf • bei Zugriff auf eine Stored. Procedure wird diese in den SGA geladen und steht allen DB-Benutzern zur Verfügung bis sie aus dem SGA verdrängt werden (LRU-Algorithmus) • da das neue Laden in den SGA Zeit kostet, können wichtige SPs auch explizit im SGA gehalten werden
Vorteile von PL/SQL • bessere Performance bei mehreren aufeinander folgenden DB-Zugriffen, wenn Anwendungsprogramm und Oracle-Server auf verschiedenen Rechnern laufen begin insert into test 1; select from. . . ; insert into test 2. ; end; PL/SQL Blockübergabe Server
Trigger • Trigger sind in PL/SQL oder SQL programmierte Objekte, die wie Stored. Procedures in der Datenbank gespeichert sind • ein Trigger gehört immer zu einer Tabelle und kann nur implizit aufgerufen werden, kann zur Integritätssicherung eingesetzt werden • der Aufruf erfolgt vor (BEFORE) oder nach (AFTER) einer Insert -, Update – oder Delete - Operation auf einer Tabelle • Trigger können Stored. Procedures, weitere Trigger, DML und DDL – Anweisungen benutzen • zwei Typen: Zeilen - und Anweisungstrigger
(Zeilen-) Trigger Beispiel TRIGGER historie_trg after INSERT or UPDATE or DELETE on film FOR EACH ROW begin if INSERTING then prc_ins_syshist( ‘FILM‘ , ‘I‘, : new. film_id); end if; if UPDATING then prc_ins_syshist( ‘FILM‘ , ‘U‘, : new. film_id); end if; if DELETING then prc_ins_syshist( ‘FILM‘ , ‘D‘, : old. jahr, : old. genre); end if;
Triggertypen • Zeilentrigger werden für jeden Datensatz, den die DML Operation einfügt, verändert oder löscht einmal aktiviert • Anweisungstrigger sind unabhängig von den Attributwerten der einzelnen Datensätze und reagieren nur auf die durchzuführende DML – Anweisung
Anwendungsbeispiel Trigger • über Anweisungstrigger lassen sich Berechtigungen im Mehrbenutzerbetrieb realisieren • durch einen BEFORE - Anweisungstrigger, der z. B. einen Semaphor implementiert, können kritische Tabellenbereiche geschützt werden • so können z. B. Dirty - Reads verhindert werden, da immer nur ein Nutzer kritische Tabelleninhalte verändern kann
SQL – Constraints • SQL – Constraints sind direkt an Spalten in Tabellen gebunden und werden bei Erzeugung einer Tabelle mit dem Schlüsselwort CONSTRAINT definiert CREATE table personal ( pnr Personalnummer, ght Gehalt, PRIMARY KEY (pnr), CONSTRAINT ght > 5000, ) • Constraints haben keine ‘Programmeigenschaften‘
Constraints vs. Trigger • reguläre Constraints haben keine 'Programmelemente', reine atomare Prüfungen • Trigger können auch zur Integritätsprüfung verwendet werden, sind aber wesentlich mächtiger als Constraints • es ist umstritten, ob man Trigger zur Integritätssicherung einsetzen sollte oder nicht
Quellen und Literatur • Heuer, Saake : Datenbanken: Konzepte und Sprachen (c) 2000 mitp Verlag • Türscher : PL/SQL (c) 1997 Springer – Verlag • http: //www. orafaq. com • http: //www. oracle. com • DIS – Skript 2003 N. Ritter, Uni – Hamburg • VSS – Skript 2003 W. Lamersdorf / G. Gryczan, Uni – Hamburg • Oracle / SQL – Tutorial http: //www. db. cs. ucdavis. edu University of California
- Slides: 62