GIWorkshop Grundlagen von Datenbanken Anwendung von Quellenbeschreibungen zur
GI-Workshop „Grundlagen von Datenbanken“ Anwendung von Quellenbeschreibungen zur Integration Digitaler Bibliotheken Eike Schallehn, Martin Endig 13. -16. Juni 2000 Otto-von-Guericke-Universität Magdeburg Institut für Technische und Betriebliche Informationssysteme Postfach 4120 D-39016 Magdeburg
Gliederung • Einordnung des Projektes – Problemdarstellung • Lösungsansatz – Architektur • Adapterebene – Quellenbeschreibung – Ergebnis Transformation • Stand der Projektarbeit • Zusammenfassung und Ausblick Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13. -16. Juni 2000 2
Einordung des Projektes • Projekttitel: „Föderierungsdienste für heterogene Dokumentenquellen“ • Teilprojekt von „Global Info“ – Förderkonzept von BMBF • Laufzeit: 2 Jahre • Ziel: Föderierungsdienst zur Literaturrecherche • Zusammenarbeit mit: – verschiedenen Universitäten – Verlagen Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13. -16. Juni 2000 3
Problemdarstellung • Begriffsbestimmung – bibliographische Metadaten zu Publikationen – Beispiel: Autoren, Titel, Jahr, Verlag, . . . • Vielzahl von Datensammlungen vorhanden – auf bestimmte Anwendungsbereiche beschränkt – herstellerspezifisch – unterschiedliche Granularität • Problem für den Benutzer – Wissen über Ort, Qualität, . . . zu Referenzen erforderlich • Ziel: einheitliche Zugriffsschnittstelle Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13. -16. Juni 2000 4
Allgemeine Lösungsarchitektur Einheitliche Benutzerschnittstelle Arbeitsbereiche Höherwertige Dienste Föderationsdienste Föderierungsebene Adapter Springer Spektrum Verlag Adapter . . . DBN Adapter Generierung/ Implementierung DBLP Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13. -16. Juni 2000 5
Adapterebene (1) • einheitlicher Zugriff auf Datenquellen – Überwindung der Heterogenität • Generelle Unterteilung von Datenlieferanten – kooperative / nicht kooperative • unterschiedliche Adapter erforderlich – Web. JDBC für nicht kooperative Datenlieferanten – XML Adapter für kooperative Datenlieferanten • für Adapter Implementierung von Bedeutung – verteilte Anfragebearbeitung – Anfrageergebnis Transformation Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13. -16. Juni 2000 6
Adapterebene (2) FRA QL Query Processor Source Description Query Translator Result Translator. . . XML Parser XSLT . . . Query Evaluator. . . Eike Schallehn Martin Endig XML GI-Workshop „Grundlagen von Datenbanken“ 13. -16. Juni 2000 7
Quellenbeschreibung (1) • Zugriff auf lokale Datenquellen hängt ab von: – Fähigkeit der Quelle – lokale Anfrageschnittstelle • Beispiel: Internet-Quellen – Konstantenselektion ( a > 5 ) – vordefinierte Vergleichsoperatoren Ô entsprechende Beschreibung erforderlich – Attribute + mögliche Vergleichsoperatoren – Kombination von möglichen Attributen Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13. -16. Juni 2000 8
Quellenbeschreibung (2) • Mögliche Beschreibung von Quellen: • Beispiel: Src. Desc 1 = ({( Book. Store, { (authors, {=}), (title, {=}) }, { {authors}, {title}, {authors, title} } )}) Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13. -16. Juni 2000 9
Quellenbeschreibung (3) select * from Publications where title=´ODBMS´ and authors=´Saake´ or authors=´Heuer´; (Book. Store) Eike Schallehn Martin Endig (Book. Store) (Books) GI-Workshop „Grundlagen von Datenbanken“ 13. -16. Juni 2000 (Books) 10
Ergebnis Transformation (1) • XML zum Datenaustausch von Metadaten – kooperative Datenlieferanten – Lieferanten-spezifische DTD – unterschiedliche Schemata und Datenmodelle vorhanden Ü Transformation in interne DTD erforderlich – Bearbeitung der Anfrageergebnis auf Föderierungsebene – Format in Anlehnung an objekt-relationales Modell • Anwendung von XSLT im Adapter – Stylesheet Sprache zur Transformation – spezifische XSLT Informationen erforderlich Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13. -16. Juni 2000 11
Ergebnis Transformation (2) Beispielanfrage: Ergebnis: <ROWSET> <ROW num=„ 1“> select * <ID>1</ID> from Publications <TITLE>ODBMS</TITLE> where tilte like ´ODBMS´; <AUTHORS>Heuer, A. </AUTHORS> </ROW>. . . </ROWSET> Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13. -16. Juni 2000 12
Ergebnis Transformation (3) <xsl: stylesheet version="1. 0"> <xsl: template match="ROWSET"> <COLLECTION> <RESULTSET> <xsl: apply-templates select="ROW"> </xsl: apply-templates> </RESULTSET> </COLLECTION> </xsl: template> <xsl: template match="ROW"> <RECORD> <xsl: apply-templates select="ID"> </xsl: apply-templates> <xsl: apply-templates select="TITLE"> </xsl: apply-templates> </RECORD> </xsl: template>. . . Eike Schallehn Martin Endig . . . <xsl: template match="TITLE"> <FIELDVALUE> <xsl: attribute name="name"> TITLE </xsl: attribute> <xsl: value-of select=". "/> </FIELDVALUE> </xsl: template>. . . </xsl: stylesheet> GI-Workshop „Grundlagen von Datenbanken“ 13. -16. Juni 2000 13
Ergebnis Transformation (4) <COLLECTION> <RESULTSET tablename="PUBLICATIONS"> <RECORD> <FIELDVALUE name="ID"> 1 </FIELDVALUE> <FIELDVALUE name="TITLE"> ODBMS </FIELDVALUE> <FIELDVALUE name="AUTHORS"> Heuer </FIELDVALUE> </RECORD>. . . </RESULTSET> </COLLECTION> Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13. -16. Juni 2000 14
Stand der Projektarbeit • Anwendung von FRAQL für Föderationsdienste – Anfragesprache für objekt-relationale DB Föderation – Erweiterung von SQL • Implementierung von verschiedenen Adaptern • XML Adapter für kooperative Datenlieferanten – Integration der Quellenbeschreibung – Implementierung XML/XSLT-Transformation Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13. -16. Juni 2000 15
Zusammenfassung und Ausblick • Anwendung von Konzepte aus Bereich föderierter DB zur Integration von Digitale Bibliotheken – Verwendung einer bekannten Architektur Ô Adapter Ebene zum Zugriff auf verschiedene Quellen • 2 Aspekte zur Adapter Implementierung wichtig – Quellenbeschreibung + Anfragebearbeitung – Ergebnis Transformation auf Basis von XML/XSLT • Integration der Quellenbeschreibung in FRAQL • Bereitstellung weiterer Adapter (z. B. für Z 39. 50) Eike Schallehn Martin Endig GI-Workshop „Grundlagen von Datenbanken“ 13. -16. Juni 2000 16
- Slides: 16