Einfhrung in XML und Techniken U Altmann Institut

  • Slides: 25
Download presentation
Einführung in XML und Techniken U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Einführung in XML und Techniken U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Entwicklung von XML z XML ye. Xtensible Markup Language y. Subset von SGML Standard

Entwicklung von XML z XML ye. Xtensible Markup Language y. Subset von SGML Standard Generalized Markup Language y. Jedes XML Dokument ist ein SGML Dokument aber nicht umgekehrt U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Entwicklung von XML z HTML y. Formale Strukturierung von Texten y. Darstellung der Dokumente

Entwicklung von XML z HTML y. Formale Strukturierung von Texten y. Darstellung der Dokumente im Vordergrund y. Statische Tag Definitionen - keine Modifikationen durch den Benutzer y. DTD nicht individuell sondern nur für Versionen ybegrenzte inhaltliche Erschließung von Dokumenten U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Entwicklung von XML z XML y. Zwischen SGML und HTML yeinfacher als SGML yumfassender

Entwicklung von XML z XML y. Zwischen SGML und HTML yeinfacher als SGML yumfassender als HTML yinsbesondere für Anwendungen im Internet y. Anwendungen xfür die Speicherung und Strukturierung von Dokumenten xals Austauschformat bei Kommunikationsstandards U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Entwicklung von XML z Entwicklungsziele von XML y. Programme zur Verarbeitung von XML Dokumenten

Entwicklung von XML z Entwicklungsziele von XML y. Programme zur Verarbeitung von XML Dokumenten sollen leicht zu entwickeln sein x. Ziel - eine Woche Trainingszeit für Studenten y. Optionale Variationen sollten so gering wie möglich gehalten werden - ideal keine y. XML Dokumente sollen in gleicher Weise für Mensch und Maschine lesbar sein y. Konzepte für XML Dokumente sollen einfachen Regeln folgen und kurz und bündig sein U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Grundlagen von XML z XML Dokumente bestehen aus y. Markup xstart-tags, end-tags, empty-element tags

Grundlagen von XML z XML Dokumente bestehen aus y. Markup xstart-tags, end-tags, empty-element tags xentity references, character references xcomments, x. CDATA section delimiters (nicht die Inhalte) xdocument type declarations xprocessing instructions y. Character Data xalles andere xauch Attributwerte, sofern. Institut Typ für als solcher deklariert U. Altmann, Medizinische Informatik, Gießen, 2000

Grundlagen von XML y. Markup von Elementen xeingeschlossen in < > x. Anfangs -

Grundlagen von XML y. Markup von Elementen xeingeschlossen in < > x. Anfangs - Markup <Diagnose> x. Ende - Markup </Diagnose> x. Anfangs- und Ende - Markup sind stets erforderlich - wesentlicher Unterschied zu SGML - y. Markup von leeren Elementen xohne Ende Markup <Diagnose/> U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Grundlagen von XML z MARKUP in XML y. MARKUP mit & verweisen auf ersetzbare

Grundlagen von XML z MARKUP in XML y. MARKUP mit & verweisen auf ersetzbare Informationsobjekte (Entities) < &chap 1; ymit & gekennzeichnete Verweise sind entweder in XML definiert (&lt) oder müssen im DTD definiert werden (&chap 1) y. Document Type Deklarationen werden in < > Markup eingeschlossen <!DOCTYPE Document SYSTEM [ ]> U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Grundlagen von XML z MARKUP in XML y. MARKUP beginnt stets mit < oder

Grundlagen von XML z MARKUP in XML y. MARKUP beginnt stets mit < oder & und endet mit > y. Diese Zeichen dürfen daher im Text nicht erscheinen < - &lt & - &amp y. Diese Zeichen sollten ebenfalls nicht verwendet werden > - &gt ‘ - &apos “ - &quot U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Grundlagen von XML z XML Dokumente Ein Informationsobjekt ist ein XML Dokument wenn es

Grundlagen von XML z XML Dokumente Ein Informationsobjekt ist ein XML Dokument wenn es entweder genügt yden in einer Dokument Type Definition beschriebenen Anforderungen - Valid document yden allgemeinen Anforderungen an XML Dokumente - wellformed document U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Grundlagen von XML z Document Type Definitions (DTD) ydefinieren die Struktur des Dokuments yenthalten

Grundlagen von XML z Document Type Definitions (DTD) ydefinieren die Struktur des Dokuments yenthalten Hinweise für die Verarbeitung z XML Parser yprüfen die Verträglichkeit des Dokuments mit der DTD - Valid Document yersetzen (sofern verarbeitbar) die sogenannten Entitäten U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Grundlagen von XML z Zeichensatz in XML Dokumente y. Unicode (ISO 10646) als Standardzeichensatz

Grundlagen von XML z Zeichensatz in XML Dokumente y. Unicode (ISO 10646) als Standardzeichensatz x. Default Zeichensatz ist ISO 10646 UTF-8 xandere Zeichensätze müssen deklariert werden ( encoding =“UTF-16“ ) xschließt ASCII Zeichensatz unverändert ein xumfaßt alle internationalen Zeichensätze x. UTF 16 -2 kann auch symbolorientierte Sprachen darstellen U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Grundlagen von XML z Kommentare in XML z <!--Dies ist ein Kommentar--> y. Beginnen

Grundlagen von XML z Kommentare in XML z <!--Dies ist ein Kommentar--> y. Beginnen mit <!-y. Enden mit --> y-- innerhalb von Kommentaren nicht erlaubt U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Grundlagen von XML z Verarbeitungs- (Processing) Instruktionen z <? AUDIO ‘Herztöne‘? > y. Beginnen

Grundlagen von XML z Verarbeitungs- (Processing) Instruktionen z <? AUDIO ‘Herztöne‘? > y. Beginnen mit <? Name y. Enden mit ? > ywerden an die Applikation übergeben y„Name“ darf nicht mit „xml“ beginnen <? xml für System reserviert yjedes XML Dokument beginnt mit der Verarbeitungsanweisung <? xml version=“ 1. 0“ ? > Institut für U. Altmann, Medizinische Informatik, Gießen, 2000

Grundlagen von XML z CDATA Bereiche z <![CDATA [ <tag 1><tag 2> ] ]

Grundlagen von XML z CDATA Bereiche z <![CDATA [ <tag 1><tag 2> ] ] > y. Beginnen mit <! [CDATA [ y. Enden mit ]]> ykeine Verarbeitung durch XML Prozessoren ybenutzt für Beispiele, Quellcode etc. ykeine hierarchische Strukturierung (nesting) möglich U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

XML und zugehörige Techniken z Problem Präsentation y Darstellung von Inhalten z Problem Analyse

XML und zugehörige Techniken z Problem Präsentation y Darstellung von Inhalten z Problem Analyse / Abruf von Information y Wie beschreibe ich Zugriffswege? z Problem Manipulation y standardisiertes API z Problem Vielfalt y semantische Vergleichbarkeit vs. Vielfalt von Tags und Attributen z Problem Struktur y Einschränkungen der DTD Ausdrucksmöglichkeiten U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

XML und zugehörige Techniken XPath XLink XSLT Transformation XSL-FO Präsentation Inhalt Namespace XML XPointer

XML und zugehörige Techniken XPath XLink XSLT Transformation XSL-FO Präsentation Inhalt Namespace XML XPointer Struktur XML SCHEMA XQL Abfrage U. Altmann, Institut für Medizinische Informatik, Gießen, 2000 DOM RDF

XML und zugehörige Techniken z XML Techniken (Auswahl) y Standardisierte Methoden für die Manipulation

XML und zugehörige Techniken z XML Techniken (Auswahl) y Standardisierte Methoden für die Manipulation von XML Dokumenten (Document Object Model, DOM), y Verknüpfen von XML Dokumenten (XLink), y Abfragen von Informationen in XML Dokumenten (XPointer, XPath, XQL, XML-QL), y Umformen von XML Dokumenten (XML style language and transformation XSLT) y Darstellung von Information mit sog. Style Sheets (XSL-FO, CSS). z Standardisiert (Recommendation): y u. a. XML, DOM Level 1, XPath, XSLT y http: //www. w 3. org U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Namespaces z Ziele y. Sollen ermöglichen, daß Dokumente aus verschiedenen Quellen gemeinsam verarbeitet werden

Namespaces z Ziele y. Sollen ermöglichen, daß Dokumente aus verschiedenen Quellen gemeinsam verarbeitet werden können y. Zur Vermeidung von Überschneidungen der Element, Attribut etc. Bezeichnungen werden vor die lokalen Namen Präfixe gesetzt, die lokale Anwendung identifizieren - Qualified Names y. Namespace Deklaration wird als Attribut in einer der Eröffnungsdeklarationen definiert und gilt für das gesamte Dokument U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

XML Schema z DTD‘s haben sich bei XML Anwendungen als zu inflexibel erwiesen. z

XML Schema z DTD‘s haben sich bei XML Anwendungen als zu inflexibel erwiesen. z Datentypen konnten nicht definiert werden z Abfolge von Elemente war relativ fixiert und nur über Kardinalitätsoperatoren zu beeinflussen z DTD‘s konnten nicht in XML beschrieben werden - eigene Sprache U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

XML Schema z XML Schema y. Teil 1 - Struktur von Dokumenten xerweiterter und

XML Schema z XML Schema y. Teil 1 - Struktur von Dokumenten xerweiterter und flexiblerer „DTD“ Ansatz x. Schema Import und Einfügung vorgesehen y. Teil 2 - Datentypen x. Primitive Datentypen x. Built-in Derived Datatypes x. User Derived Datatypes U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

XPath - XLink - XPointer z XPath y. Zugriff auf Teile (Knoten) eines Dokumentes

XPath - XLink - XPointer z XPath y. Zugriff auf Teile (Knoten) eines Dokumentes y. Grundlage für / Verwendung in weiteren Techniken (XLink, XPointer, XSLT) z XLink y. Zugriff auf andere Dokumente x. Anker <a> nicht notwendig yunterstützt auch mehrdirektionale Links z XPointer ykann auch Bereiche markieren U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

XML Stylesheet Language (XSL) z XSLT - Transformation Language y. Umformung von XML Dokumenten

XML Stylesheet Language (XSL) z XSLT - Transformation Language y. Umformung von XML Dokumenten in andere Dokumente (XML, HTML, Text) y. Nahezu alle Formen der Umformung zugelassen (Änderung der Reihenfolge, Weglassen und Hinzufügen von Daten und Texten etc. ) z XSL - Formatting Language y. Zuordnung eines Ausgabeformates zu einem XSLT Dokument U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Einführung in XML in Übungen z Elemente von XML-Dokumenten z Unterschied XML / HTML

Einführung in XML in Übungen z Elemente von XML-Dokumenten z Unterschied XML / HTML z Einsatzmöglichkeiten z Beschreibungsmöglichkeiten z Verarbeitungsmöglichkeiten U. Altmann, Institut für Medizinische Informatik, Gießen, 2000

Einführung in XSLT und XPath z Zentrale Rolle von XPath z Rolle von XSLT

Einführung in XSLT und XPath z Zentrale Rolle von XPath z Rolle von XSLT in der Zusammenführung unterschiedlich strukturierter Dokumente ähnlichen Inhalts z Festigung des Verständnisses von XMLStrukturelementen z Abgrenzung zu Document Object Model (DOM) U. Altmann, Institut für Medizinische Informatik, Gießen, 2000