ECM Enterprise Content Management Konzepte und Techniken rund

  • Slides: 64
Download presentation
ECM – Enterprise Content Management Konzepte und Techniken rund um Dokumente 2009 / 1.

ECM – Enterprise Content Management Konzepte und Techniken rund um Dokumente 2009 / 1. Auflage Kapitel 2 / Capture - XML © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Gliederung § XML- Historie, Ziel, Position zu HTML § Struktur und Syntax § XPath,

Gliederung § XML- Historie, Ziel, Position zu HTML § Struktur und Syntax § XPath, XQuery, Ablage © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Warum XML ? XML ist die einzige Möglichkeit, die Vielzahl der Daten, Anwendungen und

Warum XML ? XML ist die einzige Möglichkeit, die Vielzahl der Daten, Anwendungen und Geräte des E-Business zu verwalten © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Historische Entwicklung © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien

Historische Entwicklung © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Entwicklungsmotive § Zwei Motive haben die Entwicklung von XML ausgelöst: § Die seit 1969

Entwicklungsmotive § Zwei Motive haben die Entwicklung von XML ausgelöst: § Die seit 1969 für die Beschreibung von Dokumentenstrukturen verwendete Standard Generalized Markup Language SGML war zu komplex. § HTML als die einflussreichste aus SGML abgeleitete Auszeichnungssprache erwies sich wegen des weitgehend fixierten Satzes von Elementtypen als zu starr © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XML-Beispiel Quelle: GS 1 Germany © Wolfgang Riggert | ECM – Enterprise Content Management

XML-Beispiel Quelle: GS 1 Germany © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XML-Merkmale § § § XML ist ein offener Standard XML basiert auf selbstbeschreibenden Merkmalen

XML-Merkmale § § § XML ist ein offener Standard XML basiert auf selbstbeschreibenden Merkmalen (Kontext als auch Inhalt) XML ist leicht erlernbar XML ist leicht sowohl von Rechnern als auch von Menschen zu lesen XML Dokumente sind leicht erweiterbar XML ist plattform- und anwendungsunabhängig © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XML als Integrationswerkzeug Business-to. Consumer Transaktion EDI VS. Inhaltsverteilung © Wolfgang Riggert | ECM

XML als Integrationswerkzeug Business-to. Consumer Transaktion EDI VS. Inhaltsverteilung © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Kommunikation zwischen Anwendungen Quelle : Hochberg, SAG-Symposium, 2000 Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XML-Dokumententypen Projektdaten existierende Datenbanken Briefe kj flsjd kjs lskjlkj lskjd lksjl fslk jdlksj fksjdlkjlkjf

XML-Dokumententypen Projektdaten existierende Datenbanken Briefe kj flsjd kjs lskjlkj lskjd lksjl fslk jdlksj fksjdlkjlkjf lskjdlkjf slkjkj flskdjljdkfj s lkjlkjlsd s dfl skjd f slkdjflskdj lslkjdflk lskjd lfksjdlk lskdjfl aölskjdfölskdjf söldkfjlskdj föaslkdjlskdjf ösldkfjlskd föalskdj zentrales Datenmanagement ksjdlfkjslkjd Fax Edmund Boister Minimillennium Minga Kunden# 08/15 -4711 Sehr geehrte Damen und Herren! Bitte fakturieren Sie folgenden Auftrag: # Beschreibung Audio Listen Video E-Mails kjfskdjfl lkjfkjdflks kjlfkjslkjkjl Bilder © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags asdasd fa sdf asdfsdf asdf sdfsd asdas ddas(asdsad) asdasdasdsdasdsdasdassdsdasds dassdasd(werwe) sdasdaskjl lkjf ölkjglkdf jgs kjlkfjgölkfjg lkdfjg ldkfjglö dkfjlgdkk sdksldjfslkdf laskjdkdjf lskdj sd hflaksjdhf skk fksjdlfj öalsjdlfksjdf slkd lksdjf slkdfjlkdj aölskdjf slkjlj öa södlfjlkd föjkal slkdf lkjflksjdföa ljls df lskjd flkj llksd fjlakkjshd fkahlkh kshd flaksh kj flkahksjd flkajkjsh flkajsh dfkj h ksj fksjdhf la Prozessbeschreibungen Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XML für verschiedene Layouts und Geräte Wetterdaten Drucker CD Bild Bericht News Ticker Internet

XML für verschiedene Layouts und Geräte Wetterdaten Drucker CD Bild Bericht News Ticker Internet © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Frankfurt: Wind 4 WNW / Rain / 22°C Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XML - Überblick § Einordnung – Demo-Video © Wolfgang Riggert | ECM – Enterprise

XML - Überblick § Einordnung – Demo-Video © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XML: Trennung von Content und Layout § Darstellung der logischen Struktur von Dokumenten §

XML: Trennung von Content und Layout § Darstellung der logischen Struktur von Dokumenten § Layoutinformationen davon separat Quelle: Roland Boendgen © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XML-Strukturphilosophie © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des

XML-Strukturphilosophie © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XML-Nutzen § XML Tags § erlaubt selbstbeschreibende Daten § XML Programming Interface § arbeitet

XML-Nutzen § XML Tags § erlaubt selbstbeschreibende Daten § XML Programming Interface § arbeitet mit jedem Programmiermodell zusammen § XML Style Sheets § erleichtert die Personalisierung von Informationen § XML Document Type Definitions § gestattet eine Dokumentenbeschreibung für unterschiedlichste Belange Quelle : Viljoen, SAG-Symposium, 2000 © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Struktur von XML Im Mittelpunkt stehen Dokumente © Wolfgang Riggert | ECM – Enterprise

Struktur von XML Im Mittelpunkt stehen Dokumente © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

HTML vs. XML HTML XML Struktur Festgelegt durch Struktur-Tags. Dokumentstruktur bestimmt Anordnung der Tags.

HTML vs. XML HTML XML Struktur Festgelegt durch Struktur-Tags. Dokumentstruktur bestimmt Anordnung der Tags. Nicht erweiterbar. Festlegung einer eigenen Struktur durch selbstdefinierte Tags. Anordnung der Tags bestimmt Struktur des Dokuments. Beliebig erweiterbar. Inhalt Wird vom Autor festgelegt. Tags dienen der Formatierung des Textes zwischen den Tags. Dynamischer Zugriff auf den Text ohne Hilfsmittel nicht möglich. Wird vom Autor festgelegt. Tags beinhalten den Text des Dokuments. Dynamischer Zugriff durch spezielle Zugriffsmethoden auf den Inhalt der Tags möglich. Darstellung Zentral im HTML Dokument durch Tags, die Formatanweisungen enthalten Formatanweisungen sind ausgelagert in externe Datei © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Darstellung von XML-Dokumenten § HMTL Seiten nutzen vordefinierte Tags für die Formatierung – der

Darstellung von XML-Dokumenten § HMTL Seiten nutzen vordefinierte Tags für die Formatierung – der Browser interpretiert diese § XML zeichnet sich durch eine unendliche Menge möglicher Tags aus – daher ist es unmöglich ein definiertes Layout für diese Tags im Browser festzulegen § XSL (Extensible Stylesheet Language) ist ein Zusatzstandard, der XML-Dokumente formatiert und mit bedingten Anweisungen ausgeben kann © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Gliederung § XML- Historie, Ziel, Position zu HTML § Struktur und Syntax § XPath,

Gliederung § XML- Historie, Ziel, Position zu HTML § Struktur und Syntax § XPath, XQuery, Ablage © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Besonderheiten § Anwender definieren ihre eigenen Tags oder greifen auf öffentlich verfügbare Tagmengen zurück,

Besonderheiten § Anwender definieren ihre eigenen Tags oder greifen auf öffentlich verfügbare Tagmengen zurück, die für verschiedene Anwendungsbereiche angeboten werden. § Inhaltliche Strukturen lassen sich in beliebiger Tiefe schachteln § Die verwendeten Tagnamen lassen einen Rückschluss auf die Bedeutung der Daten zu. Dagegen wird die Darstellung nicht explizit festgelegt. § XML erlaubt die Festlegung externer Bezüge für ein Dokument. Derartige Referenzen werden aufgelöst und durch die entsprechende Entität ersetzt. Mittels Referenzen werden Entitäten in einem Dokument bei Bedarf mehrfach verwendet. Auf diese Weise lässt sich ein XML-Dokument aus vorgefertigten Teilen zusammensetzen. © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Informationseinheiten § Elf Typen von Informationseinheiten werden unterschieden: § Dokument § Element § Attribut

Informationseinheiten § Elf Typen von Informationseinheiten werden unterschieden: § Dokument § Element § Attribut § Verarbeitungsanweisung § Entitätsreferenz § Zeichen § Kommentar § Dokumenttyp-Deklaration § Ungeparste Entität § Notation § Namensraum © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Bedeutung der Informationseinheiten § Die wichtigsten Komponenten in der sich der Inhalt widerspiegelt, sind

Bedeutung der Informationseinheiten § Die wichtigsten Komponenten in der sich der Inhalt widerspiegelt, sind Elemente und Attribute. § Das XML-Dokument ist als Baum strukturiert mit einer Wurzel, die alle Elemente umschließt © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XML-Syntax § Um wohlgeformt zu sein, muss ein Dokument syntaktische Regeln der XML-Grammatik erfüllen.

XML-Syntax § Um wohlgeformt zu sein, muss ein Dokument syntaktische Regeln der XML-Grammatik erfüllen. § Dabei gilt: § Jedes wohlgeformte Dokument beginnt mit einem Prolog, dem mindestens ein Element folgt. § Danach sind Kommentare oder Verarbeitungsanweisungen erlaubt. § Hinter dem Prolog beginnen die XML-Daten in Form eines Baumes aus Elementen und Attributen. § Das erste Element ist das Wurzelelement, das alle anderen Elemente einschließt © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XML-Deklaration - Video § XML-Deklaration © Wolfgang Riggert | ECM – Enterprise Content Management

XML-Deklaration - Video § XML-Deklaration © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XML - Baum © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu

XML - Baum © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Aufbau eines XML-Dokumentes Bestandteile eines XML-Dokumentes Vorspann DTD (intern oder extern) XML © Wolfgang

Aufbau eines XML-Dokumentes Bestandteile eines XML-Dokumentes Vorspann DTD (intern oder extern) XML © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XML-Dokumentenstruktur © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des

XML-Dokumentenstruktur © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XML-Dokumentenbeispiel © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des

XML-Dokumentenbeispiel © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XML-Dokument - Baum § XML definiert Baumstruktur! § Wurzel heißt Dokumentelement § Blattelemente enthalten

XML-Dokument - Baum § XML definiert Baumstruktur! § Wurzel heißt Dokumentelement § Blattelemente enthalten Werte § Einziger Datentyp: Zeichenkette © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XML - Objekte § XML nennt seine Objekte Elemente § Elemente sind begrenzt durch

XML - Objekte § XML nennt seine Objekte Elemente § Elemente sind begrenzt durch Tags § Tagnamen sind "case-sensitive" § Jedes geöffnete Tag muss auch wieder geschlossen werden § Tags dürfen einander nicht überlappen; nicht erlaubt z. B. : <A> <B> </A> </B> § Tags leerer Elemente haben besondere Syntax: <A/> (Shortcut für <A> </A>) § Tags können Attribute enthalten: <A Attributname="Wert". . . > </A> § Eine korrekte Schachtelung ist notwendig (anders als in HTML). XML-Elemente dürfen nicht überlappen. © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Vorspann eines XML-Dokumentes § version § gegenwärtig nur 1. 0, 1. 1 § falls

Vorspann eines XML-Dokumentes § version § gegenwärtig nur 1. 0, 1. 1 § falls zukünftig weitere Versionen als Empfehlung vom W 3 C verabschiedet werden, dann ermöglicht der Parameter die Verarbeitung verschiedener Versionen. § encoding (optional) § Kodierung des Dokuments, Beispiele (UTF-8 – auch Defaultwert, UTF 16 - müssen ebenfalls alle XML-Prozessoren unterstützen). § standalone (optional) § 'yes' - spezifiziert, dass dem Dokument eine externe Markup-Deklaration (DTD oder XML-Schema) zugeordnet wird, sonst 'no' § Defaultwert 'no'‚ wenn externe Deklaration definiert ist und standalone nicht angegeben ist © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Beispiele - Vorspann <? XML version="1. 0" encoding="UTF-8" standalone="yes"> <? XML version="1. 0" encoding="UTF-16"

Beispiele - Vorspann <? XML version="1. 0" encoding="UTF-8" standalone="yes"> <? XML version="1. 0" encoding="UTF-16" standalone="no"> <!DOCTYPE tourismus-infos SYSTEM "tourismus. dtd"> © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XML - Grammatik © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu

XML - Grammatik © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Grammatik - Besonderheiten § Anders als bei HTML ist auf Groß- und Kleinschreibung zu

Grammatik - Besonderheiten § Anders als bei HTML ist auf Groß- und Kleinschreibung zu achten. Ein Name muss mit einem Buchstaben, einem Unterstrich oder einem Doppelpunkt beginnen § Elemente sind mit beliebig vielen Attributen definierbar, mit Paaren von Attributname und Attributwert § Jedes angegebene Attribut muss einen Wert haben, der in Hochkommata oder Anführungszeichen eingeschlossen ist. Mehrere Attribute werden durch Leerzeichen getrennt. § Ob in einer Dokumentenstruktur ein Objekt besser als Element oder Attribut behandelt wird, obliegt dem Anwender © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Grammatik - Namensräume § Die freie Namenswahl bei Elementen und Attributen wirft Probleme auf,

Grammatik - Namensräume § Die freie Namenswahl bei Elementen und Attributen wirft Probleme auf, wenn die gleichen Namen mit unterschiedlicher Bedeutung verwendet werden. § <beitrag> kann Mitgliedsbeiträge oder Artikel für eine Zeitschrift bedeuten. § Um Mehrdeutigkeiten zu vermeiden, ordnet man Namensräumen zu. Diese werden durch eine eindeutige URI-Referenz identifiziert. § Der URI wird über ein xmlns-Attribut ein Präfix zugeordnet: <mitglieder xmlns: mtg=„http: //mitglieder. de/organisation“> Ein Element dieses Namensraums wird wie folgt angesprochen: <mtg: beitrag>100</mtg: beitrag> © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Aufbau von XML-Dokumenten 1 Komponenten eines Buchs © Wolfgang Riggert | ECM – Enterprise

Aufbau von XML-Dokumenten 1 Komponenten eines Buchs © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Elemente eines XML Dokuments Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Aufbau von XML-Dokumenten 2 <order> <customer>Meyer</customer> <position> <isbn>1 -234 -56789 -0</isbn> <number>2</number> <price currency=´Euro´>30.

Aufbau von XML-Dokumenten 2 <order> <customer>Meyer</customer> <position> <isbn>1 -234 -56789 -0</isbn> <number>2</number> <price currency=´Euro´>30. 00</price> </position> </order> Elemente und Attribute hierarchische Schachtelung Sequenz © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags <content> XML builds on the principles of two existing languages, <emph>HTML </emph> and <emph>SGML </emph> to create a simple mechanism. . The generalized markup concept. . </content> Markup in Volltexten Mixed Content Elemente Quelle: Viele der folgenden Folien basieren auf Meike Klettke, UNI Rostock Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Syntax von Elementen /1 Ein Element besteht aus: • Start-Tag • Ende-Tag und •

Syntax von Elementen /1 Ein Element besteht aus: • Start-Tag • Ende-Tag und • Elementinhalt Beispiel: <vortragender> Ronald Bourret </vortragender> Start-Tag © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Elementinhalt Ende-Tag Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Syntax von Elementen /2 Leere Elemente sind möglich: Beispiel: <koordinaten/> Elemente können verschachtelt werden:

Syntax von Elementen /2 Leere Elemente sind möglich: Beispiel: <koordinaten/> Elemente können verschachtelt werden: Start-Tag <vortragender> Elementinhalt <name>Bourret</name> Ende-Tag <vorname>Ronald</vorname> </vortragender> © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Graphische Darstellung von XML-Dokumenten • XML-Dokumente sind Bäume! • Beispiel: <vortragender> <name>Bourret</name> <vorname>Ronald</vorname> </vortragender>

Graphische Darstellung von XML-Dokumenten • XML-Dokumente sind Bäume! • Beispiel: <vortragender> <name>Bourret</name> <vorname>Ronald</vorname> </vortragender> • korrekte Schachtelung der Elemente notwendig Elementknoten Textknoten © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Document Type Definition § Einordnung von Dokumenten in Kategorien, macht Dokumente unterscheidbar § Entscheidend

Document Type Definition § Einordnung von Dokumenten in Kategorien, macht Dokumente unterscheidbar § Entscheidend dafür sind die Elemente, die das jeweilige Dokument enthält § Um Elemente, die zu einem Dokument gehören zu definieren, verwendet man in XML die DTD © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Schemabeschreibung - DTD § Darstellung, welche Elemente auftreten können und wie sie geschachtelt werden

Schemabeschreibung - DTD § Darstellung, welche Elemente auftreten können und wie sie geschachtelt werden § Deklaration von Strukturinformationen § Vorteile einer DTD: § Entspricht einer Dokumentation für die XML-Dokumente § Anwendungen können darauf reagieren § Fehler in XML-Dokumenten können erkannt werden § Oft: bessere Qualität der XML-Dokumente, weil durchdachteres Vorgehen § PCDATA = Parsed Character Data © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Definition von Elementen in einer DTD XML-Dokument: <vortragender> Ronald Bourret </vortragender> Zugehörige DTD: <!ELEMENT

Definition von Elementen in einer DTD XML-Dokument: <vortragender> Ronald Bourret </vortragender> Zugehörige DTD: <!ELEMENT vortragender (#PCDATA)> XML-Dokument: <vortragender> <name> Bourret </name> <vorname> Ronald </vorname> </vortragender> Zugehörige DTD: <!ELEMENT vortragender (name, vorname)> <!ELEMENT name (#PCDATA)> <!ELEMENT vorname (#PCDATA)> © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Definition von Elementen in einer DTD (Inhaltsmodelle) • Sequenz (A , B) A und

Definition von Elementen in einer DTD (Inhaltsmodelle) • Sequenz (A , B) A und B müssen in der angegebenen Reihenfolge im Dokument auftreten • Alternative (A | B) entweder A oder B treten im Dokumente auf • Wiederholung A? - 0. . 1 Mal A+ - 1. . n Mal A* - 0. . n Mal • Mixed Content (#PCDATA | B)* A, B oder beliebiger Text treten im Dokument auf © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS <!ELEMENT hotel (name, adresse)> <!ELEMENT name (#PCDATA)> <!ELEMENT adresse (plz, ort, ((strasse, nummer? ) | postfach))> <!ELEMENT beschreibung (#PCDATA | ausstattung | gastronomie)*> Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Beispiele zur Definition von Elementen in einer DTD /1 <!ELEMENT hotel (name, adresse)> <hotel>

Beispiele zur Definition von Elementen in einer DTD /1 <!ELEMENT hotel (name, adresse)> <hotel> <name>Hotel am Leuchtturm</name> <adresse>. . . </adresse> </hotel> © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Beispiele zur Definition von Elementen in einer DTD /2 <!ELEMENT adresse (plz, ort, ((strasse,

Beispiele zur Definition von Elementen in einer DTD /2 <!ELEMENT adresse (plz, ort, ((strasse, nummer? ) | postfach))> <adresse> <plz>18119</plz> <ort>Warnemuende</ort> <strasse>Seestrasse</strasse> <nummer>12</nummer> </adresse> <plz>18051</plz> <ort>Rostock</ort> <postfach>12345</postfach> </adresse> © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Beispiele zur Definition von Elementen in einer DTD /3 <!ELEMENT beschreibung (# PCDATA |

Beispiele zur Definition von Elementen in einer DTD /3 <!ELEMENT beschreibung (# PCDATA | ausstattung | gastronomie)*> <beschreibung>Das Hotel am Leuchtturm befindet sich direkt am Alten Strom, mit Blick auf die Hafeneinfahrt, die Mole und den Strand. </beschreibung> <beschreibung>Unser Hotel verfügt über eine <ausstattung> Sauna </ausstattung> und eine <ausstattung> Meerwasserschwimmhalle </ausstattung>. Das <gastronomie> Hotelrestaurant</gastronomie> bietet regionale Küche und Fischspezialitäten. </beschreibung> © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Syntax von Attributen /1 Attribute werden einem Element des XML-Dokumentes zugeordnet: Attributwert Attributname <vortragender

Syntax von Attributen /1 Attribute werden einem Element des XML-Dokumentes zugeordnet: Attributwert Attributname <vortragender tutorial=´T 1´> Ronald Bourret </vortragender> Start-Tag Elementinhalt Ende-Tag Zugehörige DTD: <!ELEMENT vortragender (#PCDATA)> <!ATTLIST vortragender tutorial CDATA #REQUIRED> © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Syntax von Attributen / 2 XML-Dokument <koordinaten x=´ 200´ y=´ 300´ z=´ 150´ />

Syntax von Attributen / 2 XML-Dokument <koordinaten x=´ 200´ y=´ 300´ z=´ 150´ /> DTD <!ELEMENT koordinaten (EMPTY)> <!ATTLIST koordinaten x CDATA #REQUIRED y CDATA #REQUIRED z CDATA #IMPLIED > © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Darstellung von XML-Dokumenten • XML-Dokumente sind Bäume! Beispiel: <vortragender tutorial=´T 1´> <name>Bourret</name> <vorname>Ronald</vorname> </vortragender>

Darstellung von XML-Dokumenten • XML-Dokumente sind Bäume! Beispiel: <vortragender tutorial=´T 1´> <name>Bourret</name> <vorname>Ronald</vorname> </vortragender> vortragender tutorial name vorname T 1 Ronald Elementknoten Textknoten Attributknoten © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de Bourret

Deklaration von Attributen in einer DTD Attribute haben § einen Namen § einen Typ

Deklaration von Attributen in einer DTD Attribute haben § einen Namen § einen Typ (CDATA, IDREF/IDREFs, ENTITY/ENTITYS, NMTOKEN/NMTOKENS oder (wert 1|wert 2|. . . ) Aufzählung möglicher Werte § eine Angabe, ob das Attribut auftreten muss (#REQUIRED, #IMPLIED oder #FIXED) oder § einen optionalen Defaultwert (bei #FIXED ist dieser auch erforderlich) © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS <!ATTLIST preis waehrung CDATA #REQUIRED> <!ATTLIST projekt id ID #REQUIRED> <!ATTLIST person projekt IDREF #REQUIRED> <!ATTLIST plz xml-sqltype CDATA#FIXED ´INTEGER´> Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Zusammenfassung der DTD-Deklarationen © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu

Zusammenfassung der DTD-Deklarationen © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

DTD-Elementdeklaration © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des

DTD-Elementdeklaration © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

DTD-Attributdeklaration © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des

DTD-Attributdeklaration © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

DTD-Attributdeklaration - Beispiel © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu

DTD-Attributdeklaration - Beispiel © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Beispiel: Bookstore © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien

Beispiel: Bookstore © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

DTD-Deklarationsformen © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des

DTD-Deklarationsformen © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Beispiel – externe Deklaration © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen

Beispiel – externe Deklaration © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Kommentare § können in DTDs und in XML-Dokumenten auftreten § Kommentare lassen sich durch

Kommentare § können in DTDs und in XML-Dokumenten auftreten § Kommentare lassen sich durch Applikationen auswerten (z. B. mit XML-Prozessoren, XSLT) § Syntax: <!-- Dies ist ein Beispielkommentar --> © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XML-Editoren - Video § XML-Editoren © Wolfgang Riggert | ECM – Enterprise Content Management

XML-Editoren - Video § XML-Editoren © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Gliederung § XML- Historie, Ziel, Position zu HTML § Struktur und Syntax § XPath,

Gliederung § XML- Historie, Ziel, Position zu HTML § Struktur und Syntax § XPath, XQuery, Ablage © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XML-Zugriff Quelle: Gorke, 2006 © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen

XML-Zugriff Quelle: Gorke, 2006 © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XPath Quelle: Gorke, 2006 © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen

XPath Quelle: Gorke, 2006 © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

XQuery Quelle: Gorke, 2006 © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen

XQuery Quelle: Gorke, 2006 © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de

Materialien Den Ablauf einer Bestellung unter Verwendung von XML zeigt eine Simulation IBM stellt

Materialien Den Ablauf einer Bestellung unter Verwendung von XML zeigt eine Simulation IBM stellt unterschiedliche Tutorials bereit (in englisch) XML-Tutorial (in deutsch) und ein zweites XML-Tutorial (in deutsch) Die UNI Rostock bietet einen Foliensatz zum Thema Videos und Tutorials bietet Stylusstudio Empfehlenswertes Online-Buch Tutorials zu XML-Begleitstandards © Wolfgang Riggert | ECM – Enterprise Content Management Zusatzinformationen zu Medien des Vieweg+Teubner Verlags Vieweg+Teubner. PLUS Vieweg+Teubner Verlag | Wiesbaden 2009 www. viewegteubner. de