Vorlesung Wissensreprsentation Prof G Brewka Ontologien Eine Einfhrung
Vorlesung „Wissensrepräsentation“ Prof. G. Brewka Ontologien - Eine Einführung Formale Ontologie & Semantic Web Frank Loebe frank. loebe@informatik. uni-leipzig. de Abt. Intelligente Systeme Institut für Informatik Universität Leipzig IMISE, University of Leipzig
Übersicht • Historische Motivation • Begriffsbestimmung Box: neues Them • Anwendungen • Einteilungen • Top-level Ontologien • Ontologie im / und Semantic Web • Forschungsbereiche Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 2
Ontologie: intuitiv • ähnlich konzeptueller Modellierung bei Software-Entwicklung • gegeben: eine Domäne oder Aufgabe • Frage: Worüber (= über welche Entitäten / Dinge /. . . ) ist dabei zu sprechen? • Bsp: Domäne Uni-Sommerkurs – – Personen, Studenten, Lesende, Professoren, Tafeln, . . . Kurse, Vorlesungen, Übungen, Vorlesungsbesuche, . . . Termine, Hörsäle, . . . Themen, Probleme, Theoreme, . . . Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 3
Historische Motivation: Wiederverwendbarkeit von Wissensbasen • 1980 er: diverse WBS, Austausch nur durch Rekodierung • Probleme: – verschiedene Repräsentationssprachen & Dialekte – fehlende Kommunikationsstandards (für Austausch zw. WBS) – unterschiedliche Terminologie / Konzeptualisierung / Ontologie • im Ergebnis: Interesse an – Standardsprachen – Ontologie Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme [Neches et al. , 1991] 4
Semantic Web • ca. 2000 -2001: Vision des Semantic Web – Hauptziel: Anreicherung der Informationen im Internet, um diese besser automatisiert verarbeiten zu können – Bsp. : Einkauf im Web über Agenten • Ontologie(n) als Schlüsseltechnologie • derzeit: Web 2. 0 – Ergänzung oder Gegenspieler des Semantic Web ? Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme [W 3 C, 2000] 5
Begriffsbestimmung • Drei Leseweisen für „Ontologie“ 1. ) philosophisch: – Fach Ontologie 2. ) informatisch / in KI: – Ontologie als Begriffssystem 3. ) Spezialfall von 2. ): Ontologie im Semantic Web: – Ontologie als Technologie Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 6
Begriffsbestimmung: Ontologie (I) • Philosophie: Fach „Ontologie“ (Ontology) – – – etymologisch: aus dem Griechischen „ontos“ – Sein „logos“ – Lehre, Wort Lehre vom Sein / Seienden Systeme grundlegender Kategorien oft reduktionistisch • Definitionen: – „As a first approximation, ontology is the study of what there is. “ [Hofweber, 2004, SEP] – „Theorie kategorialer Folgerungen“ [Seibt, 2004] – „. . . the systematic, formal, axiomatic development of the logic of all forms and modes of being. ” [Cocchiarella, 1991] Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 7
Beispiel: Kategoriensystem Substance material Body animate Living sensitive Animal rational Human Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme immaterial Spirit inanimate Mineral insensitive Plant irrational Beast [Sowa, 2000] 8
Begriffsbestimmung: Ontologie (II) • „eine Ontologie“ in der Informatik (ontology) – Spezifikation / Theorie von Begriffen und deren Zusammenhängen – Zweck: gemeinsames / geteiltes Verständnis • Definitionen – „. . . an explicit specification of a conceptualization. “[Gruber, 1993] – „. . . an ontology defines a set of representational primitives with which to model a domain of knowledge or discourse. “ [Gruber, 2008] – „An ontology is a logical theory accounting for the intended meaning of a formal vocabulary, i. e. , its ontological commitment to a particular conceptualization of the world. “ [Guarino, 1998] Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 9
Tutorialbeispiel: Pizza-Ontologie (in Protege) Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme [http: //www. co-ode. org/resources/tutorials/protege-owl-tutorial. php] 10
Abgrenzungen • Ontologien vs. Wissensbasen – ontologisch: • Wenn X ein Objekt ist, kann X kein Prozess sein. – dagegen nicht: • John ist 80 kg schwer. • Um das Essen auszuwählen, wird zuerst die Karte studiert. • Ontologische/Terminologische Fakten – – – [Brachman, Levesque, 2004] Unterkategorien / Spezialisierung Student is-a Person Disjunktheit Student und Vorlesung Überdeckung (Exhaustiveness) Mann, Frau für Person Typrestriktionen für Relationen nur Personen lehren inverse Relationen versch. Relationseigenschaften, z. B. Transitivität, Symmetrie Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 11
Übersicht ü Historische Motivation ü Begriffsbestimmung • Anwendungen • Einteilungen • Top-level Ontologien • Ontologie im / und Semantic Web • Forschungsbereiche Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 12
Anwendungen (I) • Medizin & Biologie: Terminologien & Ontologien – ICD: K 09. 0 • • K 00 -K 93 Krankheiten des Verdauungssytems K 00 -K 14 Krankheiten der Mundhöhle, der Speicheldrüsen und der Kiefer K 09. - Zysten der Mundregion, anderenorts nicht klassifiziert K 09. 0 Entwicklungsbedingte odontogene Zysten (u. a. Keratozyste) – SNOMED, GALEN, FMA, UMLS. . . – OBO: Open Biomedical Ontologies • Gene Ontology, Mouse Anatomy, Celltype Ontology, . . . Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 13
Bsp. : UMLS (Auszug) Entity Physical Object Organism Plant Alga Fungus Virus. . . Substance. . . Conceptual Entity Idea or Concept. . . Finding Language. . . Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme Event Activity Behavior Social Behavior. . . Machine Activity Phenomenon / Process Human caused P/P Natural P/P Biologic Funct. Pathologic F. . Injury or Poisoning 14
Anwendungen (II) • Anwendungszwecke – – – korrekte Wiederverwendung von Informationen & Softwarekompon. Fehlererkennung / -vermeidung Vereinfachung von Datenintegration und Interoperabilität „semantische“ Verarbeitung, z. B. semantische Suche Grundlage/Ergänzung für Methoden der Domänenmodellierung • Anwendungsgebiete – – – Knowledge Engineering & Representation *-Integration (Datenintegration, Unternehmensintegration, . . . ) Wissensmanagement Konzeptuelle Modellierung, Datenbankentwurf Sprachverarbeitung Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 15
Einteilung von Ontologien • Ontologie: – Spezifikation / Theorie von Begriffen und deren Zusammenhängen • historisch gewachsen im KI-Bereich – Aufgaben-Ontologie + Domänenontologie = Anwendungsontologie • „Spezifikation“ nach Formalisierungsgrad • „Begriffe“ nach Allgemeinheitsgrad nach Domäne (Bio-, Medizin-, Business-, . . . Ontologien) • außerdem: linguistische Ontologien z. B. Wordnet Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 16
Ontologie-Arten: nach Formalisierung informal • informal – Begriffsliste, (kontrolliertes) Vokabular, Katalog, Glossar – ggf. auch: Text • Begriffshierarchie – Taxonomie, Nomenklaturen – z. B. ICD, UNSPSC, . . . • semiformal – Thesaurus, semantisches Netz, UML- oder ER-Diagramme – z. B. FMA, Me. SH, Word. Net, . . . • formal – formalisierte logische Theorie, z. B. in FOL, DL – z. B. SNOMED, GALEN formal Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 17
Ontologie-Arten: nach Allgemeinheit • Top-level-Ontologie – Kategorien für die meisten Anwendungsbereiche – Bsp. : Objekt – Prozess – Qualität • Kern-Ontologie (Top-Domänen-Ontologien) – Kategorien für einen größeren Anwendungsbereich – Bsp. : Mensch – Krankheit – Größe • Domänen-Ontologie – Kategorien für einen spezifischen Anwendungsbereich – Bsp. : Leukozyt – chronisch lymphatische Leukämie Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 18
Top-level Ontologie(n) • Ziel: Charakterisierung von Begriffen, auf die meisten Domänen zurückgreifen allgemeinste Begriffe • Themen: – Individuen und Kategorien – Objekte, Prozesse – Eigenschaften, Relationen – Raum, Zeit – Situationen, Fakten • Mereologie (Teil-Ganzes Beziehung) • Kausalität – Rollen, Funktionen – Löcher – Repräsentation, Symbole, Information – Granularität. . . • Systeme: BFO, (tlw. CYC), DOLCE, GFO, SUMO, . . . • Abgrenzung – allgemeinste Begriffe, keine Commonsense-Wissensbasis (z. B. CYC) – linguistische Ontologien: Word. Net Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 19
General Formal Ontology (GFO) • Darstellungen – informal: • Report “General Formal Ontology (GFO): A Foundational Ontology Integrating Objects and Processes“ (v 1. 0. 1: 2007) • weitere Publikationen – formal: tlw. Axiomatisierungen • in FOL: ca. 300 Formeln (Axiome, Definitionen, Folgerungen) • in OWL: 77 Klassen, 67 Relationen http: //www. onto-med. de/ontologies/gfo. owl • Status – begonnen ca. 1999 – ständige Erweiterung & Weiterentwicklung – erste Anwendungen neue Anforderungen Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 20
General Formal Ontology (GFO) Grundeinteilungen Kategorien und Klassen Individuen* Entitäten Raum und Zeit Qualitäten und Relationen Objekte und Situationen Prozesse . . . Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 21
GFO Kategorien-Hierarchie (2006) entity category immanent conceptual symbolic universal structure persistant property relation space-time entity spatial entity time entity space spatial region boundary time region boundary topoid chronoid Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme concrete entity quality relator formal material relator (relational) role material structure material boundary material object individual presential configuration occurrent process change situation situoid 22
GFO Grundrelationen (2006) formal relator element-of boundary projection instantiation at association framing ontical connectedness abstract part-of constituent part-of spatial part-of location occupation chron top participation relativized part-of projection fillsrole boundary-of role-of has-quality right boundary value-of inherence temporal part-of Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme extension space left boundary coincidence congruence 23
Übersicht ü Historische Motivation ü Begriffsbestimmung ü Anwendungen ü Einteilungen ü Top-level Ontologien • Ontologie im / und Semantic Web • Forschungsbereiche Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 24
Ontologie im / und Semantic Web • Prinzipien für das Semantic Web – – Identifizierbarkeit über URIs Semantische Typisierung von URIs Partielle Informationen Open World Assumption keine globale Konsistenz erwartet / angestrebt • Ontologie: – RDF: Ontologien als Graphen – Web Ontology Language OWL: Ontologien als Beschreibungslogik. Theorien Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme [W 3 C, 2000] 25
OWL Ontologien (technologisch) • OWL – Standard seit 2004 (OWL 1. 0) – OWL 1. 1 bereits definiert • mittlerweile recht ausgereifte Systeme zur Unterstützung – Ontologie-Editoren, z. B. Protege – Beweiser für OWL • Anwendung als Technologie – Datenmodell wird als „Ontologie“ ausgedrückt – Beweiser übernimmt bestimmte Aufgaben, z. B. • Klassifikation: Inferenz der Taxonomie • Konsistenzprüfung – Kombination mit Abfrage-Sprachen (wie SPARQL) Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 26
OWL (formal): Beschreibungslogik • Beschreibungslogiken (DLs): – Repräsentationsformalismen – für terminologisches Wissen – gesucht: DLs mit „guten“ Berechenbarkeitseigenschaften, effizient implementierbar Bsp. : • Modellierungsprimitive – Konzepte (unäre Prädikate) – Rollen (binäre Prädikate) – Konstruktoren / Konstruktionen (ALCUE = S, HOINQRF) – OWL 1. 0 - SHOIN – OWL 1. 1 - SROIQ Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 27
Ontologie-Forschung • Problemfeld: Ontologie-Erstellung – Ontological Engineering • Methodologien zur Ontologie-Erstellung • Ontologie-Editoren / Verwaltungstools – Lernen / Verfeinerung von Ontologien • Problemfeld: Ontologie-Integration – Vergleiche, Abbildungen, kombinierte Verwendung – Suche nach weitgehend automatischen Verfahren • Problemfeld: Ontologie-Verwaltung – Modularisierung – Versionierung – Evaluation Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 28
Zusammenfassung • Definitionen – Ontologie vs. Ontologien, Semantic Web Ontologien • Hintergrund & Zielstellung – semantische Interoperabilität – Wiederverwendbarkeit unterstützen (z. B. von Software) • Anwendungsbereiche – vielfältig, viele Systeme derzeit in Biologie & Medizin • Einteilungen – nach Formalisierungsgrad (weniger relevant für SW) – nach Allgemeinheit der Inhalte (Top-level. . . Domänenontologien) • Semantic Web Ontologien – werden erfasst in OWL, basieren auf Beschreibungslogik Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme 29
Referenzen • • Cocchiarella, Nino 1991 „Formal Ontology“, In: Handbook of Metaphysics and Ontology, p. 640647, Philosophia. Guarino, Nicola 1998 „Formal Ontology and Information Systems“, In: FOIS Proceedings, p. 315, IOS Press. Gruber, Tom 1993 „A Translation Approach to Portable Ontology Specifications”, Knowledge Acquisition 5(2): 199 -220. Gruber, Tom 2008 „Ontology“, to appear in: Encyclopedia of Database Systems, Springer. Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme • • • Herre et al. , 2007 General Formal Ontology (GFO) – A Foundational Ontology Integrating Objects and Processes, Version 1. 0. 1 (draft). University of Leipzig. Neches et al. , 1991 „Enabling Technology for Knowledge Sharing”, AI Magazine 12(3): 36 -56. Seibt, Johanna 2004 pers. Kommunikation. Sowa, John F. 2000 „Knowledge Representation“, Brooks/Cole. W 3 C 2000 (Berners-Lee, Tim) „Semantic Web – XML 2000“, Slides. 30
- Slides: 30