Wissensorganisation revisited Objekt Begriff Benennung Wissen und Information
Wissensorganisation revisited Objekt – Begriff Benennung Wissen und Information Zukunft des Thesaurus? Keine gute Webanwendung ohne klare Informationsstrukturierung und Datenmodell SKOS – Simple Knowledge Organisation System Spree WS 2009/2010 Die meisten Informationssysteme scheitern wegen ungeeigneter (naiver) Datenmodelle
Abgrenzung des Faches Problem der Disziplin KO „There exists no closed „universe of knowledge“ that can be studied by KO in isolation from all the other sciences‘ study of reality. “ Hjorland 2008 Spree WS 2009/2010 Seminar I-Prax: Inhaltserschließung visueller Medien, 5. 10. 2004
Aufgaben und Funktionen der Wissensorganisation Lebenszyklus von Information und Wissen Spree WS 2009/2010 Aufgaben Sammeln und erfassen Wiederauffinden Evaluieren Auswählen Verstehen Weiterverarbeiten Analysieren Anwenden Umorganisieren Wiederverwenden Seminar I-Prax: Inhaltserschließung visueller Medien, 5. 10. 2004
Zugriffe auf Informationen Ordnungsansätze 1. 2. 3. 4. 5. 6. 7. 8. IT ? ? Entity-Relationship Ansatz Relationale Datenbank Templates (Markup-Sprachen) Katalogisierung und Metadaten Gruppierung und Präsentation / Klassifikation Altmodische Wissensorganisation „Bibliothekskram“ ? ? Vom Begriff zur Terminologie / Thesaurus Ausblick: Semantic Web (mit)denkende Maschinen Spree WS 2009/2010 Zukunftstechnologien ? ? Seminar I-Prax: Inhaltserschließung visueller Medien, 5. 10. 2004
Geordnet Essen Beispiel 1. Schritt: Gegenstandsanalyse • Welche Aussagen können wir über diesen Gegenstand machen? Was wäre in Zukunft interessant über ihn zu wissen? • Quelle: http: //www. helmut. friedrichsessen. de/rezepte%202003/Rez. %20 als%20 bild%202003/italienischer %20 apfelkuchen. jpg Spree WS 2009/2010 Seminar I-Prax: Inhaltserschließung visueller Medien, 5. 10. 2004
Entity-Relationship-Modell E-R Beschreibung von Objekten durch Statements: Entities und Relationships Nahrungsmittel hat. Name hat. Beschreibung hat. Zubereitungszeit ist_ein Nahrungsmittel hat. Zutat Nahrungsmittel geeignet_fuer Nahrungsmittel … … … Spree WS 2009/2010 Text Zeit Dauer Nahrungsmittel [Apfelkuchen ist eine Backware] (Nahrungmittel, Menge [Anzahl, Einheit]) Diät [fettarm, salzarm, diabetikergeeignet, koscher] Seminar I-Prax: Inhaltserschließung visueller Medien, 5. 10. 2004
Relationale Datenbank relational In Datentabellen werden Daten zu einer Relationship festgehalten. Die Informationen über die Objekte können auf viele Tabellen verteilt sein. Mit Hilfe einer Query-Language, die einen begrenzten Logikvorrat besitzt, können die Informationen wieder gewonnen werden. idnahrung 1 2 3 4 name Ulis Apfelkuchen Bratapfelkuchen Apfelplitzen Tarte tatin Zuberee itungsze it_min 60 90 20 45 tabelle_name_zeit idnahrung diaet 1 1 2 3 4 Salzarm Vollkost Diabetiker Koscher tabelle_diaet Idzutat Zutat idnahrungs mittel Apfel 1 2 3 AND idnahrung. name_zeit = idnahrhung. diaet 1 1 1. . 8 Schmalz 1 AND diaet=‘koscher` Tabelle_zutat Anfrage: SELECT name FROM name_zeit, diaet WHERE zubereitungszeit_min > 45 Spree WS 2009/2010 Seminar I-Prax: Inhaltserschließung visueller Medien, 5. 10. 2004
Template / Markup template Die Auszeichnung (Markierung) von Informationen ist nichts Neues. Unstrukturierete Daten können mit Markup-Sprachen ausgezeichnet und damit strukturiert werden. Satzanweisungen und Korrekturvorschriften : mit ausführlicher Beispielsammlung / hrsg. von der Dudenredaktion und der Dudensetzerei. -- Mannheim : Bibliographisches Institut, © 1969. -- 187 S. : Ill. -(Duden-Taschenbücher ; 5/5 a). Nach Payer: http: //www. payer. de/xml 01. htm#1. Spree WS 2009/2010 Seminar I-Prax: Inhaltserschließung visueller Medien, 5. 10. 2004
Template / Markup template Unstrukturierete Daten können mit Markup-Sprachen ausgezeichnet und damit für eine strukturierte Suche zugänglich gemacht werden. <? xml version="1. 0" encoding="ISO-8859 -1"? > <nahrungsmittel> <nahrungsname>Ulis Apfelkuchen</nahrungsname> <beschreibung>fluffiger, saftiger Apfelkuchen nach Hausfrauenart</beschreibung> <zubereitungszeit> <zeitangabe>60</zeitangabe><zeiteinheit>Minuten</zeiteinheit> </zubereitungszeit> <zutat> <nahrungsname>Mehl</nahrungsname><menge>500</menge><einheit>g</einheit> <nahrungsname>Milch</nahrungsname><menge>250</menge><einheit>ml</einheit> </zutat> </nahrungsmittel> </xml> Spree WS 2009/2010 Seminar I-Prax: Inhaltserschließung visueller Medien, 5. 10. 2004
Metadaten und Katalogisierung metadaten „Daten über Daten“ können in Katalogen festgehalten werden. Damit Metadaten ausgetauscht werden könnten, sind Regelwerke entstanden: Ein Regelwerk schreibt vor: • was aus der Vorlage abgeschrieben werden soll • wie abgeschrieben werden soll (Reihenfolge u. ä. ) • worunter gesucht werden kann (Zugangspunkte, access points) • in welcher Form das Suchbare erfasst werden soll (Ansetzung) • wie geordnet werden soll. Title Das Regelwerk RAK kennen die BIM-Absolvent. Innen Creator von Ihnen. Aber auch der DC-Standard ist ein rudimentäres Regelwerk Subject <dc: title>Ulis Apfelkuchen</dc: title> <dc: creator>Spree, Ulrike</dc: creator> <dc: description>fluffiger, saftiger Apfelkuchen nach Hausfrauenart</dc: description> <dc: subject>Rezept</dc: subject> Beispiel: DC-Metadaten Spree WS 2009/2010 Format Identifier Source Description Language Publisher Relation Contributor Coverage Date Rights type Die 15 DC Elemente Seminar I-Prax: Inhaltserschließung visueller Medien, 5. 10. 2004
Klassifikation klassifikation Klassifikationen erlauben die geordnete Präsentation (real oder virtuell) von Objekten nach bestimmten Eigenschaften. Gericht Zubereitungsart Herkunftsregion Zutaten Gebäck Suppe Beilage Süßspeisen Backen Kochen Braten Dünsten Deutschland • Bayern • Bremen • Hamburg • … • Schlesien Obst • Äpfel • Birnen Spanien • Andalusien • Rioja Unser Objekt Spree WS 2009/2010 Fleisch • Rindfleisch • Schweinefleisch • Kangeroofleisch Kann klassiert werden, aber nicht alle Metadaten der Beschreibung finden Berücksichtigung. Seminar I-Prax: Inhaltserschließung visueller Medien, 5. 10. 2004
Thesaurus thesaurus Klassifikationen erlauben die geordnete Präsentation (real oder virtuell) von Objekten nach bestimmten Eigenschaften, aber wir benötigen Benennungen, um über Konzepte reden zu können. Thesauri ordenen Begriffe und ihre natürlichsprachigen Benennungen. Apfel SN Frucht des Apfelbaums (Malus communis), der zur Familie der Rosengewächse zählt EN Apples BT Kernobst RT Malus RT Apfelsaft RT Obst aus gemaessigten Breiten UF Holzapfel SN Scope note EN English BT Broader Term RT Related Term UF Used for Nach: Agrovoc http: //www. fao. org/aims/ag_intro. htm Wieso nicht NT? In Topic Maps oder in RDF/SKOS können konzeptionelle und terminologische Beziehungen computerlesbar kodiert werden. Spree WS 2009/2010 Seminar I-Prax: Inhaltserschließung visueller Medien, 5. 10. 2004
Zwischenresümee resumee Für welche Aufgabe/Anwendungsgebiet/Usecase würden Sie welcher Methode den Vorrang geben? Rezepte im Internet präsentieren Englische und deutsche Medizinterminologie vergleichbar machen … Spree WS 2009/2010 Seminar I-Prax: Inhaltserschließung visueller Medien, 5. 10. 2004
Ausblick: Semantic Web / Expertensysteme Semantic web Computer können die Bedeutung (Semantik) von Informationen interpretieren und weiter verarbeiten. Formalisierung von Aussagen in einer Wissensbasis: Ist ein Klarapfel zum Backen geeignet? - Kochäpfel sind: - gross = mind. 100 g pro Stück - haben einen hohen Säuregehalt Begriffliche - dürfen auch mehlig sein Festlegung - geeignet für Backen - geeignet für Kochen - Klarapfel ist_ein Kochapfel - Kochapfel ist eine Apfelart Übrigens: teilweise können Suchmaschinen das leisten. Nur wie. Beispiel: http: //de. ask. com/ Spree WS 2009/2010 Kochapfel UF Apfelart NTI Klarapfel Terminologische Festlegung Seminar I-Prax: Inhaltserschließung visueller Medien, 5. 10. 2004
Fazit Die aufgeführten Methoden und Techniken sind nicht getrennt voneinander zu Ordnungsansätze betrachten, sondern im Gegenteil: Die besten Ergebnisse werden durch integriertes Vorgehen erreicht. Entity-Relationship Ansatz Relationale Datenbank Templates (Markup-Sprachen) Katalogisierung und Metadaten Gruppierung und Präsentation / Klassifikation Vom Begriff zur Terminologie / Thesaurus Ausblick: Semantic Web (mit)denkende Maschinen Spree WS 2009/2010 Seminar I-Prax: Inhaltserschließung visueller Medien, 5. 10. 2004
Forschungstrends forschungstrends ØInteroperabilität ØSemantic Tools: Thesauri & Co. (SKOS) ØMetadatencrosswalks ØGatewayss, digitale Bibliotheken Ø Von der Klassifikation nach Disziplinen zur Klassifikation nach Aufgaben ØOrientierung am Arbeitsplatz ØUmgang mit Interdisziplinarität und Transdisziplinarität Ø formal logisch basierte Klassifikationsmodelle Ø Künstliche Intelligenz Ø Suchmaschinen Ø Qualität von Wissensorganisation und Information Retrieval im Internet Ø Mehrsprachigkeit Ø Berücksichtigung sozio-kultureller Unterschiede ØEthnische Minderheiten ØSozial benachteiligte Gruppen Spree WS 2009/2010 Quelle: López-Huertas: Some current Research Questions… In: Knowl. Org. 35(2008), S. 113 -136 Seminar I-Prax: Inhaltserschließung visueller Medien, 5. 10. 2004
Quellen und weiterführende Ressourcen Quellen / Ressourcen Die Idee zu dieser Präsentation basiert weitgehend auf dem hervorragenden Skript Dagobert Soergel: Information Organization. Berkshire Encyclopedia of Human. Computer-Interaction. July 2004. Online: http: //www. dsoergel. com/New. Publications/HCIEncyclopedia. Info. Org 8 For 670. pdf Forschungsfragen behandelt López-Huertas: Some current Research Questions… In: Knowl. Org. 35(2008), S. 113 -136 Spree WS 2009/2010 Seminar I-Prax: Inhaltserschließung visueller Medien, 5. 10. 2004
- Slides: 17