Entity Facts Ein leichtgewichtiger Normdatendienst auf Basis der
Entity Facts Ein leichtgewichtiger Normdatendienst auf Basis der GND DINI AG KIM Zweiter Workshop Mannheim, 11. /12. April 2014 Michael Büchner m. buechner@dnb. de �+49 (0) 69 1525 -1774
Einführung
Was ist Entity Facts? • maschinenlesbare Faktenblätter für Entitäten der Gemeinsamen Normdatei (GND) • Normdatenservice • aktueller Umfang: Personen • Entwicklung und Service der Deutschen Nationalbibliothek • Ziele • • Bereitstellung von Informationen zu GND-Entitäten einfache Integration in andere Anwendungen Verknüpfungen mit anderen Datenquellen Anreicherung mit Informationen aus anderen Datenquellen Entity Facts – KIM-Workshop – Mannheim – 11. /12. 04. 2014 3
Übersicht 1. 2. 3. 4. 5. Anforderungen aus Sicht der DDB Entity Facts an der DNB Umsetzung von Entity Facts Technische Details Weiterentwicklung & Ausblick Entity Facts – KIM-Workshop – Mannheim – 11. /12. 04. 2014 4
Anforderungen aus Sicht der DDB
https: //www. deutsche-digitale-bibliothek. de/entity/118540238 Die Deutsche Digitale Bibliothek – One Person Librarys Treffen – Berlin – 06. 09. 2013
Anforderungen der DDB • Umfang • • Personendaten • Vor- und Nachname (alternative Namen) • Geburts- und Sterbedaten • Tätigkeit / Beruf • Abbildung / Fotographie mit Untertitel weiterführende Verlinkung • inhaltliche Anforderungen • • • Genauigkeit Aktualität Mehrsprachigkeit • technische Anforderungen • • Leichtgewichtigkeit (JSON-Datenformat) hohe Verfügbarkeit Entity Facts – KIM-Workshop – Mannheim – 11. /12. 04. 2014 7
Entity Facts an der DNB
Das Projekt • Ausgangslage • sehr einfacher Prototyp für die DDB • Projektstart • September 2013 • Meilensteine • • Definition des Datenmodells (JSON-Antwort) Mapping ausgewählter Informationen Einbindung der Links aus externen Datenquellen Implementierung der Software und -architektur • Veröffentlichung • März 2014 Entity Facts – KIM-Workshop – Mannheim – 11. /12. 04. 2014 9
Ziele (1) Anreicherung und Verknüpfung der GND mit… • externen Datenquellen • • Wikipedia VIAF (ISNI, BNF, Lo. C) IMDb usw. • Verknüpfung zu Ressourcen • bibliografische Datensätze in Bibliothekskatalogen • usw. Entity Facts – KIM-Workshop – Mannheim – 11. /12. 04. 2014 10
Ziele (2) Agile Umsetzung, weil… • leichtgewichtiger Datenservice • einfache, selbsterklärende Verwendung • keine weitere Bearbeitung der Daten • JSON über HTTP • regelmäßiges Datenupdate • „on-the-fly“ • einfache Erweiterbarkeit • Mehrsprachigkeit • deutsche & englische Sprache Entity Facts – KIM-Workshop – Mannheim – 11. /12. 04. 2014 11
Umsetzung von Entity Facts
Abfrage über HTTP • HTTP-Request mit Header • • gewünschte Sprache (gewünschtes Datenformat) • HTTP-Response mit Header und Daten • • Entity Facts – KIM-Workshop – Mannheim – 11. /12. 04. 2014 Statuscode 200 – „OK“, 404 – „Not found“, usw. geliefertes Datenformat gelieferte Sprache Daten 13
Antwort als JSON {"@context": "http: //hub. culturegraph. org/entityfacts/context/v 1/entityfacts. jsonld", "valid": "2014 -04 -09 T 12: 48: 36+0200", "license": "http: // cre " person" : { ativecommons. org/publicdomain/zero/1. 0/legalcode", "@id": "http: //d-nb. info/gnd/118540238", "person": {"preferred. Name": "Johann Wolfgang von Goet " same. As" " : [{ same. As "preferred. Name " : "Johann Wolfgang von Goethe", "preferred. Name" he", "surname": "Goethe", "prefix": "von", "forename": "Johann Wolfgang", "place. Of. Birth": {"@id": "http: //d-nb. info/gnd/4018118 -2", "@value": " Frankfur "@id" : "http: //en. wikipedia. org/wiki / "place. Of. Birth " : { t am Main"}, "place. Of. Death": {"@id": "http: //d-nb. info/gnd/4065105 -8", "@value": "Weimar"}, "variant. Name": ["Johann Wolfgang v. Goethe", "Johann. Wol "place. Of. Birth" Johann_Wolfgang_von_Goethe ", Goethe", "J. W. von fgang Goethe", "Johann W. von Goethe", "Johann W. Goethe", "Johan Wolfgang von Goethe", "Joh. Wolfg. v. Goethe", "J. Wolfgang "@id" : "http: //d-nb. info/gnd/4018118 -2", Goethe", "J. W. v. Goethe", "J. W. Goethe", "Ioannes W. Goethe", "Iohan Wolphgang "publisher Goethe", "Jan Wolfgang Goethe", "Jean Wolfgang von Goethe", " Joã publisher" " : { " "@value" : "Frankfurt am Main"Wolfgang von Goethe", "Volfango Goethe", "Volfgango Goethe", "Wolfgang von Goethe", "Wolfgang. Goe o Wolfgang von Goethe", "Juan W. Goethe", "Juan "abbr " : "WKP", "abbr" the", "Wolfango Goethe", "Wolfgango Goethe", ". . . Goethius", "Johann Wolfgang von Göthe", "J. W. von Göthe", "Giov. Volfango Göthe ", " }, " : "Wikipedia (Englisch)", "name" Iogann V. Göte", ". . . Gede", ". . . Gēte", ". . . Gě'ṭe", ". . . Gete", "Iogann "name W. Gete", "Iogann Volʹfgang Gete", "J. V. Gete", "Iogann. Vol'f "place. Of. Death " : { "place. Of. Death" gang Ge te", "Iohan Volfgang Gete", "I. V. Gete", "Johan Volfgang Gete", "Johans Volfgangs Volʹfgang Gete", "Jogann Vol'fgang fon "icon "Géte", "Johann : "http: //en. wikipedia. org/favicon. ico" "icon" "@id" : "http: //d-nb. info/gnd/4065105 -8", Gete", "Volʹfgang Gete", "Yogann Volʹfgang Gete", "Yôhân Wôlfgang fôn Gete", "Yôhan Wolfgang Gête", "Yohann Volfqanq Gete", "Y. W. Gêtê", "YohanṾ olfgang fon Geteh", ". . . Gkaite", "Giochan Bolphnkannk phon Gkaite", "Giochan B. }, phon Gkaite", ". . . Gót", ". . . G'ote", "Jochan Volfgang G'ote ", ". "@value" : "Weimar". . Goet'e", "Iohan Volp'gang Goet'e", "Yūhān Wulfgāng fun Gūta", "Yūhān Wulfgāng. . . fūn Gūta", ". . . Gūta", "Yūhān Vūlfġanġ fūn Ġūtih", "Yohan. Wolfga }, ng Gyot'e", "E han Vol'fhanh He te", "Johann-Vol'fhanh Hete", ". . . Koet'e", "Yohan Polp'ŭgang p'on Koet'e", "Johanas Volfgangas Gėtė", "Iohann }] "date. Of. Birth " : Wolfgang "28. August 1749", Volfqanq Höte", "Johann von Goethe", " 괴테, 요한 볼프강 폰", "歌德", "約翰・沃爾夫岡・馮・歌德", "�翰・沃尔夫�・�・ 歌德 ", "ゲーテ, ヨハン・ヴォルフガ "date. Of. Birth" ング・フォン", "", [" יוהן וולפגנג פון גתה date. Of. Birth": "28. August 1749", "date. Of. Death": "22. März 1832", "profession. Or. Occupation": [{"@id": "http: // d"date. Of. Death " : "22. März 1832", "date. Of. Death" nb. info/gnd/4053309 -8", "@value": "Schriftsteller"}, {"@id": "http: //d-nb. info/gnd/4176310 -5", "@value": "Publizist"}, {"@id": "http: // d-nb. info/gn "profession. Or. Occupation " : [ { "profession. Or. Occupation" d/4046517 -2", "@value": "Politiker"}, {"@id": "http: //d-nb. info/gnd/4029050 -5", "@value": "Jurist"}, {"@id": "http: //d-nb. info/gnd/4041423 -1", "@ val ue": "Naturwissenschaftler"}, {"@id": "http: //d-nb. info/gnd/4185044 -0", "@value": "Theaterintendant"}, {"@id": "http: //d-nb. info/gnd/4037215 -7 ", „ "@id" : "http: //d-nb. info/gnd/4053309 -8", @value": "Maler"}, {"@id": "http: //d-nb. info/gnd/4200345 -3", "@value": "Zeichner"}], "gender": {"@id": "http: // d-nb. info/gnd/standards/vocab/gnd/ge "@value" : "Schriftsteller" nder#male", "@value": "Mann"}, "related. Person": [{"@id": "http: //d-nb. info/gnd/118617222", "relationship": "Freundin", "preferred. Name": "Charlottev }, on Stein"}, {"@id": "http: //d-nb. info/gnd/118633252", "relationship": "Freundin", "preferred. Name": "Marianne von Willemer"}, {"@id": "http: // d-nb. i nfo/gnd/118638076", "relationship": "Freundin", "preferred. Name": "Charlotte Buff"}, {"@id": "http: //d-nb. info/gnd/119277387", "relationship": " Freu. . . ] ndin", "preferred. Name": "Minna Herzlieb"}], "familial. Relationship": [{"@id": "http: //d-nb. info/gnd/118695940", "relationship": "Vater", " preferred. N "variant. Name" : [ "Yohann Volfqanq Gete", . . . ], ame": "Johann Caspar Goethe"}, {"@id": "http: //d-nb. info/gnd/118540246", "relationship": "Mutter", "preferred. Name": "Katharina Elisabeth Goethe "}, "depiction" : { {"@id": "http: //d-nb. info/gnd/11871791 X", "relationship": "Schwester", "preferred. Name": "Cornelia Goethe"}, {"@id": "http: // d-nb. info/gnd/11879516 3", "relationship": "Schwager", "preferred. Name": "Johann Georg Schlosser"}, {"@id": "http: //d-nb. info/gnd/118628011", "relationship": "Ehefrau", " pre "image" : . . . , ferred. Name": "Christiane von Goethe"}, {"@id": "http: //d-nb. info/gnd/11854022 X", "relationship": "Sohn", "preferred. Name": "August von Goethe "}, {" "thumbnail" : . . . , @id": "http: //d-nb. info/gnd/118540254", "relationship": "Schwiegertochter", "preferred. Name": "Ottilie von Goethe"}, {"@id": "http: //d-nb. info/gnd / 11687256 X", "relationship": "Tante", "preferred. Name": "Johanna Maria Melber"}], "depiction": {"image": "http: // upload. wikimedia. org/wikipedia/comm "url" : . . . ons/0/0 e/Goethe_(Stieler_1828). jpg", "thumbnail": "http: //upload. wikimedia. org/wikipedia/commons/thumb/0/0 e/Goethe_(Stieler_1828). jpg/270 px} Goethe_(Stieler_1828). jpg", "url": "http: //commons. wikimedia. org/wiki/File: Goethe_(Stieler_1828). jpg? uselang=de"}}, "same. As": [{"@id": "http: // t } oolserver. org/~authoritycontrol/redirect/gnd/de/118540238", "publisher": {"abbr": "WKPDE", "name": "Wikipedia (Deutsch)", "icon": "http: // de. wikip http: //hub. culturegraph. org/entityfacts/118540238 Entity Facts – KIM-Workshop – Mannheim – 11. /12. 04. 2014 14
Elemente im Datenmodell • Zweiundzwanzig Elemente, nämlich… • Einzelwerte [value] preferred. Name, surname, prefix, forename, academic. Degree, title. Of. Nobility, date. Of. Birth, date. Of. Death, date. Of. Birth. And. Death, period. Of. Activity, biographical. Or. Historical. Information • Datenfelder [array] variant. Name • Einzelwerte mit Normdatenverknüpfung bzw. kontrolliertem Vokabular place. Of. Birth, place. Of. Death, place. Of. Activity, gender • Datenfelder mit Normdatenverknüpfung bzw. kontrolliertem Vokabular profession. Or. Occupation, related. Person, familial. Relationship, affiliation • weiteres (2) depiction, same. As Entity Facts – KIM-Workshop – Mannheim – 11. /12. 04. 2014 15
Technische Details
Softwarebibliothek • Metafacture • Softwarebibliothek von „Culturegraph“ • https: //github. com/culturegraph • Bestandteile • Flux: Metadaten bearbeiten • Metamorph: Metadaten transformieren • Bearbeitung als Datenfluss (Metafacture stream) Flux Metadaten bearbeiten Entity Facts – KIM-Workshop – Mannheim – 11. /12. 04. 2014 Metamorph Metadaten transformieren 17
Schematischer Aufbau Entity Facts – KIM-Workshop – Mannheim – 11. /12. 04. 2014 18
Weiterentwicklung & Ausblick
Stand der Dinge • Entität „Person“ • Infrastruktur aufgebaut • externe Informationen sind nun leicht integrierbar • Workflow • Abbildungen von Personen aus Wikipedia • Links zu anderen Datenquellen • Relationen auf Basis von… • Beacon-Dateien • Dumps • Redirecting / Weiterleitung • mehrsprachige Datumsangaben Entity Facts – KIM-Workshop – Mannheim – 11. /12. 04. 2014 20
Entity Facts – KIM-Workshop – Mannheim – 11. /12. 04. 2014 21
Weiterentwicklung • Einbindung weiterer Entitäten • Geografika • Körperschaften • • weitere Informationen aus externen Quellen Ausbau der Mehrsprachigkeit Weiterentwicklung des Datenmodelles Pflege der Daten/Verlinkungen/Beacon-Dateien • DNB/GND-seitige Bereitstellung von Beacons? Entity Facts – KIM-Workshop – Mannheim – 11. /12. 04. 2014 22
Entity Facts Herzlichen Dank für Ihre Aufmerksamkeit! gnd-info@dnb. de m. buechner@dnb. de Entity Facts v 1. 0 Dienst http: //hub. culturegraph. org/entityfacts/{id} Entity Facts – KIM-Workshop – Mannheim – 11. /12. 04. 2014 23
- Slides: 23