BiographiePortal Probleme der Datenintegration Dirk Scholz Mnchener Digitalisierungs
Biographie-Portal: Probleme der Datenintegration Dirk Scholz · Münchener Digitalisierungs. Zentrum 24. Sep 2010
Datensätze nicht homogenisiert; Bsp. „Elisabeth“ l 2
Elisabeth: Vorlagen HLS <bio sprache="de"> <lemma>Elisabeth von Österreich</lemma> <prec>1837 -1898</prec> <berufe>Diverses</berufe> </bio> NDB <ADB-NDB-Gesamtregister_2005> <Stichwort>Elisabeth</Stichwort> <Beruf_Lebensstellung>Kaiserin von Österreich; Königin von Ungarn</Beruf_Lebensstellung> <Geburtsdatum>1837</Geburtsdatum> <Sterbedatum>1898</Sterbedatum> </ADB-NDB-Gesamtregister_2005> ÖBL <row id="1522"> <stichwort>Elisabeth</stichwort> <text>Amalie Eugenie Kn. von Österr. </text> <vita>(1837 - 1898)</vita> <suche_stichwort>Elisabeth, Habsburg-Lothringen, Oesterreich, Bayern, Wittelsbach, </suche_stichwort> <suche_text>Amalie Eugenie, Elisabeth, Sisi, </suche_text> <geburtsjahr>1837</geburtsjahr> <sterbejahr>1898</sterbejahr> <sortieren_stichwort>Elisabeth</sortieren_stichwort> <sortieren_text>Amalie Eugenie</sortieren_text> </row> 3
Elisabeth: „normierte“ Suchformen HLS <suchf_stw>elisabeth-oesterreich</suchf_stw> <suchf_stw>autriche</suchf_stw> <suchf_stw>elisabeth-autriche</suchf_stw> <suchf_stw>austria</suchf_stw> <suchf_stw>elisabetta-austria</suchf_stw> <suchf_txt>elisabeth</suchf_txt> <suchf_txt>elisabetta</suchf_txt> NDB <suchf_stw>elisabeth</suchf_stw> <suchf_stw>elisabeth-amalie-eugenie</suchf_stw> <suchf_stw>sissi</suchf_stw> <suchf_stw>sissy</suchf_stw> <suchf_txt>prinzessin-bayern</suchf_txt> ÖBL <suchf_stw>elisabeth</suchf_stw> <suchf_stw>habsburg-lothringen</suchf_stw> <suchf_stw>oesterreich</suchf_stw> <suchf_stw>bayern</suchf_stw> <suchf_stw>wittelsbach</suchf_stw> <suchf_txt>amalie-eugenie</suchf_txt> <suchf_txt>elisabeth</suchf_txt> <suchf_txt>sisi</suchf_txt> 4
Ausgeschlossene Namensbestandteile à ab altgraf am auf baron burggraf chevalier comtesse contessa d'' dall' das degli della dem des die duca edelherr edler erbprinz és freifrau freiin fürst 5 a alle altgräfin an aus baronin burggräfin comte conte d da dalla de delle der di du duchesse earl edle el erbprinzessin et freiherr frhr fürstin
Suche: Geboren vor 400 6
Lebensdaten: normierte Suchformen <datensatz status="" typ=""> <felder> <feld nr="001" ind=" ">64014</feld> <feld nr="002" ind="b">2009 -04 -07</feld> <id>NDB: 81437</id> <stw>Stilicho</stw> <daten>um 359 -408</daten> <feld nr="814" ind="i">römischer Feldherr</feld> <feld nr="814" ind="n">30470</feld> <berufe>römischer Feldherr</berufe> <normdaten>349; 369*408; 408</normdaten>. . . 7
Lebensdaten: Umwandlungen static final int um. ANT = 10; static final int um. MA = 5; static final int um. FNZ = 3; static final int um 1900 = 1; static final int NACH = 10; static final int VOR = 10; //Muster //p. C. wenn nicht ausdrücklich vor Christus final static String to. Delete = "Alter/Neuer Stil\? |begraben |getauft |Juni |p\. C\. |September |tot |vor oder |wohl Ende "; final static String oder. Del = "/. *|oder. *"; final static String vor. Chr = "a\. C\. |vor Christus"; final static String nach = "kaum früher als|in oder nach|nicht vor|vermißt|verschleppt|verschollen"; final static String vor = "nicht nach"; final static String jhd. Str = "Jahrhundert[´\? ]? |Jahhundert|Jhr\. |Jh\. |s\. "; 8
Standard-Importformat <body> <list. Person type="oebl"> <person xml: id="oebl 1417864" sex="1"> <pers. Name type="main">Adamkiewicz, Albert</pers. Name> <pers. Name type="search"> <surname>adamkiewicz</surname> <forename>albert</forename> </pers. Name> <pers. Name type="order"> <surname>adamkiewicz</surname> <forename>albert</forename> </pers. Name> <birth> <date type="not. Before">1850 -01 -01</date> <date type="not. After">1850 -12 -31</date> <date type="show">1850</date> </birth> <death> <date type="not. Before">1921 -01 -01</date> <date type="not. After">1921 -12 -31</date> <date type="show">1921</date> </death> <occupation scheme="oebl" xml: lang="de-AT"> <term type="category">Medizin</term> <term type="individual">Pathologe</term> </occupation> <note type="resource"> 9
Vielen Dank für Ihre Aufmerksamkeit! Dirk Scholz · Münchener Digitalisierungs. Zentrum 24. Sep 2010
- Slides: 10