Manuscriptorium a ENRICH 2007 2009 Dlouhodob cl Manuscriptoria
Manuscriptorium a ENRICH (2007 -2009)
Dlouhodobý cíl Manuscriptoria • Vytvořit virtuální badatelské prostředí pro oblast historických fondů“ • začít od obsahu – kvalitní nástroje jsou samozřejmost • hlavní cíl tedy je: – najít a agregovat již existující digitální obsah – zpřístupnit jej v homogenním rozhraní a v souvislostech • ENRICH nejdůležitější WP 5 –agregace
ENRICH a Manuscriptorium priority z hlediska agregace: – připojování existujících zdrojů hromadnými importy – integrace i menších zdrojů – podporu vzniku nových digitálních dokumentů
Agregace 2007 -2009 • před počátkem ENRICH (2007): – agregovány dokumenty převážně české produkce (zejména VISK 6) • 1 700 plně digitalizovaných dokumentů • 700 000 stran • na počátku ENRICH (2008) – 11 nových obsahových partnerů kteří do projektu přispějí obrazy 5 milionů obrazů stran/folií
Agregace 2007 -2009 • v průběhu ENRICH (2008) – problém 1 800 000 stran chybí ! někteří partneři do plánů zahrnuli moderní fondy, nevhodné pro MNS původní číslo je však hlavní hodnotící kritérium … ach jo – ŘEŠENÍ JE !!! … asociovaní partneři ! • hledání nových partnerů neobvyklého nadání – mohou spolupracovat – nezískají žádné finance
BNCF Biblioteca Nazionale Centrale di Firenze Florence, Italy BNE Biblioteca Nacional de Espana Madrid, Spain BNL The National Library of Belarus Minsk, Belarus BUTE The Budapest University of Technology and Economics Budapest, Hungary DSP St. Pölten Diocese Archive St. Pölten, Austria HUL Heidelberg University Library Heidelberg, Germany IMI Institute of mathematics and informatics Vilnius, Lithuania KNM Knihovna Národního Muzea Prague, Czech Republic KU Københavns Universitet, Nordisk Foskningsinstitut Copenhagen, Denmark LUL Lund University Library Lund, Sweden MZK Moravian Library Brno, Czech Republic NKP Národní knihovna ČR Prague, Czech Republic NLR National Library of Romania Bucharest, Romania NPKK Národní pedagogická knihovna Komenského Prague, . Czech Republic NULI The National and University Library of Iceland Reykjavík, Iceland PNES Patrimonio Nacional Palacio Real, Madrid, Spain SAM Stofnun Árna Magnússonar í íslenskum fræðum Reykjavík, Iceland TSL Holy Trinity-St. Sergius Lavra Sergiev Posad, Moscow district, Russia TUL Toruń University Library Toruń, Poland UCM Complutense University of Madrid, Spain ULIB University Library in Bratislava, Slovakia ULW University Library Wroclaw, Poland UZK Computer Science for the Humanities - Universität zu Köln Cologne, Germany VUL University Library Vilnius, Lithuania ZGUL Zielona Góra University Library Zielona Góra, Poland
Agregace 2007 -2009 • Konec projektu ENRICH (2009) – 25 plánovaných partnerů – 14 asociovaných partnerů Výsledek 4 , 9 milionu stránek tj. 15 -20 milionů obrazů ve specielních a různě optimalizovaných kvalitách
Příčina úspěchu agregace • Manuscriptorium akceptovalo různé přístupy vytváření digitálního obsahu brali jsme data tak, jak jsou jediná cesta je … když to jen trochu šlo individuální přístup • respektujeme podmínky, panující uvnitř instituce a vyhýbáme se ovlivňování vnitřních procesů • přizpůsobujeme Manuscriptorium – pomocí individualizace vstupních rozhraní
Obecný úvod do principů spolupráce Individuální konektory TEI P 5 UNIMARC C 2 TEI P 5 UNIMARC C 1 MNS interní databáze MARC 21 B 2 B 1 X Y Z MARC 21 A DC DC
TEI P 5 ENRICH schema • TEI P 5 s modulem pro popis rukopisů je schéma umožňující tvorbu metadat - zjednodušeně jde o následovníka MASTERu • Diskuze o migraci Manuscriptoria na TEI P 5: – již v 3. měsíci ENRICH a byla mírně řečeno poměrně vzrušená • původně nebylo plánováno • rozčarování v komunitě TEI P 5 uživatelů – Následuje nová analýza formátu TEI P 5 • Návrh změn, zejména s ohledem – na interoperabilitu s obvyklými katalogizačními postupy – na katalogizaci tisků • Významná část návrhů přijata a zapracována přímo do TEI P 5 • Diskuzí partnerů vzniká nové tzv. TEI P 5 ENRICH schéma optimalizované pro vzácné dokumenty s ohledem na zkušenosti partnerů ENRICH – plně kompatibilní s původním TEI P 5
TEI P 5 ENRICH schema • výsledkem je: – kvalitní schéma: • výrazná přidaná hodnota oproti MASTERu • nativní podpora strukturálních metadat – prakticky použitelná interoperabilita (výsledky konverze do/z klasických formátů výrazně lepší) – rozhodnutí o migraci celého systému Manuscriptoria na TEI P 5 …rozhodnutí Ai. P nad rámec projektu ENRICH
… úkoly související s Mn. S Propracovanější podpora pro uživatele i partnery – nová generace M-Toolu nástroj pro tvorbu metadat – nástroje umožňující používat nestandardní znaky při tvorbě nových záznamů – nástroje provádění konverzí on-line
Propracovanější funkce pro koncové uživatele vylepšené vyhledávání, nově: struktura položek vyhledávací formuláře strategie vyhledávání osobní digitální knihovna • vlastní kolekce dokumentů • vlastní virtuální dokumenty
TEI P 5 ENRICH schema • migrace znamenala/znamená: – přetvořit všechny existující vstupní konektory na TEI P 5 • v první fázi řešeno univerzální transformací MASTER -> TEI P 5 • přepracování každé retrokonverze od r. 2003 – přetvořit správní systém MNS na TEI P 5 • SSM původně vyvíjen pro METS – M-Tool a M-Can nové generace s TEI P 5 – vytěžovací rozhraní musí umět pracovat s TEI P 5 • přepracovat veškeré aktuálně používané profily OAI interface – vyhledávání v TEI P 5 – zobrazování v TEI P 5
Betaverze Manuscriptoria • zpřístupňuje výsledky ENRICH – všechny nové aplikace / nástroje – kompletní agregovaný obsah • aktuálně pouze digitalizované dokumenty • záznamy bez digitální kopie budou přidány později – dostupné na http: //beta. manuscriptorium. com • existuje souběžně s MNS – do konce roku bude primární službou stávající Manuscriptorium (www. manuscriptorium. com) • odladění po kompletním přechodu na TEI P 5 • vychytání chybiček v aplikacích (ještě stále nacházíme) – v lednu beta nahradí hlavní MNS • určitý čas poběží obě aplikace paralelně • t. č. veškeré aplikace v anglickojazyčném prostředí – probíhá příprava na překlady – technicky připraveno na multilingvální prostředí
Interoperabilita „vedlejší“ produkt přechodu na TEI P 5 tzv. manuál interoperability – pravidla nad rámec technické validity – reakcí na disharmonii uvnitř knihoven byla racionální spolupráce techniků a knihovníků (zejména dr. Kašparové) Výsledek: základ pro využitelnost záznamů z knihovnických systémů MARC 21 > TEI P 5 výsledky VISK 5 NKČR > Manuscriptorium Ověřeno:
Interoperabilita Metadata dig. kopie Plný text Vědecký popis Rutinní normovaný popis dle kat. normy Subminimální záznam Informace pro management dokumentu uvnitř knihovny Vhodné TEI P 5: - jemná strukturace informací, - analytický aparát, - nativní podpora souvisejících typů informací - optimalizováno pro historické fondy zde jsou formáty VZÁJEMNĚ ZAMĚNITELNÉ, sem je zaměřena “interoperabilita” V této oblasti dominuje MARC 21. TEI P 5 má sice vhodný aparát, ale chybí knihovnický SW a motivace
Obecný úvod do principů spolupráce Individuální konektory TEI P 5 UNIMARC C 2 TEI P 5 UNIMARC C 1 Mn. S interní databáze MARC 21 B 2 B 1 X Y Z MARC 21 A DC DC
Nové digitalizační pracoviště Ai. P Beroun na Strahově, Klementinum zůstává a rekonstruuje se
VISK 6 Co nabízíme: Nový individuální ceník Pomoc přihlášení do VISK 6 a konzultace svízelných 30% Bonus pro r. 2010: Vytvoření a zpřístupnění vysoké kvality obrazu v Manuscriptoriu …, LOW, NORMAL, HIGH (i zpětně) Podívejte se, co VOLNĚ pustil Heidelberg (!), … vy to máte taky.
http: //beta. manuscriptorium. com http: //www. manuscriptorium. com info@aipberoun. cz Děkuji za pozornost !
- Slides: 23