Technologie digitlnch knihoven Miroslav Bartoek VT MU Brno
Technologie digitálních knihoven Miroslav Bartošek ÚVT MU Brno bartosek@ics. muni. cz
Úvod ¡ Recyklovaná přednáška – Inforum 2006 ¡ Mají archivy a knihovny něco společného? ¡ Minimální zkušenost s archivy (Archiv MU) l l digitalizace fotosbírek (DKF-MU) digitalizace videonahrávek ¡ Zaostávání archivů ve využívání ICT? ¡ Standardy? ¡ Specifika archivů? M. Bartošek, Inforum 2006 2
Knihovny v digitálním věku ¡ ¡ Computers in Libraries (Washington, 2006) l Millenials l Informace k dispozici OKAMŽITĚ, KDEKOLIV, KDYKOLIV a nejlépe přes MOBILNÍ ZAŘÍZENÍ l knihovny musí inovovat GO DIGITAL ! l OPAC l EIZ l digitální knihovny (DL) M. Bartošek, Inforum 2006 3
Letem světem … 1. 2. 3. 4. 5. 6. 7. 15 let digitálních knihoven Budování sbírek Metadata Identifikace Interoperabilita Další technologie Google-izace digitálních knihoven M. Bartošek, Inforum 2006 4
1. 15 let digitálních knihoven
1. 1 Dospívání DL ¡ počátek 90. let – C 3 l l l ¡ computing connectivity content DL 15 let DL l první úspěchy Google, Dublin Core, OAI, METS, DSpace l první zklamání identifikace, s-interoperabilita, bezpečnost, digital preservation M. Bartošek, Inforum 2006 6
1. 2 Infrastruktura DL Trend: l od budování (izolovaných) DL k vytváření globální infrastruktury DL Ø snazší implementace DL Ø spolupráce mezi DL ¡ ještě dlouhá cesta … … ale již první stavební kameny ! ¡ jejich stručné představení M. Bartošek, Inforum 2006 7
budování digit. sbírek digitalizace born digital harvesting architektura DL ochrana duševních práv & ekonomika metadata vícejazyčný přístup k informacím interoperabilita globální vyhledávání zdrojů dlouhodobé uchovávání digitální informace M. Bartošek, Inforum 2006 8
2. Budování sbírek
2. 1 Budování sbírek – digitalizace ¡ dobře zvládnuté (běžné materiály) Best Practices, formáty (Dj. Vu) speciální dokumenty (DML-CZ) ¡ masové digitalizační projekty ¡ ¡ l 1. gen: American Memory, JSTOR, … 2. gen: Google Book Search Open Content Alliance Elsevier, Springer, … l zdokonalení technologií + pád cen l M. Bartošek, Inforum 2006 10
2. 2 Budování sbírek – born digital ¡ ¡ ¡ vědecká komunikace, open access pre/post-print archivy – Ar. Xiv. org repozitáře l l ¡ oborové (fyzika, ekonom, knihovnictví, …) institucionální (MIT, CERN, …) národní (NK ČR? ) OA-časopisy SW l l volně dostupné: EPrints, DSpace, Fedora, Greenstone, … komerční: Digi. Tool, CONTENTdm, … M. Bartošek, Inforum 2006 11
2. 3 Budování sbírek – harvesting ¡ kulturní dědictví l l l ¡ technologie sklízení-archivace-zpřístupnění obrovské objemy dat Internet Archive (2006, 2 PB = 2*10**15) národní knihovny ČR: Web. Archiv specializované automatizované DL l l úzce specializovaná data Cite. Seer M. Bartošek, Inforum 2006 12
3. Metadata
3. 1 Klasická metadata ¡ Klasická knihovnická metadata (MARC) l l l ¡ Automaticky generovaná (Google) l l ¡ složitá jen profesionály nevhodná pro digitální prostředí primitivní úzce specializovaná Internet – džungle specializovaných MD M. Bartošek, Inforum 2006 14
3. 2 Metadata pro DL ¡ Dublin Core l l l ¡ MODS l l ¡ jednoduchá popisná metadata (15 prvků) velká očekávání střízlivá realita popisná metadata - nový „svatý grál“ ? (Lo. C) MARC + XML + flexibilita METS l XML kontejner pro digitální objekty ¡ metadata (popisná, administrativní, technická) ¡ digitální obsah (soubory) ¡ struktura + propojení M. Bartošek, Inforum 2006 15
4. Identifikace
4. 1 Požadavky na identifikátory ¡ spolehlivé identifikátory – klíčový prvek ! požadavky: ¡ ¡ ¡ globální jednoznačnost persistence nezávislost na lokaci směrovatelnost URL - ne ne URL x URN (? ? ) M. Bartošek, Inforum 2006 17
4. 2 Identifikátory pro DL ¡ PURL l l ¡ Handle Systém l l l ¡ URL s nepřímou adresací (OCLC) jednoduché řešení Corporation for National Research propracované, nezávislé na URL, ne TCP/IP vlastní směrovací infrastruktura DOI l l Asociace amerických nakladatelů aplikace nad Handle Systém samovýdělečný ekonomický model velmi úspěšný - Cross. Ref M. Bartošek, Inforum 2006 18
5. Interoperabilita
5. 1 Interoperabilní protokoly ¡ Z 39. 50 l l l ¡ SRU/SRW l l l ¡ složitý, velmi rozsáhlý, search/retrieval úzká oblast využívání (drahé knihovní syst. ) ne-webová technologie, zastaralý? Search Retrieve via URL / Web. Services odlehčená a webová verze Z 39. 50 metasearching OAI-PMH l l l jednoduchost ! oddělení rolí (poskytovatelé dat x poskytovatelé služeb) sklízení metadat PMH + DC + XML M. Bartošek, Inforum 2006 20
5. 2 Linking ¡ kontextově citlivé vazby ¡ Open. URL l (appropriate copy) zakódování metadat o cíli vazby do URL http: //xxx. com/demo? sid=ebsco: medline&aulast=Moll &auinit=JR&date=20001103&stitle=J%20 Biol%20 Chem& volume=275&issue=44&spage=34826 ¡ servisní služba (SFX) výchozí zdroj Open. URL servisní služba URL cílový zdroj (kontextový !) Knowledge Base M. Bartošek, Inforum 2006 21
5. 3 EIZ – nadstavbové nástroje ¡ Linkovací nástroje l ¡ Centralizované vyhledávání l ¡ Meta. Lib, Search. Solver, Central Search, Multi. Search Správa vzdáleného přístupu l ¡ SFX, Link. Solver, Article Linker, Resource Linker HAN Net. Management EIZ l Verde, Serials. Solution ERMS M. Bartošek, Inforum 2006 22
6. Další technologie
6. 1 Další technologie ¡ IPR - Creative Commons ¡ přístup - Open Access – BOAI ¡ archivace - OAIS model ¡ distrib. systém - Web Services ¡ autentifikace - Shibboleth ¡ architektura - peer-to-peer ¡ aj. M. Bartošek, Inforum 2006 24
7. Google-izace DL
7. 1 Google-izace DL ¡ Google – skvělé služby, expanze Vše vyřeší za „nás“, stačí si počkat … ? ? ¡ Nové vymezení DL ¡ l nejen - vyhledávání (jak to najít? ) - přístup (jak to získat? ) l ale i - kvalitní výběr materiálu - kolaborativní (spolupráce uživatelů) - propojení všeho se vším M. Bartošek, Inforum 2006 26
7. 2 Nové vymezení DL ¡ DL – mnohem víc než jen vyhledávací portál ¡ podobně jako klasické knihovny – musí poskytovat kvalitní výběr zdrojů a služby napomáhající cílové komunitě uživatelů efektivnímu využívání zdrojů ¡ protože nejsou omezovány prostorem, časem, médiem, měly by být mnohem přizpůsobivější a vstřícnější ¡ měly by být kolaborativní – umožnit uživatelům přispívat svými znalostmi (aktivně, pasivně) ¡ měly by být kontextové – pavučina vztahů a znalostních vrstev mezi primárními zdroji DL ¡ snoubit profesionální výběr s moudrostí davu. What is Digital Library Anomore, Anyway? C. Lagoze et al, DLib, November 2005 M. Bartošek, Inforum 2006 27
7. 3 Příklady DL (volně dostupných) ¡ ¡ ¡ ¡ ¡ American Memory Internet Archive Intl Children’s DL ar. Xiv. org You. Tube Project Gutenberg memory. loc. gov www. archive. org www. icdlbooks. org arxiv. org www. youtube. com www. gutenberg. org Manuscriptorium Web. Archiv ČS Parlamentní knih www. manuscriptorium. com www. webarchiv. cz www. psp. cz/eknih/ M. Bartošek, Inforum 2006 28
Děkuji za pozornost Logo: www. NCSTRL. org
- Slides: 29