Zpstupnn digitalizace pro veejnost Martin Vojnar vojnarmultidata cz

  • Slides: 39
Download presentation
Zpřístupnění digitalizace pro veřejnost Martin Vojnar vojnar@multidata. cz

Zpřístupnění digitalizace pro veřejnost Martin Vojnar vojnar@multidata. cz

Z předchozího víme • • • proč usilovat o dlouhodobou archivaci jaké efekty může

Z předchozího víme • • • proč usilovat o dlouhodobou archivaci jaké efekty může přinést řešení na národní úrovni předpoklady úspěšného nasazení • veřejnost a poskytovatelé dotace budou projekt vnímat a hodnotit podle vnějších výsledků: • • formálně (kvantifikátory, splněné ukazatele) prakticky (slovenský kulturní „google“) technicky (vše musí fungovat hladce) jejich očekávání a požadavky budou v čase narůstat (tj. na co se dnes připravujete, zítra už nebude stačit) 2 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Dále se budeme bavit o 3 • • • zpřístupnění dokumentů pro veřejnost v

Dále se budeme bavit o 3 • • • zpřístupnění dokumentů pro veřejnost v širším kontextu jednotného prostředí co znamená malý a velký index • praktické ukázky • otázky / diskuse Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

1: zpřístupnění (LTP) pro veřejnost 4 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

1: zpřístupnění (LTP) pro veřejnost 4 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

veřejné rozhraní pro vyhledávání digitalizované / digitální objekty 5 Zpřístupnění digitalizace pro veřejnost, 12.

veřejné rozhraní pro vyhledávání digitalizované / digitální objekty 5 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

veřejné rozhraní pro vyhledávání digitalizované / digitální objekty z různých sektorů agregace (neustálý a

veřejné rozhraní pro vyhledávání digitalizované / digitální objekty z různých sektorů agregace (neustálý a nekonečný přísun objektů a metadat) 6 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Otázka na úvod 7 • kde mají být výsledky digitalizace prezentovány ? • specializované

Otázka na úvod 7 • kde mají být výsledky digitalizace prezentovány ? • specializované digitální knihovny šité na míru jednotlivým sbírkám • dlouhodobý archiv (light vs. dark archiv) • nápověda: repozitář (digitální knihovna/archiv) by měl být oddělen od koncového rozhraní Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Požadované funkce na zpřístupnění 8 • vyhledávání • nejen metadata, ale i „uvnitř“ objektu

Požadované funkce na zpřístupnění 8 • vyhledávání • nejen metadata, ale i „uvnitř“ objektu (např. články, plný text, titulky, …) • dodání (zobrazení) obsahu objektu • různé verze dodání • vhodný prohlížeč/plugin dle typu objektu • • v souladu s autorskými právy společenský kontext a aktivity uživatelů Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Příklad systému pro zpřístupnění • přirozeně: Primo = koncové rozhraní nad LTP systémem Rosetta

Příklad systému pro zpřístupnění • přirozeně: Primo = koncové rozhraní nad LTP systémem Rosetta • National Library of New Zealand • Binghamton University 9 • • proč klademe důraz na samostatné koncové rozhraní ? proč jednoduše neříkáme, že LTP má koncové rozhraní ? • konec konců také lze uvažovat: Primo = koncové rozhraní nad digitálními knihovnami, jejichž obsah je archivován v LTP systému • Univerzita Karlova Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Směr: jednotné prostředí 10 • ideálně: Primo = koncové rozhraní nejen nad LTP systémem

Směr: jednotné prostředí 10 • ideálně: Primo = koncové rozhraní nejen nad LTP systémem Rosetta • cíl: začlenění výsledků digitalizace do jednotného prostředí (jednotné prostředí ≠ Europeana) • řešení pro všechny uživatele všech kulturních institucí včetně: • digitalizovaného prostoru • elektronického prostoru • tradičního fyzického prostoru • proč má smysl uvažovat v kontextu jednotného prostředí ? Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

2: jednotné prostředí 11 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

2: jednotné prostředí 11 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Jednotné prostředí 12 • • • pro vyhledávání informací a dokumentů pro dodávání informací

Jednotné prostředí 12 • • • pro vyhledávání informací a dokumentů pro dodávání informací a dokumentů pro objevení nového • • používáte ho každý den pro každý dotaz Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Proč ? • • • 13 v rámci vyhledávání a dodávání informací zahájily před

Proč ? • • • 13 v rámci vyhledávání a dodávání informací zahájily před ca 5 lety nástup nové nástroje byly původně označovány jako katalogy nové generace (next-gen OPACs) postupně se vyvinuly v tzv. „discovery“ systémy jejich hlavní důraz je kladen na koncového uživatele, jeho potřeby a prostředí, samostatnost a spokojenost užitečný nástroj v kontextu informační gramotnosti Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Cíle jednotného prostředí • • každý dotaz musí být prováděn ve všech zdrojích instituce*

Cíle jednotného prostředí • • každý dotaz musí být prováděn ve všech zdrojích instituce* (tištěné, elektronické, digitalizované, …) výsledky jsou zobrazeny v jedné výsledkové množině s jednotnou relevancí a s úplnou navigací zobrazení plného textu nebo objektu na jedno kliknutí podpora SSO, integrace objednávání a čtenářského konta * v kontextu KIS 3 G apod. 14 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Co není jednotné prostředí 15 • • pokud uživatel musí přecházet do jiných systémů

Co není jednotné prostředí 15 • • pokud uživatel musí přecházet do jiných systémů pokud se musí uživatel opakovaně přihlašovat pokud uživatel ztrácí kontinuitu svého vyhledávání pokud uživatel musí začínat v „discovery“ systému (příklad) • • pokud rozhraní nenabízí jednotné výsledky pokud rozhraní neumožňuje začlenění libovolného zdroje Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Očekávání ze strany uživatelů* 16 • • • rychlé, jednoduché, intuitivní používání jediné rozhraní

Očekávání ze strany uživatelů* 16 • • • rychlé, jednoduché, intuitivní používání jediné rozhraní navigace pomocí faset DYM, návrhy/našeptávání RSS pokrytí relevantního obsahu • základní přehled „discovery“ systémů http: //www. librarytechnology. org/discovery. pl *Marshall Breeding Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Typické zdroje jednotného prostředí • • • knihovní, muzejní, archivní fondy licencované databáze volně

Typické zdroje jednotného prostředí • • • knihovní, muzejní, archivní fondy licencované databáze volně dostupné dokumenty a data (open access) digitální a digitalizované sbírky institucionální repozitáře … a další dle potřeb uživatelů • různé formáty, různé oprávnění, různé instituce, různý význam discovery také může být zdrojem pro vyšší třídu vyhledávačů • 17 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Typické zdroje jednotného prostředí jednotné prostředí včetně elektronických zdrojů 18 Zpřístupnění digitalizace pro veřejnost,

Typické zdroje jednotného prostředí jednotné prostředí včetně elektronických zdrojů 18 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Anatomie vyhledávání index lokálních zdrojů instituce / institucí index elektronických zdrojů (tzv. velký/centrální index)

Anatomie vyhledávání index lokálních zdrojů instituce / institucí index elektronických zdrojů (tzv. velký/centrální index) • index národních zdrojů (tzv. malý index) výhody: rychlost, kompletní navigace, jednotná relevance • • 19 • • paralelní vyhledávání (tzv. metavyhledávání) externí vyhledávání (jiné Primo, Solr, API, …) • zadávání dotazů a jejich typy Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

3: malý a velký index 20 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

3: malý a velký index 20 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Dimenze obsahu indexu 21 • • obsah je online obsah je k dispozici pro

Dimenze obsahu indexu 21 • • obsah je online obsah je k dispozici pro daného uživatele (tj. instituci) • velký index: stovky miliónů záznamů (licencované i otevřené) • jaký je potenciál národního obsahu ? Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Příklad: potenciál českého obsahu 22 • • • SK ČR, ANL, registr digitalizace oborové

Příklad: potenciál českého obsahu 22 • • • SK ČR, ANL, registr digitalizace oborové bibliografie národní digitální knihovny (M+K+W) oborové digitální knihovny (DML-CZ) NUŠL placené zdroje • • nová média: wiki, archivy vysílání, e-knihy publikační činnost / výstupy Va. V nástroje pro podporu vzdělávání, doporučená literatura institucionální repozitáře • a další (? ) (Anopress IT, Newton Media, Infobanka ČTK, Beck online, ASPI, …) (DSpace. CZ, digitalizace KNAV ČR, …) Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Potenciál českého obsahu – pár čísel • experiment v testovacím prostředí UK: • katalog

Potenciál českého obsahu – pár čísel • experiment v testovacím prostředí UK: • katalog + kvalifikační práce ca 1 mil. záznamů • ostatní ca 1 mil. záznamů, v tom: cswiki + wikiskripta. eu ca 200 tis. záznamů manuscriptorium a kramerius ca 200 tis. záznamů ANL (online) ca 200 tis. záznamů BMČ (online), BDÚ (online), ZPB (online), GEOBIBLINE ca 60 tis. záznamů • DML-CZ a NUŠL ca 100 tis. záznamů • různé ca 50 tis. záznamů (Forum, Anopress IT, Beck online, palmknihy. cz, Newton Media…) • SK ČR ca 50 tis. záznamů • • 23 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Zdroj č. 1: souborné báze NK ČR • Souborný katalog ČR • celkem ca

Zdroj č. 1: souborné báze NK ČR • Souborný katalog ČR • celkem ca 5 mil. záznamů • z toho ca 51 tis. záznamů s online obsahem • problém: rozlišení typu online obsahu v poli 856 (MARC 21) • česká článková bibliografie (báze ANL) • celkem ca 1, 4 mil. záznamů • z toho ca 206 tis. záznamů s online obsahem • problém: nefunkční nebo neplatné odkazy 24 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Zdroj č. 2: digitalizace NK ČR • Kramerius a Manuscriptorium • celkem 200 tis.

Zdroj č. 2: digitalizace NK ČR • Kramerius a Manuscriptorium • celkem 200 tis. záznamů v obou digitálních knihovnách • ca 10 mil. digitalizovaných stran • ca 20 tis. digitalizovaných záznamů • problém: chybí metadata na úrovni článků, DJVU plugin • 25 registr digitalizace – v testovací fázi Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Zdroj č. 3: wiki zdroje 26 • wikipedie (cs) • ca 180 tis. záznamů

Zdroj č. 3: wiki zdroje 26 • wikipedie (cs) • ca 180 tis. záznamů článků (dump abstract. xml) • wikizdroje (cs-books) • ca 18 tis. záznamů článků • wikiknihy (cs-sources) • ca 2 tis. záznamů článků • wikiskripta • ca 4 tis. záznamů lékařských článků • problém: wiki syntaxe; chybí univerzální wiki parser Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Zdroj č. 4: komerční databáze 27 • Anopress IT • vzorek ca 15 tis.

Zdroj č. 4: komerční databáze 27 • Anopress IT • vzorek ca 15 tis. záznamů článků (textové přepisy audiovizuálních relací) • Newton Media • vzorek ca 500 záznamů (deník MF Dnes s plnými texty) • C. H. Beck online • vzorek ca 30 záznamů různých právních dokumentů (judikatura, literatura, Sb. z. , mezin. smlouvy, vyhlášky, …) Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Zdroj č. 5: oborové digitální knihovny 28 • DML-CZ • česká matematická digitální knihovna

Zdroj č. 5: oborové digitální knihovny 28 • DML-CZ • česká matematická digitální knihovna • ca 50 tis. záznamů článků • privátní rozšíření kvalifikovaného DC • NUŠL • národní úložiště šedé literatury • ca 42 tis. záznamů různých druhů dokumentů (bez plného textu pro indexování) • palmknihy. cz • volně dostupné elektronické knihy • ca 3, 5 tis. záznamů v různých formátech (e. Pub, mobi, pdf, …) Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Zdroj č. 6: oborové bibliografie 29 • budovány samostatně odbornými institucemi, typicky ústavy AV

Zdroj č. 6: oborové bibliografie 29 • budovány samostatně odbornými institucemi, typicky ústavy AV • • • týká se ANL (část bibliografií částečně přispívá) týká se národních digitálních knihoven (K) týká se institucionálních repozitářů (digitalizace KNAV ČR) • problém: absence propojení s digitální knihovnou AV ČR Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Oborové bibliografie - výběr 30 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Oborové bibliografie - výběr 30 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Malý a velký index • • 31 velký index celosvětových zdrojů je příliš velký

Malý a velký index • • 31 velký index celosvětových zdrojů je příliš velký a drahý na to, aby si ho instituce mohly dovolit budovat samy malý index národních zdrojů je naopak ideální příležitostí pro lokální cenu/výkon, byť se řada zdrojů pohybuje v šeru Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

4: ukázka ~ Primo od Ex Libris 32 Zpřístupnění digitalizace pro veřejnost, 12. 4.

4: ukázka ~ Primo od Ex Libris 32 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Ukázka systému Primo • • uživatelé: 800 knihoven celosvětově v Evropě: Finsko, Rakousko, Lucembursko,

Ukázka systému Primo • • uživatelé: 800 knihoven celosvětově v Evropě: Finsko, Rakousko, Lucembursko, Německo, Belgie, … • elektronické zdroje: • • 33 získání plného textu (přímé linkování, více zdrojů) doporučení, citovanost dostupnost deduplikace, seskupení (FRBR) čtenářské konto a objednávání z knihovního fondu otevřenost (aktuální články) webové rozhraní pro administrátora Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Ukázka systému Primo • • • 34 chemistry rfid application in libraries babička zemětřesení

Ukázka systému Primo • • • 34 chemistry rfid application in libraries babička zemětřesení japonsko mapa měsíce hypokalcemie versaillská smlouva beckonline mikuláš rutze rur vít richter čtenář vít richter ikaros Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

5: shrnutí 35 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

5: shrnutí 35 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Výzva pro kulturní instituce OBECNĚ 36 • • sjednocení vyhledávacího prostředí sjednocení služeb na

Výzva pro kulturní instituce OBECNĚ 36 • • sjednocení vyhledávacího prostředí sjednocení služeb na něj navázaných • výsledek: • efektivnější využívání zdrojů instituce • častější využívání zdrojů instituce • získání nových uživatelů pro instituci Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Výzva pro kulturní instituce CULTURE. GOV. SK • • • 37 sjednocení digitalizace využití

Výzva pro kulturní instituce CULTURE. GOV. SK • • • 37 sjednocení digitalizace využití existujících sítí KIS 3 G, NISPEZ ad. každá instituce může přispívat a čerpat, ale nemusí spravovat o podobě koncového rozhraní a plnění indexu rozhodujete Vy výsledek: • spokojení uživatelé • spokojené instituce a jejich pracovníci • spokojení zřizovatelé Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Máme za sebou • • zpřístupnění dokumentů pro veřejnost širší kontext: jednotné prostředí malý

Máme za sebou • • zpřístupnění dokumentů pro veřejnost širší kontext: jednotné prostředí malý a velký index praktické ukázky • otázky / diskuse 38 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Děkuji za pozornost. vojnar@multidata. cz 39 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011

Děkuji za pozornost. vojnar@multidata. cz 39 Zpřístupnění digitalizace pro veřejnost, 12. 4. 2011