Metadta nielen pre popis digitlnych objektov Lucia Falbov
Metadáta (nielen) pre popis digitálnych objektov Lucia Falbová, Jana Šubová
O čom budem hovoriť • Čo sú to metadáta • Na čo metadáta slúžia • Členenie, tvorba a práca s metadátami
Čo sú to metadáta = informácie o informáciách • alebo „počítačom spracovateľné štruktúrované informačné objekty popisujúce vlastnosti iných informačných objektov“ • alebo „štruktúrované dáta o dátach“ • alebo. . .
Funkcie metadát inf. o získaní, ©. . . UCHOVÁVANIE požiadavky pre uchovávanie PRÍSTUP podmienky prístupu k inf. „TECHNIKA“ technické požiadavky inf. o metadátach SPRÁVA správa metadát INFORMAČNÝ OBJEKT POPIS bibliografický záznam
Klasifikácia metadát Podľa určenia: • popisné metadáta (vyhľadávanie, identifikácia. . . ) • administratívne metadáta (štruktúra, uloženie. . . ) • štrukturálne metadáta (riadenie prístupu, archivácia. . . ) Podľa štruktúry, formátu: • jednoduché metadáta • štruktúrované metadáta • „bohaté“ metadáta Podľa aplikačnej oblasti: • metadáta pre oblasť vzdelávania • geopriestorové metadáta
Význam metadát informácie informačné objekty (dokumenty) M E T A D Á T A používatelia informačné systémy metadáta môžu znamenať aj prístupový bod používateľov k informáciám a informačným objektom
Metadáta vs. bibliografický popis Popisné metadáta • určené na popis zdrojov s možnosťou vyhľadávania Dublin Core • metadátový štandard, ktorý má byť dosť jednoduchý pre „nekvalifikovaných“ používateľov a zároveň dostatočne komplexný pre výmenu informácií Formáty MARC • štandardy pre reprezentáciu a komunikáciu bibliografických informácií v strojom čitateľnej forme
Metadáta vs. bibliografický popis = metadáta . . . čím teda môže byť téma metadát pre nás nová?
Metadáta – širšie súvislosti hľadisko tvorby technologické hľ. • štandardy popisu (AACR, FRBR. . . ) • metadátové schémy (UNIMARC, Dublin Core) implementácia • UNIMARC so štruktúrou ISO • UNIMARC so štruktúrou XML (Biblio. ML) • MARC so štruktúrou XML (MARCXML). . . • • • štruktúra dát a súborov XML ISO 2709 HTML RDF. . . • • • protokoly HTTP OAI-PMH Z 39. 50 ZING. . . hľ. výmeny informácií • súbor našej_knižnice. iso • súbor vašej_knižnice. xml. . . hľadisko služieb • OPAC založený na HTTP/HTML • vyhľadávanie založené na Z 39. 50. . .
Hľadisko tvorby Dublin Core (DC) – štruktúra: • súbor metadátových prvkov (názov, tvorca, predmet, popis, vydavateľ, prispievateľ, dátum, typ, formát, identifikátor, zdroj, jazyk, vzťah, pokrytie, práva) • kvalifikátory (spresňujú prvky a určujú použité pravidlá pre zápis údajov) • názov môže mať kvalifikátor „alternatívny“ • dátum môže mať kvalifikátor „vytvorený“, „platný“, „vydaný“, . . . • predmet môže mať kvalifikátor „LCSH“, „Me. SH“, „DDC“, . . .
Hľadisko tvorby Dublin Core (DC) – základné charakteristiky: • jednoduchosť • sémantická interoperabilita • medzinárodný konsenzus • rozšíriteľnosť • modularita metadát na webe • modifikovateľnosť Dublin Core (DC) • vytváranie DC nad rámec „bežného“ bibliografického popisu • vytváranie DC z existujúcich údajov – konverzia UNIMARC do štruktúry DC
Hľadisko tvorby Dublin Core UNIMARC názov 200 $a názov 200 $e podnázov 510 $a súbežný názov 517 $a ďaľšie varianty názvu tvorca 700 $a osobné meno – hlavná zodpovednosť 701 $a osobné meno – spoluautor 710 $a korporácia – hlavná zodpovednosť 711 $a korporácia – spoluautor predmet 610 $a kľúčové slová 606 predmetové heslá 675 MDT 676 DDC 680 LCC 686 iné klasifikačné systémy
Príklad – Dublin Core http: //www. webarchiv. cz/cgi-bin/dc_cz. pl
Technologické hľadisko XML – prečo? 1. XML nie je limitujúce 2. XML je „človekom čitateľné“ 3. XML sa dá jednoducho vytvoriť (aj pomocou textového editora) a jednoducho overiť (pomocou tzv. parserov) 4. XML má relatívne presnú syntax 5. XML podporuje tvorbu hierarchických vzťahov 6. XML môže obsahovať aj informácie o spôsobe prezentácie dát 7. XML „spolupracuje“ s www prostredním
Technologické hľadisko XML – čo to je: • vyvinutý konzorciom W 3 C • patrí do skupiny značkovacích jazykov • XML - e. Xtensible Markup Language – rozšírený alebo rozšíriteľný značkovací jazyk • formát pre ukladanie štruktúrovaného textu • má logickú a fyzickú štruktúru; logická štruktúra rozdeľuje dokument do pojmových jednotiek a podjednotiek, fyzická štruktúra umožňuje pomenovať a uložiť samostatné časti dokumentu
Technologické hľadisko XML • umožňuje definovať nielen spracovanie informácie – formát, ale aj jej sémantickú úroveň – obsah • popisuje nielen to, čo dáta sú a ako ich spracovávať, ale aj čo znamenajú, t. j. umožňujú automatizované logické myslenie • je prenosný medzi systémami, pretože používa SGML ako centrálnu technológiu
Technologické hľadisko XML – význam: • štandardný formát pre výmenu dát medzi aplikáciami a pre publikovanie dokumentov • medzinárodná podpora – umožňuje používať znaky všetkých jazykov (kódovanie je presne určené), používa štandard ISO 10646 (tiež UNICODE) • vysoký informačný obsah – presne vyznačené jednotlivé časti dokumentu • ľahká konverzia do iných formátov • automatická kontrola štruktúry dokumentu • hypertext a odkazy
Technologické hľadisko získavanie podpora elektronického obchodu spracovanie konverzia do rôznych formátov uchovávanie formát elektronických dokumentov nezávislý na rôznych platformách sprístupňovanie dokumentov informácií vhodný pre www prostredie prácu s aplikácie heterogénnymi IZ lepší systém vyhľadávania
Technologické hľadisko Čo je potrebné pre využitie XML pri bibliografickom popise • DTD alebo XML schéma – popis štruktúry XML dokumentu • nástroj, ktorý umožní ukladanie dát v štruktúre XML – prípadne nástroj na konverziu dát do štruktúry XML
Príklad – Biblio. ML http: //www. biblioml. org/fr/form/index. html
Príklad – MARCXML http: //www. loc. gov/standards/marcxml/
Ďakujem za pozornosť! Lucia Falbová, Jana Šubová www. cosmotron. cz falbova@cosmotron. cz, subova@cosmotron. cz
- Slides: 22