Archiwa cyfrowe moliwoci ich wykorzystania w bibliotekach dr
Archiwa cyfrowe możliwości ich wykorzystania w bibliotekach. dr Grzegorz Gmiterek Instytut Informacji Naukowej i Studiów Bibliologicznych UW
Rozwój cywilizacji • Biblioteka Aleksandryjska (Starożytność) • Projekt Gutenberg (Współczesność)
www. archive. org
Archiwizacja zasobów WWW 2002 r. – 10 mld. stron 2006 r. – 40 bilionów stron 2012 r. - ? Cofnijmy się w czasie
www. archive. org
www. wp. pl (98 r. )
www. uw. edu. pl (marzec 2000 r. )
Dodawanie swojej strony do archiwum
, , Prelinger Archive’’
EDUCATION
Niezależnie od czasu jaki upłynął od stworzenia obiektu cyfrowego użytkownik musi posiadać możliwość odtworzenia zawartej w nim informacji Adam Dudczak PCSS M. Góralska: Książka on-line. Próba objaśnienia zjawiska. „EBIB” 2003, nr 7
Powody długoterminowej archiwizacji zasobów • Zagrożenia: utrata, zniszczenie nośnika zapisu, • Ewolucja, starzenie się formatów umożliwiających zapoznawanie się z zasobami cyfrowymi.
Ochrona przed zagrożeniami Ø Ciągła migracja do nowych formatów, Ø Emulacja starszych aplikacji (np. emulacja starszych technologii na współczesnych platformach technologicznych).
• Brak zrozumienia istoty ewolucji dokonującej się w świecie technologii i zapisu informacji może być powodem bezpowrotnej utraty możliwości odczytu elektronicznych zasobów
DŁUGOTERMINOWA ARCHIWIZACJA ZASOBÓW CYFROWYCH • „zbiór wszystkich procesów służących zapewnieniu ciągłości dostępu do materiałów należących do dziedzictwa cyfrowego w okresie, w którym ciągłość taka jest pożądana” (Ochrona dziedzictwa cyfrowego: zalecenia, Oprac. National Library of Australia) • zachowanie środków zapewniających dostęp do autentycznej treści cyfrowego dokumentu, ale także jego wykorzystanie zgodnie z celem, w jakim został stworzony. Rozmiar współczesnego świata cyfrowego to 1. 2 zetabajty (1. 2 x 1012 gigabajów), a z każdym rokiem świat ten jest większy o 50% (przy czym 25% to zasoby unikalne, 75% - kopie) – Piotr Beńke (IBM)
DŁUGOTERMINOWA ARCHIWIZACJA ZASOBÓW CYFROWYCH PARADOKS „tradycyjnie, ochrona rzeczy oznaczała zachowanie ich w niezmienionej formie; tymczasem rzeczywistość cyfrowa zmieniła fundamentalnie naszą koncepcję wymagań konserwacyjnych. Jeżeli zachowamy informację cyfrową bez modyfikacji, dostęp do niej stanie się niezmiernie trudny, jeżeli niemożliwy” Su-Sing Chen, profesor z Wydziału Informatyki i Inżynierii Informacji z Uniwersytetu na Florydzie.
Biblioteki jako jeden z największych „producentów danych cyfrowych” Główne problemy: qrozbudowa systemu zarządzającego zarchiwizowanymi zasobami, qprawidłowa organizacja metadanych, qkonieczność zapewnienia dostępu w perspektywie długoterminowej, qbezpieczeństwo, qpoufność, qkompletność i niezmienność danych, qutrzymanie ich substancji, qautentyczność, qintegralność danych, qrosnące koszty przechowywania danych cyfrowych. „misją Narodowej Infrastruktury Informacji Cyfrowej i Programu Ochrony jest gromadzenie, archiwizowanie i zabezpieczanie rosnących ilości danych, zwłaszcza materiałów, które mają tylko formę elektroniczną (tzw. born digital) dla obecnych i przyszłych pokoleń” Biblioteka Kongresu oraz Rada Zbiorów Bibliotecznych i Informacyjnych
DŁUGOTERMINOWA ARCHIWIZACJA ZASOBÓW CYFROWYCH
DŁUGOTERMINOWA ARCHIWIZACJA ZASOBÓW CYFROWYCH Biblioteki centralne jako instytucje współodpowiedzialne za proces archiwizacji i udostępniania zasobów Dokument opracowanym przez Bibliotekę Narodową Australii na zlecenie UNESCO, zawierającym wskazówki i zalecenia techniczne dotyczące ochrony oraz zapewnienia ciągłej dostępności powiększającego się dziedzictwa cyfrowej rzeczywistości.
Projekt A. Januszko -Szakiel Program Długoterminowej Archiwizacji Polskich Zasobów Cyfrowych Biblioteczny system depozytowy Narodowego Repozytorium Dokumentów Elektronicznych 1996 r. – najwcześniejsza data opublikowania dokumentów będących w zasobach BN (na nośniku fizycznym) Średni czas życia strony WWW to tylko 44 dni. (J. Potęga)
Zadania NAC
Rozmieszczenie Węzłów oraz usług systemu KMD. Źródło: http: //kmd. pcss. pl/index. html Poznańskie Centrum Superkomputerowo-Sieciowe Rozmieszczenie Węzłów oraz usług systemu KMD. Źródło: http: //kmd. pcss. pl/index. html
Długoterminowa archiwizacja - doświadczenia Model organizacji i funkcjonowania archiwów elektronicznych OAIS (Open Archival Information System) Rozróżnienie pomiędzy danymi cyfrowymi (Data Object), a obiektami informacyjnymi (Information Object). Przy czym te drugie oprócz danych cyfrowych zawierają też narzędzia umożliwiające przetworzenie surowych danych tak, aby użytkownik był w stanie się z nimi zapoznać
Rosetta firmy Ex Libris Trzy moduły: archiwizacji i ochrony, przechowywania i depozytu oraz zarządzania poszczególnymi kolekcjami dokumentów System Rosetta. Moduł depozytu. Okno kolekcji – opis dokumentu (format opisu).
Tożsamość
Możliwość prawidłowego odczytania i zrozumienia zasobu üTrwałość, stałość (fixity) czyli zabezpieczenie obiektów cyfrowych przed nieautoryzowanymi zmianami (celowymi bądź niezamierzonymi). üWażnym aspektem jest tutaj też możliwość przechowywania pełnych obiektów informacyjnych (dane, metadane, Yanivnarzędzia). Levi Identyfikacja i odczyt dokumentu zapisanego w danym formacie
Dziękuję za uwagę
- Slides: 47