Universidade do Minho Mestrado em Informtica Preservao Digital

  • Slides: 32
Download presentation
Universidade do Minho Mestrado em Informática Preservação Digital conceitos, estratégias e actuais consensos Miguel

Universidade do Minho Mestrado em Informática Preservação Digital conceitos, estratégias e actuais consensos Miguel Ferreira mferreira@dsi. uminho. pt 2006 -05 -05

Contextualização Mestrado em Informática Universidade do Minho 2 • Vivemos na era digital –

Contextualização Mestrado em Informática Universidade do Minho 2 • Vivemos na era digital – Grande parte da actual produção intelectual é criada em formatos digitais – Facilidades na sua criação e disseminação – Qualidade dos resultados obtidos • Rápida obsolescência da tecnologia – Embora um objecto digital possa ser copiado inúmeras vezes sem perder qualidade – Depende de um contexto tecnológico para que possa ser interpretado – Os objectos acabam prisioneiros dos seus próprios suportes e/ou formatos

Preservação Digital Mestrado em Informática Universidade do Minho 3 Conjunto de actividades ou processos

Preservação Digital Mestrado em Informática Universidade do Minho 3 Conjunto de actividades ou processos responsáveis por garantir o acesso continuado a longo-prazo à informação e restante património cultural existente em formatos digitais Webb, C. , Bradley, K. , Campbell, D. , Clifton, G. , Corbould, M. , O’Connor, M. , Phillips, M. and Whiting, J. Guidelines for the Preservation of Digital Heritage, Information Society Division - United Nations Educational, Scientific and Cultural Organization, 2003.

Longo-prazo Mestrado em Informática Universidade do Minho 4 Período de tempo suficientemente longo para

Longo-prazo Mestrado em Informática Universidade do Minho 4 Período de tempo suficientemente longo para que haja preocupação com o impacto da evolução da tecnologia (incluindo o aparecimento de novos suportes e/ou formatos de dados), assim como, com alterações ao nível dos requisitos/exigências impostos pela comunidade de consumidores da informação preservada. Consultative Committee for Space Data Systems Reference Model for an Open Archival Information System (OAIS) - Blue Book. National Aeronautics and Space Administration, Washington, January 2002.

Objecto, Material ou Recurso Digital Mestrado em Informática Universidade do Minho Tudo que possa

Objecto, Material ou Recurso Digital Mestrado em Informática Universidade do Minho Tudo que possa ser representado em formato digital, quer tenha nascido digital, quer tenha sido convertido a partir de formatos analógicos • e. g. databases, spreadsheets, word processor documents, webpages, video, audio, images, maps, 2 and 3 D models, computer software, etc… Thibodeau, K. , Overview of Thechnological Approaches to Digital Preservation and Challenges in Coming Years. in The State of Digital Preservation: An International Perspective, (Washington D. C. , July 2002), Documentation Abstracts, Inc. - Institutes for Information Science. 5

Analógico versos Digital Mestrado em Informática Universidade do Minho 6

Analógico versos Digital Mestrado em Informática Universidade do Minho 6

Analógico versus Digital Mestrado em Informática Universidade do Minho 7

Analógico versus Digital Mestrado em Informática Universidade do Minho 7

A anatomia dum Objecto Digital Universidade do Minho Mestrado em Informática Universidade do Minho

A anatomia dum Objecto Digital Universidade do Minho Mestrado em Informática Universidade do Minho • Nível Conceptual 8 – Aquilo com que lidamos no mundo real; o que reconhecemos como uma unidade significativa de informação – e. g. , jornal, livro, mapa, fotografia • Nível Lógico – Codificação da informação – Tarefa realizada pelo software – Trata-se do formato do objecto • Nível Físico – Sinais inscritos em suporte físico – e. g. disco rígido, CD, Pen-drive Thibodeau, K. , Overview of Thechnological Approaches to Digital Preservation and Challenges in Coming Years. in The State of Digital Preservation: An International Perspective, (Washington D. C. , July 2002), Documentation Abstracts, Inc. - Institutes for Information Science.

A anatomia dum Objecto Digital Mestrado em Informática Universidade do Minho 9 Se um

A anatomia dum Objecto Digital Mestrado em Informática Universidade do Minho 9 Se um dos níveis se tornar obsoleto o objecto conceptual deixa de estar acessível Thibodeau, K. , Overview of Thechnological Approaches to Digital Preservation and Challenges in Coming Years. in The State of Digital Preservation: An International Perspective, (Washington D. C. , July 2002), Documentation Abstracts, Inc. - Institutes for Information Science.

Universidade do Minho Mestrado em Informática Universidade do Minho 10 Estratégias de Preservação

Universidade do Minho Mestrado em Informática Universidade do Minho 10 Estratégias de Preservação

Estratégias de Preservação Universidade do Minho Mestrado em Informática • Foco no objecto físico/lógico

Estratégias de Preservação Universidade do Minho Mestrado em Informática • Foco no objecto físico/lógico 11 – Preocupação em preservar a informação nos seus formatos lógicos e/ou físicos originais – Utilização da tecnologia originalmente associada a estes objectos para garantir o acesso aos mesmos – Preservação de tecnologia • Foco no objecto conceptual – Preocupação em preservar as características essenciais dos objectos digitais de uma forma independente do hardware e do software – Preservação de objectos conceptuais

Universidade do Minho Mestrado em Informática Universidade do Minho 12 Preservação de tecnologia (físico/lógico)

Universidade do Minho Mestrado em Informática Universidade do Minho 12 Preservação de tecnologia (físico/lógico)

Refrescamento Universidade do Minho Mestrado em Informática Universidade do Minho 13 Transferência de informação

Refrescamento Universidade do Minho Mestrado em Informática Universidade do Minho 13 Transferência de informação de um suporte físico de armazenamento para outro mais estável antes que o primeiro se deteriore ou se torne irremediavelmente obsoleto

Preservação de tecnologia Universidade do Minho Mestrado em Informática Universidade do Minho 14 •

Preservação de tecnologia Universidade do Minho Mestrado em Informática Universidade do Minho 14 • Museus de hardware – Preservação do contexto de criação/interpretação original em museus de hardware e software obsoleto • Demasiado dispendioso • Dificuldade em mater o hardware operacional a longoprazo • Restrições elevadas no acesso à informação • Dificuldade na reutilização da informação • Digital tablet – Um computador portátil com um ecrã sensível ao tacto especializado na interpretação de determinados tipos de material – Possui as mesmas desvantagens da preservação de hardware

Emulação Universidade do Minho Mestrado em Informática Universidade do Minho 15 Software capaz de

Emulação Universidade do Minho Mestrado em Informática Universidade do Minho 15 Software capaz de reproduzir o comportamento de uma plataforma de hardware e/ou software • Vantagens – Recriação do contexto tecnológico original – Preservação do look & feel do objecto • Desvantagens – – – Os próprios emuladores estão sujeitos a obsolescência Os utilizadores são obrigados a operar sistemas obsoletos A construção de emuladores é um processo complexo Problemas de direitos de autor Preservar um sistema operativo inteiro apenas para visualizar um documento parece uma tarefa exageradamente pesada – Não garante a reutilização da informação.

Encapsulamento Universidade do Minho Mestrado em Informática Universidade do Minho 16 Preservação do bit

Encapsulamento Universidade do Minho Mestrado em Informática Universidade do Minho 16 Preservação do bit stream original juntamente com metainformação capaz de garantir a sua futura interpretação • Vantagens – Permite adiar as responsabilidades de preservação – Orientado a objectos que apenas serão acedidos num futuro longínquo – Desenvolvimento de visualizadores, migradores ou emuladores apenas no futuro • Desvantagens – Objectos complexos possuem especificações complexas – Uma especificação incompleta poderá ter um efeito desastroso

Universal Virtual Computer Universidade do Minho Mestrado em Informática Universidade do Minho 17 •

Universal Virtual Computer Universidade do Minho Mestrado em Informática Universidade do Minho 17 • Variante da Emulação e Encapsulamento • Preservação do bit stream original + parser compilado para uma máquina virtual (e. g. Java) • A máquina virtual será facilmente reproduzida no futuro • Simplifica o processo de emulação • Está limitada a um conjunto finito de operações • Necessita de software de visualização • Estratégia ainda em estudo (interpretação muito lenta) Raymond Lorie, IBM

Universidade do Minho Mestrado em Informática Universidade do Minho 18 Preservação do objecto conceptual

Universidade do Minho Mestrado em Informática Universidade do Minho 18 Preservação do objecto conceptual

Migração Universidade do Minho Mestrado em Informática Universidade do Minho 19 • Descrição –

Migração Universidade do Minho Mestrado em Informática Universidade do Minho 19 • Descrição – Transferência periódica de material digital de uma configuração de hardware/software para outra mais actual – Concentra-se na preservação das características essenciais do objecto sem se preocupar em manter o bit stream original • Vantagens – Disseminação dos materiais em formatos actualizados que os consumidores reconhecem – Sem necessidade de preservar o software original – A estratégia mais aplicada e a única que funcionou até ao momento • Desvantagens – Possível perda de informação durante a conversão – Necessidade de diligência continua – Dispendiosa a longo-prazo

Migração (variantes) Universidade do Minho Mestrado em Informática • Print-out 20 – Transferir o

Migração (variantes) Universidade do Minho Mestrado em Informática • Print-out 20 – Transferir o objecto digital para um meio analógico mais persistente (e. g. imprimir em papel) • Actualização de versões – Actualização dos formatos utilizando software retrocompatível – e. g. utilização do Word 6 para actualizar um documento criado com o Word 5 • Migração entre formatos – Conversão para formatos rivais • Normalização – Migração para um número mais reduzido de formatos normalizados

Migration on Request Universidade do Minho Mestrado em Informática Universidade do Minho 21 •

Migration on Request Universidade do Minho Mestrado em Informática Universidade do Minho 21 • Variante da migração com o objecto de fazer diminuir a perda de informação • Preservação do bit stream original • Manutenção de uma ferramenta capaz de converter o bit stream original para formatos actuais

Migração distribuída Universidade do Minho 22 t 1 <. 9, . 8, . 95,

Migração distribuída Universidade do Minho 22 t 1 <. 9, . 8, . 95, . 1> <. 7 , <. 9, . 8, . 6, . 1> Mestrado em Informática Universidade do Minho t 2 t 3 . 5, . 65, <. 5 , . 3 . 1> t 4 t 5 <. 9, . 6, t 6 1> 9 , . 6 , . . 5, t 7 3 <. , <. 5, . 3 . 95, 1> , . 9 5, . 6 > . 9, . 7>

Universidade do Minho Mestrado em Informática Universidade do Minho 23 O modelo de referência

Universidade do Minho Mestrado em Informática Universidade do Minho 23 O modelo de referência OAIS

Modelo de referência OAIS Universidade do Minho Mestrado em Informática Universidade do Minho 24

Modelo de referência OAIS Universidade do Minho Mestrado em Informática Universidade do Minho 24 • Define os componentes funcionais básicos presentes num sistema de arquivo com responsabilidade de preservação – Interfaces internas e externas – Caracteriza os objectos digitais manuseados – Determina a terminologia a utilizar no contexto da preservação • Desenvolvido pelo Consultative Commitee for Space Data Systems (CCSDS) – Grupo responsável por estabelecer normas para os dados produzidos por agências espaciais • Aprovado como uma norma ISO em Janeiro de 2002 (ISO 14721) Consultative Committee for Space Data Systems Reference Model for an Open Archival Information System (OAIS) - Blue Book. National Aeronautics and Space Administration, Washington, January 2002.

OAIS (Intervenientes) Universidade do Minho • Produtor Universidade do Minho Mestrado em Informática –

OAIS (Intervenientes) Universidade do Minho • Produtor Universidade do Minho Mestrado em Informática – Responsável pela criação e depósito do material 25 • Consumidor – Aquele que procura encontrar itens de informação • Gestão – Responsável pela gestão do arquivo digital

OAIS (Componentes Funcionais) Universidade do Minho • Ingestão Universidade do Minho Mestrado em Informática

OAIS (Componentes Funcionais) Universidade do Minho • Ingestão Universidade do Minho Mestrado em Informática – Recepção, validação, transformação, descrição da informação submetida pelos produtores 26 • Armazenamento – Garante a preservação da informação a nível físico e lógico (e. g. refrescamento, migração, verificação de integridade, disaster recovery, etc. ) • Gestão de metainformação – Responsável pela gestão da metainformação associada aos objectos custodiados

OAIS (Componentes Funcionais) Universidade do Minho Mestrado em Informática • Planeamento de preservação 27

OAIS (Componentes Funcionais) Universidade do Minho Mestrado em Informática • Planeamento de preservação 27 – Monitoriza o ambiente externo quanto a modificações na tecnologia ou comunidade de utilizadores que poderão afectar a estratégia de preservação • Acesso – Localização, pedido, transformação e entrega de objectos digitais aos consumidores – Controlo de acessos • Administração – Dá suporte às operações do dia-a-dia – Coordena as restantes actividades

OAIS (Information Packages) Universidade do Minho Mestrado em Informática • Pacote de submissão (SIP)

OAIS (Information Packages) Universidade do Minho Mestrado em Informática • Pacote de submissão (SIP) 28 – Objecto digital fornecido – Metainformação disponibilizada pelo produtor • Pacote de arquivo (AIP) – Objecto digital a arquivar – Metainformação suficiente para garantir a preservação e o acesso ao objecto • Pacote de disseminação (DIP) – Objecto no formato que será entregue ao consumidor – Metainformação relevante

Conclusões Universidade do Minho Mestrado em Informática • Emulação versus Migração 29 – Emulação

Conclusões Universidade do Minho Mestrado em Informática • Emulação versus Migração 29 – Emulação para preservação de software e objectos complexos/interactivos – Migração para a preservação dos restantes objectos digitais • Não existe uma solução única e adequada a todos os tipos de material • Preservação do bit stream original – Hoje em dia reconhece-se que para garantir a preservação será necessário alterar o objecto preservado – Os objectos analógicos (e. g. livros) também são modificados ao longo do tempo (e. g. escurecimento das folhas)

Conclusões Universidade do Minho Mestrado em Informática Universidade do Minho 30 • A decisão

Conclusões Universidade do Minho Mestrado em Informática Universidade do Minho 30 • A decisão sobre que estratégia de preservação adoptar depende de vários factores: – – Simplicidade de implementação a curto e longo-prazo Custo Restrições legais Satisfação da comunidade de interesse • Avaliação/selecção vs arquivar cegamente – O preço/Mb decresce com o tempo – O preço do homem/mês aumenta com o tempo – “Prefiro ser condenado por algo que fiz do que por algo que não fiz” (Lesk, Internet Archive)

Universidade do Minho Mestrado em Informática Discussão Universidade do Minho 31

Universidade do Minho Mestrado em Informática Discussão Universidade do Minho 31

Questões Universidade do Minho Mestrado em Informática Universidade do Minho 32 • Dê exemplos

Questões Universidade do Minho Mestrado em Informática Universidade do Minho 32 • Dê exemplos de objectos digitais que gostaria de ver preservados por um longo período de tempo. Justifique. • Que medidas poderiam ser tomadas para preservar cada uma dos objectos que identificou?