Controle de vocabulrio taxonomia corporativa e tesauro funcional
Controle de vocabulário, taxonomia corporativa e tesauro funcional para Arquivos. Indexação em arquivos. Elaborado Cibele A. C. M. Santos para a disciplina CBD 0164 – Introdução à Organização de Arquivos no CDB/ECA/USP – Aula 10
• O acesso à informação nos arquivos é mediado por pontos de acesso, portas ou pontes que permitem detectar agrupamentos de documentos, distinguindo-os de outros agrupamentos de documentos. (Smit e Kobashi, 2003) 2
• Tipologia documental • Instituição Produtora/Receptora • Data (Smit e Kobashi, 2003) 3
• a identificação das características documentos – descrição eficiente - menor tempo possível do arquivista quanto do usuário do sistema; – descrição eficaz - objetivo do arquivo atingido. – nos documentos e/ou seus conjuntos - as categorias informacionais para busca. • As normas ISAD (G) e ISAAR (CPF) dispõem de categorias informacionais para descrição e controle de autoridade respeitando os princípios arquivísticos. 4
• controle de vocabulário é um meio para produzir confiança no sistema de organização e na busca de informações arquivísticas (Smit e Kobashi, 2003). • desenvolvido pela Documentação e introduzido na arquivística, especialmente em razão da informatização crescente dos arquivos (Smit e Kobashi, 2003). • Identificação do assunto do documento ou dos conjuntos de documentos (quando pertinente) (Santos, 2018). 5
• Nos arquivos correntes, diferentes rotinas incluem – ou deveriam incluir – a preocupação com o controle de vocabulário: – elaboração de tabelas de temporalidade dos documentos, – nomeação das séries documentais; – elaboração de planos de classificação, através da nomeação das atividades desenvolvidas pela instituição ou nomeação das séries documentais; – na elaboração de listas de assuntos para protocolos automatizados; – atribuição de títulos a formulários (Smit e Kobashi, 2003). 6
Fonte: Como elaborar vocabulário controlado para arquivo. (Smit e Kobashi, 2003) 7
OPERAÇÃO / MOMENTO VARIÁVEIS Elaboração e gestão do vocabulário controlado • Política da instituição como um todo (missão e objetivos) • Atividades/funções envolvidas na documentação a ser organizada. • Identificação da linguagem de especialidade e terminologia. • Planejamento e desenvolvimento • Manutenção e atualização Utilização do vocabulário controlado • Política de acesso à informação • Política de indexação • Público-alvo 8
• introdução relativamente recente na área, ainda não se dispõe de um número razoável de vocabulários controlados desenvolvidos para arquivos; • empresas privadas que desenvolvem seus vocabulários controlados, via de regra, não os colocam em domínio público, pois consideram resultado de um investimento (Smit e Kobashi, 2003). 9
• introdução relativamente recente na área. . . (Smit e Kobashi, 2003). • A organização da informação nos arquivos pode, no entanto, ser considerada como parte da área de organização do conhecimento (tradução nossa, Hjørland, 2016) http: //www. isko. org/cyclo/knowledge_organization#ref 10
• CONTROLE DE VOCABULÁRIO = processo, objetivo que se deseja atingir; • VOCABULÁRIO CONTROLADO = um instrumento para nomear as atividades/funções, gerando confiança no sistema. (Smit e Kobashi, 2003) 11
• Tamanho do arquivo e projeção de crescimento, variedade de atividades e tipos documentais – complexidade e diversidade de funções desenvolvidas pela instituição. • Área de atuação da instituição – atividades-fim da instituição se muito especializadas supõem a incorporação de uma linguagem mais especializada. • Objetivos da instituição e determinação de prioridades no atendimento no arquivo. (Smit e Kobashi, 2003) 12
• O ideal é que o vocabulário controlado reflita a linguagem da instituição, aproximando-se o máximo possível da linguagem do “usuário”. • Todas as variáveis evocam questões de linguagem e sua adequação a culturas locais, a composição sociocultural e socioprofissional dos usuários do sistema. (Smit e Kobashi, 2003) 13
• Procedimentos “micro” de controle de vocabulário – – – Normalização gramatical Opções de grafia Alterações em nomes de pessoas ou topônimos Controle de sinonímia, homonímia e quase-sinonímia Adoção de termos compostos Notas de escopo e de uso (Smit e Kobashi, 2003) 14
• Normalização gramatical – Forma substantiva, masculina e singular dos termos. – Forma plural se representar conceitos diferentes ou classe de objetos. – Forma plural é o termo consagrado. • Opções de grafia – Grafias diferentes em função da passagem do tempo. (Smit e Kobashi, 2003) 15
• Alterações nomes de pessoas ou topônimos • nomes de pessoas ou topônimos são variante das opções de grafia. • lugares (cidades, bairros, ruas, praças, etc. ), supõe-se sempre a possibilidade de resgatar o ato que determinou a mudança (decisão de Câmara, Assembléia, etc. ) : – Floriano Peixoto, rua - até 1907 chamada Fundição, rua da – Fundição, rua da USE Floriano Peixoto, rua, nome do logradouro a partir de 1907. (Smit e Kobashi, 2003) 16
• Alterações nomes de pessoas ou topônimos • nomes próprios de pessoas - nomes artísticos ou outras mudanças no nome. – O Visconde do Bom Retiro, nasceu José da Silva. Qual nome adotar? Provavelmente o de Visconde, pois supõe-se que, a partir da obtenção do título nobiliárquico, a geração dos documentos tenha sido maior. – normas preconizam a adoção do nome mais conhecido, mas nem sempre há consenso sobre o nome mais conhecido. (Smit e Kobashi, 2003) 17
• Alterações nomes de pessoas ou topônimos • manter a mesma lógica em todos os casos; • utilizar o recurso da remissiva para garantir o controle e evitar que a mesma pessoa tenha seus documentos acumulados em dois conjuntos distintos. – Forma adotada • VISCONDE DO BOM RETIRO - nascido José da Silva, tornou-se visconde em. . . • JOSÉ DA SILVA USE VISCONDE DO BOM RETIRO, título obtido em. . • Remissiva da forma não adotada para a forma adotada pelo sistema (Smit e Kobashi, 2003) 18
• distinção entre termos adotados e termos não adotados pelo sistema; • remissivas dos termos não adotados para os termos adotados pelo sistema; • padronização formal dos termos adotados; • conceituação de termos. (Smit e Kobashi, 2003) 19
• Procedimentos “macro” – ordenação de termos • Termos submetidos ao controle de vocabulário devem ser ordenados, organizados, hierarquizados ou categorizados. • A categorização gera significado ao introduzir os termos num sistema significante. • Gera a arquitetura do universo de funções e atividades da instituição. • Atribui sentido ao todo. (Smit e Kobashi, 2003) 20
21
• Tesauro funcional controla o vocabulário que designa a razão de ser do documento (sua função) e não o que ele contém (assunto). • Construção parte do plano de classificação e o reordena. • Um tesauro funcional não substitui o plano. Apresenta diferentes visualizações deste (sua estrutura, a apresentação hierárquica e a lista alfabética). (Smit e Kobashi) 22
• Tesauro funcional – – Organização física dos documentos. Organização intelectual das atividades que os produzem. opera como índice de termos do plano de classificação; opera como índice para encontrar séries documentais a serem eliminadas; – provê pontos de acesso ao usuário, – pode ser usado como ferramenta para ajudar a encontrar documentos necessários para as tarefas do dia-a-dia. (Smit e Kobashi) 23
• Propostas / exemplos • Tipologia documental – Espécie documental + de + função/atividade + assunto – Ofício + de + solicitação + de + policiamento • Tipologia documental + assunto (NOBRADE) – – – Espécie documental + de + função/atividade assuntos Ofício + de + solicitação Solicitação de policiamento Segurança pública 24
• SOC (Sistemas de Organização do Conhecimento ou KOS (Knowledge Organization Systems) – utilizados nas bibliotecas, arquivos e museus (tradicionais ou digitais), – áreas institucionais, empresariais e comerciais, – classificações, tesauros ou vocabulários controlados, – taxonomias usadas na organização de sites de empresas, – aplicados a registros de metadados. • A construção de SOCs, incluindo linguagens documentárias, exige conhecimentos específicos: – padrões, normas, formatos, – contribuições da Linguística, da Lógica e da Computação. 25
• SOC (Sistemas de Organização do Conhecimento ou KOS (Knowledge Organization Systems) – utilizados nas bibliotecas, arquivos e museus (tradicionais ou digitais), – áreas institucionais, empresariais e comerciais, – classificações, tesauros ou vocabulários controlados, – taxonomias usadas na organização de sites de empresas, – aplicados a registros de metadados. • A construção de SOCs, incluindo linguagens documentárias, exige conhecimentos específicos: – padrões, normas, formatos, – contribuições da Linguística, da Lógica e da Computação. 26
Termos Definição Fonte Sistemas de Organização do Conhecimento Sistemas que incluem todos os tipos de esquemas para organização da informação como os sistemas de classificação e categorização, listas de cabeçalhos de assunto, controle de autoridades, vocabulários estruturados, tesauros, taxonomias e esquemas emprestados de outras áreas como as redes semânticas e as ontologias. (HODGE, 2000) Anéis de sinônimos Grupo de termos que são considerados equivalentes para proposições de recuperação. ANSI/NISO Z 39. 192005 (R 2010) Vocabulário controlado Lista de termos explicitados e controlados, sendo que seus termos não podem ter ambiguidade e devem ter definições que não sejam redundantes. ANSI/NISO Z 39. 192005 (R 2010) Fonte: SANTOS, C. A. C. M. ; JESUS, E. A. ; LUCA, J. R. A informação digital e os sistemas de organização do conhecimento. In: IV Seminário de Pesquisa da FESPSP, 2015, São Paulo. Anais. São Paulo: FESPSP, 2015. p. 1 -15. 27
Termos Definição Fonte Linguagem de indexação Vocabulário controlado ou sistema de classificação e suas regras para aplicação, linguagem usada para a representação dos conceitos tratados nos documentos. ANSI/NISO Z 39. 19 -2005 (R 2010) Linguagem documentária Conjunto de termos, providos ou não de regras sintáticas, utilizadas para representar conteúdos de documentos técnico-científicos com fins de classificação ou busca retrospectiva de informações. (GARDIN et al. , 1968, apud CINTRA et al, 2002). Sistemas de Método de organização caracterizado por um conjunto de princípios pré-estabelecidos com sistema de notação e estrutura hierárquica de relacionamento entre as entidades. ANSI/NISO Z 39. 19 -2005 (R 2010) classificação Fonte: SANTOS, C. A. C. M. ; JESUS, E. A. ; LUCA, J. R. A informação digital e os sistemas de organização do conhecimento. In: IV Seminário de Pesquisa da FESPSP, 2015, São Paulo. Anais. São Paulo: FESPSP, 2015. p. 1 -15. 28
Termos Tesauro Definição Fonte 1. Listas nas quais os conceitos são ISO 25964 -1 representados por termos, organizados de forma (2011) que as relações entre conceitos são explícitas e os termos preferidos são acompanhados por entradas de termos não preferidos para sinônimos e quase sinônimos. 2. Vocabulários controlados estruturados cuja hierarquia e relações entre os termos são mostradas de forma clara e identificados por indicadores padronizados, que devem ser empregados reciprocamente. ANSI/NISO Z 39. 19 -2005 (R 2010) Fonte: SANTOS, C. A. C. M. ; JESUS, E. A. ; LUCA, J. R. A informação digital e os sistemas de organização do conhecimento. In: IV Seminário de Pesquisa da FESPSP, 2015, São Paulo. Anais. São Paulo: FESPSP, 2015. p. 1 -15. 29
Tipo Norma Documentária Data 1985 ISO 5964 - Diretrizes para elaboração de tesauros multilingues 1985 ISO 5963 – Diretrizes para indexação (existe norma da ABNT) 1986 ISO 2788 - Diretrizes para elaboração de tesauros monolíngues 2013 ISO 22274 - Sistemas para gestão de terminologia, de conhecimento e de conteúdo - aspectos relacionados com conceito para desenvolvimento e internacionalização dos sistemas de classificação 30
Tipo Norma Documentária Data 2011 ISO 25964 -1 - Informação e documentação – Thesauri e interoperabilidade com outros vocabulários - Parte 1: Thesauri para recuperação de informação 2013 ISO 25964 -2 - Informação e documentação Thesauri e interoperabilidade com outros vocabulários - Parte 2: A interoperabilidade com outros vocabulários 31
Tipo Norma Documentária Data 2005 ANSI/NISO Z 39. 19 - Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies R 2010 ANSI/NISO Z 39. 19 - Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies 32
Norma ANSI/NISO Z 39. 19 • Controle de vocabulário é usado para melhorar a eficácia do armazenamento de informações e recuperação de sistemas informacionais, sistemas de navegação da Web e outros ambientes que procuram identificar e localizar o conteúdo desejado através de algum tipo de descrição usando a linguagem. • O objetivo principal do controle de vocabulário é obter consistência na descrição de objetos de conteúdo e facilitar a recuperação 33
• características básicas da linguagem natural – palavras ou termos para representar um conceito único – Exemplo: VHF/frequência muito alta Emergência/Urgência – palavras com mesma ortografia e diferentes conceitos Norma ANSI/NISO Z 39. 19 34
• Controle de vocabulário - três métodos principais: – Definindo o escopo ou significado de termos. – Usando a relação de equivalência para link de sinônimos e termos quase sinônimos – Distinguindo homógrafos. Norma ANSI/NISO Z 39. 19 35
• Diretrizes para a construção de vocabulários controlados: – selecionando e formulando os termos – estabelecendo relações entre termos – apresentando a informação eficientemente em formato impresso, online e em web sites de navegação. Norma ANSI/NISO Z 39. 19 36
• Vocabulários controlados fornecem um meio para organizar informações. – processo de atribuição de termos selecionados para descrever documentos e outros tipos de objetos de conteúdo. • Há muitos tipos diferentes de vocabulários controlados. Alguns mais comuns são: – – Listas simples de termos ou listas alfabéticas Anéis de sinônimos Taxonomias Tesauros Norma ANSI/NISO Z 39. 19 37
Vocabulários Controlados 1. Tradução: fornecem um meio de converter a linguagem natural de autores, indexadores e usuários em um vocabulário que pode ser usado para indexação e recuperação. 2. Coerência: promovem a uniformidade no formato e na atribuição de termos. 3. Indicação de relações: indicam relações semânticas entre os termos. 4. Etiquetas e pesquisa: fornecer hierarquias consistentes e claras em um sistema de navegação para ajudar os usuários a localizar objetos de conteúdo desejados. 5. Recuperação: servem como ajuda na localização de objetos de conteúdo. Norma ANSI/NISO Z 39. 19 38
Princípios de vocabulários controlados • Há quatro princípios importantes do controle de vocabulário que orientam a sua concepção e desenvolvimento que são: – – eliminar a ambiguidade controlar sinônimos estabelecer relações entre termos testar e validar termos Norma ANSI/NISO Z 39. 19 39
40
• vários tipos de relações semânticas entre os termos de um vocabulário controlado – relações de igualdade – relações hierárquicas – relações associativas conforme necessidade Norma ANSI/NISO Z 39. 19 41
42
• O processo de seleção de termos para inclusão em vocabulários controlados com base em: – a linguagem usada para descrever objetos de conteúdo (garantia literária) – o idioma ou terminologia dos usuários (garantia do usuário) – as necessidades e prioridades da organização (garantia organizacional) 43
• Estrutura de vocabulários controlados – para permitir a exibição de diferentes tipos de relações entre os termos – quatro tipos de vocabulários controlados, determinados pela sua estrutura cada vez mais complexa: – Listas alfabéticas – Lista de sinônimos – Taxonomia – Tesauro 44
45
46
47
Taxonomia • Uma taxonomia é um vocabulário controlado com termos preferenciais, todos ligados em uma hierarquia ou polihierarquia. 48
Tesauro • Um tesauro é um vocabulário controlado, organizado em ordem conhecida e estruturada de modo que as diversas relações entre termos sejam exibidas claramente e identificadas por indicadores de relacionamento padronizado. • Indicadores de relacionamento normalmente empregados mutuamente. 49
50
51
52
53
• Os desenvolvedores podem produzir diferentes versões do vocabulário: – uma lista básica de termos, referências e relações projetadas para o usuário final ou pesquisador ocasional – uma versão mais completa, projetada para o indexador e pesquisador especializado, que pode incluir notas de escopo detalhado, instruções de indexação, informações sobre a história do termo e dados de postagens. Norma ANSI/NISO Z 39. 19 54
55
- Slides: 55