CURSO MESTRADO EM CINCIA DA INFORMAO Unidade Curricular

  • Slides: 26
Download presentation
CURSO MESTRADO EM CIÊNCIA DA INFORMAÇÃO Unidade Curricular: Análise de Conteúdo e Indexação FEUP/FLUP

CURSO MESTRADO EM CIÊNCIA DA INFORMAÇÃO Unidade Curricular: Análise de Conteúdo e Indexação FEUP/FLUP 2007 -2008

Análise de Conteúdo e Indexação n INDEXAÇÃO (em sentido lato) = elaborar índices n

Análise de Conteúdo e Indexação n INDEXAÇÃO (em sentido lato) = elaborar índices n ÍNDICE - instrumento de referência; guia; instrumento de n n n n n acesso à informação Exemplos: catálogos em fichas catálogos em forma de livro catálogos automatizados bibliografias índices de fim de livros boletins bibliográficos sistemas com fichas “uniterm” ou com fichas “peek-a-boo” bases de dados e bancos de dados. .

Análise de Conteúdo e Indexação n Elementos constitutivos dos índices: n rubrica (cabeçalho, ponto

Análise de Conteúdo e Indexação n Elementos constitutivos dos índices: n rubrica (cabeçalho, ponto de acesso) n referência (conduz ao documento ou à informação) n informação (geralmente de tipo bibliográfico) n De acordo com o contexto em que se insere o ponto de acesso de um índice, podem-se distinguir duas categorias: n índices independentes n índices dependentes ÍNDICES Índices independentes Vantagens consulta a um só tempo (mais rápido e mais agradável) mínimo de espaço; facilidade de elaboração; não limitação do nº de entradas referências extensas (mais espaço); necessidade de limitar o nº de entradas consulta em 2 tempos (mais moroso; cria relutância) Inconvenientes Índices dependentes

Análise de Conteúdo e Indexação n INDEXAÇÃO - operação que consiste em descrever e

Análise de Conteúdo e Indexação n INDEXAÇÃO - operação que consiste em descrever e caracterizar um documento, com a ajuda da representação dos conceitos nele contidos, ou seja, transcrever em linguagem documental esses conceitos, após tê-los extraído do documento, através de uma análise n (In : Principes d’Indexation / UNISIST) n Da definição de indexação pode-se inferir que: n - indexar implica um processo de análise n - na informação existem conceitos (ideias), que na indexação são representados através de uma linguagem documental* (as rubricas, os pontos de acesso) [* hoje ‘linguagem de indexação’] n Acrescentamos ainda: n - a indexação tem uma finalidade: possibilitar a pesquisa eficaz da informação n - a pesquisa faz-se através de uma “linguagem de indexação” (registada nos instrumentos de apoio à indexação) e pressupõe também a indexação da pergunta

Análise de Conteúdo e Indexação n FASES DA INDEXAÇÃO n 1ª - Reconhecimento /

Análise de Conteúdo e Indexação n FASES DA INDEXAÇÃO n 1ª - Reconhecimento / Identificação dos conceitos n 2ª - Representação dos conceitos n n Conceito Termo de indexação Palavra-chave {Descritor {Não-descritor {Notação de uma classificação Termo de indexação - é a expressão vocabular que traduz o conceito; pode ser simples ou composto

Análise de Conteúdo e Indexação n 1ª FASE DA INDEXAÇÃO - Reconhecimento / Identificação

Análise de Conteúdo e Indexação n 1ª FASE DA INDEXAÇÃO - Reconhecimento / Identificação dos n n n conceitos É a fase essencial. Pressupõe, antes de mais, a análise do conteúdo informacional. A análise requer o estabelecimento de uma metodologia (ver NP-3715). - apreensão do conteúdo informacional - identificação dos conceitos que representam esse conteúdo - selecção dos conceitos considerados relevantes para possibilitar a recuperação da informação A apreensão do conteúdo e a identificação dos conceitos diferem de acordo com o código em que a informação está registada. A informação textual (documentos escritos) possui determinados elementos que ajudam a fazer a análise do conteúdo e permitem mais facilmente estabelecer métodos e grelhas de análise. A informação não textual (documentos não escritos) requer procedimentos específicos e, muitas vezes, implica o recurso a fontes de referência exteriores ao próprio conteúdo em análise.

Análise Documental n ANÁLISE POR FACETAS n (metodologia aplicável à identificação dos conceitos) n

Análise Documental n ANÁLISE POR FACETAS n (metodologia aplicável à identificação dos conceitos) n Exemplos: n (Domínio) "Questões Sociais / Sociologia" n Crianças n Faceta "Pessoas" Mulheres n Emigrantes n etc. n n n Faceta "Problemas" Doenças mentais Marginalidade Solidão Pobreza etc.

Análise Documental (Domínio) - "Arquitectura" Edifícios de pedra Igrejas Faceta "Edifícios" Castelos Edifícios de

Análise Documental (Domínio) - "Arquitectura" Edifícios de pedra Igrejas Faceta "Edifícios" Castelos Edifícios de madeira Edifícios góticos Escolas Casas etc. (A partir da faceta "Edifícios“ podem-se organizar subfacetas) Faceta "Elementos estruturais" Alicerces Janelas Abóbadas Contrafortes Claustros etc.

Análise de Conteúdo e Indexação n n n Factores que influenciam a selecção dos

Análise de Conteúdo e Indexação n n n Factores que influenciam a selecção dos conceitos: - perfil do utilizador - características do conjunto bibliográfico - características do serviço - produto que vai ser elaborado A indexação deve adaptar-se à sua função. Essa adaptação pode ser vista segundo dois parâmetros: a exaustividade e a especificidade n A exaustividade, a especificidade, a uniformidade, a pertinência são factores que condicionam a qualidade da indexação. A estes factores juntam-se, como condicionantes da qualidade da indexação, as próprias qualidades pessoais e profissionais do indexador.

Análise de Conteúdo e Indexação Análise do conteúdo informacional – Casos práticos n O

Análise de Conteúdo e Indexação Análise do conteúdo informacional – Casos práticos n O aproveitamento do trapo em pequenas indústrias da região de Coimbra. Referência especial às mantas de farrapo de Almalaguês e ao fabrico do papel na Lousã e sua representação na feira da Confederação das Indústrias de Coimbra (CIC/86). n A classificação das ciências ao longo da história da Filosofia e a sua influência nas classificações bibliográficas. A classificação de Francis Bacon e a classificação bibliográfica de Brunet. A aplicação da CDU nos Serviços de Documentação da Universidade do Minho.

Análise de Conteúdo e Indexação Análise do conteúdo informacional – Casos práticos n O

Análise de Conteúdo e Indexação Análise do conteúdo informacional – Casos práticos n O turismo no Algarve. Os transportes em geral e os transportes marítimos em especial. Infraestruturas hoteleiras. O factor climático. A cooperação com empresas turísticas britânicas. n A abertura da auto-estrada da Amazónia e o problema da transferência das populações autóctones. A contestada acção da FUNAI em prol do índio brasileiro. Em apêndice um estudo sobre a presença do índio guarani na literatura brasileira. (FUNAI - Fundação de Apoio ao Índio)

Análise de Conteúdo e Indexação n 2ª FASE DA INDEXAÇÃO - Representação dos conceitos

Análise de Conteúdo e Indexação n 2ª FASE DA INDEXAÇÃO - Representação dos conceitos n A representação dos conceitos faz-se através da n n n linguagem de indexação e com auxílio dos instrumentos de indexação nos quais ela está registada. Linguagem de indexação: - é uma condensação e simplificação da linguagem natural - é uma linguagem convencional, controlada, intermediária entre a informação e o utilizador - é um sistema de representação do conteúdo informacional e das perguntas do utilizador, destinado a facilitar a pesquisa da informação - é formada por um conjunto de termos de indexação, cuja organização lógica ou apresentação ordenada varia conforme o tipo de linguagem utilizado

Análise de Conteúdo e Indexação n n O recurso à linguagem de indexação é

Análise de Conteúdo e Indexação n n O recurso à linguagem de indexação é uma necessidade que decorre das características da própria linguagem natural. Na linguagem natural existem relações implícitas entre palavras e termos: 1 - relações de equivalência 2 - relações de hierarquia 3 - relações de associação n n n Relações de equivalência Exemplos: termo antigo / termo actual termo vulgar / termo erudito termo corrente / termo científico sinónimos quase sinónimos n n n Relações de hierarquia Exemplos: género / espécie todo / parte n n Relações de associação Exemplos: escola / professor / aluno feira / mercado indústria / fábrica / produto industrial n açougue / talho dor de cabeça / cefaleia sal / cloreto de sódio pastelaria / confeitaria casa / edifício de habitação legumes / alface, agrião… Portugal / Algarve / Faro…

Análise de Conteúdo e Indexação n Características da linguagem de indexação: n - é

Análise de Conteúdo e Indexação n Características da linguagem de indexação: n - é um vocabulário controlado, formado por um conjunto limitado de termos que se impõe normativamente n - está registada num instrumento de apoio para o indexador e para o utilizador n - é constituída pelos termos usados na indexação (termos preferenciais) e pelos não usados (não preferenciais), que remetem para os adoptados [relações de equivalência] n - apresenta, de forma explícita, relações semânticas de tipo hierárquico e de tipo associativo, o que lhe dá a forma de um vocabulário estruturado

Análise de Conteúdo e Indexação n Elementos constitutivos da linguagem de indexação: n -

Análise de Conteúdo e Indexação n Elementos constitutivos da linguagem de indexação: n - termos que constituem ponto de acesso à informação n - termos não preferenciais, que não são ponto de acesso n n n à informação e que remetem para os preferenciais - relações entre os termos de indexação - notações (símbolos) - notas de aplicação - elementos de sintaxe (abreviaturas, sinais gráficos, . . . que permitem explicitar as relações entre os termos de indexação) - gráficos (esquemas, representações gráficas) que ajudam a visualizar as relações entre os termos de indexação

Análise de Conteúdo e Indexação n Noções essenciais: n - Coordenação – relação sintáctica

Análise de Conteúdo e Indexação n Noções essenciais: n - Coordenação – relação sintáctica entre os vários conceitos que constituem o conteúdo informacional n - Controlo de autoridade – processo que permite manter consistência nos pontos de acesso, através da ligação a um ficheiro (ou lista) de autoridade, constituído pelo conjunto dos “registos de autoridade” n - Termo autorizado – ponto de acesso à informação, que integra um vocabulário de indexação controlado e que representa univocamente um conceito

Análise de Conteúdo e Indexação n Tipos de linguagem de indexação n Pré-coordenadas linguagens

Análise de Conteúdo e Indexação n Tipos de linguagem de indexação n Pré-coordenadas linguagens categoriais / classificações tabelas de classificação (coordenação no momento da indexação) Pós-coordenadas linguagens combinatórias tesauros, listas estruturadas (coordenação no momento da pesquisa) n Linguagens categoriais - os assuntos encontram-se organizados logicamente, numa estruturação feita a priori (pré-coordenação), ou seja, independente do conteúdo informacional; é nesses quadros lógicos que o indexador tem de “encaixar” os assuntos extraídos da informação n Linguagens combinatórias - são formadas por termos soltos, extraídos da linguagem natural, susceptíveis de variadas combinações a posteriori (pós-coordenação), decorrentes do conteúdo informacional

Análise de Conteúdo e Indexação n LINGUAGEM CATEGORIAL n - princípio da classificação n

Análise de Conteúdo e Indexação n LINGUAGEM CATEGORIAL n - princípio da classificação n - os assuntos são integrados numa estrutura rígida que constitui n n o universo dos conhecimentos - este universo está organizado numa estrutura fixa e dividido em classes e subclasses - plano de classificação - cada rubrica do plano de classificação identifica um assunto (da informação ou da pergunta) - as rubricas são exclusivas e quanto à construção são hierarquizadas; as relações hierárquicas não podem alteradas sem modificar a indexação dos conteúdos já tratados - um plano de classificação baseia-se na lógica aristotélica e é dedutivo (do geral para o particular)

Análise de Conteúdo e Indexação n - indexar com uma linguagem categorial significa: identificar

Análise de Conteúdo e Indexação n - indexar com uma linguagem categorial significa: identificar o n assunto principal; atribuir-lhe a notação mais adequada a esse assunto - na pesquisa: procura na estante (arranjo sistemático); procura no catálogo sistemático - um assunto indexado pode encontrar-se em todas as rubricas de classificação de uma mesma hierarquia (hierarquicamente superiores) Exemplo: A alimentação dos gatos com produtos de conserva Notação da CDU - 599. 742. 7: 613. 2: 664. 8 (1 só ponto de acesso) Pesquisa: n n n Animais - Mamíferos -- Gatos ---Alimentação dos gatos ---- Alimentação dos gatos com conservas n n

Análise de Conteúdo e Indexação n LINGUAGEM COMBINATÓRIA n - princípio combinatório n -

Análise de Conteúdo e Indexação n LINGUAGEM COMBINATÓRIA n - princípio combinatório n - os assuntos são analisados e representados em conceitos, n n cuja evolução caracteriza a evolução dos conhecimentos - os conceitos são reunidos num tesauro, com uma estrutura flexível, que se destina mais à pesquisa do que à fixação de relações entre os termos de indexação - cada rubrica identifica um conceito (da informação ou da pergunta) - as rubricas são exclusivas e quanto à construção são independentes entre si; as relações existentes entre elas podem facilmente ser alteradas sem modificação da indexação já feita - um tesauro constrói-se pela via indutiva e analítica (levantamento de termos a partir da realidade)

Análise de Conteúdo e Indexação n - indexar com uma linguagem combinatória significa: identificar

Análise de Conteúdo e Indexação n - indexar com uma linguagem combinatória significa: identificar os n conceitos; representá-los pelos termos de indexação mais adequados - na pesquisa: procura no catálogo ideográfico, em todos os termos de indexação representativos dos vários conceitos e combinação dos mesmos - um documento indexado pode-se encontrar em todas as combinações dos seus conceitos Exemplo: A alimentação dos gatos com produtos de conserva Termos de indexação - Alimentação / Gatos / Conservas (3 pontos de acesso) Pesquisa: n n n n Alimentação / Gatos / Conservas Alimentação / Gatos Alimentação / Conservas / Gatos Alimentação Conservas Gatos n n

Análise de Conteúdo e Indexação n LINGUAGENS CATEGORIAIS - Classificações n Tipos de classificações:

Análise de Conteúdo e Indexação n LINGUAGENS CATEGORIAIS - Classificações n Tipos de classificações: n - Enumerativas - enumeram todos os assuntos possíveis, integrados em quadros lógicos (normalmente hierárquicos); teoricamente, o tema de qualquer conteúdo pode ser encontrado nesta enumeração n - Facetadas - há uma enumeração genérica, apenas; a notação compõe-se para poder exprimir os assuntos da informação, os quais não se encontram pré-determinados

Análise de Conteúdo e Indexação n Linguagens categoriais n Vantagens: n - permitem uma

Análise de Conteúdo e Indexação n Linguagens categoriais n Vantagens: n - permitem uma arrumação sistemática dos documentos (livre acesso); n - permitem a organização de catálogos sistemáticos, onde a pesquisa pode ser feita a partir de questões genéricas para as mais específicas; n - revelam uma grande precisão semântica; n - constituem um elemento disciplinador do espírito, quer do indexador, quer do utilizador

Análise de Conteúdo e Indexação n Linguagens categoriais n Inconvenientes: n - os quadros

Análise de Conteúdo e Indexação n Linguagens categoriais n Inconvenientes: n - os quadros lógicos envelhecem; eles traduzem momentos; n n n revelam o estado do conhecimento numa determinada época; - revelam, muitas vezes, particularidades de espaço, tendências de carácter geográfico, falta de universalidade; - têm notações extensas e complicadas, sobretudo se se procura muita especificidade - suscitam uma relutância por parte do utilizador, que não encontra o que necessita numa só abordagem; - as revisões são caras e morosas, carecendo de patrocínios e de especialistas; - revelam grande unidimensionalidade, fixando a informação a uma única notação; não estão abertas às combinações pedidas pelo utilizador.

Análise de Conteúdo e Indexação n n n n Linguagens combinatórias Vantagens: - não

Análise de Conteúdo e Indexação n n n n Linguagens combinatórias Vantagens: - não têm quadros fixos, o que permite a introdução de novos termos; - não existem imposições de carácter geográfico; os vocabulários são, em geral, sectoriais, relativos a áreas especializadas; - não necessitam de notações; estão muito próximas da linguagem natural, o que anula a relutância do utilizador; - a pesquisa é fácil e directa (uma só abordagem); - não obrigam a revisões de fundo e, as que são necessárias não implicam com a indexação já feita nem com a organização do sistema de informação; - lidam conceitos, unidades isoladas do pensamento, que se podem combinar na pesquisa; têm, pois, em conta a multidimensionalidade dos conteúdos e dos interesses dos utilizadores

Análise de Conteúdo e Indexação n Linguagens combinatórias n Inconvenientes: n - não contemplam

Análise de Conteúdo e Indexação n Linguagens combinatórias n Inconvenientes: n - não contemplam o aspecto prático da arrumação dos documentos, pois não permitem a colocação sistemática; n - nos catálogos, não organizam hierarquicamente os conhecimentos, dando acesso directo ao conceito pesquisado; n - fazem correr riscos de ambiguidade, por falta de precisão semântica (a criação de vocabulários estruturados - tesauros - procura colmatar esta falha)