Anlise Documentria e Representao da Informao Nair Kobashi
Análise Documentária e Representação da Informação Nair Kobashi Erick Akira Fernando Azambuja Gabriela Alfonso Hélio Ohmaye Plínio Soares
Nair Kobashi 1972 – Estudante universitária e filiada ao PC do B, foi presa em São Paulo por 18 meses 1978 - Bacharel em Biblioteconomia pela Universidade de São Paulo 1980 - Bacharel em Jornalismo pela Universidade de São Paulo 1988 - Mestre em Ciências da Comunicação pela Universidade de São Paulo 1994 - Doutora em Ciências da Comunicação pela Universidade de São Paulo 2006 - Livre-docente, Escola de Comunicações e Artes, Universidade de São Paulo
1. Introdução Biblioteca de Alexandria Tabuletas Mesopotâmicas
Introdução 1665 – Surgimento da Documentação enquanto sistema público de circulação de informações “Journal des Sçavans”
Introdução “Um dos marcos mais importantes desse percurso encontra-se, sem sombra de dúvida, na proposta de indexação e elaboração Automática de resumos de Luhn (1958 e 1959). Sua contribuição Foi, durante quase duas décadas, o paradigma norteador de Inúmeros projetos que visavam modificar radicalmente os Métodos tradicionais de armazenamento, tratamento e recuperação de informações. ” (KOBASHI, N. 1996)
A interface Linguística/Análise Documentária Tesauros Jean-Claude Gardin - Léxico – conjunto de termos - Eixo paradigmático – relações entre as unidades lexicais, a priori - Eixo sintagmático – sintaxe que articula os encadeamentos entre os termos da linguagem Jean-Claude Gardin
A Interface Análise Documentária/Inteligência Artificial Uso da Inteligência Artificial para produção automática de resumos e pesquisa de indexação TOPIC (Text Oriented Procedures for Information Management and Condensation of Expository Texts) – Sistema modular de operação de textos INIST (Institut de L'Information Scientifique et Technique) – bancos de dados cada vez mais especializados. Representação por “mapas conceituais”
A Interface Análise Documentária/Inteligência Artificial Juan Barceló (1991) - Um conjunto de conceitos que descrevem conhecimentos relevantes relacionados a um problema; - Uma representação “ativa” desses conceitos, o que permite ligar conceitos e perguntas do usuário; - Um conjunto de regras que gerencia a representação conceptual; - Um conjunto de operadores lógicos que articula a linguagem de representação; - Três tipos de meta-conhecimento: a) conhecimentos sobre o problema a ser resolvido; b) conhecimentos sobre a estrutura do sistema; c) conhecimentos sobre a estratégia para resolver o problema;
A Organização e a Representação de Informações Documentárias As pesquisas relacionadas à organização e representação de informações devem levar em conta os seguintes fatos: a Documentação operar sempre com grandes quantidades de textos o valor do produto documentário estar, na maioria dos casos, relacionado à atualidade da informação
A elaboração de informações documentárias compreende um conjunto de operações, esquematizáveis em três partes: leitura seleção representação A Análise Documentária manipula e transforma textos em dois tipos básicos de representações: Resumo Indexação
O processo global de Análise Documentária defronta-se com pelo menos dois objetos: o texto, como sua unidade de análise a Linguagem Documentária, como instrumento comutador Deve-se evitar: amalgamar perspectivas entre si irreconciliáveis estabelecer equivalências entre conceitos homólogos ou mesmo homônimos ou assimilá-los de forma precipitada ao campo específico de trabalho
A Representação Documentária A palavra representação evoca inúmeras noções. Na Documentação, o termo "representação" é um conceito pré-teórico, associado, de um lado, à descrição de aspectos que identifiquem materialmente os documentos (catalogação) e de outro, ao processo e ao produto da condensação de conteúdos de textos, ou seja, à indexação e à elaboração de resumos (processos) e aos próprios índices e resumos (produtos).
Informação Documentária representação particular representação condensada Segundo Cassirer, a função de representação é uma das três funções fundamentais da consciência, ao lado da função expressiva e da função significativa. A Análise Documentária, ao operar com textos do domínio da ciência e da técnica, opera com objetos que trazem as marcas das várias funções da consciência: representação (mito), função expressiva (linguagem) e função significativa (ciência).
Significação nos Processos Documentários Semântica Ramo da linguística que estuda o significado das palavras e as relações entre os signos e os seus referentes. Semiologia/ Semiótica Ciência dos modos de produção, de funcionamento e de recepção dos diferentes sistemas de sinais de comunicação entre indivíduos ou coletividades.
Peirce Saussure • Semiose é o processo no qualquer coisa age como signo • Semiose é o objeto da Lingüística, enquanto parte da Semiologia, é a língua • Objetivo é análise do funcionamento do • Princípio semiológico fundamental é a signo, no ato individual da semiose arbitrariedade do signo • Signos se estabelecem a partir de regras ou convenções
Linguagem Documentária Composta por um conjunto limitado de termos, que prescreve as formas de entrada e de busca a serem utilizadas pelo indexador ou pelo usuário, num sistema documentário. Denominado também de: • Linguagem de Indexação • Sistema de Classificação • Linguagem de Informação • Listas de Cabeçalhos de Assuntos Unidades constitutivas: • Linguagens de Especialidade • Linguagem de Uso Corrente • Terminologias de Área
Linguagem Documentária • Objetivo descrever e tornar recuperáveis textos de campos de conhecimentos especializados • Tem como referência os instrumentos terminológicos • Funciona como classificação intermediária • É mais adequada na recuperação da informação Terminologia • Objetivo selecionar, criar termos de noções de domínios específicos e fixa-los, por meio da definição • É referência para Linguagem Documentária
O Texto como Objeto • Análise de Conteúdo • Análise do Discurso • Lingüística do Texto • Análise Logicista • Análise de Textos segundo a Inteligência Artificial Análise de Conteúdo Análise e interpretação de textos de diversas naturezas, utilizando a descrição e quantificação de palavras, temas ou frases. 1. Formulação de dados 2. Redução dos dados 3. Interferência 4. Análise
Linguagem de Dados Processo intermediário entre o mundo dos fenômenos reais e dos fatos científicos. É o código que dá forma ao objeto de análise. Seus elementos devem representar todas as unidades do texto e conter distinções nítidas entre si. Críticas Henry e Moscovici apontam dois problemas na Análise de Conteúdo, ambos na Linguagem de Dados: 1. Falta rigor na definição das categorias utilizadas na descrição dos dados coletados 2. Falta uniformidade nos dados, que podem ser palavras presentes no texto ou unidades maiores de conteúdo
Análise de Conteúdo • Trabalha com textos de natureza diversa • Extrai fragmentos para revelar opiniões e valores no texto Análise Documentária • Trabalha com textos de natureza técnico-científica • Identifica a estrutura informacional do texto
Análise de Conteúdo • Estudos sobre o discurso: Caráter Multidisciplinar • Início : Anos 50 Linguística Psicologia Literatura • Ênfase: Anos 80 Filosofia Sociologia Psicanálise • Evolução conceitual: Filologia História . . • Palavra • Frase • Coerência • Concisão • Visão Ampliada
A Análise de Texto na perspectiva da Inteligência Artificial Modelar e simular processos cognitivos • tornar os computadores mais úteis • área interdisciplinar: Psicologia, Cognitiva, Linguística e Lógica • linguagem natural e tratamento automático • interface com Análise do Discurso e Linguística do Texto – item 2. 2. 2 • Catalogação – regras explícitas • análise e indexação de documentos
Linguística Saussureana ou Estrutural Desenvolvimento de regras gramaticais e capacidade de expressão. Povos sem escrita Comunicação: Palavras, + Gestos + Olhares + Roupas + Cortes de cabelo Pêcheux e a Linguística Social Linguística e as Condições Sócio-econômicas de Produção
Adam – Linguística Textual/Limites estruturais da Língua Natureza Linguística e Programática Textual Greimas – Análise Linguística Estruturalista Linguística e Cientificidade das Ciências Duras Ducrot e Todorov - Pragmática Linguística.
ANÁLISE LOGICISTA: Textos científicos Gardin e Análise Epistemológica Prática Projeto de Pesquisa da Professora N. Kobashi. A questão da Produtividade. .
Problemas com a Documentação – resumo negativo 2. 3. 1 Análise de Conteúdo análise de textos de natureza técnico- científica identificação da estrutura informacional dos textos 2. 3. 2 Análise do Discurso e Linguística do Texto identificação da base temática do texto apropriação equivocada de conceitos pode produzir modelos inconsistentes 2. 3. 3 Análise Logicista - ECA acompanhamento da escala de produção de textos técnicos e científicos condensação de textos sem avaliar a consistência ou validade moroso e aplicável somente a textos restritos 2. 3. 4 Análise de Textos conforme Inteligência Artificial protótipos laboratoriais, sem aplicação em escala real impossibilidade de transposição de procedimentos entre áreas, de forma mecanica ( automática ) especificidade da A. D. requer modelos próprios, recortes teóricos, múltiplos domínios geração de resumos, Cyrus e Frump, são referências teóricas e metodológicas operações de A. D. ainda não transportados para processamento computacional
Considerações finais Elaborar modelos de informação resumos ( condensação ) = novos textos representações padronizadas, sistemas classificatórios Aproximação com outros tipos de análise de textos Problemas complexos Sistematizar questões relacionadas à interface Linguística / Ciência da Informação quadro teórico unificado
Análise Documentária Representação Descritiva Referência Bibliográfica Representação Temática Documentos Análise Documentária Resumo Tratamento de documentos (adaptado de KOBASHI, 1994) Indexação
- Slides: 28