Tendncias em indexao Disciplina Indexao Teoria e mtodos

  • Slides: 36
Download presentation
Tendências em indexação Disciplina: Indexação – Teoria e métodos CBD 0284 ECA/USP

Tendências em indexação Disciplina: Indexação – Teoria e métodos CBD 0284 ECA/USP

Vocabulário n n representação de conteúdo dos documentos eletrônicos assegurar a consistência e o

Vocabulário n n representação de conteúdo dos documentos eletrônicos assegurar a consistência e o controle de vocabulário complexidade do processo de indexação questões relativas à indexação manual e indexação automatizada março 21 2

Vocabulário n Para padronização da representação de conteúdo é necessário utilizar n n março

Vocabulário n Para padronização da representação de conteúdo é necessário utilizar n n março 21 normas de valores linguísticos, sintáticos e semânticos classificações, tesauros, taxonomias ontologias, mapas conceituais, anéis de sinônimos. 3

Normalização n Metadados n n Padrões internacionais, equipe interdisciplinar , desenhados para ajudar os

Normalização n Metadados n n Padrões internacionais, equipe interdisciplinar , desenhados para ajudar os motores de busca a encontrar e recuperar as informações Inclusão de marcadores temáticos n n n Indexação de assuntos – palavras-chaves regras explícitas para a organização hierarquização Vocabulário Controlado (tesauro, taxonomia) n n março 21 e Conceitos com características compartilhadas Categorias linguístico-funcionais Normalização (ANSI/NISO Z 39. 19 – ISO 25964 -1: 2011) Ontologias, mapas conceituais, nuvens de tags 5

Taxonomia n classificação, espécie em relação a leis genéricas ou princípios de subdivisão da

Taxonomia n classificação, espécie em relação a leis genéricas ou princípios de subdivisão da ciência, de uma ciência particular ou um assunto, n n relações de classificação sistemática dos organismos vivos n n n Exemplo: Organismo --> Sistemas --> Órgãos -->Tecidos --> Células --> Organelas --> Moléculas http: //www. ncbi. nlm. nih. gov/Taxonomy/Browser/w wwtax. cgi março 21 6

Taxonomia n O uso genérico do termo mapeamento tem sido enfatizado nas taxonomias e

Taxonomia n O uso genérico do termo mapeamento tem sido enfatizado nas taxonomias e ontologias com novas técnicas n n O tesauro começa a ficar quase invisível para os usuários. Taxonomia tem sido usada com pelo menos 5 sentidos: n 1) Diretórios Web: usado na Internet e nas intranets. n n março 21 Uma forma de classificação, com um menu de termo superior, o segundo nível é mostrado e com os diversos níveis. os termos podem estar repetidos nos diferentes níveis criando caminhos alternativos para pesquisa. 7

Taxonomia n 2) Taxonomias para indexação automática: n n n março 21 Em site

Taxonomia n 2) Taxonomias para indexação automática: n n n março 21 Em site comercial o usuário é apresentado a 2 níveis de classificação. O que o usuário não vê é a taxonomia atrás da classificação, onde cada termo carrega conjuntos de algoritmos de palavras e frases, sinônimos, variações sintáticas, pesos. Soluções deste tipo são interessantes onde a indexação manual não é viável economicamente. 8

Taxonomia n n Exemplos: Open Directory Project (www. dmoz. com) n n n Factiva

Taxonomia n n Exemplos: Open Directory Project (www. dmoz. com) n n n Factiva (www. factiva. com) Serviço comercial de taxonomias: n março 21 Taxonomia com mais de 350. 000 organizados por mais de 35. 000 editores voluntários. http: //www. taxonomywarehouse. com 9

Taxonomia n 3) Taxonomias criadas por categorização automática: n n n março 21 alguns

Taxonomia n 3) Taxonomias criadas por categorização automática: n n n março 21 alguns softwares fazem análise de texto, criam categorias e classificam os documentos a partir das categorias criadas. podem ser disponibilizados no formato de diretórios Web, ou em mapas bi-dimensionais, com os termos relacionados linkados. Exemplo: www. gammasite. com 10

Taxonomia n 4) Cabeçalhos e filtros: n n março 21 a taxonomia é criada

Taxonomia n 4) Cabeçalhos e filtros: n n março 21 a taxonomia é criada ou importada e usada numa formulação de busca. Os homógrafos podem ser especificados para perderem a ambigüidade e os sinônimos inseridos em suas hierarquias. É um tesauro formatado para facilitar a navegação. Exemplo: http: //www. wordmap. com/ 11

Taxonomia n 5)Taxonomias corporativas: n n março 21 Mapeamento e diretrizes para os repositórios

Taxonomia n 5)Taxonomias corporativas: n n março 21 Mapeamento e diretrizes para os repositórios institucionais e seus conteúdos. Novo tipo de tesauro/ontologia usado para mapeamento de alto nível em portais corporativos guiando o capital intelectual da organização. 12

Taxonomia n Ex. Glaxo. Smith. Kline n n março 21 corporação internacional tem um

Taxonomia n Ex. Glaxo. Smith. Kline n n março 21 corporação internacional tem um “megatesauro” com 53. 500 conceitos básicos (termos preferidos), 201. 750 (sinônimos – inclusive equivalentes de produtos químicos) e 443. 500 termos relacionados. associaram-se a uma empresa de software americana especializada em ontologias para o desenvolvimento de novo software para a taxonomia. 13

Ontologia n ciência ou estudo do ser, parte da metafísica relacionado com o ser

Ontologia n ciência ou estudo do ser, parte da metafísica relacionado com o ser ou a essência das coisas, ou o ser no abstrato. n março 21 definições foram apropriadas pela área da ciência da informação com significados modificados. O sentido original e o sentido apropriado pela área são corretos. É questão de terminologia de área de domínio. 14

Ontologias n n março 21 documento ou arquivo que define formalmente as relações entre

Ontologias n n março 21 documento ou arquivo que define formalmente as relações entre termos e conceitos, uma especificação de uma conceituação, para compartilhamento de definições necessárias à criação de um vocabulário comum. Nos novos sentidos destes termos existe uma interrelação que deve ser levada em conta. 15

Ontologias n Vickery (1997) primeiro uso do termo ontologia para a área de engenharia

Ontologias n Vickery (1997) primeiro uso do termo ontologia para a área de engenharia e ciência da informação. n n “Uma ontologia pode ser definida como uma explicitação formal de uma conceituação compartilhada” Conceitualização: n março 21 refere-se a um modelo abstrato de um fenômeno do mundo que é identificado por conceitos relevantes deste fenômeno. 16

Ontologias n Explícita: n n Formal: n n refere-se ao fato que a ontologia

Ontologias n Explícita: n n Formal: n n refere-se ao fato que a ontologia pode ser lida por máquina. Compartilhada: n março 21 significa que os tipos de conceitos usados, em contraste com o seu uso são explicitamente definidos. reflete a noção de que a ontologia captura o conhecimento consensual que não é privado ou individual e aceito por um grupo. 17

Ontologias n n Uma ontologia descreve uma área usando a noção de conceitos, relações,

Ontologias n n Uma ontologia descreve uma área usando a noção de conceitos, relações, funções e axiomas. Os conceitos em uma ontologia são organizados em taxonomias, onde mecanismos de relações podem ser aplicados. março 21 18

Ontologias n Duas das mais antigas e maiores ontologias do mundo são Word. Net

Ontologias n Duas das mais antigas e maiores ontologias do mundo são Word. Net and CYC. n Word. Net: n n n março 21 termos agrupados em cinco categorias: verbos, adjetivos, advérbios e funções de palavras e seus significados são relacionados através de sinônimos, antônimos, hipônimos (relações hierárquicas), merônimos (parte de relacionamentos que contém conceitos) e relações morfológicas. Word. Net é uma ferramenta léxica, disponível gratuitamente na Internet http: //wordnet. princeton. edu/ 19

Ontologias n A ontologia da CYC foi produzida pela companhia que trabalhou com a

Ontologias n A ontologia da CYC foi produzida pela companhia que trabalhou com a Glaxo. Smith. Kline. n n n março 21 o conhecimento é representado por uma variante de predicado lógico. http: //www. cyc. com http: //www. opencyc. org/images/opencyc -kb-browser. gif 20

Ontologias n Ontologias de domínio específico foram construídas para aplicações com tradução por máquina,

Ontologias n Ontologias de domínio específico foram construídas para aplicações com tradução por máquina, mapeamento empresarial, re-uso do conhecimento e recuperação da informação. n n n março 21 1) Ontologia organizacional descreve um meta-modelo de informação ex. estrutura e formato de fontes de informação. 2) Ontologia de domínio é usada para descrever o conteúdo de uma fonte de informação. 3) Ontologia empresarial é usada para modelar os processos de negócios. Propõe um modelo de atendimento às necessidades de conhecimento para processos empresariais. 21

Web Semântica n n A Web Semântica foi proposta por Berners-Lee. “A Web Semântica

Web Semântica n n A Web Semântica foi proposta por Berners-Lee. “A Web Semântica não é separada da Web, mas uma extensão da atual, na qual a informação é dada por um significado bem definido, melhor aplicado a computadores e elaborado por trabalho cooperativo” março 21 22

Web Semântica n n É um sistema online, com o conceito de Web universal,

Web Semântica n n É um sistema online, com o conceito de Web universal, sistema descentralizado sem discriminação de informação comercial ou acadêmica, cultura, linguagem ou mídia. A Web. Semântica roda em XML e RDF. março 21 23

Redes semânticas baseadas na Árvore de Porfírio março 21 24

Redes semânticas baseadas na Árvore de Porfírio março 21 24

Mapas Conceituais Psicologia cognitiva de Ausubel Aprendizagem ocorre por assimilação de novos conceitos e

Mapas Conceituais Psicologia cognitiva de Ausubel Aprendizagem ocorre por assimilação de novos conceitos e proposições na estrutura cognitva Aprendizagem significativa março 21 25

Mapas Conceituais Joseph Novak década de 70 São diagramas que indicam relações entre conceitos

Mapas Conceituais Joseph Novak década de 70 São diagramas que indicam relações entre conceitos março 21 26

Mapas Conceituais n n Modelo de aprendizagem Estrutura cognitiva está constantemente se reestruturando durante

Mapas Conceituais n n Modelo de aprendizagem Estrutura cognitiva está constantemente se reestruturando durante a apresendizagem significativa; O processo é dinâmico; O conhecimento vai sendo construído. março 21 27

Mapas Conceituais – C. I n n março 21 linguagem para descrição e comunicação

Mapas Conceituais – C. I n n março 21 linguagem para descrição e comunicação de conceitos. Estrutura que vai desde os conceitos mais abrangentes até os menos inclusivos. Representações gráficas de conceitos em um domínio específico com interações entre os conceitos. Conceitos são conectados por arcos, formando proposições mediante frases simplificadas. 28

Mapas Conceituais n Regras de construção: n n Não há um único modo de

Mapas Conceituais n Regras de construção: n n Não há um único modo de traçar um mapa conceitual. Um mapa conceitual é uma coisa dinâmica, refletindo a compreensão de quem faz no momento em que faz. março 21 29

Mapas Conceituais n n n Etapas: seleção: escolha do assunto e identificação das palavras-chave

Mapas Conceituais n n n Etapas: seleção: escolha do assunto e identificação das palavras-chave ou frases relacionadas ordenação: organização de conceitos do mais abstrato para o mais concreto agrupamento: reunir conceitos em um mesmo nível de abstração e com forte inter-relacionamento arranjo: organização de conceitos na forma de um diagrama link e preposição: conexão de conceitos com linhas e nomeação de cada linha com uma proposição (Lima, 2004) março 21 30

Mapas Conceituais n Mapas Conceituais março 21 31

Mapas Conceituais n Mapas Conceituais março 21 31

Mapas Conceituais n n n Softwares Cmaptools http: //cmap. ihmc. us/ Inspiration http: //www.

Mapas Conceituais n n n Softwares Cmaptools http: //cmap. ihmc. us/ Inspiration http: //www. inspiration. com/ n n n Kidsinspiration http: //www. inspiration. com/Kidspiration C-tools https: //ctools. umich. edu/portal março 21 32

Folksonomia n n n Maneira de indexar informações. Esta expressão foi cunhada por Thomas

Folksonomia n n n Maneira de indexar informações. Esta expressão foi cunhada por Thomas Vander Wal. É uma analogia à taxonomia, mas inclui o prefixo folks, palavra da língua inglesa que significa pessoas. Construção a partir da lingua natural da comunidade que a utiliza. Enquanto na taxonomia clássica primeiro são definidas as categorias do índice para depois encaixar as informações em uma delas (e em apenas uma), a folksonomia permite a cada usuário da informação classificar com uma ou mais palavraschaves ou tags (marcadores). Por meio das tags, o usuário pode recuperar as informações e compartilhá-las. Pode visualizar as tags de outros usuários, assim como identificar o grau de popularidade de cada tag no sistema, e acessar as informações relacionadas. março 21 33

Folksonomia n n n O primeiro site a usar folksonomia foi o del. icio.

Folksonomia n n n O primeiro site a usar folksonomia foi o del. icio. us (http: //delicious. com/) e, em seguida, o flickr e o you. Tube. O gmail oferece, no lugar de pastas, o recurso de tags para organizar os emails. Mas não é um exemplo clássico de folksonomia, pois não permite compartilhar as tags entre usuários do sistema. A rede social Last FM http: //www. lastfm. com. br/ usa a folksonomia para efetuar a classificação de faixas e artistas. O Library Thing é um catalogo cooperativo que utiliza a folksonomia (http: //br. librarything. com/) Blogs e microblogs utilizam marcadores. O Twitter utiliza #hashtags. março 21 34

Controle da linguagem e estrutura semântica n n n n n março 21 Glossários

Controle da linguagem e estrutura semântica n n n n n março 21 Glossários e dicionários Lista de autoridades Lista de sinônimos Cabeçalhos de assunto Classificações Taxonomias/Folksonomia Tesauros Mapas conceituais Rede semânticas Ontologias 35

Abordagem clássica n n n Meio de organizar os conceitos em uma área de

Abordagem clássica n n n Meio de organizar os conceitos em uma área de domínio. Conceitos de grupo baseados em características compartilhadas. Usadas com receptáculos de conceitos Categorias linguístico / funcionais Linguagens pré-coordenadas março 21 37

Referências n n n ZENG, M. L. Standards for Controlled Vocabularies. Denver, 2005. (Apresentado

Referências n n n ZENG, M. L. Standards for Controlled Vocabularies. Denver, 2005. (Apresentado em 7 th NKOS Workshop, 2005). ALVARENGA, L; SOUZA, R. R . A Web Semântica e suas contribuições para a ciência da informação. Ciência da Informação. , v. 33, n 1, 2004 BROUGHTON, V. Meccano, molecules and the organization of knowlegde: the continuing contribution of S. R. Ranganathan. (Apresentado em ISKO UK, nov. 2007). Disponível em: http: //www. iskouk. org/presentations/Vanda. Broughton. Nov 2007. ppt MÉNDEZ RODRÍGUES, E . Modelos de metadatos. In: Méndez Rodrígues, E. Metadados y recuperación de información: estándares, problemas y aplicabilidad em bibliotecas digitales. Gijón: Trea, 2002. cap. 3. LIMA, G. A. B. Mapa conceitual como ferramenta para organização do conhecimento em sistema de hipertextos e seus aspectos cognitivos. Belo Horizonte, Perspectiva em Ciência da Informação, v. 9, n. 2, p. 134 -145, jul. / dez. 2004. Disponível em: http: //www. eci. ufmg. br/pcionline/viewarticle. php? id=72 BAX, M. P e SOUZA, R. Uma proposta de uso de agentes e mapas conceituais para representação de conhecimentos altamente contextualizados. Disponível em: http: //www. emack. com. br/info/apostilas/nestor/agentes. pdf março 21 38