Tendncias em indexao Disciplina Indexao Teoria e mtodos

  • Slides: 47
Download presentation
Tendências em indexação Disciplina: Indexação – Teoria e métodos CBD 0284 ECA/USP Profa. Dra.

Tendências em indexação Disciplina: Indexação – Teoria e métodos CBD 0284 ECA/USP Profa. Dra. Cibele A. C. Marques dos Santos

Vocabulário n n representação de conteúdo dos documentos eletrônicos assegurar a consistência e o

Vocabulário n n representação de conteúdo dos documentos eletrônicos assegurar a consistência e o controle de vocabulário complexidade do processo de indexação questões relativas à indexação manual e indexação automatizada outubro 21 2

Vocabulário n Para padronização da representação de conteúdo é necessário utilizar n n outubro

Vocabulário n Para padronização da representação de conteúdo é necessário utilizar n n outubro 21 normas de valores linguísticos, sintáticos e semânticos classificações, tesauros, taxonomias ontologias, mapas conceituais, anéis de sinônimos. 3

Normalização n norma ANSI/NISO Z 39. 19 n n diretrizes para construção, formatação e

Normalização n norma ANSI/NISO Z 39. 19 n n diretrizes para construção, formatação e gerenciamento de tesauros monolíngues, revisão de 2005 - expansão do conceito de tesauro e processos automatizados. norma britânica BS 8723 diretrizes para o desenvolvimento de tesauros monolíngues atualizada pela norma ISO 25964 -1: 2011 e ISO 25964 -2 em desenvolvimento outubro 21 4

Normalização n Metadados n n Padrões internacionais, equipe interdisciplinar , desenhados para ajudar os

Normalização n Metadados n n Padrões internacionais, equipe interdisciplinar , desenhados para ajudar os motores de busca a encontrar e recuperar as páginas Web. Inclusão de marcadores temáticos n n n Indexação de assuntos – palavras-chaves regras explícitas para a organização e hierarquização Vocabulário Controlado (tesauro, taxonomia) n n outubro 21 Conceitos com características compartilhadas Categorias linguístico-funcionais Normalização (ANSI/NISO Z 39. 19 – ISO 25964 -1: 2011) Ontologias, mapas conceituais, nuvens de tags 5

Taxonomia n classificação, espécie em relação a leis genéricas ou princípios de subdivisão da

Taxonomia n classificação, espécie em relação a leis genéricas ou princípios de subdivisão da ciência, de uma ciência particular ou um assunto, n n relações de classificação sistemática dos organismos vivos. n n n outubro 21 Exemplo: Organismo --> Sistemas --> Órgãos -->Tecidos --> Células --> Organelas --> Moléculas http: //www. ncbi. nlm. nih. gov/Taxonomy/Browser/w wwtax. cgi 6

Taxonomia n O uso genérico do termo mapeamento tem sido enfatizado nas taxonomias e

Taxonomia n O uso genérico do termo mapeamento tem sido enfatizado nas taxonomias e ontologias com novas técnicas n n O tesauro começa a ficar quase invisível para os usuários. Taxonomia tem sido usada com pelo menos 5 sentidos: n 1) Diretórios Web: usado na Internet e nas intranets. n n outubro 21 Uma forma de classificação, com um menu de termo superior, o segundo nível é mostrado e com os diversos níveis. os termos podem estar repetidos nos diferentes níveis criando caminhos alternativos para pesquisa. 7

Taxonomia n 2) Taxonomias para indexação automática: n n n outubro 21 Em site

Taxonomia n 2) Taxonomias para indexação automática: n n n outubro 21 Em site comercial o usuário é apresentado a 2 níveis de classificação. O que o usuário não vê é a taxonomia atrás da classificação, onde cada termo carrega conjuntos de algoritmos de palavras e frases, sinônimos, variações sintáticas, pesos. Soluções deste tipo são interessantes onde a indexação manual não é viável economicamente. 8

Taxonomia n n Exemplos: Open Directory Project (www. dmoz. com) n n n Factiva

Taxonomia n n Exemplos: Open Directory Project (www. dmoz. com) n n n Factiva (www. factiva. com) Serviço comercial de taxonomias: n outubro 21 Taxonomia com mais de 350. 000 organizados por mais de 35. 000 editores voluntários. http: //www. taxonomywarehouse. com 9

Taxonomia n 3) Taxonomias criadas por categorização automática: n n n outubro 21 alguns

Taxonomia n 3) Taxonomias criadas por categorização automática: n n n outubro 21 alguns softwares fazem análise de texto, criam categorias e classificam os documentos a partir das categorias criadas. podem ser disponibilizados no formato de diretórios Web, ou em mapas bi-dimensionais, com os termos relacionados linkados. Exemplo: www. gammasite. com 10

Taxonomia n 4) Cabeçalhos e filtros: n n outubro 21 a taxonomia é criada

Taxonomia n 4) Cabeçalhos e filtros: n n outubro 21 a taxonomia é criada ou importada e usada numa formulação de busca. Os homógrafos podem ser especificados para perderem a ambigüidade e os sinônimos inseridos em suas hierarquias. É um tesauro formatado para facilitar a navegação. Exemplo: http: //www. wordmap. com/ 11

Taxonomia n 5)Taxonomias corporativas: n n outubro 21 Mapeamento e diretrizes para os repositórios

Taxonomia n 5)Taxonomias corporativas: n n outubro 21 Mapeamento e diretrizes para os repositórios institucionais e seus conteúdos. Novo tipo de tesauro/ontologia usado para mapeamento de alto nível em portais corporativos guiando o capital intelectual da organização. 12

Taxonomia n Ex. Glaxo. Smith. Kline n n outubro 21 corporação internacional tem um

Taxonomia n Ex. Glaxo. Smith. Kline n n outubro 21 corporação internacional tem um “megatesauro” com 53. 500 conceitos básicos (termos preferidos), 201. 750 (sinônimos – inclusive equivalentes de produtos químicos) e 443. 500 termos relacionados. associaram-se a uma empresa de software americana especializada em ontologias para o desenvolvimento de novo software para a taxonomia. 13

Ontologia n ciência ou estudo do ser, parte da metafísica relacionado com o ser

Ontologia n ciência ou estudo do ser, parte da metafísica relacionado com o ser ou a essência das coisas, ou o ser no abstrato. n outubro 21 definições foram apropriadas pela área da ciência da informação com significados modificados. O sentido original e o sentido apropriado pela área são corretos. É questão de terminologia de área de domínio. 14

Ontologias n n outubro 21 documento ou arquivo que define formalmente as relações entre

Ontologias n n outubro 21 documento ou arquivo que define formalmente as relações entre termos e conceitos, uma especificação de uma conceituação, para compartilhamento de definições necessárias à criação de um vocabulário comum. Nos novos sentidos destes termos existe uma interrelação que deve ser levada em conta. 15

Ontologias n Vickery (1997) primeiro uso do termo ontologia para a área de engenharia

Ontologias n Vickery (1997) primeiro uso do termo ontologia para a área de engenharia e ciência da informação. n n “Uma ontologia pode ser definida como uma explicitação formal de uma conceituação compartilhada” Conceitualização: n outubro 21 refere-se a um modelo abstrato de um fenômeno do mundo que é identificado por conceitos relevantes deste fenômeno. 16

Ontologias n Explicita: n n Formal: n n refere-se ao fato que a ontologia

Ontologias n Explicita: n n Formal: n n refere-se ao fato que a ontologia pode ser lida por máquina. Compartilhada: n outubro 21 significa que os tipos de conceitos usados, em contraste com o seu uso de explicitamente definidos. reflete a noção de que a ontologia captura o conhecimento consensual que não é privado ou individual e aceito por um grupo. 17

Ontologias n n Uma ontologia descreve uma área usando a noção de conceitos, relações,

Ontologias n n Uma ontologia descreve uma área usando a noção de conceitos, relações, funções e axiomas. Os conceitos em uma ontologia são organizados em taxonomias, onde mecanismos de relações podem ser aplicados. outubro 21 18

Ontologias n Duas das mais antigas e maiores ontologias do mundo são Word. Net

Ontologias n Duas das mais antigas e maiores ontologias do mundo são Word. Net and CYC. n Word. Net: n n n outubro 21 termos agrupados em cinco categorias: verbos, adjetivos, advérbios e funções de palavras e seus significados são relacionados através de sinônimos, antônimos, hipônimos (relações hierárquicas), merônimos (parte de relacionamentos que contém conceitos) e relações morfológicas. Word. Net é uma ferramenta léxica, disponível gratuitamente na Internet http: //wordnet. princeton. edu/ 19

Ontologias n A ontologia da CYC foi produzida pela companhia que trabalhou com a

Ontologias n A ontologia da CYC foi produzida pela companhia que trabalhou com a Glaxo. Smith. Kline. n n n outubro 21 o conhecimento é representado por uma variante de predicado lógico. http: //www. cyc. com http: //www. opencyc. org/images/opencyckb-browser. gif 20

Ontologias n Ontologias de domínio específico foram construídas para aplicações com tradução por máquina,

Ontologias n Ontologias de domínio específico foram construídas para aplicações com tradução por máquina, mapeamento empresarial, re-uso do conhecimento e recuperação da informação. n n n outubro 21 1) Ontologia organizacional descreve um meta-modelo de informação ex. estrutura e formato de fontes de informação. 2) Ontologia de domínio é usada para descrever o conteúdo de uma fonte de informação. 3) Ontologia empresarial é usada para modelar os processos de negócios. Propõe um modelo de atendimento às necessidades de conhecimento para processos empresariais. 21

Web Semântica n n A Web Semântica foi proposta por Berners-Lee. “A Web Semântica

Web Semântica n n A Web Semântica foi proposta por Berners-Lee. “A Web Semântica não é separada da Web, mas uma extensão da atual, na qual a informação é dada por um significado bem definido, melhor aplicado a computadores e elaborado por trabalho cooperativo” outubro 21 22

Web Semântica n n É um sistema online, com o conceito de Web universal,

Web Semântica n n É um sistema online, com o conceito de Web universal, sistema descentralizado sem discriminação de informação comercial ou acadêmica, cultura, linguagem ou mídia. A Web. Semântica roda em XML e RDF. outubro 21 23

Redes semânticas baseadas na Árvore de Porfírio outubro 21 24

Redes semânticas baseadas na Árvore de Porfírio outubro 21 24

Redes semânticas outubro 21 25

Redes semânticas outubro 21 25

Mapas Conceituais Psicologia cognitiva de Ausubel Aprendizagem ocorre por assimilação de novos conceitos e

Mapas Conceituais Psicologia cognitiva de Ausubel Aprendizagem ocorre por assimilação de novos conceitos e proposições na estrutura cognitva Aprendizagem significativa outubro 21 26

Mapas Conceituais Joseph Novak década de 70 São diagramas que indicam relações entre conceitos

Mapas Conceituais Joseph Novak década de 70 São diagramas que indicam relações entre conceitos outubro 21 27

Mapas Conceituais n n Modelo de aprendizagem Estrutura cognitiva está constantemente se reestruturando durante

Mapas Conceituais n n Modelo de aprendizagem Estrutura cognitiva está constantemente se reestruturando durante a apresendizagem significativa; O processo é dinâmico; O conhecimento vai sendo construído. outubro 21 28

Mapas Conceituais – C. I n n outubro 21 linguagem para descrição e comunicação

Mapas Conceituais – C. I n n outubro 21 linguagem para descrição e comunicação de conceitos. Estrutura que vai desde os conceitos mais abrangentes até os menos inclusivos. Representações gráficas de conceitos em um domínio específico com interações entre os conceitos. Conceitos são conectados por arcos, formando proposições mediante frases simplificadas. 29

Mapas Conceituais n Regras de construção: n n Não há um único modo de

Mapas Conceituais n Regras de construção: n n Não há um único modo de traçar um mapa conceitual. Um mapa conceitual é uma coisa dinâmica, refletindo a compreensão de quem faz no momento em que faz. outubro 21 30

Mapas Conceituais n n n Etapas: seleção: escolha do assunto e identificação das palavras-chave

Mapas Conceituais n n n Etapas: seleção: escolha do assunto e identificação das palavras-chave ou frases relacionadas ordenação: organização de conceitos do mais abstrato para o mais concreto agrupamento: reunir conceitos em um mesmo nível de abstração e com forte inter-relacionamento arranjo: organização de conceitos na forma de um diagrama link e preposição: conexão de conceitos com linhas e nomeação de cada linha com uma proposição (Lima, 2004) outubro 21 31

Mapas Conceituais n Mapas Conceituais outubro 21 32

Mapas Conceituais n Mapas Conceituais outubro 21 32

Mapas Conceituais n n n Softwares Cmaptools http: //cmap. ihmc. us/ Inspiration http: //www.

Mapas Conceituais n n n Softwares Cmaptools http: //cmap. ihmc. us/ Inspiration http: //www. inspiration. com/ n n n Kidsinspiration http: //www. inspiration. com/Kidspiration C-tools https: //ctools. umich. edu/portal outubro 21 33

Folksonomia n n n Maneira de indexar informações. Esta expressão foi cunhada por Thomas

Folksonomia n n n Maneira de indexar informações. Esta expressão foi cunhada por Thomas Vander Wal. É uma analogia à taxonomia, mas inclui o prefixo folks, palavra da língua inglesa que significa pessoas. Construção a partir da lingua natural da comunidade que a utiliza. Enquanto na taxonomia clássica primeiro são definidas as categorias do índice para depois encaixar as informações em uma delas (e em apenas uma), a folksonomia permite a cada usuário da informação classificar com uma ou mais palavraschaves ou tags (marcadores). Por meio das tags, o usuário pode recuperar as informações e compartilhá-las. Pode visualizar as tags de outros usuários, assim como identificar o grau de popularidade de cada tag no sistema, e acessar as informações relacionadas. outubro 21 34

Folksonomia n n n O primeiro site a usar folksonomia foi o del. icio.

Folksonomia n n n O primeiro site a usar folksonomia foi o del. icio. us (http: //delicious. com/) e, em seguida, o flickr e o you. Tube. O gmail oferece, no lugar de pastas, o recurso de tags para organizar os emails. Mas não é um exemplo clássico de folksonomia, pois não permite compartilhar as tags entre usuários do sistema. A rede social Last FM http: //www. lastfm. com. br/ usa a folksonomia para efetuar a classificação de faixas e artistas. O Library Thing é um catalogo cooperativo que utiliza a folksonomia (http: //br. librarything. com/) Blogs e microblogs utilizam marcadores. O Twitter utiliza #hashtags. outubro 21 35

Controle da linguagem e estrutura semântica n n n n n outubro 21 Glossários

Controle da linguagem e estrutura semântica n n n n n outubro 21 Glossários e dicionários Lista de autoridades Lista de sinônimos Cabeçalhos de assunto Classificações Taxonomias/Folksonomia Tesauros Mapas conceituais Rede semânticas Ontologias 36

Ranganathan n Para a construção de um esquema de classificação ou para sua extensão

Ranganathan n Para a construção de um esquema de classificação ou para sua extensão pode -se utilizar n outubro 21 os Cânones de Classificação, Sequência Útil e os Postulados e Princípios para Sequência de Facetas. 38

Ranganathan n As Leis Fundamentais consistem em: n outubro 21 Leis da Biblioteconomia, Leis

Ranganathan n As Leis Fundamentais consistem em: n outubro 21 Leis da Biblioteconomia, Leis da Interpretação, Lei da Imparcialidade, Lei da Simetria, Lei da Parcimônia, Lei da Variação Local, Lei da Osmose. 39

Categorias n para organização de classes, subclasses, cadeias e renques é preciso reuni-los em

Categorias n para organização de classes, subclasses, cadeias e renques é preciso reuni-los em categorias, facetas em categorias fundamentais, buscando o nível seminal, aquela que dá origem a classes, chegando ao nível fenomenal mais próximo do nível seminal. outubro 21 40

Categorias n chegar ao nível produtivo que funcione para classificação que seja útil para

Categorias n chegar ao nível produtivo que funcione para classificação que seja útil para a maioria. n n outubro 21 categorias referem-se a cinco idéias fundamentais, as mais genéricas possíveis e passíveis de se manifestarem de diversas formas, capazes de hospedar todos os objetos da natureza até então conhecidos pelo homem e classificá-los de acordo com sua natureza conceitual. são elas: tempo, espaço, energia, matéria e personalidade. (GOMES, MOTTA E CAMPOS, 2006) 41

Impacto das facetas n n Análise de facetas retomada recentemente Sistemas de organização do

Impacto das facetas n n Análise de facetas retomada recentemente Sistemas de organização do conhecimento estruturados em elementos facetados. Sites comerciais utilizando abordagem facetada Compreensão diferenciada da ideia de facetas (BROUGHTON, 2007) outubro 21 42

Impacto das facetas n n Fast: Faceted Application of subject terminology – derivado da

Impacto das facetas n n Fast: Faceted Application of subject terminology – derivado da LCSH http: //www. oclc. org/research/project s/fast/ Sites comerciais outubro 21 43

Abordagem clássica n n n Meio de organizar os conceitos em uma área de

Abordagem clássica n n n Meio de organizar os conceitos em uma área de domínio. Conceitos de grupo baseados em características compartilhadas. Usadas com receptáculos de conceitos Categorias linguístico / funcionais Linguagens pré-coordenadas outubro 21 44

Abordagens n n n Categorias de Ranganathan (PMEST). Categorias do CRG: (coisa, tipo, parte,

Abordagens n n n Categorias de Ranganathan (PMEST). Categorias do CRG: (coisa, tipo, parte, propriedade, material, processo, operação, paciente, produto, agente, espaço, tempo). Taxonomia e classificação - texto outubro 21 45

Modelos moleculares n Modelagem molecular permite um equivalente moderno a analogia com o Meccano

Modelos moleculares n Modelagem molecular permite um equivalente moderno a analogia com o Meccano feita por Ranganathan. n outubro 21 O sistema molecular representa a natureza dos componentes, seu relacionamento, posições relativas, relações internas e externas com partículas, sintaxe ou regras de combinação. 46

Modelos moleculares n n n Ontologias Mapas conceituais Label clouds / nuvens de tags

Modelos moleculares n n n Ontologias Mapas conceituais Label clouds / nuvens de tags Outros sistemas facetados modernos (inclusive tesauros modernizados, com possibilidade de navegação) FATKS http: //www. ucl. ac. uk/fatks/index. htm outubro 21 47

Referências n n n ZENG, M. L. Standards for Controlled Vocabularies. Denver, 2005. (Apresentado

Referências n n n ZENG, M. L. Standards for Controlled Vocabularies. Denver, 2005. (Apresentado em 7 th NKOS Workshop, 2005). ALVARENGA, L; SOUZA, R. R. A Web Semântica e suas contribuições para a ciência da informação. Ciência da Informação. , v. 33, n 1, 2004 BROUGHTON, V. Meccano, molecules and the organization of knowlegde: the continuing contribution of S. R. Ranganathan. (Apresentado em ISKO UK, nov. 2007). Disponível em: http: //www. iskouk. org/presentations/Vanda. Broughton. Nov 2007. ppt MÉNDEZ RODRÍGUES, E. Modelos de metadatos. In: Méndez Rodrígues, E. Metadados y recuperación de información: estándares, problemas y aplicabilidad em bibliotecas digitales. Gijón: Trea, 2002. cap. 3. LIMA, G. A. B. Mapa conceitual como ferramenta para organização do conhecimento em sistema de hipertextos e seus aspectos cognitivos. Belo Horizonte, Perspectiva em Ciência da Informação, v. 9, n. 2, p. 134 -145, jul. / dez. 2004. Disponível em: http: //www. eci. ufmg. br/pcionline/viewarticle. php? id=72 BAX, M. P e SOUZA, R. R. Uma proposta de uso de agentes e mapas conceituais para representação de conhecimentos altamente contextualizados. Disponível em: http: //www. emack. com. br/info/apostilas/nestor/agentes. pdf outubro 21 48