Banco de Dados Multimdia Captulo 2 Metadados UFPBCCTCOPIN
Banco de Dados Multimídia Capítulo 2: Metadados UFPB/CCT/COPIN Cláudio Baptista
Metadados z. Introdução z. Motivação z. Principais questões sobre metadados z. Armazenamento e captura z. Metadados em diferentes mídias z. Exemplo de metadados: Modelo Vi. Mod z. Padrões de Metadados z. Estudo de Caso: o modelo STep. Lib
Introdução z. Metadata = ‘dados sobre dados’ zÉ metadata: y um esquema conceitual num BD? yum diagrama funcional num projeto de software? yuma descrição de uma imagem? yo próprio dado?
Motivação z. Em dados multimídia, metadados assumem um papel especial devido a: yimpossibilidade de se ter consultas exatas em vários casos yimpossibilidade de se fazer Content-based Retrieval (CBR) em alguns casos ypara melhorar a qualidade das consultas CBR, pois a semântica é mais precisa ypor razões de performance, CBR nem sempre é recomendável em toda consulta
Questões acerca de metadados z Quais as características dos tipos de dados MM? z Quais são exemplos típicos de metadados ? z Qual o conteúdo de metadados (ontologia)? z Como extrair metadados? z Como metadados podem ser estruturados e armazenados? z Como metadados facilitam o processo de descoberta da informação?
Metadados Porquê metadata? - data discovery - data transfer - data management - data use (interpretation) como classifcar metadata? • Sistema: vocabulário, formatos, protocolos • Controle de qualidade: lineage, who, when, where, how data was collected • Semântico: data attributes, content-based attributes
Hierarquia de Metadados Application Domain Dependent Higher Level of Abstraction Ontologies Lower level of Abstraction Media Dependent System Quality Control MM data Semantic
Armazenamento e Captura Onde armazenar metadata? boa solução: integrar dados e metadata no modelo de dados uso da mesma API para recuperar e indexar dados e metadados. Como capturrar metadata? manualmente automaticamente semi-automaticamente
Exemplos de MM metadata Imagem: resolução (dpi), formato, compressão, histogramas, mapas de gradiente and contorno, cor mais usada em background e foreground, localização, composição, data de captura. Vídeo: duração, num de frames/seg, compressão, formato, cor, textura, classificação do video, sumário, keyframes. Texto: índices sobre word tokens, author name, date, publication, abstract. Áudio: num. de samples/seg, num de canais, the coding in which it has been recorded, and a speaker, identificação da fala, duração, língua.
Exemplos de MM metadata VÍDEO Subject: Campina Grande IMAGEM Compression: MPEG-2 subject: Pirâmide duration: 3’ 23’’ resolution: 600 X 800 description: festa, parque do povo. format: jpeg Class: turismo bit rate: 120 Metadados autor: Cláudio Baptista data: 24/06/2001 histograma: []bytes TEXTO Subject: Maior São João do Mundo Autor: João Ninguém data: 10/09/1997 lingua: Português palavras-chave: forró, festa, folclore, turismo tamanho: 5000 palavras Formato: PDF ÁUDIO Subject: Forró Coding: ADCPM locução: Flávio José data: 12/06/1999 duração: 3’’
Exemplo de Geo-spatial metadata z. General Identification: title, description, publisher, producer, progress, fees, constraints, copyright, accessibility, size z. Spatial Identification: bouding coordinates (west, east, north, south), scale, resolution, spatial data structure(raster/vector), spatial reference z. Temporal Identification: valid time, transaction time, temporal reference
Exemplo: Modelo Vi. Mod z. Video Features y (I) Content dependent: y (II) Temporal extent: frame (image) X motion (video) y(III) Labeling (futebol: drible, passe, gol)
Exemplo: Modelo Vi. Mod Feature T Content dependent Data Feature Temporally extended T Video Feature T Qualitatively Labelled Video Q-feature F Meta Feature F Image Feature F T Video R-Feature Image Q-feature Qualitatively labelled F Image R-Feature
Vi. Mod: Video Q-Features (I, III)
Vi. Mod: Video R-Features (I, II, Raw data)
Vi. Mod: Image Q-Features (I, Frame, III)
Vi. Mod: Image R-Features (I, Frame, Raw data)
Vi. Mod: Meta Features (content independent)
Padrões de Metadados z. FGDC/CSDGM y. Para dados espaciais y. Proposto pelo governo americano, porém depois influenciou o padrão ISO TC/TC 11 CD 19115 y. ISO TC/TC 11 possui dois levels • level 0: 53 elementos • level 1: mais de 400 elementos
Padrões de Metadados z. Dublin Core y. Inicialmente proposto para recursos Web y. Possui apenas 15 elementos: Title, Creator, Subject, Description, Publisher, Contributor, Date, Type, Format, Identifier, Source, Language, Relation, Coverage, Rights.
Estudo de Caso: o Modelo STep. Lib z. STep. Lib = Spatio. TEm. Poral digital LIBrary ymotivação: xenorme volume de dados dispníveis (terabytes/day) xa ubiqüidade da WWW yáreas involvidas: xspatiotemporal data xmultimedia data xmetadata
STep. Lib: Spatiotemporal requirements z. Space y. Spatial data xvector vs. raster y Spatial operators x topological, directional, metric, network, set oriented z. Time y. Temporal data y. Temporal operators
STep. Lib: requisitos MM z. Storage, indexing, retrieving, presentation, composition, modeling z Data types: text, image, video and audio z. Query yexact match vs. partial match ycontent-based retrieval similarity() and rank()
STep. Lib: hierarquia de metdados Application Domain Dependent Collections Ontologies Gazetteer High level of abstraction Semantic Metadata Quality Metadata Dependent System Metadata Raw Data Low level of abstraction
STep. Lib: tipos de metadados z. Spatiotemporal metadata ybounding coordinates (W, E, N, S), theme keywords, attribute accuracy, cloud cover, date/time range, contact information z. MM metadata yimage: resolution, format, compression, … yvideo: duration, frames/sec, keyframes, . . . ytext: author, date, format, keywords, . . . yaudio: samples/sec. , duration, language, …
STep. Lib: modelo de metadados Gazetteer Meta. Image Collection Ontology Meta. Geo. Object Full. Metadata Meta. Video Meta. Audio Meta. Text Video Audio Text Point Meta. Map Arc Polygon
STep. Lib: coleções Collection title: Text description: Text bounding. Box: Polygon period: TInterval librarian: Person creator: Person creation. Date: Time. Stamp datatype: Data. Type
STep. Lib: Meta. Geo. Object title: Text theme: {Text} bounding. Box: Polygon spatial. Reference: Text period: TInterval creator: Person creation. Date: Time. Stamp datatype: Data. Type publisher: Person annotation: Text data. Quality: Text
STep. Lib: Meta. Image format: Img. Format size: Integer thumbnail: Image num. X: Integer num. Y: Integer num. Z: Integer
STep. Lib: Meta. Video format: Video. Format standard: Video. Std compression: Vid. Comp size: Real duration: Time bit. Rate: Real frame. Rate: Real
STep. Lib: Meta. Audio compression: Aud. Comp size: Real sample. Rate: Real bit. Rate: Real channel: Integer duration: Time
STep. Lib: Meta. Text language: Text format: Text. Format size: Real word. Count: Integer
STep. Lib: Meta. Map scale: Real
STep. Lib: Meta. Map Point latitude: Real longitude: Real altitude: Alt. Range time: Time theme: Text feature: Text
STep. Lib: Meta. Map Line. String points: List altitude: Alt. Range time: Time theme: Text feature: Text
STep. Lib: Meta. Map Polygon points: List altitude: Alt. Range time: Time theme: Text feature: Text
- Slides: 36