D 2 I Integrazione Warehousing e Mining di

  • Slides: 9
Download presentation
D 2 I Integrazione, Warehousing e Mining di sorgenti eterogenee Tema 1: Integrazione di

D 2 I Integrazione, Warehousing e Mining di sorgenti eterogenee Tema 1: Integrazione di dati provenienti da sorgenti eterogenee Responsabile del tema di ricerca Sonia Bergamaschi Unita' coinvolte nel tema Univ. di Bologna Univ. della Calabria Univ. di Milano Univ. di Modena e Reggio Emilia Univ. di Roma "La Sapienza"

Obiettivo Fase 2 Quadro metodologico per l’integrazione di dati provenienti da sorgenti fortemente eterogenee

Obiettivo Fase 2 Quadro metodologico per l’integrazione di dati provenienti da sorgenti fortemente eterogenee w Metodologia per la costruzione di viste riconciliate di dati semi-strutturati provenienti da sorgenti eterogenee basata su tecniche intelligenti w Metodi e tecniche per il trattamento di interrogazioni formulate sulla vista integrata

Prodotti Fase 2 Prodotti Previsti D 1. R 6 Descrizione della metodologia di integrazione

Prodotti Fase 2 Prodotti Previsti D 1. R 6 Descrizione della metodologia di integrazione di sorgenti fortemente eterogenee (MI, BO, MO) D 1. R 7 Architettura funzionale di un ambiente di ausilio al progettista per la costruzione di viste riconciliate di sorgenti fortemente eterogenee basato sulle tecniche sviluppate (CS, MI, MO) D 1. R 8 Specifiche funzionali del Query Manager (MO) D 1. R 9 Algoritmi per la traduzione di informazioni da modelli di dati sorgente a modelli di dati target (CS) D 1. R 10 Descrizione del linguaggio fuzzy per l' interrogazione di viste riconciliate(MI) D 1. R 11 Descrizione della metodologia e degli strumenti per la riconciliazione dei dati (RM)

Unità di Modena (MO) D 1. R 8: Specifiche funzionali del Query Manager

Unità di Modena (MO) D 1. R 8: Specifiche funzionali del Query Manager

Unità di Milano (MI) D 1. R 6: Descrizione della metodologia … D 1.

Unità di Milano (MI) D 1. R 6: Descrizione della metodologia … D 1. R 10: Descrizione del linguaggio fuzzy … u u D 1. R 6: Descrizione della metodologia di integrazione di sorgenti fortemente eterogenee (MI, BO, MO) n metodologia generale articolata in fasi che integra i contributi delle tre UO coinvolte (ARTEMIS/MOMIS + BO) n sezioni dedicate ai contributi delle singole unita’: proprieta’ inter-schema e ontologie (MO), integrazione di sorgenti Web (MI), integrazione con proprieta’ estensionali (MI+MO), aspetti di integrazione di BO D 1. R 10: Descrizione del linguaggio fuzzy per l'interrogazione di viste riconciliate (MI) n uso di un linguaggio fuzzy per il popolamento semiautomatico di classi globali in presenza di dati imprecisi (eterogeneita’ semantica) nelle sorgenti da integrare n applicazione nell’approccio global-as-view

D 1. R 6: articolazione proposta 1. Introduction (MI - all) 2. Overview of

D 1. R 6: articolazione proposta 1. Introduction (MI - all) 2. Overview of the integration methodology (MI+MO+BO) 3. Interschema property specification and ontologies (MO) 4. Schema integration for Web data (MI) 5. Data integration with extensional properties (MI+MO) 6. T. B. D. (BO) 7. Concluding remarks (MI - all)

Unità di Roma – La Sapienza (RM) D 1. R 11: Descrizione della metodologia

Unità di Roma – La Sapienza (RM) D 1. R 11: Descrizione della metodologia e degli strumenti per la riconciliazione dei dati w w w Rapporti precedenti n D 1. R 1: Approccio DLR per la rappresentazione e l’integrazione di sorgenti n eterogenee D 1. R 5: Rassegna sui metodi di answering a rewriting Framework: schema sorgente, schema globale, mapping (LAVGAV) Nuovo rapporto D 1. R 11 n n w Confronto LAV-GAV Metodologia per la riconciliazione dei dati in LAV ed in GAV Riconciliazione in LAV n Approccio DLR : sorgenti relazionali a cui associamo viste sul livello concettuale corrispondenze di riconciliazione (convert, match, merge) algoritmo di query rewriting w Riconciliazione in GAV n n Vincoli sullo schema globale e Viste Sound: Unfolding non e’ sufficiente Caso di schemi relazionali con vincoli di chiave e vincoli di foreign key sullo schema globale

Unità della Calabria (CS) D 1. R 9: Algoritmi per la traduzione di informazioni

Unità della Calabria (CS) D 1. R 9: Algoritmi per la traduzione di informazioni da modelli di dati sorgente a modelli dei dati target w Approfondimento dei metodi ed degli algoritmi di traduzione presentati nel rapporto tecnico precedente. In particolare: n n n Analisi volta a dimostrare l’omogeneità delle traduzioni Approfondimento delle analogie e differenze del nostro modello con i modelli proposti in letteratura per gestire le medesime problematiche Definizione, a livello logico, di un modello capace di rappresentare i dati provenienti da sorgenti informative eterogenee (E-SDR-Network). La E-SDR-Network è il modello logico corrispondente al modello concettuale SDR-Network introdotto nel precedente rapporto

Unità della Calabria (CS) D 1. R 7: Architettura funzionale di un ambiente di

Unità della Calabria (CS) D 1. R 7: Architettura funzionale di un ambiente di ausilio al progettista per la costruzione di viste riconciliate… w Le architetture per la costruzione di viste necessitano di una fase di Integrazione ed, eventualmente, di una fase di Astrazione degli schemi e dei dati w Sono stati sviluppati due approcci per la realizzazione di questi processi (MOMIS e DIKE) w Nel rapporto tecnico vengono analizzate le caratteristiche dei due approcci w Successivamente viene definito un framework che, ad un livello di astrazione maggiore, rappresenti i due approcci e consenta di catturare le caratteristiche migliori di entrambi