Introduzione allontology engineering Ernesto Damiani Dipartimento di Tecnologie

  • Slides: 49
Download presentation
Introduzione all’ontology engineering Ernesto Damiani Dipartimento di Tecnologie dell’Informazione – Università di Milano Polo

Introduzione all’ontology engineering Ernesto Damiani Dipartimento di Tecnologie dell’Informazione – Università di Milano Polo di Crema 12/29/2021 Cesena

Sommario z. Cos’è il Web of Knowledge ? z. I metadati z. I formati

Sommario z. Cos’è il Web of Knowledge ? z. I metadati z. I formati storici z. Nuovi formati: da XML a RDF z. RDF Schema e il Semantic Web z. Ontology Engineering 12/29/2021 Cesena

Web of Knowledge z L’educazione moderna incoraggia la specializzazione. Lo storico e il fisico

Web of Knowledge z L’educazione moderna incoraggia la specializzazione. Lo storico e il fisico “generico” sono stati sostituiti da figure con competenze più focalizzate (e. g. lo storico del Rinascimento o l’astrofisico) z Però: il progresso della conoscenza nasce dalle interconnessioni “laterali” tra discipline quanto e più che dalla ricerca “verticale”. z Conoscenza=informazione organizzata 12/29/2021 Cesena

Un esempio: Frankenstein search (James Burke) 12/29/2021 Cesena

Un esempio: Frankenstein search (James Burke) 12/29/2021 Cesena

Frankenstein search: struttura d’accesso 12/29/2021 Cesena

Frankenstein search: struttura d’accesso 12/29/2021 Cesena

Frankenstein search: i dati 12/29/2021 Cesena

Frankenstein search: i dati 12/29/2021 Cesena

Frankenstein search: i metadati relazioni tipi vincoli 12/29/2021 Cesena

Frankenstein search: i metadati relazioni tipi vincoli 12/29/2021 Cesena

Metadati: una visione ‘ingenua’ z Dati che descrivono altri dati ye. g. il catalogo

Metadati: una visione ‘ingenua’ z Dati che descrivono altri dati ye. g. il catalogo di una biblioteca z. Spesso piu’ facili da trattare dei dati stessi y. Il formato dei metadati è una decisione del catalogatore, quello dei dati no. . 12/29/2021 Cesena

Quindi: z Metadati =‘etichette descrittive’ z Usi dei metadati y Catalogazione dei dati y

Quindi: z Metadati =‘etichette descrittive’ z Usi dei metadati y Catalogazione dei dati y Elaborazione automatica dei dati da parte di agenti software y Controllo degli accessi y Filtraggio dei flussi informativi esprimono: y Struttura e semantica dei dati ma anche altro: y Autore y Copyright y Informazioni di autenticazione y Protezioni e permessi d’accesso y Prezzo 12/29/2021 Cesena

Metadati: una visione “colta” Il “meaning triangle” (Ogden and Richards, 1923) 12/29/2021 Cesena

Metadati: una visione “colta” Il “meaning triangle” (Ogden and Richards, 1923) 12/29/2021 Cesena

Esempi ‘storici’ z. PICS z. Dublin core 12/29/2021 Cesena

Esempi ‘storici’ z. PICS z. Dublin core 12/29/2021 Cesena

PICS z Platform for Internet Content Selection z www. w 3. org/PICS/ z Recommendation

PICS z Platform for Internet Content Selection z www. w 3. org/PICS/ z Recommendation dal 1996 z Condivisione e interscambio di valutazioni su siti e pagine Web yetichette PICS trasportate negli header HTTP or come marcatori META xfrom document server xor an independent label bureau yfirmati elettronicamente e associati con un digest 12/29/2021 Cesena

Esempio <html> <head> <META http-equiv="PICS-Label" content=' (PICS-1. 1 "http: //www. gcf. org/v 2. 5"

Esempio <html> <head> <META http-equiv="PICS-Label" content=' (PICS-1. 1 "http: //www. gcf. org/v 2. 5" labels on "1999. 11. 05 T 08: 15 -0500" until ” 2001. 12. 31 T 23: 59 -0000" for "http: //w 3. org/PICS/Overview. html" ratings (suds 0. 5 density 0 color/hue 1)) '> </head> <body> <p>qui va il documento</p> </body> </html> 12/29/2021 Cesena

Applicazioni di PICS z Protezione dei minori y. Cyber. Patrol, Eval. Web, Net. Nanny,

Applicazioni di PICS z Protezione dei minori y. Cyber. Patrol, Eval. Web, Net. Nanny, … z Utente genera o ottiene un profilo z L’applicazione confronta rating e profilo e compie una delle seguenti azioni: ysuggest ysearch ymonitor ywarn yblock 12/29/2021 Cesena

Etichette Recreational Software Advisory Council (RSAC): Violenza z (category (transmit-as "v") (name "Violence") (label

Etichette Recreational Software Advisory Council (RSAC): Violenza z (category (transmit-as "v") (name "Violence") (label (name "Conflict") (description "Harmless conflict; some damage to objects") (value 0)) (label (name "Fighting") (description "Creatures injured or killed; damage to objects; fighting") (value 1)) (label (name "Killing") (description "Humans injured or killed with small amount of blood") (value 2)) (label (name "Blood and Gore") (description "Humans injured or killed; blood and gore") (value 3)) (label (name "Wanton Violence") (description "Wanton and gratuitous violence; torture; rape") (value 4))) 12/29/2021 Cesena

Problemi z. Chi sceglie le etichette? z. Chi ne definisce la sintassi? z. Come

Problemi z. Chi sceglie le etichette? z. Chi ne definisce la sintassi? z. Come determinarne il significato? z. A quale dato sono associate? 12/29/2021 Cesena

Dublin Core z 15 etichette z. Metadati bibliografici z. Campi tipati yvocabolario controllato y.

Dublin Core z 15 etichette z. Metadati bibliografici z. Campi tipati yvocabolario controllato y. ISO 8601 (date) ytipi di risorse y. URLs, ISBNs y. RC 1766 (lingue) 12/29/2021 Cesena

Elementi Dublin Core (1) z Title z Creator (persona, organizzazione, servizio) z Subject (lista

Elementi Dublin Core (1) z Title z Creator (persona, organizzazione, servizio) z Subject (lista di parole chiave dal vocabolario controllato) 12/29/2021 z Publisher z Contributor z Date z Type (e. g. collezione, evento, immagine, oggetto fisico, software, suono, …) z Format Cesena

Elementi Dublin Core (2) z Identifier z Source z Language (lingua) z Relation (collegamento

Elementi Dublin Core (2) z Identifier z Source z Language (lingua) z Relation (collegamento a una risorsa correlata) z Coverage (es. luogo, tempo, a giurisdizione) 12/29/2021 z Rights (proprieta’ intellettuale, copyright) z Description (riassunto, indice, o testo libero) Cesena

Metadati basati su XML z. XML Schema (perchè no? . . ) z. RDF

Metadati basati su XML z. XML Schema (perchè no? . . ) z. RDF (Resource Description Framework) z. RDF Schema 12/29/2021 Cesena

Uso di schemi XML come rappresentazione di metadati • Problema principale: il potere espressivo

Uso di schemi XML come rappresentazione di metadati • Problema principale: il potere espressivo • Ambiguità nel significato dell’inclusione di elementi 12/29/2021 Cesena

RDF z Resource Description Framework z W 3 C Recommendation, dal Febbraio 1999 ysi

RDF z Resource Description Framework z W 3 C Recommendation, dal Febbraio 1999 ysi basa su XML e spazi di denominazione z Indipendente dalla piattaforma z Eredita’ y. PICS ybiblioteche digitali, SGML e rappresentazione della conoscenza z Scopo principale yrendere le etichette elaborabili da agenti software oltre che leggibili dall’uomo 12/29/2021 Cesena

Primi passi con RDF z I dati sono descritti da asserzioni z Un’asserzione e’

Primi passi con RDF z I dati sono descritti da asserzioni z Un’asserzione e’ composta da y. Una risorsa x. Pagina Web o parte di essa, intero sito Web… x…un documento XML …un libro … qualunque cosa dotata di URI yuna proprieta’ xe. g. Titolo, Data, Tipo yun valore xes. stringa, numero, frammento XML, un’altra risorsa 12/29/2021 Cesena

Risorse z. Dalla RFC 2396: z “A resource can be anything that has identity.

Risorse z. Dalla RFC 2396: z “A resource can be anything that has identity. Familiar examples include an electronic document, an image, a service (e. g. , "today's weather report for Los Angeles"), and a collection of other resources. Not all resources are network "retrievable"; e. g. , human beings, corporations, and bound books in a library can also be considered resources. The resource is the conceptual mapping to an entity or set of entities, not necessarily the entity which corresponds to that mapping at any particular instance in time. Thus, a resource can remain constant even when its content ---the entities to which it currently corresponds---changes over time, provided that the conceptual mapping is not changed in the process”. 12/29/2021 Cesena

Risorse e URI z. Le risorse sono identificate da URI z. La risorsa identificata

Risorse e URI z. Le risorse sono identificate da URI z. La risorsa identificata da una URI puo’ essere astratta = non recuperabile in Rete z. Sintassi: [absolute. URI | relative. URI] [“#” fragment-id] / 12/29/2021 Cesena

Altre visioni di RDF z Sintassi XML standard per rappresentare grafi etichettati diretti z

Altre visioni di RDF z Sintassi XML standard per rappresentare grafi etichettati diretti z Sintassi XML standard per rappresentare fatti in logica del primo ordine senza variabili 12/29/2021 Cesena soggetto predicato oggetto Asserzione : = (predicato, soggetto, oggetto) Predicato = URI Soggetto = URI Oggetto = URI o costante Oggetto = Predicato(Soggetto)

http: //www. crema. unimi. it/Home/Damiani. htm Esempio di modello RDF Autore “La persona id=240,

http: //www. crema. unimi. it/Home/Damiani. htm Esempio di modello RDF Autore “La persona id=240, il cui nome e’ Ernesto Damiani e l’e-mail edamiani@crema. unimi. it e’ l’autore di http: //www. crema. unimi. it/Home/Damiani. htm” http: // www. crema. unimi. it /docenti/240 nome Ernesto Damiani 12/29/2021 Cesena Email edamiani@crema. unimi. it

Sintassi <? xml version="1. 0" encoding="UTF-8"? > <rdf: RDF xmlns: rdf="http: //www. w 3.

Sintassi <? xml version="1. 0" encoding="UTF-8"? > <rdf: RDF xmlns: rdf="http: //www. w 3. org/1999/02/22 -rdf-syntaxns#" xmlns: rdfs="http: //www. w 3. org/2000/01/rdf-schema#"> <rdf: description about="http: //www. crema. unimi. it/Home/Damiani"> <s: Creator>Ernesto Damiani</s: Creator> </rdf: description> </rdf: RDF> RISORSA SPAZIO DI DENOMINAZIONE = PROPRIETA’ - VALORE VOCABOLARIO DI DOMINIO = (in questo caso costante) ELENCO DI PROPRIETA’ 12/29/2021 Cesena

Ipertesti e RDF zxlink semplici: niente semantica! zxlink tipati yxlink: arcrole : = predicato

Ipertesti e RDF zxlink semplici: niente semantica! zxlink tipati yxlink: arcrole : = predicato yxlink: href : = oggetto yxlink: role : = tipo 12/29/2021 Cesena

Schemi RDF z. Specificano le proprieta’ che possono comparire nelle asserzioni RDF z. Non

Schemi RDF z. Specificano le proprieta’ che possono comparire nelle asserzioni RDF z. Non sono solo elenchi di proprieta’ y. Specificano le relazioni tra le proprieta’ y. Dichiarano classi (e sottoclassi) di risorse z. Sviluppo consortile 12/29/2021 Cesena

Cosa sono gli schemi RDF ? z Una vecchia idea: le reti semantiche y

Cosa sono gli schemi RDF ? z Una vecchia idea: le reti semantiche y formalismo IA, circa 1970 Spina dorsale ha cuore vertebrato peloso E’ un ali mammifero z Organizzano uccello vola concetti in modo camminare sa E’ un elaborabile da Non vola E’ un agenti software giallo canarino struzzo z Primo passo verso ontologie di dominio Titti 12/29/2021 Cesena Hugo

Interrogazioni ai metadati z“Titti sa volare? ” z“Hugo ha le ali? ” z“Titti ha

Interrogazioni ai metadati z“Titti sa volare? ” z“Hugo ha le ali? ” z“Titti ha la spina dorsale? ” z“Quanti canarini vivono in gabbia? ” 12/29/2021 Cesena

Cosa sono gli schemi RDF ? (2) z. Schemi RDF = Reti semantiche sul

Cosa sono gli schemi RDF ? (2) z. Schemi RDF = Reti semantiche sul Web z. Nodi=risorse (URI) z. Archi yrdfs: Class yrdfs: Property yrdfs: sub. Class. Of yrdf: type 12/29/2021 Cesena

Esempio Risorsa Persona Paziente Sanitario <? xml version="1. 0" encoding="UTF-8"? > <rdf: RDF xmlns:

Esempio Risorsa Persona Paziente Sanitario <? xml version="1. 0" encoding="UTF-8"? > <rdf: RDF xmlns: rdf="http: //www. w 3. org/1999/02/22 -rdf-syntax-ns#" xmlns: rdfs="http: //www. w 3. org/2000/01/r df-schema#"> <rdfs: Class rdf: ID="Sanitario"> <rdfs: sub. Class. Of rdf: resource="#Persona"/> </rdfs: Class> </rdf: RDF> Infermiere Medico 12/29/2021 Cesena

RDFS: : il metaschema a. k. a. “lo schema degli schemi” 12/29/2021 Cesena

RDFS: : il metaschema a. k. a. “lo schema degli schemi” 12/29/2021 Cesena

Ontologie e RDFS • Ontologie=schemi RDFS scritti in RDFS • Definiamo Class e Property

Ontologie e RDFS • Ontologie=schemi RDFS scritti in RDFS • Definiamo Class e Property con nome e cognome • Possiamo reificare, cioè dire che una property ha una property o che una class appartiene a una class 12/29/2021 Cesena

Linguaggi avanzati Schemi RDFS già pronti che definiscono property interessanti Potere espressivo uguale a

Linguaggi avanzati Schemi RDFS già pronti che definiscono property interessanti Potere espressivo uguale a quello della logica descrittiva DARPA Agent Markup Language (DAML) OWL=DAML+OIL Standard W 3 C 12/29/2021 Ontology Interchange Language (OIL) Cesena

Resource Directory Description Language (RDDL) z Proposto inizialmente (Gennaio 2001) per dare un significato

Resource Directory Description Language (RDDL) z Proposto inizialmente (Gennaio 2001) per dare un significato ai riferimenti agli URI degli spazi di denominazione z Identifica classi di risorse a cui si accede attraverso collegamenti ipertestuali dandone scopo e natura (spazi di denominazione: un caso particolare) z formato leggibile sia dagli utenti umani sia dalle macchine z Adottato da XML Schema, Schematron, RSS, Examplotron, XSLT Extension framework, SWAG z Un semplice approccio al “Semantic Web” 12/29/2021 Cesena

RDDL: Esempio <? xml version="1. 0" encoding="UTF-8"? > <rdf: RDF xmlns: rdf="http: //www. w

RDDL: Esempio <? xml version="1. 0" encoding="UTF-8"? > <rdf: RDF xmlns: rdf="http: //www. w 3. org/1999/02/22 -rdf-syntax-ns#" xmlns: rddl="http: //www. rddl. org/"> <rddl: resource rddl: id=”www. questa. URL. org/questodoc. xml" xlink: arcrole="http: //www. rddl. org/purposes#schemavalidation" xlink: role="http: //www. w 3. org/2001/XMLSchema” xlink: title=”uno schema XML" xlink: href="http: //www. crema. unimi. it/loschemadiquestodoc. xsd"> <p>Testo descrittivo</p> </rddl: resource> </rdf: RDF> 12/29/2021 Cesena

RDDL Esempio (3) <? xml version="1. 0" encoding="UTF-8"? > <rdf: RDF xmlns: rdf="http: //www.

RDDL Esempio (3) <? xml version="1. 0" encoding="UTF-8"? > <rdf: RDF xmlns: rdf="http: //www. w 3. org/1999/02/22 -rdf-syntax-ns#" xmlns: rddl="http: //www. rddl. org/"> <rddl: resource xlink: role="http: //www. crema. unimi. it/application/java-archive" xlink: arcrole="http: //www. rddl. org/purposes/software#xslt-extension" xl: href="this. NS-xslt-extension. jar"> <p>le estensioni XSLT definite in questo namespace sono in questo JAR</p> </rddl: resource> </rdf: RDF> 12/29/2021 Cesena

Ontology Engineering 12/29/2021 Cesena

Ontology Engineering 12/29/2021 Cesena

Comunicazione intelligente usando ontologie RDF Schema: linguaggio standard per rappresentare e scambiare ontologie 12/29/2021

Comunicazione intelligente usando ontologie RDF Schema: linguaggio standard per rappresentare e scambiare ontologie 12/29/2021 Cesena

Tipi di ontologie Necessità di progettazione modulare basata su template e di chiara definizione

Tipi di ontologie Necessità di progettazione modulare basata su template e di chiara definizione di interfacce 12/29/2021 Cesena

Dove prendo il vocabolario? http: //www. cogsci. princeton. edu/~wn 12/29/2021 Cesena

Dove prendo il vocabolario? http: //www. cogsci. princeton. edu/~wn 12/29/2021 Cesena

Passi del progetto di ontologie • Uso di strumenti visuali (e. g. UML) •

Passi del progetto di ontologie • Uso di strumenti visuali (e. g. UML) • Ambienti specializzati per l’ontology design (e. g. , Onto. Maker) 12/29/2021 Cesena

Waterfall ontology lifecycle • Ontologie come software artifact • Passi di uno sviluppo industriale

Waterfall ontology lifecycle • Ontologie come software artifact • Passi di uno sviluppo industriale • Tecniche di software engineering 12/29/2021 Cesena

Iterative ontology lifecycle Problema aperto: Necessità di far evolvere l’ontologia mentre la si usa

Iterative ontology lifecycle Problema aperto: Necessità di far evolvere l’ontologia mentre la si usa 12/29/2021 Cesena

Conclusioni z Web of Knowledge=Web + metadati z Shared Web of Knowledge: Web +

Conclusioni z Web of Knowledge=Web + metadati z Shared Web of Knowledge: Web + metadati espressi in un formato standard di riferimento Basato sullo spazio delle URI z Schemi interessanti gia’ disponibili z Primi passi verso grandi ontologie di dominio z Ci stiamo lavorando, Crema+Lecce z Per saperne di più: http: //bingo. crema. unimi. it/ontology/ 12/29/2021 Cesena

Ci sono domande? 12/29/2021 Cesena

Ci sono domande? 12/29/2021 Cesena