Corese RDF Semantic Search Engine Marek Rika ACACIA

  • Slides: 28
Download presentation
Corese RDF Semantic Search Engine Marek Růžička ACACIA INRIA, Sophia Antipolis http: //www-sop. inria.

Corese RDF Semantic Search Engine Marek Růžička ACACIA INRIA, Sophia Antipolis http: //www-sop. inria. fr/acacia/ 3. 3. 2005 1

CORESE (COnceptual REsource Search Engine) - napsán v Java - vyvíjen cca 5 let

CORESE (COnceptual REsource Search Engine) - napsán v Java - vyvíjen cca 5 let - vyhledávání v dokumentech RDF - pro vyhodnocování dotazů využívá konceptuální grafy 3. 3. 2005 2

RDF - Resource Description Framework Jazyk W 3 C pro sémantický web Popisuje zdroje

RDF - Resource Description Framework Jazyk W 3 C pro sémantický web Popisuje zdroje na webu Založen na tripletech: resource property value RDF/XML syntaxe RDF Schema (RDF(S)) : RDF Vocabulary Description Language 3. 3. 2005 3

 • Ontologie: Man • Anotace: Woman Man: #jnovak interest • Pravidla: • Dotazy

• Ontologie: Man • Anotace: Woman Man: #jnovak interest • Pravidla: • Dotazy ? !: 3. 3. 2005 designation Human name novak Topic: Semantic. Web Human: ? x member Human: ? y member Human: ? x colleague Human: #jnovak title interest Group: ? g Human: ? y Topic: ? t 4

Dotazování v RDF dokumentech Komplexní dotaz (corese query language): ? x rdf: type c:

Dotazování v RDF dokumentech Komplexní dotaz (corese query language): ? x rdf: type c: Person ? x c: name ? n ? x c: author ? doc rdf: type c: Thesis - Při vyhledávání procházet i všechny podtřídy - Aproximace dotazu Pro RDF(S) neexistuje (zatím) vhodný algoritmus 3. 3. 2005 5

Dotazy v RDF Dotazu {document} -> {created. By} -> {Person} -> {subject} -> {Science}

Dotazy v RDF Dotazu {document} -> {created. By} -> {Person} -> {subject} -> {Science} odpovídá {Tech. Report} -> {created. By} -> {Researcher} -> {subject} -> {Cognitive. Science} nebo {Book} 3. 3. 2005 -> -> {created. By} {topic} -> -> {Profesor} {Social. Science} 6

Projekce CG Najít výskyt vzoru grafu v cílovém grafu Procházet specializace tříd podle hierarchie

Projekce CG Najít výskyt vzoru grafu v cílovém grafu Procházet specializace tříd podle hierarchie Human action Food Man eat Apple eat < action Man < Human Apple < Food 3. 3. 2005 7

RDF vs. Konceptuální grafy rdfs: Class Concept Type rdf: Property Relation rdfs: Resource Concept

RDF vs. Konceptuální grafy rdfs: Class Concept Type rdf: Property Relation rdfs: Resource Concept rdfs: domain rdfs: range Signature RDF Graph CG 3. 3. 2005 8

Mapování RDF to CG Převedení RDF do konceptuálního grafu RDF Schema ~ CG support

Mapování RDF to CG Převedení RDF do konceptuálního grafu RDF Schema ~ CG support RDF ~ CG Využití operace projekce (CG) jako query engine 3. 3. 2005 9

Inferenční pravidla <cos: rule> <cos: if> ? p rdf: type c: Person ? p

Inferenční pravidla <cos: rule> <cos: if> ? p rdf: type c: Person ? p c: author ? doc rdf: type c: Ph. DThesis </cos: if> <cos: then> ? p rdf: type c: Ph. D </cos: then> </cos: rule> 3. 3. 2005 10

Aproximativní projekce Proč aproximovat projekci? Původní vize sémantického webu je založena na třech silných

Aproximativní projekce Proč aproximovat projekci? Původní vize sémantického webu je založena na třech silných hypotézách: - je možné navrhnout ontologii objektivně popisující danou doménu - pomocí této ontologie lze popsat zdroje na webu - uživatelé budou vyhledávat informace skrze dotazy založené na stejné ontologii 3. 3. 2005 11

Aproximativní projekce Human action Food Chimp eat Banana Najít nejlepší aproximaci na základě -

Aproximativní projekce Human action Food Chimp eat Banana Najít nejlepší aproximaci na základě - ontologické vzdálenosti - příbuznosti tříd a relací - „relation paths“ 3. 3. 2005 12

Ontologická vzdálenost dvou tříd onto_distance(t 1, t 2)= class_distance(t 1, t) + class_distance(t 2,

Ontologická vzdálenost dvou tříd onto_distance(t 1, t 2)= class_distance(t 1, t) + class_distance(t 2, t) kde t je nejhlubší společná nadtřída t 1 a t 2 Vzdálenost mezi třídou a nadtřídou class_distance(t 1, t) = min ½ depth(x) x <t 1, t>, x t 1 Kde <t 1, t> zahrnuje celou cestu mezi t 1 a t a depth(x) je maximální hloubka třídy x v celé ontologii 3. 3. 2005 13

Ontologická vzdálenost 1 1/2 1/4 1/8 D(Human, Chimp)=0. 25 3. 3. 2005 (1/8 +

Ontologická vzdálenost 1 1/2 1/4 1/8 D(Human, Chimp)=0. 25 3. 3. 2005 (1/8 + 1/8) 14

Ontologická vzdálenost 1 1/2 1/4 1/8 D(Dolphin, Human) =0. 75 3. 3. 2005 (2/8

Ontologická vzdálenost 1 1/2 1/4 1/8 D(Dolphin, Human) =0. 75 3. 3. 2005 (2/8 + 2/4) 15

Ontologická vzdálenost 1 1/2 1/4 1/8 D(Dolphin, Fish) =1. 375 (1/8+1/4+2/2) 3. 3. 2005

Ontologická vzdálenost 1 1/2 1/4 1/8 D(Dolphin, Fish) =1. 375 (1/8+1/4+2/2) 3. 3. 2005 16

Corese Query langage V dotazovacím jazyce lze specifikovat pro které třídy (relace) aproximaci použít

Corese Query langage V dotazovacím jazyce lze specifikovat pro které třídy (relace) aproximaci použít a pro které ne. ? x rdf: type c: Person ? x c: name ? n ? x c: author ? doc <=: c: Thesis Původně navržen v čistě textové podobě aby byl „snadno čitelný i pro uživatele“ Plánovaný přechod na SPARQL (dotazovací jazyk od W 3 C pro RDF) 3. 3. 2005 17

Příbuznost tříd Z pohledu některých uživatelů : <rdfs: Class rdf: ID=“Knowledge. Dissemination”> <rdfs: see.

Příbuznost tříd Z pohledu některých uživatelů : <rdfs: Class rdf: ID=“Knowledge. Dissemination”> <rdfs: see. Also rdf: resource=“#Knowledge. Engineering”/> </rdfs: Class> Zkrátí vzdálenost mezi Knowledge. Dissemination a Knowledge. Engineering Globálně se aplikuje pravidlo (distribuce see. Also mezi potomky): ? x rdfs: see. Also ? y ? z rdfs: sub. Class. Of ? x => ? z rdfs: see. Also ? y 3. 3. 2005 18

Příbuznost relací Pomocí see. Also lze aproximovat i vlastnosti: <rdfs: Property rdf: ID=“has. For.

Příbuznost relací Pomocí see. Also lze aproximovat i vlastnosti: <rdfs: Property rdf: ID=“has. For. Working. Interest”> <rdfs: see. Also rdf: resource=“#is. Interested. By”/> </rdfs: Property> Použitím see. Also se ontologická vzdálenost snižuje na vzdálenost dvou tříd se stejnou nadtřídou 3. 3. 2005 19

Aproximace vlastností 3. 3. 2005 Human eat Food Chimp drink Milk 20

Aproximace vlastností 3. 3. 2005 Human eat Food Chimp drink Milk 20

Relation Paths Pro dotaz x R y Corese generuje i dotazy x R z

Relation Paths Pro dotaz x R y Corese generuje i dotazy x R z R y, x R z R t R y apod. ? org c: relation[3] ? topic ? org rdf: type c: Organization ? topic rdf: type c: Human. Science Default 3. 3. 2005 all: : c: relation[3] 21

Semantic search engine <accident> <date> 19 Mai 2000 </date> <description> <facteur>le facteur </description> </accident>

Semantic search engine <accident> <date> 19 Mai 2000 </date> <description> <facteur>le facteur </description> </accident> Documents RDF Schema RDF Metadata & Annotations Instance of RDF Schema Web stack QUERIES RDFS CG Support RDF CG Base Rules CG Rules Queries CG Query RULES ONTOLOGY RDFS RDF 3. 3. 2005 XML URI Users <ns: article rdf: about="http: //intranet/articles/ecai. doc"> <ns: title>MAS and Corporate Semantic Web</ns: title> <ns: author> <ns: person rdf: about="http: //intranet/employee/id 109" /> </ns: author> </ns: article> <rdfs: Class rdf: ID="thing"/> <rdfs: Class rdf: ID="person"> <rdfs: sub. Class. Of rdf: resource="#thing"/> </rdfs: Class> CORESE XML NAMESPACES UNICODE INFERENCES PROJECTION CG Results query answer Ontologies Semantic Web server RDF/S 22

Corese Přestože je napsán v Java, velmi rychlý… Např. pro RDF graf s 18

Corese Přestože je napsán v Java, velmi rychlý… Např. pro RDF graf s 18 000 relacemi vyhodnotí dotaz za 0. 01 s (mód bez aproximací – 0 odpovědí) resp. 0. 02 s (mód s aproximacemi – 5 odpovědí) 3. 3. 2005 23

CORESE - implementace 1. 2. 3. 4. 5. 6. 7. 8. KMP : Knowledge

CORESE - implementace 1. 2. 3. 4. 5. 6. 7. 8. KMP : Knowledge Management Platform Web. Learn : Semantic Web for e. Learning MEAT : Biology DNA Micro. Array Experiment Life-line : Cooperative medical reasoning EADS : Research Lab Corporate Memory Escrire : Comparison of CG, DL and Objects Samovar : Car Design Project Memory with Renault Approbatiom : Design Document Management with CSTB 9. Comma : IST Project Corporate Memory Management through Agents 3. 3. 2005 24

Project Life-line – Virtual Staff 3. 3. 2005 25

Project Life-line – Virtual Staff 3. 3. 2005 25

3. 3. 2005 26

3. 3. 2005 26

Project Life-line – Virtual Staff 3. 3. 2005 27

Project Life-line – Virtual Staff 3. 3. 2005 27

Závěr CORESE - RDF Semantic Search Engine Vyhledávání v RDF(S) pomocí operace projekce v

Závěr CORESE - RDF Semantic Search Engine Vyhledávání v RDF(S) pomocí operace projekce v CG Implementován v INRIAe v 9 aplikacích http: //www. inria. fr/acacia/corese 3. 3. 2005 28