Ontologie Olivier Corbysophia inria fr INRIA Sophia Antipolis

  • Slides: 41
Download presentation
Ontologie Olivier. Corby@sophia. inria. fr INRIA, Sophia Antipolis http: //www. inria. fr/acacia «Knowledge is

Ontologie Olivier. [email protected] inria. fr INRIA, Sophia Antipolis http: //www. inria. fr/acacia «Knowledge is Power» 1

Ontologie Etude de ce qui est terme emprunté à la philosophie Pour nous :

Ontologie Etude de ce qui est terme emprunté à la philosophie Pour nous : formalisation d’une conceptualisation 2

Ontologie Se mettre d'accord sur le sens des termes employés dans une organisation, une

Ontologie Se mettre d'accord sur le sens des termes employés dans une organisation, une communauté, un métier Faire en sorte que les personnes et les logiciels se comprennent Utile pour des applications distribuées telles que le Web 3

Ambiguité ‘chambre’ : Chambre d'hôtel ? Chambre d'écho ? Chambre des députés ? Chambre

Ambiguité ‘chambre’ : Chambre d'hôtel ? Chambre d'écho ? Chambre des députés ? Chambre d'enregistrement ? Chambre noire ? Chambre funéraire ? 4

Ontologie Identifier, modéliser les concepts et les relations d'un domaine, pertinents pour une/des applications

Ontologie Identifier, modéliser les concepts et les relations d'un domaine, pertinents pour une/des applications Se mettre d'accord, au sein d'une communauté, sur les termes employés pour se référer à ces notions 5

Terme Mot de la langue naturelle qui désigne un (des) concept(s) : cat, chat,

Terme Mot de la langue naturelle qui désigne un (des) concept(s) : cat, chat, greffier, matou termes qui désignent le concept de chat synonymie : plusieurs termes dénotent le même concept ambiguïté : le même terme dénote des concepts différents 6

Pour quoi faire ? une base de connaissances à objets un système d’annotation un

Pour quoi faire ? une base de connaissances à objets un système d’annotation un système d’indexation documentaire, de recherche d’information Commerce électronique 7

Ontologie Différentes acceptions du mot ontologie : Vocabulaire technique, Référentiel métier, Terminologie/thesaurus, Système de

Ontologie Différentes acceptions du mot ontologie : Vocabulaire technique, Référentiel métier, Terminologie/thesaurus, Système de classes d’une représentation par objet : UML ? Base de connaissances terminologique Théorie logique 8

Conception Identifier un domaine technique Recenser, classer les termes du vocabulaire Identifier les termes

Conception Identifier un domaine technique Recenser, classer les termes du vocabulaire Identifier les termes dénotant • des objets • des propriétés • des relations Classer les objets 9

Conception Identifier les points de vue pertinents du domaine : • • Technique, Financier,

Conception Identifier les points de vue pertinents du domaine : • • Technique, Financier, Management Structurel, Fonctionnel 10

Concept Identifier/modéliser les concepts et leurs propriétés Choisir les termes pertinents pour les dénoter,

Concept Identifier/modéliser les concepts et leurs propriétés Choisir les termes pertinents pour les dénoter, éventuellement multilingue Concept primitif Concept défini 11

Concept primitif : Human, Male, Female Concept défini : Man : Human and Male

Concept primitif : Human, Male, Female Concept défini : Man : Human and Male Woman : Human and Female 12

Concept défini Patient : < Human has Desease 13

Concept défini Patient : < Human has Desease 13

Relation Identifier les relations pertinentes : subsomption, instanciation part. Of, has. Part, close. To,

Relation Identifier les relations pertinentes : subsomption, instanciation part. Of, has. Part, close. To, over, under, contain, connected, etc 14

Relation Propriétés des relations : part. Of est transitive, close. To est symétrique, over

Relation Propriétés des relations : part. Of est transitive, close. To est symétrique, over inverse. Of under signature : part. Of : Object -> Object 15

Modélisation Ontologie : modélisation des connaissances Au sens où une théorie physique est un

Modélisation Ontologie : modélisation des connaissances Au sens où une théorie physique est un modèle de la réalité Il peut y avoir plusieurs modèles d’une même réalité : • expérience de la chute des corps • théorie de la gravitation de Newton • relativité générale d’Einstein 16

Modélisation Pour l’aide à la résolution de problème Pour la recherche d’information 17

Modélisation Pour l’aide à la résolution de problème Pour la recherche d’information 17

Connaissance Continuum : donnée, information, connaissance • donnée : … --- … • information

Connaissance Continuum : donnée, information, connaissance • donnée : … --- … • information : SOS • connaissance : en cas d’alerte, déclencher les secours La connaissance permet de produire de nouvelles données, informations, connaissances : inférence 18

Types de Connaissances de résolution de problème : conception, diagnostic, évaluation, planification tâches, inférences

Types de Connaissances de résolution de problème : conception, diagnostic, évaluation, planification tâches, inférences Connaissances du domaine e. g. électronique, mécanique, médecine, etc. ontologie : réutilisable modèles de domaine : fonctionnel, causal, structurel, exprimés dans le vocabulaire de l’ontologie. 19

Ontologie Concept concept Thing Engine < Thing Vehicle < Thing relation part. Of :

Ontologie Concept concept Thing Engine < Thing Vehicle < Thing relation part. Of : Thing -> Thing 20

Modèle de domaine Structurel : Engine e 1 part. Of Vehicle v 2 causal

Modèle de domaine Structurel : Engine e 1 part. Of Vehicle v 2 causal : Engine breakdown => Vehicle stop 21

Modèle de tâche Conception : specify, design, assess Diagnostic : identifier des symptômes, choisir

Modèle de tâche Conception : specify, design, assess Diagnostic : identifier des symptômes, choisir un modèle causal, émettre des hypothèses, imaginer des conséquences, les tester, etc. 22

Ontologie L’accent est mis sur les concepts et les relations du domaine Orienté modélisation,

Ontologie L’accent est mis sur les concepts et les relations du domaine Orienté modélisation, spécification, réutilisation, partage, standardisation. Relations spécifiques du domaine considéré 23

Objets L'accent est mis sur le coté opérationnel. Opérations rendues possibles par le modèle

Objets L'accent est mis sur le coté opérationnel. Opérations rendues possibles par le modèle objet : classification, évolution, simulation, calcul. Orienté résolution de problème 24

Thesaurus L'accent est mis sur les termes utilisés pour dénoter les concepts du domaine

Thesaurus L'accent est mis sur les termes utilisés pour dénoter les concepts du domaine (linguistique, langue naturelle). Les relations entre termes sont linguistiques. Orienté indexation. 25

Thesaurus Recueil documentaire alphabétique de termes servant de descripteur pour : analyser un corpus

Thesaurus Recueil documentaire alphabétique de termes servant de descripteur pour : analyser un corpus indexer des documents Relations prédéfinies standardisées pour les thésaurus 26

Relations linguistiques BT : Broader Term NT : Narrower Term TT : Top Term

Relations linguistiques BT : Broader Term NT : Narrower Term TT : Top Term RT : Related Term (other than BT, NT, TT, etc. ) 27

Relations linguistiques USE : Prefered Term UF : Use for, non preferred synonym, quasi

Relations linguistiques USE : Prefered Term UF : Use for, non preferred synonym, quasi synonym SN : Scope Note, Une note pour expliquer un terme 28

Ontologie Composant réutilisable Réutilisation : généralité, abstraction (reuse) Partage : consensus, standardisation (sharing) Accord

Ontologie Composant réutilisable Réutilisation : généralité, abstraction (reuse) Partage : consensus, standardisation (sharing) Accord sur conceptualisation partagée : engagement ontologique (commitment) 29

Caractéristique Formalisation : lever les ambiguïtés Indépendance (relative) par rapport à une tâche, ou

Caractéristique Formalisation : lever les ambiguïtés Indépendance (relative) par rapport à une tâche, ou un problème précis Utilisable pour différentes tâches ? : conception, diagnostic, maintenance, recherche d'information 30

Caractéristique Indépendante d’une implémentation : limiter le biais dû à un formalisme de représentation

Caractéristique Indépendante d’une implémentation : limiter le biais dû à un formalisme de représentation : niveau conceptuel Des inférences sont possibles (relations transitives, axiomes, etc. ) 31

Types d’ontologies Ontologies générales, abstraites, de haut niveau : • Ontologie des catégories conceptuelles

Types d’ontologies Ontologies générales, abstraites, de haut niveau : • Ontologie des catégories conceptuelles : Objet, événement, état, processus, action, temps, espace Ontologies théoriques : • physique, mathématique, cinématique 32

Types d’ontologies Ontologie applicative : Médecine, automobile, patrimoine culturel, organisation, etc. 33

Types d’ontologies Ontologie applicative : Médecine, automobile, patrimoine culturel, organisation, etc. 33

Principes Clarté : communiquer le sens des termes définis Cohérence Extensibilité Indépendance vs implémentation

Principes Clarté : communiquer le sens des termes définis Cohérence Extensibilité Indépendance vs implémentation Modularité Abstraction 34

Langages KIF : Knowledge Interchange Format Ontolingua Logiques de description (orientée classification) Graphe conceptuel

Langages KIF : Knowledge Interchange Format Ontolingua Logiques de description (orientée classification) Graphe conceptuel (support) RDF Schema OWL, DAML+OIL 35

Exemples Ontolingua : www-ksl. stanford. edu/sns. html Word. Net : Ontologie de la langue

Exemples Ontolingua : www-ksl. stanford. edu/sns. html Word. Net : Ontologie de la langue naturelle Enterprise Ontology Kactus : ingénierie UMLS : Unified Medical Language System Eng. Math, Phys. Sys, CIM 36

Comma O’Comma : Corporate Memory Management through Agents Système multi agents (Jade) Ontology en

Comma O’Comma : Corporate Memory Management through Agents Système multi agents (Jade) Ontology en RDF : Document, Entreprise, Domaine, Utilisateur Moteur de recherche Corese : RDF en graphe conceptuels Règles de graphe 37

Comma Méthode: Recueil, Phase terminologique, Structuration, Validation, Formalisation en RDFS Résultat: 470 concepts, 80

Comma Méthode: Recueil, Phase terminologique, Structuration, Validation, Formalisation en RDFS Résultat: 470 concepts, 80 relations, 13 niveaux de profondeur 38

Comma Haut niveau Niveau médian Aspects Document Aspects Entreprise Utilisateur Aspects Domaine Niveau spécifique

Comma Haut niveau Niveau médian Aspects Document Aspects Entreprise Utilisateur Aspects Domaine Niveau spécifique 39

KMP : Knowledge Management Platform Cartographie des compétences en Télécom sur Sophia Antipolis Serveur

KMP : Knowledge Management Platform Cartographie des compétences en Télécom sur Sophia Antipolis Serveur Web sémantique de compétence Favoriser les partenariats Ontologie en RDF : Compétence, Organisation, Domaine 40

Outils Protégé Oiled Web. ODE Corese 41

Outils Protégé Oiled Web. ODE Corese 41