Cours sur le traitement automatique des langues La

  • Slides: 59
Download presentation
Cours sur le traitement automatique des langues La sémantique Violaine Prince Université de Montpellier

Cours sur le traitement automatique des langues La sémantique Violaine Prince Université de Montpellier 2 LIRMM-CNRS Introduction

Plan de l’exposé n n n Introduction Les principes Les applications u u n

Plan de l’exposé n n n Introduction Les principes Les applications u u n recherche d’information interprétation de requêtes dialogues finalisés le contrôle de l’interprétation morphosyntaxique Conclusion et perspectives Introduction 2

Introduction n Qu ’est-ce que la sémantique ? u n A quoi sert la

Introduction n Qu ’est-ce que la sémantique ? u n A quoi sert la sémantique ? u n affectation d ’un (ou plusieurs) sens à des formes l ’utilité dépend du domaine Domaines de la sémantique u u u linguistique logique langages Introduction 3

Définitions de la sémantique (I) n Autant de définitions que de domaines u en

Définitions de la sémantique (I) n Autant de définitions que de domaines u en logique : affectation d’une interprétation à F u un prédicat, une formule, un énoncé en logique classique : évaluation à vrai, faux en logique multivaluée : évaluation à une des valeurs autorisées en logique floue : calcul de la valeur (numérique) de la fonction de « fitness » Introduction 4

Exemples (I) n objet (ballon, rouge) évalué à vrai si et seulement si :

Exemples (I) n objet (ballon, rouge) évalué à vrai si et seulement si : u u n n objet(x, y) et « ballon » appartient au domaine de validité de x et « rouge » appartient au domaine de validité de y sémantique vériconditionnelle ne traite pas du rapport avec le monde Introduction 5

Exemples (II) n n objet( ballon, rouge) évalué à « inconnu » en logique

Exemples (II) n n objet( ballon, rouge) évalué à « inconnu » en logique non monotone si on n ’a pas, dans la base, objet(ballon, rouge), comme une connaissance vraie. Introduction 6

Définitions de la sémantique (II) u u u langages de programmation : intervient après

Définitions de la sémantique (II) u u u langages de programmation : intervient après la vérification morpho- syntaxique la sémantique est réalisée par le compilateur ou l ’interpréteur F interpréter une instruction revient à • vérifier les contraintes d ’intégrité • produire un exécutable Introduction 7

Définitions de la sémantique (III) u linguistique : il existe plusieurs définitions F F

Définitions de la sémantique (III) u linguistique : il existe plusieurs définitions F F ordonner les significations d ’un mot (sens du dictionnaire) exemple : pompe • 1. appareil permettant l ’aspiration d’un liquide, ex : « une pompe de relevage » • 2. par extension de 1, dispositif de fourniture d ’essence pour automobile , « la pompe à essence » • 3. par extension de 2, représente les propriétés de l ’essence, « le prix à la pompe » • 4. par extension de 2, représente le lieu de fourniture d ’essence , « il y a une pompe pas loin » . Introduction 8

F mais aussi , • 5. faste, luxe , « cérémonie en grande pompe

F mais aussi , • 5. faste, luxe , « cérémonie en grande pompe » • 6. (familier) chaussures « des pompes en similicrocodile » . • 7. Exercice physique, parfois d ’aspect punitif « vous me ferez 100 pompes » F retrouver le (ou les sens) en contexte : • Je me suis arrêté à la première pompe que j ’ai pu trouver. J’en ai profité pour nettoyer au jet mes pompes boueuses, d’autant plus que je devais assister ensuite à une cérémonie en grande pompe à la mairie. Introduction 9

Qu’est-ce qu’un contexte ? u En linguistique : F F u groupe de mots

Qu’est-ce qu’un contexte ? u En linguistique : F F u groupe de mots phrase paragraphe texte mais aussi : F F le sous-ensemble des hypothèses de l’auditeur sur le monde (Latraverse, 1987) les objets et individus présents dans la situation d’énonciation ou évoqués par elle (Lyons, 1977) Introduction 10

Langue référent : objet linguistique référé: objet mental objet référé: objet du monde individu

Langue référent : objet linguistique référé: objet mental objet référé: objet du monde individu triangle aristotélicien Le contexte d’un objet linguistique est composé : 1. du co-texte (autres objets linguistiques dans l ’entourage) 2. du contexte mental (base de connaissances) où se trouve le référé 3. du contexterne (le monde) où se trouve l ’objet référé. Introduction 11

u En logique F F F u u les prédicats du même énoncé les

u En logique F F F u u les prédicats du même énoncé les variables liées les valeurs de variables proposées En logique, les contextes mental et externe sont confondus avec le co-texte En programmation : F F F il existe un « contexte mental » qui pourrait correspondre à : l’état de la base de connaissances l’état de la machine Introduction 12

A quoi sert la sémantique n En linguistique : u mise en rapport des

A quoi sert la sémantique n En linguistique : u mise en rapport des objets de langue avec le monde • les enfants de Pierre et Marie sont blonds • La génération soixante-huit, ce sont les enfants de Marx et du Coca-Cola n En traitement automatique des langues u mise en rapport des objets de langue et d’une « forme » calculable Introduction 13

Les principes n Les modèles u u u n n de la linguistique de

Les principes n Les modèles u u u n n de la linguistique de l ’intelligence artificielle autres modèles en informatique Les modes de résolution Les architectures les principes 14

Les modèles n Modèles linguistiques pour la sémantique u u u sémantique compositionnelle sémantique

Les modèles n Modèles linguistiques pour la sémantique u u u sémantique compositionnelle sémantique différentielle sémantique « interprétative » les principes 15

Modèles linguistiques pour la sémantique n Sémantique compositionnelle u u u Le sens de

Modèles linguistiques pour la sémantique n Sémantique compositionnelle u u u Le sens de la phrase est une composition (plus ou moins formelle) des sens des mots si un mot a plusieurs sens, cela génère autant de combinaisons possibles le « bon » sens est celui dont la combinaison est plausible les principes 16

Sémantique compositionnelle Exemple « Je me suis arrêté à la première pompe que j’ai

Sémantique compositionnelle Exemple « Je me suis arrêté à la première pompe que j’ai pu trouver. » n lieu appareil chaussure La condition de « plausibilité » exclut : « faste » , et « exercice physique » . les principes 17

Sémantique compositionnelle Exemple « Je me suis arrêté à la première pompe que j

Sémantique compositionnelle Exemple « Je me suis arrêté à la première pompe que j ’ai pu trouver. » n trois « phrases -sens » générées. n QUI DÉTERMINE LA PLAUSIBILITÉ ? UN PROCESSEUR HUMAIN UNE CONNAISSANCE FORTE DU MONDE les principes 18

Sémantique compositionnelle Exemple « Je me suis arrêté à la première pompe que j

Sémantique compositionnelle Exemple « Je me suis arrêté à la première pompe que j ’ai pu trouver. » n Une deuxième « passe » de plausibilité supprimera le sens « chaussure » . n EST PLAUSIBLE CE QUI : N ’EST PAS INCONGRU N ’EST PAS RIDICULE les principes 19

Sémantique différentielle n n n Parmi tous les sens d ’un mot, c ’est

Sémantique différentielle n n n Parmi tous les sens d ’un mot, c ’est le plus spécifique qui doit être choisi en premier. S ’appuie sur une représentation très fine des sens des mots dans le dictionnaire Pottier, Greimas (sémantique structuraliste), Barwise et Perry (sémantique des situations) les principes 20

Sémantique différentielle « Je me suis arrêté à la première pompe que j ’ai

Sémantique différentielle « Je me suis arrêté à la première pompe que j ’ai pu trouver. » • 1. appareil permettant l’aspiration d’un liquide, ex : « une pompe de relevage » • 2. par extension de 1, dispositif de fourniture d ’essence pour automobile , « la pompe à essence » • 3. par extension de 2, représente les propriétés de l’essence, « le prix à la pompe » • 4. par extension de 2, représente le lieu de fourniture d ’essence , « il y a une pompe pas loin » . les principes 21

Sémantique différentielle « Je me suis arrêté à la première pompe que j ’ai

Sémantique différentielle « Je me suis arrêté à la première pompe que j ’ai pu trouver. » 1. appareil aspiration liquide 2. appareil à essence les propriétés de l’essence 3. essence automobile lieu consacré à la vente station d’essence 4. les principes 22

Sémantique différentielle n n Les règles de différentiation qui s ’appliquent sont : compatibles

Sémantique différentielle n n Les règles de différentiation qui s ’appliquent sont : compatibles avec le co-texte u n arrêter, trouver forcées par le co-texte (coercitive rules de Pustejovsky) Introduction 23

Sémantique interprétative Le sens le plus spécifique garde en mémoire tous les sens génériques,

Sémantique interprétative Le sens le plus spécifique garde en mémoire tous les sens génériques, et la récurrence du terme peut s ’appuyer sur le fond commun. Rastier (1986) Fonctionne pour les mots à sens multiples et dépendants. . les principes 24

Sémantique interprétative « Je me suis arrêté à la première pompe que j ’ai

Sémantique interprétative « Je me suis arrêté à la première pompe que j ’ai pu trouver. » 1. appareil aspiration liquide 2. appareil à essence les propriétés de l’essence 3. essence automobile lieu consacré à la vente station d’essence 4. les principes 25

Les modèles n Les modèles de l’intelligence artificielle u u Les schémas (frames) Les

Les modèles n Les modèles de l’intelligence artificielle u u Les schémas (frames) Les scénarios (scripts) Les ontologies arborescentes (issues des réseaux sémantiques) Les graphes conceptuels les principes 26

Les modèles de l ’intelligence artificielle n Les schémas (Minsky 1974) u u Un

Les modèles de l ’intelligence artificielle n Les schémas (Minsky 1974) u u Un schéma (frame) est un ensemble de connaissances autour d’un sujet donné (ici, un mot). L ’usage des schémas en sémantique se fait de la manière suivante : F sur une chaîne de classification donnée, on associe à chaque terme son schéma. les principes 27

n valeurs par défaut pour C 1 n sous forme d ’{attribut (facette, valeur)}

n valeurs par défaut pour C 1 n sous forme d ’{attribut (facette, valeur)} C 11 Schéma de C 11 C 1 n-1 C 1 n Schéma de C 1 n-1 Schéma de C 1 n les principes lien « is-a » 28

n Chaise : Exemple fait en : meuble chaise fauteuil chaise-à-porteur matière (organique, minérale)

n Chaise : Exemple fait en : meuble chaise fauteuil chaise-à-porteur matière (organique, minérale) type (naturelle, artificielle) prix: origine : composé de: pieds (3, 4) dosseret (oui, barreaux : oui, non) assise : matière 17ème siècle mode de transport les principes 29

n n Beaucoup de connaissances à intégrer Problème des sens figurés du mot: u

n n Beaucoup de connaissances à intégrer Problème des sens figurés du mot: u u n Et de certains de ses dérivés : u n n jouer aux chaises musicales mener une vie de bâton de chaise ambitionner le fauteuil présidentiel. Les schémas sont adaptés en sémantique lorsqu ’il s ’agit d ’applications très limitées. A éviter en recherche d’information ou indexation les principes 30

Les modèles de l ’intelligence artificielle n Les scénarios (Schank 1978) u u Un

Les modèles de l ’intelligence artificielle n Les scénarios (Schank 1978) u u Un scénario (script) est un ensemble de connaissances autour d ’une situation donnée. Le scénario comprend : F F u des conditions initiales (de déclenchement) des actions (possibles) un résultat des exceptions (anomalies) A chaque élément est associé un schéma. les principes 31

Les scénarios pour l ’interprétation du LN n Les scénarios s’appliquent à l ’interprétation

Les scénarios pour l ’interprétation du LN n Les scénarios s’appliquent à l ’interprétation du langage naturel en fournissant les conditions pragmatiques d ’interprétation. u u Les conditions initiales peuvent être exprimées par du texte Les actions sont des prédicats verbaux Le résultat est ce qui est attendu Les anomalies sont répertoriées lors qu ’elles sont connues. les principes 32

F COMPRENDRE ce que l ’on sait déjà Ce qui est dit événement Schémas

F COMPRENDRE ce que l ’on sait déjà Ce qui est dit événement Schémas actions élémentaires les principes référence à d ’autres schémas 33

Exemple n Scénario : « réviser une voiture » u ELEMENTS : F u

Exemple n Scénario : « réviser une voiture » u ELEMENTS : F u ACTEURS : F u voiture client, garagiste CONDITIONS INITIALES F F F le client amène sa voiture au garage il possède un moyen de paiement la voiture est dans un état donné les principes 34

Exemple : réviser une voiture u RESULTAT(ESCOMPTE) F F F u le client reprend

Exemple : réviser une voiture u RESULTAT(ESCOMPTE) F F F u le client reprend sa voiture au garage il a de l ’argent en moins la voiture est révisée ANOMALIES F F F le client ne reprend pas sa voiture la voiture n ’est pas révisée la voiture est révisée mais elle n ’est pas en bon état les principes 35

Exemple : réviser une voiture u ACTIONS F Origine : CLIENT • • AMENER

Exemple : réviser une voiture u ACTIONS F Origine : CLIENT • • AMENER (voiture, garage) LAISSER-A (voiture, clés, papiers, garagiste) CONVENIR-AVEC (rendez-vous, garagiste) PARTIR REVENIR PAYER(facture) PRENDRE (voiture, clé, papiers) les principes 36

Exemple : réviser une voiture F Origine : GARAGISTE • pour chaque partie de

Exemple : réviser une voiture F Origine : GARAGISTE • pour chaque partie de Voiture (schéma VOITURE) faire : – VERIFIER (partie) – si partie à changer alors CHANGER(partie) – si partie à réparer alors REPARER (partie) • fin • pour tous les éléments changés et réparés, MARQUER (partie) • FACTURER (partie) • DONNER (facture, client). les principes 37

Les difficultés n n Des situations stéréotypées Ambiguïté du déclenchement u Jean est allé

Les difficultés n n Des situations stéréotypées Ambiguïté du déclenchement u Jean est allé chez le garagiste. acheter une voiture réviser une voiture louer une voiture réparer une voiture les principes 38

Extensions : plans et thèmes n Repérer le thème du texte u u n

Extensions : plans et thèmes n Repérer le thème du texte u u n acteurs, éléments premiers prédicats verbaux Considérer un scénario comme un plan possible, modifiable (déroutable) planification Introduction 39

Conclusion sur les schémas et les scénarios n n Essaient d ’intégrer des connaissances

Conclusion sur les schémas et les scénarios n n Essaient d ’intégrer des connaissances « contextuelles » de type pragmatique Mais u u u lourdeur des structures rigidité aspect trop détailliste par certains côtés pas assez par d ’autres énorme quantité de connaissances structuration dépendant fortement des concepteurs les principes 40

Les modèles de l ’intelligence artificielle n Les « ontologies » arborescentes u u

Les modèles de l ’intelligence artificielle n Les « ontologies » arborescentes u u après l ’échec d’une structuration trop importante et trop large restriction des années 90 F F F u à une application à un domaine, de préférence technique et défini à une structure arborescente plusieurs « arbres de connaissance » plutôt qu ’un seul réseau les principes 41

Exemple u u domaine : chimie application : enseignement secondaire de la chimie atomique:

Exemple u u domaine : chimie application : enseignement secondaire de la chimie atomique: F agrégats « partie-de » molécule substance atome particule les principes 42

Exemple u u domaine : chimie application : enseignement secondaire de la chimie atomique:

Exemple u u domaine : chimie application : enseignement secondaire de la chimie atomique: F agrégat « sorte-de » particule neutre chargée proton électron les principes neutron 43

u relations typées F F n n sorte-de selon un critère sorte-de : inclusion

u relations typées F F n n sorte-de selon un critère sorte-de : inclusion de classe sorte-de : membre-de partie-de Les ontologies arborescentes supposent : un mot un sens u ce qui correspond qu ’à un sous-ensemble très faible du langage naturel les principes 44

Les modèles de l ’intelligence artificielle n Les graphes conceptuels (Sowa 1984) u u

Les modèles de l ’intelligence artificielle n Les graphes conceptuels (Sowa 1984) u u u l ’idée que l ’esprit et le langage s ’organisent de la même manière (ressemblance des contextes linguistique et mental) il existe une représentation en lambda-calcul du contexte mental application à la langue objet du prochain cours les principes 45

Les applications n Recherche d’information u u u recherche d ’une information I représentée

Les applications n Recherche d’information u u u recherche d ’une information I représentée par un texte T, dans une base de documents D Indexation par un texte T d ’une information I, applicable à toute base de documents Dk Les deux problèmes ne sont pas exactement symétriques les applications 46

Recherche d ’information I 1 texte T In recherche d’occurrences I 2 les Ij

Recherche d ’information I 1 texte T In recherche d’occurrences I 2 les Ij sont des sens possibles de T, ou contenus dans des sens de T base de documents (corpus) l ’algorithme de recherche d ’occurrence est celui d ’un motif M/ M◊ T d ’un sous-motif K de M/ MÇ T = K les applications 47

Problèmes n L ’information I recherchée u u u n n n ’est pas

Problèmes n L ’information I recherchée u u u n n n ’est pas représentée par un unique texte T n ’est pas le seul sens possible de T n ’est pas la composition des sens des éléments de T Les occurrences de T récupérées, sont, au mieux des sur-textes de T, parfois des soustextes. La recherche d ’information est donc parasitée par la non unicité sémantique. les applications 48

Exemple n L ’information I recherchée concerne « l ’Hôtel de Ville » ,

Exemple n L ’information I recherchée concerne « l ’Hôtel de Ville » , c ’est-à-dire, la mairie principale du lieu (s ’il s ’agit d ’une ville à arrondissements). u La séquence « hôtel de ville » a pour sens : F F F u I 1 : mairie I 2: sorte d ’hôtel I 3: sorte d ’hôtel en milieu urbain. Sont récupérées dans le corpus des chaînes : F F rue de l ’Hôtel de Ville l ’hôtel de Mussy est dans la ville de Gordes les applications 49

Exemple (suite) u Si, de manière sophistiquée, un analyseur accepte les formes accordées, on

Exemple (suite) u Si, de manière sophistiquée, un analyseur accepte les formes accordées, on récupère en plus : F F F u tous les hôtels de la ville de Paris sont chers. l ’hôtel est en dehors de la ville. au métro Hôtel-de-Ville, vous trouverez le bazar de l ’Hôtel-de-Ville. mais aussi, avec un pourcentage affaibli de concordance, tout ce qui va contenir « hôtel » et « ville » , dans la fenêtre donnée. les applications 50

L ’indexation n l ’indexation est le marquage d ’un texte T comme motif

L ’indexation n l ’indexation est le marquage d ’un texte T comme motif pour tout corpus de documents Dk, dans le but de récupérer une information I. Il faut donc choisir, pour indexer, le meilleur T parmi les Ti représentant I, mais recher sur les Ti (avoir un dictionnaire T: Ti) La qualité intrinsèque de T n ’est cependant pas suffisante, elle est dépendante de la confrontation avec chaque corpus. les applications 51

L ’indexation n Ainsi, par exemple il vaut mieux indexer par : u n

L ’indexation n Ainsi, par exemple il vaut mieux indexer par : u n n que par « hôtel de ville » par : u n n mairie coléoptère que par « papillon » à cause des sens multiples, mais, si vous cherchez dans un corpus scientifique, la qualité de votre index n ’est pas la même que dans un corpus général. les applications 52

n n Dans un corpus de biologie, le mot « mère » a souvent

n n Dans un corpus de biologie, le mot « mère » a souvent le sens de « origine » ce qui n ’est pas le cas des corpus autres, et le mot « charme » va souvent être associé u u aux propriétés des particules dans un corpus de physique atomique, aux arbres dans un corpus d ’agronomie mais aussi à n ’importe quel autre sens possible. ex « la démonstration/l ’expérience ne manque pas de charme » . les applications 53

Les applications n L ’interprétation de requêtes u On suppose que l ’usager exprime

Les applications n L ’interprétation de requêtes u On suppose que l ’usager exprime une demande vis-à-vis d ’une : F F F n base de données base de connaissances base de documents sous forme d ’une requête en langage naturel. les applications 54

L’interprétation de requêtes n la sémantique consiste a : u u transformer la requête

L’interprétation de requêtes n la sémantique consiste a : u u transformer la requête en structure toute ou partiellement appariable avec F F F n la base de données : attribut/valeur la base de connaissances: prémisse/conclusion la base de documents dans le dernier cas, il s ’agit d ’identifier le texte T a recher, et le sens I le plus plausible de T. les applications 55

Les dialogues finalisés n n n Le plus souvent, la requête est suffisamment mal

Les dialogues finalisés n n n Le plus souvent, la requête est suffisamment mal formulée, ou l ’on souhaite assister l ’usager dans la formulation ou la satisfaction de sa requête Le dialogue est le plus haut niveau d ’intégration du TALN dans l ’interaction homme-machine u l ’appariement de la requête devient l ’étape ultime d ’un processus de communication les applications 56

La sémantique au secours de l ’analyse morpho-syntaxique n n De nombreuses ambiguïtés morphosyntaxiques

La sémantique au secours de l ’analyse morpho-syntaxique n n De nombreuses ambiguïtés morphosyntaxiques peuvent être levées grâce à l ’information sémantique, mais surtout pragmatique. la ferme de Jean u l ’usage désigne plus souvent le bâtiment que la poutre. les applications 57

Conclusion (provisoire) n n la sémantique est un élément qui, en TALN, devrait être

Conclusion (provisoire) n n la sémantique est un élément qui, en TALN, devrait être indissociable de la pragmatique. Les mots ont des significations possibles différentes, mais en contexte, ils ont un sens, qui peut être complexe. les modèles logiques de la sémantique ont été insuffisants pour remplir leur rôle d ’interprétation en revanche, ils sont très utiles comme systèmes d ’aide au raisonnement conclusion 58

perspectives n n des modèles logiques descriptifs de la sémantique : les graphes conceptuels

perspectives n n des modèles logiques descriptifs de la sémantique : les graphes conceptuels les problèmes de la sémantique les modèles où le sens est calculé en contexte le modèle vectoriel : tourné vers la recherche d ’information et l ’indexation. conclusion 59