IFT 608 IFT 702 Planification en intelligence artificielle

  • Slides: 22
Download presentation
IFT 608 / IFT 702 Planification en intelligence artificielle Introduction Froduald Kabanza Département d’informatique

IFT 608 / IFT 702 Planification en intelligence artificielle Introduction Froduald Kabanza Département d’informatique Université de Sherbrooke planiart. usherbrooke. ca/cours/ift 608

Problème de planification l La planification est le problème de choisir des actions en

Problème de planification l La planification est le problème de choisir des actions en vue d’accomplir un but. Je voudrais poster une lettre. Quelle prochaine action? l Cela suppose qu’il y a plusieurs alternatifs possibles. l Cela suppose aussi généralement une optimisation – choisir la meilleure séquence d’actions. l Cela suppose aussi une prédiction du future – explorations des possibilités IFT 608/IFT 702 © Froduald Kabanza 2

Méthodes pour choisir les actions Il y a trois approches algorithmiques principales en IA

Méthodes pour choisir les actions Il y a trois approches algorithmiques principales en IA pour permettre à un agent de choisir ses actions : 1. Programmer un plan (contrôleur) – Donne la capacité d’avoir des comportements automatiques, mais pas forcément autonome. 2. Apprendre un plan (contrôleur) à partir de l’expérience – Confère l’autonomie à l’agent, mais pas encore suffisamment efficace pour bien des problèmes. 3. Générer un plan (contrôleur) à partir d’un modèle d’actions primitives, des capteurs et du but de l’agent – Efficace pour des problèmes complexes, mais difficulté d’acquisition/représentation des modèles et de définition/extraction/apprentissage d’heuristiques. Dans la pratique courante, ces approches sont complémentaires. IFT 608/IFT 702 © Froduald Kabanza 3

Contrôleur : programme qui contrôle le robot pour effectuer des tâches domestiques. C’est le

Contrôleur : programme qui contrôle le robot pour effectuer des tâches domestiques. C’est le « cerveau » de l’agent! Entrées continues du contrôleur: l Données des capteurs (observations du monde) l Les buts Sortie continue du contrôleur: l La prochaine action à exécuter. Actions Controller World Obs. IFT 608/IFT 702 © Froduald Kabanza 4

Comment concevoir le contrôleur? Programmer explicitement le contrôleur observations buts if (saleté plancher >

Comment concevoir le contrôleur? Programmer explicitement le contrôleur observations buts if (saleté plancher > 50%) then nettoie plancher; else if (batterie < 25%) then trouver endroit branchement; brancher; … World IFT 608/IFT 702 action Exécution de l’action © Froduald Kabanza 5

Comment concevoir le contrôleur? Apprentissage profond du contrôleur observations buts Controleur ≡ réseau de

Comment concevoir le contrôleur? Apprentissage profond du contrôleur observations buts Controleur ≡ réseau de neurones Processus d’apprentissage World IFT 608/IFT 702 action Exécution de l’action © Froduald Kabanza 6

Comment concevoir le contrôleur? Générer automatique du contrôleur à l’aide d’un planificateur observations buts

Comment concevoir le contrôleur? Générer automatique du contrôleur à l’aide d’un planificateur observations buts Controleur ≡ plan ≡ program Planificateur Avancer; Aspirer; Reculer; action Modèle d’actions World IFT 608/IFT 702 Exécution de l’action © Froduald Kabanza 7

Comment concevoir le contrôleur? Apprendre les modèles d’actions et les heuristiques observations buts Controleur

Comment concevoir le contrôleur? Apprendre les modèles d’actions et les heuristiques observations buts Controleur ≡ plan ≡ program Générateur Modèle d’actions World IFT 608/IFT 702 Avancer; Aspirer; Reculer; action Processus d’apprentissage Exécution de l’action © Froduald Kabanza 8

Robots spatiales • Les concepts de missions spatiales du futur introduisent de plus en

Robots spatiales • Les concepts de missions spatiales du futur introduisent de plus en plus d’autonomie dans les manipulations robotiques. IFT 608/IFT 702 © Froduald Kabanza 12

Robots domestiques asimo. honda. com • Plusieurs prototypes de robots, de plus en plus

Robots domestiques asimo. honda. com • Plusieurs prototypes de robots, de plus en plus agiles, visant plusieurs domaines d’application. IFT 608/IFT 702 © Froduald Kabanza 13

Véhicules autonomes The Telegraph IFT 608/IFT 702 © Froduald Kabanza 14

Véhicules autonomes The Telegraph IFT 608/IFT 702 © Froduald Kabanza 14

Jeux vidéos IFT 608/IFT 702 © Froduald Kabanza 15

Jeux vidéos IFT 608/IFT 702 © Froduald Kabanza 15

Problème de reconnaissance de plan l L’autre problème que nous allons étudier est celui

Problème de reconnaissance de plan l L’autre problème que nous allons étudier est celui de reconnaître les intentions, les buts, ou les plans d’un autre agent. Quel est son but? Comment va-t-il l’accomplir? l Ce problème peut être formulé et résolu comme l’inverse de la planification. l C’est un problème fondamental dans l’interaction humain-machine. l C’est un problème pertinent aussi dans l’analyse de la menace dans les jeux vidéo, la sécurité publique et la défense nationale. IFT 608/IFT 702 © Froduald Kabanza 17

Inférer l’intention de l’autre à partir des observations Agent A: Game AI (observateur) Agent

Inférer l’intention de l’autre à partir des observations Agent A: Game AI (observateur) Agent B: Joueur observé IFT 608/IFT 702 © Froduald Kabanza 18

Inférer l’intention de l’autre à partir des observations Agent A: Game AI (observateur) Agent

Inférer l’intention de l’autre à partir des observations Agent A: Game AI (observateur) Agent B: Joueur observé IFT 608/IFT 702 © Froduald Kabanza 19

Évidences que les êtres humains recourent souvent à la reconnaissance de plans (Schmidt et

Évidences que les êtres humains recourent souvent à la reconnaissance de plans (Schmidt et al. , AIJ 1978) Ont fait des expérimentations montrant que dans plusieurs situations les sujets recourraient à la reconnaissance de plan pour prédire les comportements des personnes observées. IFT 608/IFT 702 © Froduald Kabanza 20

Évidences que les êtres humains recourent souvent à la reconnaissance de plans (Baker et

Évidences que les êtres humains recourent souvent à la reconnaissance de plans (Baker et al. , Cognition 2009) Ont fait des expérimentations dans lesquels ils montraient à des animations de personnages se déplaçant dans un labyrinthe à des sujets humains. À différents moments, on demandait au sujets de prédire la destinations des personnages. Ils ont montré qu’un algorithme de reconnaissance de plans pouvait donner des prédictions comparables à celles des sujets humains. IFT 608/IFT 702 © Froduald Kabanza 21

Application dans l’interaction humain-machine Pour que les robots interagissent naturellement avec les humains, ils

Application dans l’interaction humain-machine Pour que les robots interagissent naturellement avec les humains, ils devront pouvoir comprendre leurs intentions. NASA Robonaut IFT 608/IFT 702 © Froduald Kabanza 22

Application aux jeux de stratégie temps réel Where Où will envoyer the opponent les

Application aux jeux de stratégie temps réel Where Où will envoyer the opponent les renforts? attack? IFT 608/IFT 702 © Froduald Kabanza 23

Reconnaissance de plan dans Star. Craft (Filion, 2013) IFT 608/IFT 702 © Froduald Kabanza

Reconnaissance de plan dans Star. Craft (Filion, 2013) IFT 608/IFT 702 © Froduald Kabanza 25

Prérequis de IFT 615 • • Recherche heuristique (A*, recherche locale, satisfaction de contraintes)

Prérequis de IFT 615 • • Recherche heuristique (A*, recherche locale, satisfaction de contraintes) Raisonnement avec la logique du premier ordre Processus de décision de Markov Apprentissage par renforcement IFT 608/IFT 702 © Froduald Kabanza 26

 • • Suite … Le cours couvre deux sujets connexes: – La planification

• • Suite … Le cours couvre deux sujets connexes: – La planification – choix d’actions – La reconnaissance plan – inférence de l’intention des autres Une bonne partie des problèmes de planification intéressantes sont encore très difficiles : ex. : Star. Craft AI La reconnaissance de plan demeure un problème non résolu La littérature est très vaste. Le cours donne un aperçu sur certaines approches avec un grand un accent sur la pratique. IFT 608/IFT 702 © Froduald Kabanza 27