CEFETRJ Departamento de Informtica Inteligncia Artificial GTSI 1306

  • Slides: 14
Download presentation
CEFET/RJ Departamento de Informática Inteligência Artificial (GTSI 1306, GCC 1734) Prof. Eduardo Bezerra ebezerra@cefet-rj.

CEFET/RJ Departamento de Informática Inteligência Artificial (GTSI 1306, GCC 1734) Prof. Eduardo Bezerra ebezerra@cefet-rj. br

Créditos § Essa apresentação é material traduzido e/ou adaptado pelo prof. Eduardo Bezerra (ebezerra@cefet-rj.

Créditos § Essa apresentação é material traduzido e/ou adaptado pelo prof. Eduardo Bezerra (ebezerra@cefet-rj. br), e utiliza material cuja autoria é dos professores a seguir: Dan Klein e Pieter Abbeel, UC Berkeley. § O material original é usado no curso CS 188 (Introduction to Artificial Intelligence). § https: //www. cs. berkeley. edu/~russell/classes/cs 188/f 14/ 2

Busca Competitiva - Expectimax 3

Busca Competitiva - Expectimax 3

Ações com resultados incertos § Em que situações um agente não saberia o resultado

Ações com resultados incertos § Em que situações um agente não saberia o resultado de uma ação que tomou? § Aleatoriedade explícita: e. g. , jogar um dado § Oponentes imprevisíveis: e. g. , os fantasmas no Pacman respondem aleatoriamente. § Ações podem falhar: e. g. , em um robô, suas rodas podem deslizar

Jogos não-determinísticos § O não-determinismo é um elemento aleatório proveniente de jogo de dados,

Jogos não-determinísticos § O não-determinismo é um elemento aleatório proveniente de jogo de dados, sorteio de cartas, etc. § Não-determinismo é inerente em ambientes reais. § O estudo de algoritmos para jogos com elemento aleatório é um passo em direção a algoritmos que podem ser aplicados no mundo real. § Uma árvore de um jogo não-determinístico deve incluir nós de acaso (chance node) além de nós minimax. § Ramificações que saem dos nós de acaso denotam “resultados possíveis”, e são anotadas com a probabilidade de cada mudança de estado.

Pior caso vs. caso médio max min 10 10 9 100 Ideia: resultados incertos

Pior caso vs. caso médio max min 10 10 9 100 Ideia: resultados incertos são controlados pelo acaso, e não por um oponente!

Busca Expectimax § Nesse caso, valores devem refletir o resultado do caso médio (expectimax),

Busca Expectimax § Nesse caso, valores devem refletir o resultado do caso médio (expectimax), e não resultados de pior caso (minimax). max § Busca Expectimax: computa o escore médio de um nó, considerando oponente racional § Nós MAX são como na busca minimax § Nó de acaso são similares aos nós MIN, mas o resultado é incerto § Calcula a utilidade esperada (expected utility) de cada nó de acaso 10 10 4 5 9 100 7 § i. e. a média ponderada (valor esperado) dos filhos [Demo: min vs exp (L 7 D 1, 2)]

Expectimax: Pseudocódigo def value(state): if the state is a terminal state: return the state’s

Expectimax: Pseudocódigo def value(state): if the state is a terminal state: return the state’s utility if the next agent is MAX: return max-value(state) if the next agent is EXP: return exp-value(state) def max-value(state): initialize v = -∞ for each successor of state: v = max(v, value(successor)) return v def exp-value(state): initialize v = 0 for each successor of state: p = probability(successor) v += p * value(successor) return v

Expectimax: Exemplo def exp-value(state): initialize v = 0 for each successor of state: p

Expectimax: Exemplo def exp-value(state): initialize v = 0 for each successor of state: p = probability(successor) v += p * value(successor) return v exp-value( 1/2 5 8 1/3 1/6 24 7 ) = (1/2) (8) + (1/3) (24) + (1/6) (-12) = 10 -12

Expectimax: Exemplo

Expectimax: Exemplo

Expectimax: Exemplo 3 12 9 2 4 6 15 6 0

Expectimax: Exemplo 3 12 9 2 4 6 15 6 0

Expectimax: Poda é possível? 3 12 9 2

Expectimax: Poda é possível? 3 12 9 2

Expectimax com Profundidade Limitada 400 300 … 492 Estimate of true …expectimax value (which

Expectimax com Profundidade Limitada 400 300 … 492 Estimate of true …expectimax value (which would require a lot of work to compute) 362 …

Expectimax: Importância da Escala § No expectimax, a escala dos valores é importante. §

Expectimax: Importância da Escala § No expectimax, a escala dos valores é importante. § Esquerda, a jogada A 1 é escolhida. § Direita, a jogada A 2 é escolhida. § A função de avaliação heurística tem que ser uma transformação positiva e linear da chance de ganhar o jogo a partir daquele ponto.