Universidade Federal de Campina Grande Departamento de Sistemas

Agentes Tópico q Caracterização dos Agentes 2 DSC/CCT/UFC

Agentes p Propriedades de um ambiente n acessível (completamente observável) x inacessível (parcialmente observável)

Ambientes: propriedades p Acessível: quando os sensores do agente conseguem perceber o estado completo

Ambientes: propriedades p Estático: o ambiente não muda enquanto o agente está escolhendo a

Agentes - Estrutura n Agentes reativos simples n Agentes reativos baseados em modelo n

ambiente Agente Reativo Simples sensores Agente Qual a aparência atual do mundo? Que ação

Agente Reativo Simples p Tipo mais simples. p Seleciona ações com base na percepção

Agente Reativo Simples p Vantagens e desvantagens n Regras condição-ação: representação inteligível, modular e

Agente Reativo Simples p Funcionará somente se a decisão correta puder ser tomada com

Agente Reativo Baseado em Modelos Agente ambiente sensores Qual é a aparência atual mundo?

Agente Reativo Baseado em Modelos p Agente controla a parte do mundo que ele

Agente Reativo Baseado em Modelos p O agente deve manter um estado interno que

Agente Reativo Baseado em Modelos p Um agente que utiliza o modelo de mundo

Agente Baseado em Objetivo ambiente sensores Agente estado: como o mundo era antes Qual

Agente Baseado em Objetivo p Agente combina seu objetivo com as informações sobre os

Agente Baseado em Objetivo p O agente precisa de algum tipo de informação sobre

Agente Baseado em Objetivo p Para encontrar seqüências de ações que alcançam os objetivos

Agente Baseado em Objetivo p Vantagens e desvantagens: n Mais complicado e “ineficiente”, porém

Agente Baseado em Utilidade Agente sensores ambiente Qual a aparência atual do mundo? Qual

Agente Baseado em Utilidade p Existem muitas seqüências de ações que levam o agente

Agente Baseado em Utilidade p Se um estado do mundo é mais desejável que

Agente Baseado em Utilidade p Ambiente: sem restrição p Desvantagem: não tem adaptabilidade 23

Agente com Aprendizagem Agente sensores t+1 avaliação ambiente t elemento de desempenho (agente) t

Agente com Aprendizagem p Um elemento de aprendizado utiliza realimentação sobre como um agente

Agente com Aprendizagem p Em agentes sem aprendizagem tudo o que o agente sabe

Agente com Aprendizagem p Ambiente: sem restrição p Vantagem: tem adaptabilidade (aprende) 27 DSC/CCT/UFC

Slides: 27

Download presentation

Universidade Federal de Campina Grande Departamento de Sistemas e Computação Curso de Bacharelado em Ciência da Computação Fonte: José Francisco Salm Junior (Diretor de Engenharia de Sistemas Instituto Stela) Inteligência Artificial I Introdução a Agentes (Adicional II) Prof. a Joseana Macêdo Fechine joseana@dsc. ufcg. edu. br Carga Horária: 60 horas DSC/CCT/UFC G

Agentes Tópico q Caracterização dos Agentes 2 DSC/CCT/UFC

Agentes p Propriedades de um ambiente n acessível (completamente observável) x inacessível (parcialmente observável) n estático x dinâmico n determinístico x não-determinístico n discreto x contínuo n episódico x não-episódico (seqüencial) 3 DSC/CCT/UFC

Ambientes: propriedades p Acessível: quando os sensores do agente conseguem perceber o estado completo do ambiente. p Determinístico: o próximo estado do ambiente pode ser completamente determinado pelo estado atual e as ações selecionadas pelo agente. p Episódico: a experiência do agente é dividida em episódios. Cada episódio consiste em o agente perceber e então agir. Cada episódio não depende das ações que ocorreram em episódios prévios. 4 DSC/CCT/UFC

Ambientes: propriedades p Estático: o ambiente não muda enquanto o agente está escolhendo a ação a realizar. n Semi-dinâmico: o ambiente não muda enquanto o agente delibera, mas o "score" do agente muda. p Discreto: quando existe um número distinto e claramente definido de percepções e ações em cada turno. p Contínuo: percepções e ações mudam em um espectro contínuo de valores. 5 DSC/CCT/UFC

Agentes - Estrutura n Agentes reativos simples n Agentes reativos baseados em modelo n Agentes baseados em objetivos n Agentes baseados na utilidade n Agentes com aprendizagem 6 DSC/CCT/UFC

ambiente Agente Reativo Simples sensores Agente Qual a aparência atual do mundo? Que ação devo executar agora? Regras “condição-ação” atuadores 7 DSC/CCT/UFC

Agente Reativo Simples p Tipo mais simples. p Seleciona ações com base na percepção atual, ignorando o restante do histórico de percepções. p Exemplo: Agente aspirador de pó, porque sua decisão se baseia apenas na posição atual e no fato de essa posição conter ou não sujeira. 8 DSC/CCT/UFC

Agente Reativo Simples p Vantagens e desvantagens n Regras condição-ação: representação inteligível, modular e eficiente p n p ex. Se velocidade > 60 então multar Não pode armazenar uma seqüência de percepções, pouca autonomia Ambientes: n n Reflexo imprescindível em ambientes dinâmicos Acessível, episódico, pequeno 9 DSC/CCT/UFC

Agente Reativo Simples p Funcionará somente se a decisão correta puder ser tomada com base apenas na percepção atual n p Ambiente completamente observável Exemplos de alguns problemas: n Talvez somente uma imagem não é suficiente para determinar se o carro da frente esta dando sinal de mudança de direção, alerta ou freio 10 DSC/CCT/UFC

Agente Reativo Baseado em Modelos Agente ambiente sensores Qual é a aparência atual mundo? estado: como o mundo era antes como o mundo evolui impacto de minhas ações Que ação devo executar agora? Regras “condição-ação” atuadores 11 DSC/CCT/UFC

Agente Reativo Baseado em Modelos p Agente controla a parte do mundo que ele não pode ver agora (agente mantém estado interno que depende do histórico de percepções). p Exemplo: agente taxista vai trocar de pista e pode não ver momentaneamente alguns carros à sua volta 12 DSC/CCT/UFC

Agente Reativo Baseado em Modelos p O agente deve manter um estado interno que dependa do histórico de percepções e reflita os aspectos não observados no estado atual p Dois tipos de conhecimento são necessários para atualizar o estado interno do agente (modelo do mundo): n Como o ambiente evolui independente do agente p n Um carro que está ultrapassando, em geral estará mais perto do que estava um instanterior Como as ações do próprio agente afetam o mundo p Se o agente virar o volante à direita, o carro irá virar p/ a direita 13 DSC/CCT/UFC

Agente Reativo Baseado em Modelos p Um agente que utiliza o modelo de mundo p Desvantagem: pouca autonomia n p não tem objetivo, não encadeia regras Ambientes: determinístico e pequeno 14 DSC/CCT/UFC

Agente Baseado em Objetivo ambiente sensores Agente estado: como o mundo era antes Qual a aparência atual do mundo? como o mundo evolui Qual será a aparência se for executada a ação A? impacto de minhas ações Que ação devo executar agora? Objetivos atuadores 15 DSC/CCT/UFC

Agente Baseado em Objetivo p Agente combina seu objetivo com as informações sobre os resultados de ações possíveis a fim de escolher ações que alcancem os seus objetivos p Exemplo: Táxi em um entroncamento de estradas: virar à esquerda, à direita ou ir em frente? p Necessidade de busca e planejamento: áreas da IA dedicadas a encontrar seqüências de ações que alcançam os objetivos do agente. 16 DSC/CCT/UFC

Agente Baseado em Objetivo p O agente precisa de algum tipo de informação sobre o seu objetivo n p Combinando informações sobre: n n O objetivo do agente Os resultados de suas ações p O agente pode escolher ações que alcancem o objetivo p A seleção da ação baseada em objetivo pode ser: n n DSC/CCT/UFC Objetivos descrevem situações desejáveis. Ex: estar no destino Direta: quando o resultado de uma única ação atinge o objetivo Mais complexa: quando será necessário longas seqüências de ações para atingir o objetivo 17

Agente Baseado em Objetivo p Para encontrar seqüências de ações que alcançam os objetivos n p Algoritmos de Busca e Planejamento A tomada de decisão envolve a consideração do futuro -> distinta das regras de condição-ação n n “O que acontecerá se eu fizer isso ou aquilo? ” “O quanto isso me ajudará a atingir o objetivo? ” p Agentes reativos: reação -> frear quando carro da frente frear p Agentes baseado em objetivo: raciocínio -> carro da frente freia -> carro da frente diminui velocidade -> objetivo: não atingir outros carros -> ação para atingir objetivo: frear 18 DSC/CCT/UFC

Agente Baseado em Objetivo p Vantagens e desvantagens: n Mais complicado e “ineficiente”, porém mais flexível, autônomo n Não trata objetivos conflitantes p Ambientes: determinístico 19 DSC/CCT/UFC

Agente Baseado em Utilidade Agente sensores ambiente Qual a aparência atual do mundo? Qual será a aparência se for executada a ação A? Este novo mundo é melhor? Que ação devo executar agora? atuadores estado: como o mundo era antes como o mundo evolui qual é o impacto de minhas ações Função de Utilidade 20 DSC/CCT/UFC

Agente Baseado em Utilidade p Existem muitas seqüências de ações que levam o agente ao seu objetivo. Algumas mais rápidas, mais seguras, mais econômicas, etc. p Agentes baseados em utilidade utilizam uma medida de desempenho (função de utilidade) que permite uma comparação entre diferentes estados do mundo, permitindo selecionar a seqüência de ações 21 DSC/CCT/UFC

Agente Baseado em Utilidade p Se um estado do mundo é mais desejável que outro, então ele terá maior utilidade para o agente n p Utilidade é uma função que mapeia um estado para um número real que representa o grau de satisfação com este estado Especificação completa da função de utilidade – decisões racionais em dois tipos de casos: n n Quando existem objetivos conflitantes (velocidade x segurança) a função de utilidade especifica o compromisso apropriado Quando existem vários objetivos que se deseja alcançar e nenhum deles pode ser atingido com certeza – ponderar a importância dos objetivos 22 DSC/CCT/UFC

Agente Baseado em Utilidade p Ambiente: sem restrição p Desvantagem: não tem adaptabilidade 23 DSC/CCT/UFC

Agente com Aprendizagem Agente sensores t+1 avaliação ambiente t elemento de desempenho (agente) t atuadores crítico trocas conhecimento elemento de aprendizagem objetivos de aprendizagem Gerador de problemas 24 DSC/CCT/UFC

Agente com Aprendizagem p Um elemento de aprendizado utiliza realimentação sobre como um agente está funcionando e determina de que maneira o elemento de desempenho deve ser modificado para funcionar melhor no futuro. 25 DSC/CCT/UFC

Agente com Aprendizagem p Em agentes sem aprendizagem tudo o que o agente sabe foi colocado nele pelo projetista p Turing propõe construir máquinas com aprendizagem e depois ensiná-las p Aprendizagem também permite ao agente atuar em ambientes totalmente desconhecidos e se tornar mais competente do que o seu conhecimento inicial poderia permitir 26 DSC/CCT/UFC

Agente com Aprendizagem p Ambiente: sem restrição p Vantagem: tem adaptabilidade (aprende) 27 DSC/CCT/UFC