Universidade Federal de Campina Grande Departamento de Sistemas

  • Slides: 52
Download presentation
Universidade Federal de Campina Grande Departamento de Sistemas e Computação Curso de Bacharelado em

Universidade Federal de Campina Grande Departamento de Sistemas e Computação Curso de Bacharelado em Ciência da Computação Inteligência Artificial I Representação do Conhecimento (Parte VI) Prof. a Joseana Macêdo Fechine joseana@dsc. ufcg. edu. br Carga Horária: 60 horas DSC/CCT/UFC

Representação do Conhecimento Como agir em meio à incerteza? 2 DSC/CCT/UFCG

Representação do Conhecimento Como agir em meio à incerteza? 2 DSC/CCT/UFCG

Representação do Conhecimento Tópicos p p Tratamento de Incerteza Raciocínio Estatístico 3 DSC/CCT/UFCG

Representação do Conhecimento Tópicos p p Tratamento de Incerteza Raciocínio Estatístico 3 DSC/CCT/UFCG

Representação do Conhecimento p Exemplo: Definição de regras para diagnóstico odontológico utilizando a lógica

Representação do Conhecimento p Exemplo: Definição de regras para diagnóstico odontológico utilizando a lógica de primeira ordem. Está regra está correta? 4 DSC/CCT/UFCG

Representação do Conhecimento p Nem todos os pacientes com dores de dentes têm caries;

Representação do Conhecimento p Nem todos os pacientes com dores de dentes têm caries; alguns deles têm gengivite, abscessos ou outros problemas: p Tentativa de transformar a regra em uma regra causal: n Essa regra também não é correta; nem todas as cáries causam dor. 5 DSC/CCT/UFCG

Representação do Conhecimento p Tentar usar a lógica de primeira ordem para lidar com

Representação do Conhecimento p Tentar usar a lógica de primeira ordem para lidar com um domínio como diagnóstico médico é uma abordagem falha, por três razões principais: n Preguiça n Ignorância Teórica n Ignorância Prática p O conhecimento do agente pode, na melhor das hipóteses, fornecer apenas um grau de “crença” nas sentenças relevantes. p Principal ferramenta para lidar com graus de “crença” – Teoria da Probabilidade 6 DSC/CCT/UFCG

Tratamento de Incerteza p Necessidade de representar imperfeições da informação, imprecisão, conflito, ignorância parcial,

Tratamento de Incerteza p Necessidade de representar imperfeições da informação, imprecisão, conflito, ignorância parcial, etc p Exemplos de informação: n n n n Perfeita: a aula começa às 8 h Imprecisa: a aula começa entre 8 h e 9 h Incerta: acho que a aula começa às 8 h Vaga: a aula começa lá pelas 8 h Probabilística: é provável que a aula comece às 8 h Possibilista: é possível que a aula comece às 8 h Inconsistente: segundo Maria, a aula começa as 8 h, porém segundo João ela começa às 9 h Incompleta: não sei quando a aula começa, mas usualmente as aulas têm começado às 8 h 7 DSC/CCT/UFCG

Tratamento de Incerteza p Mesmo lidando com informações imperfeitas, ainda é possível tomar decisões

Tratamento de Incerteza p Mesmo lidando com informações imperfeitas, ainda é possível tomar decisões razoáveis p Existe um modelo formal para tratar cada um dos tipos de informações apresentadas anteriormente n n n Probabilística: teoria de probabilidades; ou teoria da evidência (Dempster-Shafer) Imprecisa/Vaga: teoria dos conjuntos nebulosos; conjuntos de aproximação (rough sets); ou classes de referência Possibilista: teoria de possibilidades Incerta: teoria de probabilidades; possibilidades; evidência; ou modelos ad hoc Inconsistente: lógicas não clássicas Incompleta: lógicas não monotônicas como lógica de default 8 DSC/CCT/UFCG

Tratamento de Incerteza p Modelos numéricos mais conhecidos para a representação da informação imperfeita:

Tratamento de Incerteza p Modelos numéricos mais conhecidos para a representação da informação imperfeita: n n Probabilista Nebuloso 9 DSC/CCT/UFCG

Modelo Probabilista p Teoria de probabilidades – é o modelo mais tradicional para o

Modelo Probabilista p Teoria de probabilidades – é o modelo mais tradicional para o tratamento da informação incerta p Dado um evento , a probabilidade de ocorrência de A é descrita por uma medida: P : 2 X [0, 1], que satisfaz os seguintes axiomas: 10 DSC/CCT/UFCG

Modelo Probabilista p A partir dos axiomas anteriores, pode-se derivar as seguintes propriedades: 11

Modelo Probabilista p A partir dos axiomas anteriores, pode-se derivar as seguintes propriedades: 11 DSC/CCT/UFCG

Modelo Probabilista p A distribuição de probabilidade p: X [0, 1] caracteriza a probabilidade

Modelo Probabilista p A distribuição de probabilidade p: X [0, 1] caracteriza a probabilidade dos eventos sobre um domínio discreto X p No caso contínuo 12 DSC/CCT/UFCG

Modelo Probabilista p A medida de probabilidade tem 2 interpretações: n Frequentista: P(A) representa

Modelo Probabilista p A medida de probabilidade tem 2 interpretações: n Frequentista: P(A) representa o limite da frequência da ocorrência do evento A em uma seqüência infinita de experimentos independentes n Subjetiva: P(A) representa a crença de um determinado indivíduo na ocorrência de A, neste caso supõe-se que o indivíduo, que fornece as probabilidades aos eventos em X, seja capaz de exprimi-las de forma que estas obedeçam aos axiomas anteriores 13 DSC/CCT/UFCG

Modelo Probabilista p O teorema de Bayes provê a base para o tratamento da

Modelo Probabilista p O teorema de Bayes provê a base para o tratamento da imperfeição da informação em diversos sistemas baseados em conhecimento. p Este teorema computa a probabilidade de um dado evento, dado um conjunto de observações. 14 DSC/CCT/UFCG

Modelo Probabilista p Teorema de Bayes. Seja: P(Hi|E) - a probabilidade de que a

Modelo Probabilista p Teorema de Bayes. Seja: P(Hi|E) - a probabilidade de que a hipótese Hi seja verdadeira dada a evidência E. P(E|Hi) - a probabilidade de que a evidência E será observada se a hipótese Hi for verdadeira. P(Hi) - a probabilidade “a priori” de que a hipótese Hi é verdadeira na ausência de qualquer evidência específica. 15 DSC/CCT/UFCG

Modelo Probabilista p Teorema de Bayes p Em sistemas baseados em conhecimento k -

Modelo Probabilista p Teorema de Bayes p Em sistemas baseados em conhecimento k - o número de hipóteses possíveis En e Ea representam, respectivamente, novas evidências e evidências anteriores, em relação a um dado momento do processo. DSC/CCT/UFCG 16

Modelo Probabilista p Exemplo: Suponha que no meio da noite dispare o alarme contra

Modelo Probabilista p Exemplo: Suponha que no meio da noite dispare o alarme contra ladrões de uma casa. Deseja-se então saber quais são as chances de que esteja havendo uma tentativa de roubo. Suponha: n que existam 95% de chances de que o alarme dispare quando uma tentativa de roubo ocorre, n que em 1% das vezes o alarme dispara por outros motivos, n e que no bairro existe uma chance em 10. 000 de uma dada casa ser assaltada em um dado dia. 17 DSC/CCT/UFCG

Modelo Probabilista p Tem-se então: 18 DSC/CCT/UFCG

Modelo Probabilista p Tem-se então: 18 DSC/CCT/UFCG

Modelo Probabilista p Este valor pode parecer estranho, mas ele pode ser intuitivamentendido quando

Modelo Probabilista p Este valor pode parecer estranho, mas ele pode ser intuitivamentendido quando verifica-se que as chances de haver um roubo e do alarme tocar (0, 000095) são muito pequenas em relação às chances de haver um alarme falso (0, 01). 19 DSC/CCT/UFCG

Modelo Probabilista Exemplo: p Um médico sabe que: n n Meningite causa torcicolo em

Modelo Probabilista Exemplo: p Um médico sabe que: n n Meningite causa torcicolo em 50% das vezes Se uma pessoa é aleatoriamente selecionada da população dos EUA, há 1/50. 000 de chance da pessoa ter meningite. Se uma pessoa é aleatoriamente selecionada da população dos EUA, há 5% de chance da pessoa ter torcicolo. Qual a probabilidade de que a causa subjacente seja meningite? 20 DSC/CCT/UFCG

Modelo Probabilista Supor: P(M) = 1/50. 000 P(T) = 1/20 P(T|M) = 0, 5

Modelo Probabilista Supor: P(M) = 1/50. 000 P(T) = 1/20 P(T|M) = 0, 5 p p O cálculo de P(M|T) decorre diretamente do Teorema de Bayes 21 DSC/CCT/UFCG

Modelo Probabilista p Muitos dos sistemas baseados em conhecimento mais famosos têm o enfoque

Modelo Probabilista p Muitos dos sistemas baseados em conhecimento mais famosos têm o enfoque bayesiano como base para o tratamento da informação imperfeita, como, por exemplo, o MYCIN e o PROSPECTOR. p No sistema MYCIN, tanto regras como fatos têm associados um par [MB MD] n n n MB mede a “crença” na hipótese (o próprio fato, ou conclusão de uma regra quando a premissa é completamente satisfeita) MD mede a “crença” na negação dessa hipótese. A máquina de inferência então não somente cria novos fatos, mas também um par [MB MD] para este novo fato, utilizando uma variação formalmente imperfeita, porém eficaz, da regra de Bayes. 22 DSC/CCT/UFCG

Modelo Nebuloso (Fuzzy) p Teoria dos conjuntos nebulosos - objetiva permitir graduações na pertinência

Modelo Nebuloso (Fuzzy) p Teoria dos conjuntos nebulosos - objetiva permitir graduações na pertinência de um elemento a uma dada classe. p Teoria dos conjuntos “clássica” n p Ou um elemento pertence (1) ou não-pertence (0) a um conjunto. Teoria nebulosa n O grau de pertinência passa a ser dado por um valor no intervalo de números reais [0, 1]. 23 DSC/CCT/UFCG

Modelo Nebuloso (Fuzzy) p Regras: Decisões binárias (sim ou não). n p Fuzzy Logic

Modelo Nebuloso (Fuzzy) p Regras: Decisões binárias (sim ou não). n p Fuzzy Logic n p Se condição x Então ação y com confiança z Exemplo: Regras versus Fuzzy Logic n n p E se não tivermos certezas? Regras: Se o objeto é redondo então é uma bola. FL: Se o objeto é muito redondo então é uma bola com grande probabilidade. Fuzzy Logic: Framework matemático para lidar com esta incerteza. 24 DSC/CCT/UFCG

Modelo Nebuloso (Fuzzy) p Dado um universo de discurso X, um subconjunto nebuloso A

Modelo Nebuloso (Fuzzy) p Dado um universo de discurso X, um subconjunto nebuloso A de X é definido por uma função de pertinência que associa a cada elemento x de X o grau μA(x), compreendido entre 0 e 1, com o qual x pertence a A μA(x): X [0, 1] 25 DSC/CCT/UFCG

Modelo Nebuloso (Fuzzy) p Supondo que se deseja modelar o conceito “alto” aplicado a

Modelo Nebuloso (Fuzzy) p Supondo que se deseja modelar o conceito “alto” aplicado a pessoas. n n n Usualmente, uma pessoa que mede mais de 1, 75 m é alta Não é alta se tiver menos de 1, 60 m Já uma pessoa que mede entre 1, 60 m e 1, 75 m será considerada mais alta quanto mais a altura está próxima de 1, 75 m 26 DSC/CCT/UFCG

Modelo Nebuloso (Fuzzy) p É possível modelar o conceito “alto” pelo conjunto nebuloso A,

Modelo Nebuloso (Fuzzy) p É possível modelar o conceito “alto” pelo conjunto nebuloso A, definido no intervalo de 0, 5 m a 2, 5 m 27 DSC/CCT/UFCG

Modelo Nebuloso (Fuzzy) p Graficamente, o conjunto nebuloso A pode ser representado como 28

Modelo Nebuloso (Fuzzy) p Graficamente, o conjunto nebuloso A pode ser representado como 28 DSC/CCT/UFCG

Representação gráfica dos Conjuntos Fuzzy discretos A 1 -- 0 -10 A(u) = 10

Representação gráfica dos Conjuntos Fuzzy discretos A 1 -- 0 -10 A(u) = 10 0, 0 , se módulo(x) > 5 (5 – módulo(x))/5, se módulo(x) <= 5 29 DSC/CCT/UFCG

Representação gráfica dos Conjuntos Fuzzy contínuos Baixa Alta 1 0. 5 0, 4 0,

Representação gráfica dos Conjuntos Fuzzy contínuos Baixa Alta 1 0. 5 0, 4 0, 2 0 1. 4 1. 5 1. 6 1. 7 1. 8 1. 9 2. 0 Uma pessoa de 1, 77 m pode se considerada tanto 20% baixa quanto 40% alta 30 DSC/CCT/UFCG

Modelo Nebuloso (Fuzzy) p Normalmente, uma BC Fuzzy é representada por meio de regras

Modelo Nebuloso (Fuzzy) p Normalmente, uma BC Fuzzy é representada por meio de regras de produção. p Regra de produção n If <antecedente> then <conseqüente> p Antecedente: composto por um conjunto de condições Conseqüente: composto por um conjunto de ações ou diagnósticos. p p Quando as condições da regra são satisfeitas (mesmo que parcialmente) dizemos que a regra é disparada o que determina o processamento do conseqüente da regra pelo sistema de inferência fuzzy. 31 DSC/CCT/UFCG

Sistemas fuzzy - fases Entradas do sistema Fuzzificação Níveis de pertinência Saídas do sistema

Sistemas fuzzy - fases Entradas do sistema Fuzzificação Níveis de pertinência Saídas do sistema Funções de pertinência Conjunto de regras Avaliação das regras Defuzzificação Níveis de saída 32 DSC/CCT/UFCG

Sistemas fuzzy - fases p Estágio de entrada n p Processamento n n p

Sistemas fuzzy - fases p Estágio de entrada n p Processamento n n p Fuzzificação: mapeia cada entrada de dados ao sistema em uma ou mais funções de pertinência. As regras de um conjunto de regras (predefinidas) são avaliadas verificando quais são aplicáveis e Quão fortemente cada regra deve ser disparada dependendo de como foi ativada cada função de pertinência. Saída n Defuzzificação: calcula a saída, baseada nos valores mapeados em funções de pertinência de saída e em função das regras que foram disparadas. 33 DSC/CCT/UFCG

Modelo Nebuloso (Fuzzy) Exemplo: p p Controle de velocidade de um ventilador A velocidade

Modelo Nebuloso (Fuzzy) Exemplo: p p Controle de velocidade de um ventilador A velocidade depende da temperatura Temperatura Velocidade Corrente relativa do motor Muito frio Desligado 0 Frio Devagar 15 Quente Média 50 Muito quente Rápida 100 34 DSC/CCT/UFCG

Exemplo: Desenvolvendo o sistema fuzzy p No momento de desenvolver um sistema baseado em

Exemplo: Desenvolvendo o sistema fuzzy p No momento de desenvolver um sistema baseado em lógica fuzzy, deve-se decidir: n n p No exemplo, tem-se 4 funções de pertinência para a entrada n p Como cada variável de entrada e saída será particionada e Associar uma função de pertinência para cada partição Uma quinta (moderada) poderia ser adicionada entre frio e quente O número de funções necessárias depende da exatidão desejada para o sistema n Quanto mais curvas, mais sensibilidade, maior complexidade 35 DSC/CCT/UFCG

Exemplo: Conjuntos fuzzy correspondentes à variável Temperatura p p Funções de pertinência para a

Exemplo: Conjuntos fuzzy correspondentes à variável Temperatura p p Funções de pertinência para a variável de entrada No exemplo tem-se apenas a variável temperatura Frio Muito_frio Quente Muito_quente 1 0. 5 0 -10 0 10 20 30 40 Os formatos mais utilizados para funções de pertinência são os trapezoidais e os triangulares. Mas qualquer função mais adequada ao caso pode ser utilizada. DSC/CCT/UFCG 36

Exemplo: Conjuntos fuzzy correspondentes à variável Velocidade p p Funções de pertinência para a

Exemplo: Conjuntos fuzzy correspondentes à variável Velocidade p p Funções de pertinência para a variável de saída No exemplo tem-se apenas a variável velocidade zero baixa média alta 1 0. 5 0 0 20 40 60 80 100 37 DSC/CCT/UFCG

Exemplo: Definindo as regras de produção p If (temperatura is muito_frio) then (velocidade is

Exemplo: Definindo as regras de produção p If (temperatura is muito_frio) then (velocidade is zero) p If (temperatura is frio) then (velocidade is baixa) p If (temperatura is quente) then (velocidade is média) p If (temperatura is muito_quente) then (velocidade is alta) p Tanto as regras como os conjuntos fuzzy são especificados de acordo com o conhecimento de um especialista no domínio do SE. 38 DSC/CCT/UFCG

Exemplo: Processo de fuzzificação p 20ºC pode ser considerada “fria” ou “quente” n 70%

Exemplo: Processo de fuzzificação p 20ºC pode ser considerada “fria” ou “quente” n 70% fria e 30% quente Frio Muito_frio Quente Muito_quente 1 0. 5 0 -10 0 10 20 30 40 Fuzzificação: transformar variáveis qualitativas, com base nas funções de pertinência, em algum significado para o computador DSC/CCT/UFCG 39

Exemplo: Regras ativadas p If (temperatura is muito_frio) then (velocidade is zero) p If

Exemplo: Regras ativadas p If (temperatura is muito_frio) then (velocidade is zero) p If (temperatura is frio) then (velocidade is baixa) p If (temperatura is quente) then (velocidade is média) p If (temperatura is muito_quente) then (velocidade is alta) 40 DSC/CCT/UFCG

Exemplo: Avaliação das regras p Durante a avaliação de uma regra n Valores são

Exemplo: Avaliação das regras p Durante a avaliação de uma regra n Valores são computados baseados níveis de ativação alcançados p p Para cada uma das funções de pertinência Para cada uma das entradas n Estes valores são associados às regras difusas de saída. n Geralmente uma função de minimização é utilizada para determinar o valor associado a cada variável de entrada quando mais de uma função de pertinência é ativada na mesma regra. 41 DSC/CCT/UFCG

Exemplo: Operações sobre conjuntos fuzzy p Interseção de dois conjuntos, corresponde à função fuzzy-AND

Exemplo: Operações sobre conjuntos fuzzy p Interseção de dois conjuntos, corresponde à função fuzzy-AND n u(A AND B) = min(u. A(x), u. B(x)) p União de dois conjuntos, corresponde à função fuzzy -OR n u(A OR B) = max(u. A(x), u. B(x)) 42 DSC/CCT/UFCG

Frio Muito_frio Quente Muito_quente 1 temperatura 0. 5 0 -10 0 zero 10 20

Frio Muito_frio Quente Muito_quente 1 temperatura 0. 5 0 -10 0 zero 10 20 30 baixa 40 média alta 1 velocidade 0. 5 DSC/CCT/UFCG 0 0 20 40 60 80 100 43

velocidade temperatura -10 20 40 Composição: DSC/CCT/UFCG 0 100 44

velocidade temperatura -10 20 40 Composição: DSC/CCT/UFCG 0 100 44

Exemplo: Processo de defuzzificação p Uma vez que já se sabe quais regras devem

Exemplo: Processo de defuzzificação p Uma vez que já se sabe quais regras devem ser ativadas p O processo de defuzzificação da saída é necessário para: n Decifrar o significado de uma ação vaga como: “a velocidade de ser baixa” e n Resolver conflitos entre regras que possam parecer contraditórias p Um dos métodos mais utilizados se baseia no método de determinação do centróide (determinação do centro de gravidade ou massa) 45 DSC/CCT/UFCG

Exemplo: Processo de defuzzificação 1. Verificação das regras que foram ativadas; 2. Processo de

Exemplo: Processo de defuzzificação 1. Verificação das regras que foram ativadas; 2. Processo de composição das regras disparadas; 3. As áreas que representam o grau de ativação de cada regra são compostas formando uma área resultante; 4. Sobre esta área se calcula o ponto central, baseado no cálculo do centro de massa. p Assim, o nível de ativação de cada regra age como um nível de ponderação no cálculo final. 46 DSC/CCT/UFCG

velocidade temperatura -10 20 40 Composição: DSC/CCT/UFCG 0 44. 1 100 47

velocidade temperatura -10 20 40 Composição: DSC/CCT/UFCG 0 44. 1 100 47

Modelo Nebuloso p A utilização mais significativa da teoria dos conjuntos nebulosos em sistemas

Modelo Nebuloso p A utilização mais significativa da teoria dos conjuntos nebulosos em sistemas baseados em conhecimento são os controladores nebulosos. p Um controlador nebuloso pode ser visto como um sistema especialista simplificado, em que a conseqüência de uma regra não é aplicada como antecedente de outra. Isto porque as ações de controle são baseadas em um único nível de inferência. 48 DSC/CCT/UFCG

Aplicações … p Controle n n p Otimização e Planejamento n n p Elevadores

Aplicações … p Controle n n p Otimização e Planejamento n n p Elevadores (Hitachi, Fujitech, Mitsubishi) Análise do Mercado de Ações (Yamaichi) Análise de Sinais n n n DSC/CCT/UFCG Controle de Aeronave (Rockwell Corp. ) Operação do Metrô de Sendai (Hitachi) Transmissão Automática (Nissan, Subaru) Space Shuttle Docking (NASA) Ajuste da Imagem de TV (Sony) Autofocus para Câmera de Video (Canon) Estabilizador de Imagens de Video (Panasonic) 49

Aplicações … p Máquinas de lavar (Hitachi) – uso otimizado de potência, água e

Aplicações … p Máquinas de lavar (Hitachi) – uso otimizado de potência, água e detergente p Ar condicionado industrial (Mitsubishi) – reduz o consumo de potência em 24%, usa menos sensores 50 DSC/CCT/UFCG

Aplicações p Outros projetos japoneses: n n p Reconhecimento de caracteres Sistemas fuzzy óticos

Aplicações p Outros projetos japoneses: n n p Reconhecimento de caracteres Sistemas fuzzy óticos Robôs Helicópteros comandados por voz NASA – controle fuzzy para ancorar suas naves automaticamente no espaço 51 DSC/CCT/UFCG

Perspectivas p Potencial manuseio de incertezas e controle de sistemas complexos p Lógica fuzzy

Perspectivas p Potencial manuseio de incertezas e controle de sistemas complexos p Lógica fuzzy combinada com redes neurais artificiais n Capacidade de adaptação e aprendizagem p Simbiose n Novas classes de sistemas e de controladores neurodifusos 52 DSC/CCT/UFCG