Universidade Federal de Campina Grande Departamento de Sistemas

  • Slides: 34
Download presentation
Universidade Federal de Campina Grande Departamento de Sistemas e Computação Curso de Bacharelado em

Universidade Federal de Campina Grande Departamento de Sistemas e Computação Curso de Bacharelado em Ciência da Computação Inteligência Artificial I Aprendizagem (Parte III) Prof. a Joseana Macêdo Fechine joseana@dsc. ufcg. edu. br Carga Horária: 60 horas DSC/CEEI/UFCG

Aprendizagem Tópico q Redes Neurais 2 DSC/CEEIUFCG

Aprendizagem Tópico q Redes Neurais 2 DSC/CEEIUFCG

Redes Neurais p É uma célula do cérebro cuja principal função é coletar, processar

Redes Neurais p É uma célula do cérebro cuja principal função é coletar, processar e disseminar sinais elétricos. p Acredita se que a capacidade de processamento de informações no cérebro vem de redes de neurônios. Componentes de um neurônio 3 DSC/CEEIUFCG

Redes Neurais Componentes de um Neurônio p Axônio – transmissão de sinais a partir

Redes Neurais Componentes de um Neurônio p Axônio – transmissão de sinais a partir do corpo celular; poucas ramificações e compridos; p Dendritos – conduzem sinais para a célula; têm muitas ramificações (zonas receptivas); p Sinapses – estruturas funcionais elementares que mediam as conexões entre os neurônios 4 DSC/CEEIUFCG

Redes Neurais p Plasticidade de um neurônio – capacidade de adaptação ao ambiente. p

Redes Neurais p Plasticidade de um neurônio – capacidade de adaptação ao ambiente. p Mecanismos de Plasticidade (cérebro de um adulto) n n p Criação de novas conexões sinápticas Modificação das sinapses existentes Plasticidade essencial para as Redes Neurais Artificiais 5 DSC/CEEIUFCG

Neurociência computacional p Modelo matemático do neurônio criado por Mc. Culloch e Pitts (1943)

Neurociência computacional p Modelo matemático do neurônio criado por Mc. Culloch e Pitts (1943) p Interesse nas propriedades mais abstratas da RNs n n n p Habilidade para executar computação distribuída Habilidade para tolerar entradas ruidosas Habilidade para aprender Uma das formas mais populares e efetivas de sistemas de aprendizagem 6 DSC/CEEIUFCG

Redes Neurais Artificiais Inspiração Biológica 7 DSC/CEEIUFCG

Redes Neurais Artificiais Inspiração Biológica 7 DSC/CEEIUFCG

Neurônio Artificial Neurônio artificial projetado por Mc. Culloch e Pitts (1943) p p sinais

Neurônio Artificial Neurônio artificial projetado por Mc. Culloch e Pitts (1943) p p sinais são apresentados à entrada; cada sinal é multiplicado por um número, ou peso, que indica a sua influência na saída da unidade; é feita a soma ponderada dos sinais que produz um nível de atividade; se este nível de atividade exceder um certo limite (threshold) a unidade produz uma determinada resposta de saída. Função de ativação 8 DSC/CEEIUFCG

Neurônio Artificial p “Dispara” quando uma combinação linear de suas entradas excede algum limiar.

Neurônio Artificial p “Dispara” quando uma combinação linear de suas entradas excede algum limiar. 9 DSC/CEEIUFCG

Redes Neurais Artificiais p Cada unidade i calcula n n Uma soma ponderada de

Redes Neurais Artificiais p Cada unidade i calcula n n Uma soma ponderada de suas entradas Depois, aplica uma função de ativação g a essa soma para derivar a saída 10 DSC/CEEIUFCG

A função de ativação p g é projetada para atender a dois propósitos n

A função de ativação p g é projetada para atender a dois propósitos n Deseja se a unidade “ativa” (próxima de =1) quando as entradas “corretas” forem recebidas e “inativa” (próxima de 0) quando as entradas “erradas” forem recebidas n A ativação precisa ser não linear função de limiar (a) função sigmóide (b) DSC/CEEIUFCG 11

Neurônio Artificial Exemplo: p p p sinais de entrada X 1, X 2, .

Neurônio Artificial Exemplo: p p p sinais de entrada X 1, X 2, . . . , Xp (0 ou 1) pesos W 1, W 2, . . . , Wp, valores reais. limitador t; Neste modelo, o nível de atividade a é dado por: a = W 1 X 1 + W 2 X 2 +. . . + Wp. Xp A saída y é dada por: • y = 1, se a ≥ t ou • y = 0, se a < t. 12 DSC/CEEIUFCG

Exemplos de Aplicações p Exemplo bem simplificado: suponha que você está em uma encruzilhada

Exemplos de Aplicações p Exemplo bem simplificado: suponha que você está em uma encruzilhada com quatro caminhos a seguir, e precisa escolher o mais fácil. n n Como você nunca andou em nenhum deles, o peso de cada um é 1, ou seja, tanto faz escolher qualquer um. Você escolhe um deles, e anda até descobrir um lago em que deve atravessar a nado. Pela dificuldade, você deve aumentar o peso deste caminho para 2. Quando outra pessoa chegar na mesma encruzilhada, saberá que o caminho de maior peso é o mais difícil a seguir. A rede neural “aprende” a determinar os pesos de acordo com as movimentações entre as paradas. 13 DSC/CEEIUFCG

Redes Neurais Artificiais Rede Neural - Organização em Camadas (Exemplo) 14 DSC/CEEIUFCG

Redes Neurais Artificiais Rede Neural - Organização em Camadas (Exemplo) 14 DSC/CEEIUFCG

Redes Neurais Artificiais p As camadas são classificadas em três grupos (usualmente): n n

Redes Neurais Artificiais p As camadas são classificadas em três grupos (usualmente): n n n Camada de Entrada: onde os padrões são apresentados à rede; Camadas Intermediárias ou Escondidas: onde é feita a maior parte do processamento, através das conexões ponderadas; podem ser consideradas como extratoras de características; Camada de Saída: onde o resultado final é concluído e apresentado. 15 DSC/CEEIUFCG

Redes Neurais Artificiais Redes Neurais: Classificação dos Modelos Conexionistas p Em relação à estrutura

Redes Neurais Artificiais Redes Neurais: Classificação dos Modelos Conexionistas p Em relação à estrutura da rede: n n n n Redes de uma única camada Redes de múltiplas camadas Redes do tipo uni direcional Redes do tipo recorrentes Redes com estrutura estática (não altera a sua estrutura) Redes com estrutura dinâmica (altera a estrutura) Redes com conexões de ordem superior 16 DSC/CEEIUFCG

Estruturas de rede p p Redes acíclicas ou redes de alimentação direta: n Representam

Estruturas de rede p p Redes acíclicas ou redes de alimentação direta: n Representam uma função de sua entrada atual; n NÃO têm nenhum estado interno além dos pesos. Redes cíclicas ou redes recorrentes: n Utilizam suas saídas para realimentar suas próprias entradas; n Níveis de ativação da rede formam um sistema dinâmico p n Pode atingir um estado estável ou exibir oscilações; A resposta da rede a uma determinada entrada pode depender de entradas anteriores (como um flip flop). 17 DSC/CEEIUFCG

Redes de alimentação direta p Representa uma função de suas entradas p Dados os

Redes de alimentação direta p Representa uma função de suas entradas p Dados os valores de entrada a 1 e a 2 a rede calcula: a 5 = g(W 3, 5 a 3 + W 4, 5 a 4) = g(W 3, 5 g(W 1, 3 a 1 + W 2, 3 a 2) + W 4, 5 g(W 1, 4 a 1 + W 2, 4 a 2)) 18 DSC/CEEIUFCG

Redes de alimentação direta p Expressando a saída de cada unidade oculta como uma

Redes de alimentação direta p Expressando a saída de cada unidade oculta como uma função de suas entradas percebe se que: n a 5 é uma função das entradas da rede; n Os pesos da rede atuam como parâmetros dessa função; n A rede calcula hw(x); n Ajustando os pesos muda se a função que a rede representa; n Aprendizagem! 19 DSC/CEEIUFCG

Redes Neurais Artificiais Processos de Aprendizado p p p A propriedade mais importante das

Redes Neurais Artificiais Processos de Aprendizado p p p A propriedade mais importante das redes neurais é a habilidade de aprender com seu ambiente e com isso melhorar seu desempenho. Isso é feito através de um processo iterativo de ajustes aplicado a seus pesos, o treinamento. O aprendizado ocorre quando a rede neural atinge uma solução generalizada para uma classe de problemas. 20 DSC/CEEIUFCG

Redes Neurais Artificiais Algoritmo de Aprendizado p p p Conjunto de regras bem definidas

Redes Neurais Artificiais Algoritmo de Aprendizado p p p Conjunto de regras bem definidas para a solução de um problema de aprendizado. Existem muitos tipos de algoritmos de aprendizado específicos para determinados modelos de redes neurais. Os algoritmos diferem entre si principalmente pelo modo como os pesos são modificados. 21 DSC/CEEIUFCG

Redes Neurais Artificiais Redes Neurais: Classificação - Aprendizado p Em relação ao aprendizado: n

Redes Neurais Artificiais Redes Neurais: Classificação - Aprendizado p Em relação ao aprendizado: n n n Aprendizado supervisionado Aprendizado semi supervisionado Aprendizado não supervisionado Aprendizado instantâneo Aprendizado por pacotes Aprendizado contínuo Aprendizado ativo Aprendizado: aproximação de funções Aprendizado: classificação Usar apenas uma base de exemplos de aprendizado Usar uma base de aprendizado e uma base de teste de generalização 22 DSC/CEEIUFCG

Redes Neurais Artificiais Redes Neurais: Classificação dos Modelos Conexionistas p Em relação as unidades

Redes Neurais Artificiais Redes Neurais: Classificação dos Modelos Conexionistas p Em relação as unidades da rede: n n Redes baseadas em Perceptrons (MLP Multi-Layer Perceptron) Redes baseadas em Protótipos (RBF Radial Basis Function) 23 DSC/CEEIUFCG

Redes Neurais Artificiais Exemplos de Redes Neurais 24 DSC/CEEIUFCG

Redes Neurais Artificiais Exemplos de Redes Neurais 24 DSC/CEEIUFCG

Redes Neurais Artificiais Aplicações Práticas p p p Reconhecimento de Padrões: Caracteres, Imagens, Voz,

Redes Neurais Artificiais Aplicações Práticas p p p Reconhecimento de Padrões: Caracteres, Imagens, Voz, etc Sistemas de Auxílio ao Diagnóstico: Médico, Falhas Mecânicas, etc Robótica Inteligente Previsão: Tempo, Cotações da Bolsa de Valores, etc Sistemas de Controle Processamento de Sinais n p Processamento de Linguagem Natural Data Mining 25 DSC/CEEIUFCG

Redes Neurais Artificiais Aplicações Práticas p http: //www. nd. com/neurosolutions/products/ns/nnandnsvideo. html p http: //fbim.

Redes Neurais Artificiais Aplicações Práticas p http: //www. nd. com/neurosolutions/products/ns/nnandnsvideo. html p http: //fbim. fh regensburg. de/~saj 39122/begrolu/kohonen. html 26 DSC/CEEIUFCG

Exemplos de Aplicações p Exemplo de uso prático no Brasil: Visanet, operadora de cartões

Exemplos de Aplicações p Exemplo de uso prático no Brasil: Visanet, operadora de cartões de crédito. n n A empresa implantou um sistema de rede neural, batizado de Lynx, que detecta possíveis fraudes em transações com cartão. A base de dados fornece um histórico e o hábito de consumo de cada número de cartão de crédito Visa emitido no país. p n Número de transações anteriores: mais de 850 milhões. São emitidos alertas para os bancos toda vez que o Lynx detecta variáveis fora dos padrões e, portanto, a possibilidade de fraude. p p O sistema compara o comportamento de cada transação com os padrões armazenados na base de dados. Uma despesa em um estabelecimento comercial nunca utilizado antes por determinado cartão, por exemplo, gera uma variável. O cadastro e o histórico do próprio estabelecimento comercial geram outras variáveis que levam em conta fatores como a ocorrência de casos anteriores de fraude. A soma dessas variáveis resulta em um índice de probabilidade de fraude que vai de 1% a 100%. Lynx (lince) animal que os antigos acreditavam ter o poder de enxergar através de paredes. 27 DSC/CEEIUFCG

Exemplos de Aplicações p Exemplo: Reconhecimento de fala – reconhecer 1 de 10 vogais

Exemplos de Aplicações p Exemplo: Reconhecimento de fala – reconhecer 1 de 10 vogais entre h_d (em inglês) n – F 1 e F 2: parâmetros retirados da análise espectral do som da palavra. 28 DSC/CEEIUFCG

Exemplos de Aplicações p Neural Networks Java Applets: n n n p Joone Java

Exemplos de Aplicações p Neural Networks Java Applets: n n n p Joone Java Object Oriented Neural Engine n p Perceptron Learning Rule (CNNL) Image Compression Using Backprop (CNNL) Generalizations of the Hamming Associative Memory (CNNL) Porta XOR Simulador de Redes Neurais: SNNS (Stuttgart Neural Network Simulator) Fonte: Java Demonstrations of Neural Net Concepts, http: //neuron. eng. wayne. edu/software. html 29 DSC/CEEIUFCG

Redes Neurais Artificiais Por que utilizá-las? p Generalização: Podem aprender através de conjuntos de

Redes Neurais Artificiais Por que utilizá-las? p Generalização: Podem aprender através de conjuntos de exemplos e apresentar respostas coerentes para entradas não vistas durante o treinamento. p Adaptabilidade: Podem adaptar se a um novo ambiente através de alterações em seus pesos sinápticos. Também podem ser projetadas para alterarem seus pesos em tempo real ou para operarem em ambientes que variem com o tempo. p Informação Contextual: Processam as informações contextuais de forma natural, uma vez que o processamento de um neurônio é afetado pelo processamento de outros neurônios da rede. p Uniformidade: A mesma notação é utilizada em diferentes domínios de aplicações; os neurônios são encontrados em todas as redes neurais; é possivel utilizar os mesmos algoritmos de aprendizagem e teorias em diversas apllicações; através da integração homogênea de módulos, podemos construir redes modulares. 30 DSC/CEEIUFCG

Redes Neurais Artificiais Vantagens p Aquisição automática de conhecimentos empíricos a partir de uma

Redes Neurais Artificiais Vantagens p Aquisição automática de conhecimentos empíricos a partir de uma base de exemplos de aprendizado referente a um problema; p Manipulação de dados quantitativos, aproximados e mesmo incorretos com uma degradação gradual das respostas; p Grande poder de representação de conhecimentos através da criação de relações ponderadas entre as entradas do sistema; 31 DSC/CEEIUFCG

Redes Neurais Artificiais Desvantagens p Dificuldade de configuração das redes em relação à sua

Redes Neurais Artificiais Desvantagens p Dificuldade de configuração das redes em relação à sua estrutura inicial e também no que se refere aos parâmetros dos algoritmos de aprendizado; p Dificuldade de explicitar os conhecimentos adquiridos pela rede através de uma linguagem compreensível para um ser humano; p Dificuldade de convergência (bloqueios) e instabilidade, inerentes aos algoritmos de otimização empregados; p “Lentidão” do processo de aprendizado / adaptação. 32 DSC/CEEIUFCG

Aprendizagem Sistemas Inteligentes Híbridos 33 DSC/CEEIUFCG

Aprendizagem Sistemas Inteligentes Híbridos 33 DSC/CEEIUFCG

Aprendizagem conhecimento intensional (regras) Sistemas de PLN Sistemas Nebulosos (fuzzy) numérico Redes Bayesianas Sistemas

Aprendizagem conhecimento intensional (regras) Sistemas de PLN Sistemas Nebulosos (fuzzy) numérico Redes Bayesianas Sistemas Especialistas simbólico Robôs Algoritmos genéticos Sistemas baseados em Redes Neurais Sistemas de Aprendizagem simbólica indutiva Sistemas baseado em casos conhecimento extensional (exemplos) DSC/CEEIUFCG 34