PROCEDIMENTOS AUTOMTICOS E SEMIAUTOMTICOS DE REGIONALIZAO POR RVORE

  • Slides: 24
Download presentation
PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto

PROCEDIMENTOS AUTOMÁTICOS E SEMI-AUTOMÁTICOS DE REGIONALIZAÇÃO POR ÁRVORE GERADORA MÍNIMA Marcos Corrêa Neves Gilberto Câmara Renato M. Assunção Corina da Costa Freitas

Objetivos • Desenvolvimento de um método de regionalização eficiente. – Teoria de Grafo. –

Objetivos • Desenvolvimento de um método de regionalização eficiente. – Teoria de Grafo. – Técnicas de otimização. • Abordagem de regionalização semi-automática: – dirigida pelo usuário.

Regionalização • Agrupamento de objetos-área em regiões homogêneas e espacialmente contíguas.

Regionalização • Agrupamento de objetos-área em regiões homogêneas e espacialmente contíguas.

Regionalização • Utilidade do procedimento: – facilitar a análise dos dados. – melhorar a

Regionalização • Utilidade do procedimento: – facilitar a análise dos dados. – melhorar a representatividade dos valores dos atributos e taxas associados aos objetos. – Redução dos efeitos de imprecisão dos atributos e do posicionamento geográfico dos eventos.

Regionalização via AGM • • Grafo representa a estrutura de vizinhança. Cada objeto é

Regionalização via AGM • • Grafo representa a estrutura de vizinhança. Cada objeto é um vértice. Objetos vizinhos são ligados por uma aresta. Custos associados às aresta (medida de similaridade entre os objetos). • Grafo dá origem a Árvore Geradora Mínima (árvore de custo mínimo).

Regionalização via AGM Algoritmo de Prim

Regionalização via AGM Algoritmo de Prim

Regionalização via AGM • Fase de “poda” da AGM: – Escolha da aresta que

Regionalização via AGM • Fase de “poda” da AGM: – Escolha da aresta que forme dois grupos de objetos homogêneos. – São retiradas k-1 arestas sucessivamente, formando k árvores disjuntas. • Medida utilizada: – Baseada na Soma dos Quadrados Desvios (SSD) entre os atributos dos objetos e os valores médios.

Regionalização via AGM • Soma dos quadrados desvios:

Regionalização via AGM • Soma dos quadrados desvios:

Regionalização via AGM • Custo da aresta na fase de poda: l T Ta

Regionalização via AGM • Custo da aresta na fase de poda: l T Ta Tb

Regionalização via AGM • Busca exaustiva pela aresta que melhor divide a árvore. •

Regionalização via AGM • Busca exaustiva pela aresta que melhor divide a árvore. • Para k regiões, k-1 buscas são conduzidas.

Otimização • Utilização de técnicas de otimização visando a melhorar a eficiência na fase

Otimização • Utilização de técnicas de otimização visando a melhorar a eficiência na fase de poda. • Como um problema de otimização:

Otimização • Elementos de Busca Local (Expansão da Vizinhança e Busca Tabu). • Duas

Otimização • Elementos de Busca Local (Expansão da Vizinhança e Busca Tabu). • Duas soluções são vizinhas se suas arestas correspondentes são incidentes em um mesmo vértice. S 1 S 2 S 3 S 4

Estratégia de busca • Passo 1: escolher a solução inicial Si em S. Fazer

Estratégia de busca • Passo 1: escolher a solução inicial Si em S. Fazer S* = Si ; k* = k = 0; e incluir Si na lista de soluções analisadas (T). • Passo 2: Fazer k = k + 1. Escolher na lista T a solução que terá a vizinhança expandida, gerando o conjunto de soluções promissoras (V*). • Passo 3: Avaliar as soluções em V*; escolher a melhor solução, Sj, em V*; Armazenar soluções avaliadas em T. • Passo 4: Se f(Sj) < f(S*), então: S* = Sj; k* = k. • Passo 5: Verificar condição de parada (k - k* > 8). Senão satisfeita, voltar ao passo 2.

Estratégia de busca • Solução que terá a vizinhança expandida: – Solução que apresentar

Estratégia de busca • Solução que terá a vizinhança expandida: – Solução que apresentar um menor valor para f’. – f’ evita busca em ramos da árvore com poucos vértices.

Estratégia de Busca

Estratégia de Busca

Estratégia de Busca

Estratégia de Busca

Estratégia de Busca • Próximas podas: – Laço de controle externo executado k-1 vezes

Estratégia de Busca • Próximas podas: – Laço de controle externo executado k-1 vezes • Ponto de partida mais apropriado: – vértice “central”. • Tende a ter valores de atributos médios; • próximos a solução ótima.

Estratégia de Busca Vértice central

Estratégia de Busca Vértice central

Regionalização semi-automática • Os grupos “naturais”: – dependentes de uma série de escolhas: •

Regionalização semi-automática • Os grupos “naturais”: – dependentes de uma série de escolhas: • relacionadas ao objetivo da classificação. • atributos, medidas de similaridade, algoritmos, métricas de avaliação, “correção das variáveis”. – Requisitos adicionais para as regiões (número de objetos, população mínima, extensão da área, . . . ).

Observações sobre a AGM • A AGM contém informações que não são visíveis em

Observações sobre a AGM • A AGM contém informações que não são visíveis em resultados de classificação: – ramos de similaridade em diferentes níveis, nós-folhas e vértices centrais (global e locais). – hierarquia entre os objetos. – Possibilidades de fusão (ou subdivisão) de Regiões.

Observações sobre a AGM

Observações sobre a AGM

Regionalização semi-automática • O uso da AGM: – Não somente como um passo intermediário

Regionalização semi-automática • O uso da AGM: – Não somente como um passo intermediário e escondido dentro do processo de regionalização. – Como ferramenta de exploração dos dados. – Como suporte à regionalização guiada pelo usuário: • Representando o status do processo de regionalização. • Verificação de ligação válida na fusão de regiões. • Seleção de subconjuntos de objetos similares.

Regionalização semi-automática • Seleção de regiões: – comparações; – gráficos; – sumários estatísticos; –

Regionalização semi-automática • Seleção de regiões: – comparações; – gráficos; – sumários estatísticos; – outras informações. • Edição das regiões.

Conclusões • É possível melhorar a eficiência da regionalização via AGM utilizando técnicas de

Conclusões • É possível melhorar a eficiência da regionalização via AGM utilizando técnicas de otimização • A AGM explicita a similaridade entre os objetos; • A AGM torna algumas informações visíveis podendo ser utilizada como ferramenta em análise exploratória dos dados espaciais. • A AGM pode funcionar como suporte à regionalização guiada pelo usuário.