Anlise de Dados de rea Parte 3 Anlise

  • Slides: 46
Download presentation
Análise de Dados de Área Parte 3 - Análise Exploratória

Análise de Dados de Área Parte 3 - Análise Exploratória

Análise Exploratória • Definição – Conjunto de ferramentas estatísticas gráficas e descritivas direcionado ao

Análise Exploratória • Definição – Conjunto de ferramentas estatísticas gráficas e descritivas direcionado ao descobrimento de padrões em dados. • ESDA (Exploratory Spatial Data Analysis). “Coleção de técnicas para descrever e visualizar distribuições espaciais, identificar situações atípicas, descobrir padrões de associação espacial, clusters e sugerir regimes espaciais ou formas de heterogeneidade espacial” (Anselin).

Técnicas de Análise Exploratória • Indicadores Globais de Autocorrelação – suposição: estacionariedade (função da

Técnicas de Análise Exploratória • Indicadores Globais de Autocorrelação – suposição: estacionariedade (função da “distância”). – Ex: variograma, correlograma, etc. • Indicadores Locais de Associação Espacial – Ressaltam as situações atípicas (“outliers” ). – Ex: Mapa de LISA, gráfico de espalhamento de Moran. • Indicadores multivariados da associação espacial – generalização do variograma em múltiplas dimensões

Proximidade espacial • Na geoestatística: distância euclidiana. • Principal diferença para objetos áreas, é

Proximidade espacial • Na geoestatística: distância euclidiana. • Principal diferença para objetos áreas, é na formalização da proximidade espacial! – Qual distância de São José à Jacareí? • 10 mim, 15 km ou “são colados”. • Depende!

Exemplos de medidas • proporção da fronteira pelo perímetro. L 2 w 14 =

Exemplos de medidas • proporção da fronteira pelo perímetro. L 2 w 14 = L 1 + L 2 + L 3 + L 4 - wij ¹ wji - “média ponderada!”

Exemplos de medidas • distância linear entre centróides dos obejtos. para d > limiar

Exemplos de medidas • distância linear entre centróides dos obejtos. para d > limiar para d £ limiar • inverso da distância linear.

Exemplos de medidas • Existência de fronteira comum. P 1 faz fronteira com P

Exemplos de medidas • Existência de fronteira comum. P 1 faz fronteira com P 4 P 2 não tem fronteira com P 4

Matriz de Proximidade éw 11 ê w 21 W= ê êw 31 ê ëw

Matriz de Proximidade éw 11 ê w 21 W= ê êw 31 ê ëw 41 w 12 w 13 w 14ù ú w 22 w 23 w 24ú w 32 w 33 w 34ú ú w 42 w 43 w 44û wij : “distância” do objeto i ao objeto j.

Matriz de Proximidade Espacial • Conteúdo – Matriz (n x n) W , cujos

Matriz de Proximidade Espacial • Conteúdo – Matriz (n x n) W , cujos elementos wij representa uma medida de proximidade entre Oi e Oj • Critérios: wij =1, se Oi toca Oj wij = 1, se dist(Oi, Oj) < h wij = lij/li, onde lij é o tamanho da fronteira entre Oi e Oj e li é o perímetro de Oi C B A E D A B C D E A 0 1 0 B 1 0 1 1 1 C 0 1 0 0 1 D 1 1 0 0 1 E 0 1 1 1 0

Média Espacial Móvel • O Método de Média Espacial Móvel é uma técnica que

Média Espacial Móvel • O Método de Média Espacial Móvel é uma técnica que explora o valor médio mi do atributo na região de estudo (primeira ordem). • Seu estimador é definido como: onde: 4 Wij é a matriz de proximidade. 4 yi é o valor do atributo em cada área. 4 n é o número de polígonos (áreas).

Média Espacial Móvel Antes A B 20 C 24 19, 66 15 D A

Média Espacial Móvel Antes A B 20 C 24 19, 66 15 D A C 5 16, 0 Depois B 16, 0 D 14, 66

Média Espacial Móvel Efeito de suavização Agrupamento estatístico Média Espacial Móvel

Média Espacial Móvel Efeito de suavização Agrupamento estatístico Média Espacial Móvel

Média Espacial Móvel Regiões onde existe disparidade entre o valor do atributo e o

Média Espacial Móvel Regiões onde existe disparidade entre o valor do atributo e o valor da média local indicam pontos de transição entre regimes espaciais. Atributo Média local

Indicadores Globais de Autocorrelação Espacial • Explorar a dependência espacial • Autocorrelação espacial. –

Indicadores Globais de Autocorrelação Espacial • Explorar a dependência espacial • Autocorrelação espacial. – Mede o quanto o valor observado de um atributo numa região é independente dos valores desta mesma variável nas localizações vizinhas. • Indicadores Globais – Moran, Geary, Variograma • Indicadores Locais – Local Moran, Local Geary

Variabilidade Espacial: Variograma • Passo 1: Transformar mapas poligonais em amostras

Variabilidade Espacial: Variograma • Passo 1: Transformar mapas poligonais em amostras

Variabilidade Espacial: Variograma • Passo 2 : Medir a • Para cada par Z(x)

Variabilidade Espacial: Variograma • Passo 2 : Medir a • Para cada par Z(x) e Z(x+h), separados por um vetor distância h, medimos a variância entre eles • • h • h • • h • • a • h Vetor distância h h Variância no Espaço • h

Variograma para Dados de Área • Gerar Centróides a partir de Áreas • Modelar

Variograma para Dados de Área • Gerar Centróides a partir de Áreas • Modelar o Variograma • Interpolar uma Superfície (se desejar)

VARIOGRAMAS DO I. C. V.

VARIOGRAMAS DO I. C. V.

ÍNDICE ICV = 1 = 0 DE CONDIÇÃ O DE VIDA

ÍNDICE ICV = 1 = 0 DE CONDIÇÃ O DE VIDA

VARIOGRAMAS DO I. D. H.

VARIOGRAMAS DO I. D. H.

Forma genérica dos índices • forma genérica: global local n Gi = åwij aij

Forma genérica dos índices • forma genérica: global local n Gi = åwij aij j n n i j G = å å wij aij onde: wij : medida de proximidade entre objetos i e j aij : expressão que representa a associação entre os atributos do objeto i com os demais objetos de sua vizinhança.

Forma genérica dos índices n n n i j G = å å wij

Forma genérica dos índices n n n i j G = å å wij aij Gi = åwij aij j Quando aij é da forma: (x - x )(x i j -x ) (x - x ) 2 i j x j ou (xi + x j ) zi z j Moran (covariância) (z - z ) 2 i Geary (variância) j ( z j ou zi + z j ) G ou G* (média móvel)

Indice Global de Moran onde: – n corresponde ao número de áreas, – yi

Indice Global de Moran onde: – n corresponde ao número de áreas, – yi é o valor do atributo considerado na área i, – representa o valor médio do atributo na região de estudo, – wij são os pesos atribuídos conforme a conexão entre as áreas i e j.

Indicadores Globais Moran • Qual o significado do índice global de Moran ( I

Indicadores Globais Moran • Qual o significado do índice global de Moran ( I ) ? • Como interpretar a equação acima ? • Qual sua siginificância ou validade estatística ? Como avaliar ?

Índice Globais de Moran • É análogo ao coeficiente de correlação convencional, porque têm

Índice Globais de Moran • É análogo ao coeficiente de correlação convencional, porque têm em seu numerador um termo que é produto de momento. • Como um coeficiente de correlação, os valores de I também variam de -1 a +1, quantificando o grau de autocorrelação espacial existente. Þ-1 autocorrelação espacial negativa ou inversa. Þ 0 significa aleatoriedade Þ+1 significa autocorrelação espacial positiva ou direta.

Indicadores Globais de Autocorrelação Espacial • Consideremos o exemplo que segue: A 20 C

Indicadores Globais de Autocorrelação Espacial • Consideremos o exemplo que segue: A 20 C 24 B 15 D 5 Matriz de Proximidade A B C D A 0 1 1 0 B 1 0 1 1 C 1 1 0 1 D 0 1 1 0

Indicadores Globais de Autocorrelação Espacial • A equação de I pode ser simplificada [N(m=0

Indicadores Globais de Autocorrelação Espacial • A equação de I pode ser simplificada [N(m=0 e s 2=1)] e alteramos W, de forma que a soma dos elementos de cada linha seja igual a 1. A B C D A 0 1 1 0 A B 1 0 1 1 B 1/3 0 1/3 C 1 1 0 1 C 1/3 0 1/3 D 0 1 1 0 D 0 1/2 1/2 0

Indicadores Globais de Autocorrelação Espacial A A 20 C A B 24 C D

Indicadores Globais de Autocorrelação Espacial A A 20 C A B 24 C D z. A = 0, 5628 z. B = -0, 1407 z. C = 1, 1257 z. D = -1, 5479 0 1/2 0 B 1/3 0 1/3 15 D B C 1/3 0 1/3 5 D wij 0 1/2 0 * zi zj = Mij

Significância do Índice de Moran Avaliação da siginificância do índice de Moran (I). Para

Significância do Índice de Moran Avaliação da siginificância do índice de Moran (I). Para estimar a significância de I, será preciso associar a este uma distribuição estatística, para tanto, duas abordagens são possíveis: • Teste de pseudo-significância (experimento aleatório). • Distribuição aproximada (hipótese da normalidade).

Indicadores Globais de Autocorrelação Espacial • A validade estatística do índice de Moran (I)

Indicadores Globais de Autocorrelação Espacial • A validade estatística do índice de Moran (I) sob o extremo Distribuição simulada extremo teste de pseudo-significância. • Se o índice I efetivamente medido corresponder a um “extremo” da distribuição simulada, então trata-se de evento com significância estatística.

I de Moran: Validade Estatística • Para um número suficiente de sub-regiões o índice

I de Moran: Validade Estatística • Para um número suficiente de sub-regiões o índice I tem uma distribuição amostral que é aproximadamente normal, dada por: Índice Moran Normalizado onde: n = número de regiões, Normal Padrão 95% -1, 96 0 1, 96

Mapeando a Violência: Dados de Área Fonte: Carvalho, M. S. , 1998. FIOCRUZ -

Mapeando a Violência: Dados de Área Fonte: Carvalho, M. S. , 1998. FIOCRUZ - RJ

Indicadores Globais de Autocorrelação Espacial 0 RJ 100 200 300 400 500 600 SP

Indicadores Globais de Autocorrelação Espacial 0 RJ 100 200 300 400 500 600 SP 0. 6 auto-correlação 0. 4 0. 2 0. 0 -0. 2 MG ES 0. 6 0. 4 0. 2 0. 0 -0. 2 0 100 200 300 400 500 600 distância Fonte: Carvalho, M. S. , 1998. FIOCRUZ - RJ

Diagrama de Espalhamento de Moran Este diagrama relata espacialmente o relacionamento entre os valores

Diagrama de Espalhamento de Moran Este diagrama relata espacialmente o relacionamento entre os valores do vetor de desvios Z ( ) e os valores das médias locais WZ, indicando diferentes regimes espaciais presentes nos dados. WZ Q 4 Nesta formulação, I equivale ao coeficiente de regressão linear, ou seja a inclinação da reta de regressão. Q 1 Reta de regressão de WZ em Z I é equivalente a tg a a 0 Q 2 Q 3 0 z

Diagrama de Espalhamento de Moran Q 1 (val. [+], médias [+]) e Q 2

Diagrama de Espalhamento de Moran Q 1 (val. [+], médias [+]) e Q 2 (val. [-], médias [-]) Indicam pontos de associação espacial positiva, no sentido que uma localização possui vizinhos com valores semelhantes. WZ Q 4 Q 1 a 0 Q 2 Q 3 (val. [+], médias [-]) e Q 4 (val. [-], médias [+]) Indicam pontos de associação espacial negativa, no sentido que uma localização possui vizinhos com valores distintos. Q 3 0 z Nota: - os pontos localizados em Q 3 e Q 4 podem ser vistos como extremos, tanto por estar afastados da reta de regressão linear, como por indicar regiões que não seguem o mesmo processo de dependência espacial das demais observações. Estes pontos marcam regiões de transição entre regimes espaciais distintos.

Autocorrelação Espacial O Diagrama de Espalhamento de Moran pode ser apresentado na forma de

Autocorrelação Espacial O Diagrama de Espalhamento de Moran pode ser apresentado na forma de um mapa coroplético bidimensional, no qual cada polígono é apresentado indicando-se seu quadrante no diagrama de espalhamento. São Paulo WZ Q 4 = LH Q 1= HH a 0 Q 2= LL Q 3 = HL 0 z Atributo considerado percentagem de idosos

Indicadores Locais de Associação Espacial (LISA) • Como vimos anteriormente o estimador de autocorrelação

Indicadores Locais de Associação Espacial (LISA) • Como vimos anteriormente o estimador de autocorrelação espacial, Moran (I), fornece um valor único como medida da associação espacial. • Por outro lado, muitas vezes é necessário examinar padrões numa escala maior. • Neste caso, é preciso utilizar indicadores locais de associação espacial que possam ser associados a diferentes localizações de uma variável distribuída espacialmente. • A utilização destes indicadores em conjunto com os indicadores globais, refinam nosso conhecimento sobre o processos que dão origem a dependência espacial.

Introdução • Índices locais (LISA): – Permitem avaliar diferentes regimes espaciais existentes na área

Introdução • Índices locais (LISA): – Permitem avaliar diferentes regimes espaciais existentes na área de estudo. – Medem a associação espacial entre uma observação i e sua vizinhança. – Requisitos (Anselin) • A soma dos índices locais deve ser proporcional ao índice global. • Indicar a significância da associação espacial para cada observação.

Indicadores Locais de Associação Espacial (LISA) • Os indicadores locais de associação espacial, produzem

Indicadores Locais de Associação Espacial (LISA) • Os indicadores locais de associação espacial, produzem um valor específico para cada objeto. • Isto acarreta a identificação de: – “Clusters”: objetos com valores de atributos semelhantes, – “Outliers”: objetos anómalos, – A presença de mais de um regime espacial. • Tem que atender a dois objetivos: – Permitir a identificação de padrões de associação espacial significativos; – Ser uma decomposição do índice global de associação espacial.

Índice local de Moran • Formulação:

Índice local de Moran • Formulação:

Indicadores Locais de Associação Espacial (LISA) • Indicadores locais Ii de Moran (Anselin, 1996)

Indicadores Locais de Associação Espacial (LISA) • Indicadores locais Ii de Moran (Anselin, 1996) • Indicadores locais Gi e Gi * (Getis e Ord, 1992) • O indicador local de Moran Ii é assim definido: Ii > 0 “clusters” de valores similares (altos ou baixos). Ii < 0 “clusters” de valores distintos (Ex: uma localização com valores altos rodeada por uma vizinhança de valores baixos). • Normalizando as variáveis o indicador reduz-se a:

Indicadores Locais de Associação Espacial (LISA) • De forma similiar aos indicadores globais, a

Indicadores Locais de Associação Espacial (LISA) • De forma similiar aos indicadores globais, a significância do índice local de Moran (Ii) deve ser avaliado, utilizando hipótese de normalidade ou simulação de distribuição por permutação aleatória nos valores dos atributos (Anselin, 1995). • Uma vez determinada a significância estatística de Moran (Ii) é muito útil gerar um mapa indicando as regiões que apresentam correlação local significativamente diferente do resto dos dados. • Este mapa é denominado por Anselin (1995) de “LISA MAP”. • Na geração do LISA MAP, os índices locais Ii são classificados como: – não significantes

Indicadores Locais de Associação Espacial (LISA) • Os indicadores locais Gi e Gi *

Indicadores Locais de Associação Espacial (LISA) • Os indicadores locais Gi e Gi * (Getis e Ord, 1992): onde: – wij valor na matriz de proximidade para região i com a região j em função da distância. – xi e xj são os valores dos atributos considerados nas áreas i e j. – d é distância entre pontos – n o número de áreas (polígonos) • NOTA: a estatística Gi, inclui no numerador a soma de todos os valores de

Indicadores Locais de Associação Espacial (LISA) • Os indicadores locais Gi e Gi *

Indicadores Locais de Associação Espacial (LISA) • Os indicadores locais Gi e Gi * (Getis e Ord, 1992): • onde: – wij valor na matriz de proximidade para região i com a região j em função da distância. – xi e xj são os valores dos atributos considerados nas áreas i e j. – d é distância entre pontos – n o número de áreas (polígonos)

Indicadores Locais de Autocorrelação Espacial não signif. 95% sign. 99% sign. • “Bolsões” de

Indicadores Locais de Autocorrelação Espacial não signif. 95% sign. 99% sign. • “Bolsões” de exclusão/inclusão social em São Paulo

Indicadores Locais de Associação Espacial (LISA) • Uma outra forma de análise é através

Indicadores Locais de Associação Espacial (LISA) • Uma outra forma de análise é através do mapa denominado “Moran Map” (Anselin, 1999). Neste caso, os índices locais Ii são associados ao diagra-ma de espalhamento de Moran. Nota: este resultado apresenta somente as regiões para os quais os valores de Ii , foram considerados significantes (com intervalo >95%). % Idosos não significantes Q 1 [HH] Q 2 [LL]