Anlise de Dados de rea Parte 3 Anlise
- Slides: 46
Análise de Dados de Área Parte 3 - Análise Exploratória
Análise Exploratória • Definição – Conjunto de ferramentas estatísticas gráficas e descritivas direcionado ao descobrimento de padrões em dados. • ESDA (Exploratory Spatial Data Analysis). “Coleção de técnicas para descrever e visualizar distribuições espaciais, identificar situações atípicas, descobrir padrões de associação espacial, clusters e sugerir regimes espaciais ou formas de heterogeneidade espacial” (Anselin).
Técnicas de Análise Exploratória • Indicadores Globais de Autocorrelação – suposição: estacionariedade (função da “distância”). – Ex: variograma, correlograma, etc. • Indicadores Locais de Associação Espacial – Ressaltam as situações atípicas (“outliers” ). – Ex: Mapa de LISA, gráfico de espalhamento de Moran. • Indicadores multivariados da associação espacial – generalização do variograma em múltiplas dimensões
Proximidade espacial • Na geoestatística: distância euclidiana. • Principal diferença para objetos áreas, é na formalização da proximidade espacial! – Qual distância de São José à Jacareí? • 10 mim, 15 km ou “são colados”. • Depende!
Exemplos de medidas • proporção da fronteira pelo perímetro. L 2 w 14 = L 1 + L 2 + L 3 + L 4 - wij ¹ wji - “média ponderada!”
Exemplos de medidas • distância linear entre centróides dos obejtos. para d > limiar para d £ limiar • inverso da distância linear.
Exemplos de medidas • Existência de fronteira comum. P 1 faz fronteira com P 4 P 2 não tem fronteira com P 4
Matriz de Proximidade éw 11 ê w 21 W= ê êw 31 ê ëw 41 w 12 w 13 w 14ù ú w 22 w 23 w 24ú w 32 w 33 w 34ú ú w 42 w 43 w 44û wij : “distância” do objeto i ao objeto j.
Matriz de Proximidade Espacial • Conteúdo – Matriz (n x n) W , cujos elementos wij representa uma medida de proximidade entre Oi e Oj • Critérios: wij =1, se Oi toca Oj wij = 1, se dist(Oi, Oj) < h wij = lij/li, onde lij é o tamanho da fronteira entre Oi e Oj e li é o perímetro de Oi C B A E D A B C D E A 0 1 0 B 1 0 1 1 1 C 0 1 0 0 1 D 1 1 0 0 1 E 0 1 1 1 0
Média Espacial Móvel • O Método de Média Espacial Móvel é uma técnica que explora o valor médio mi do atributo na região de estudo (primeira ordem). • Seu estimador é definido como: onde: 4 Wij é a matriz de proximidade. 4 yi é o valor do atributo em cada área. 4 n é o número de polígonos (áreas).
Média Espacial Móvel Antes A B 20 C 24 19, 66 15 D A C 5 16, 0 Depois B 16, 0 D 14, 66
Média Espacial Móvel Efeito de suavização Agrupamento estatístico Média Espacial Móvel
Média Espacial Móvel Regiões onde existe disparidade entre o valor do atributo e o valor da média local indicam pontos de transição entre regimes espaciais. Atributo Média local
Indicadores Globais de Autocorrelação Espacial • Explorar a dependência espacial • Autocorrelação espacial. – Mede o quanto o valor observado de um atributo numa região é independente dos valores desta mesma variável nas localizações vizinhas. • Indicadores Globais – Moran, Geary, Variograma • Indicadores Locais – Local Moran, Local Geary
Variabilidade Espacial: Variograma • Passo 1: Transformar mapas poligonais em amostras
Variabilidade Espacial: Variograma • Passo 2 : Medir a • Para cada par Z(x) e Z(x+h), separados por um vetor distância h, medimos a variância entre eles • • h • h • • h • • a • h Vetor distância h h Variância no Espaço • h
Variograma para Dados de Área • Gerar Centróides a partir de Áreas • Modelar o Variograma • Interpolar uma Superfície (se desejar)
VARIOGRAMAS DO I. C. V.
ÍNDICE ICV = 1 = 0 DE CONDIÇÃ O DE VIDA
VARIOGRAMAS DO I. D. H.
Forma genérica dos índices • forma genérica: global local n Gi = åwij aij j n n i j G = å å wij aij onde: wij : medida de proximidade entre objetos i e j aij : expressão que representa a associação entre os atributos do objeto i com os demais objetos de sua vizinhança.
Forma genérica dos índices n n n i j G = å å wij aij Gi = åwij aij j Quando aij é da forma: (x - x )(x i j -x ) (x - x ) 2 i j x j ou (xi + x j ) zi z j Moran (covariância) (z - z ) 2 i Geary (variância) j ( z j ou zi + z j ) G ou G* (média móvel)
Indice Global de Moran onde: – n corresponde ao número de áreas, – yi é o valor do atributo considerado na área i, – representa o valor médio do atributo na região de estudo, – wij são os pesos atribuídos conforme a conexão entre as áreas i e j.
Indicadores Globais Moran • Qual o significado do índice global de Moran ( I ) ? • Como interpretar a equação acima ? • Qual sua siginificância ou validade estatística ? Como avaliar ?
Índice Globais de Moran • É análogo ao coeficiente de correlação convencional, porque têm em seu numerador um termo que é produto de momento. • Como um coeficiente de correlação, os valores de I também variam de -1 a +1, quantificando o grau de autocorrelação espacial existente. Þ-1 autocorrelação espacial negativa ou inversa. Þ 0 significa aleatoriedade Þ+1 significa autocorrelação espacial positiva ou direta.
Indicadores Globais de Autocorrelação Espacial • Consideremos o exemplo que segue: A 20 C 24 B 15 D 5 Matriz de Proximidade A B C D A 0 1 1 0 B 1 0 1 1 C 1 1 0 1 D 0 1 1 0
Indicadores Globais de Autocorrelação Espacial • A equação de I pode ser simplificada [N(m=0 e s 2=1)] e alteramos W, de forma que a soma dos elementos de cada linha seja igual a 1. A B C D A 0 1 1 0 A B 1 0 1 1 B 1/3 0 1/3 C 1 1 0 1 C 1/3 0 1/3 D 0 1 1 0 D 0 1/2 1/2 0
Indicadores Globais de Autocorrelação Espacial A A 20 C A B 24 C D z. A = 0, 5628 z. B = -0, 1407 z. C = 1, 1257 z. D = -1, 5479 0 1/2 0 B 1/3 0 1/3 15 D B C 1/3 0 1/3 5 D wij 0 1/2 0 * zi zj = Mij
Significância do Índice de Moran Avaliação da siginificância do índice de Moran (I). Para estimar a significância de I, será preciso associar a este uma distribuição estatística, para tanto, duas abordagens são possíveis: • Teste de pseudo-significância (experimento aleatório). • Distribuição aproximada (hipótese da normalidade).
Indicadores Globais de Autocorrelação Espacial • A validade estatística do índice de Moran (I) sob o extremo Distribuição simulada extremo teste de pseudo-significância. • Se o índice I efetivamente medido corresponder a um “extremo” da distribuição simulada, então trata-se de evento com significância estatística.
I de Moran: Validade Estatística • Para um número suficiente de sub-regiões o índice I tem uma distribuição amostral que é aproximadamente normal, dada por: Índice Moran Normalizado onde: n = número de regiões, Normal Padrão 95% -1, 96 0 1, 96
Mapeando a Violência: Dados de Área Fonte: Carvalho, M. S. , 1998. FIOCRUZ - RJ
Indicadores Globais de Autocorrelação Espacial 0 RJ 100 200 300 400 500 600 SP 0. 6 auto-correlação 0. 4 0. 2 0. 0 -0. 2 MG ES 0. 6 0. 4 0. 2 0. 0 -0. 2 0 100 200 300 400 500 600 distância Fonte: Carvalho, M. S. , 1998. FIOCRUZ - RJ
Diagrama de Espalhamento de Moran Este diagrama relata espacialmente o relacionamento entre os valores do vetor de desvios Z ( ) e os valores das médias locais WZ, indicando diferentes regimes espaciais presentes nos dados. WZ Q 4 Nesta formulação, I equivale ao coeficiente de regressão linear, ou seja a inclinação da reta de regressão. Q 1 Reta de regressão de WZ em Z I é equivalente a tg a a 0 Q 2 Q 3 0 z
Diagrama de Espalhamento de Moran Q 1 (val. [+], médias [+]) e Q 2 (val. [-], médias [-]) Indicam pontos de associação espacial positiva, no sentido que uma localização possui vizinhos com valores semelhantes. WZ Q 4 Q 1 a 0 Q 2 Q 3 (val. [+], médias [-]) e Q 4 (val. [-], médias [+]) Indicam pontos de associação espacial negativa, no sentido que uma localização possui vizinhos com valores distintos. Q 3 0 z Nota: - os pontos localizados em Q 3 e Q 4 podem ser vistos como extremos, tanto por estar afastados da reta de regressão linear, como por indicar regiões que não seguem o mesmo processo de dependência espacial das demais observações. Estes pontos marcam regiões de transição entre regimes espaciais distintos.
Autocorrelação Espacial O Diagrama de Espalhamento de Moran pode ser apresentado na forma de um mapa coroplético bidimensional, no qual cada polígono é apresentado indicando-se seu quadrante no diagrama de espalhamento. São Paulo WZ Q 4 = LH Q 1= HH a 0 Q 2= LL Q 3 = HL 0 z Atributo considerado percentagem de idosos
Indicadores Locais de Associação Espacial (LISA) • Como vimos anteriormente o estimador de autocorrelação espacial, Moran (I), fornece um valor único como medida da associação espacial. • Por outro lado, muitas vezes é necessário examinar padrões numa escala maior. • Neste caso, é preciso utilizar indicadores locais de associação espacial que possam ser associados a diferentes localizações de uma variável distribuída espacialmente. • A utilização destes indicadores em conjunto com os indicadores globais, refinam nosso conhecimento sobre o processos que dão origem a dependência espacial.
Introdução • Índices locais (LISA): – Permitem avaliar diferentes regimes espaciais existentes na área de estudo. – Medem a associação espacial entre uma observação i e sua vizinhança. – Requisitos (Anselin) • A soma dos índices locais deve ser proporcional ao índice global. • Indicar a significância da associação espacial para cada observação.
Indicadores Locais de Associação Espacial (LISA) • Os indicadores locais de associação espacial, produzem um valor específico para cada objeto. • Isto acarreta a identificação de: – “Clusters”: objetos com valores de atributos semelhantes, – “Outliers”: objetos anómalos, – A presença de mais de um regime espacial. • Tem que atender a dois objetivos: – Permitir a identificação de padrões de associação espacial significativos; – Ser uma decomposição do índice global de associação espacial.
Índice local de Moran • Formulação:
Indicadores Locais de Associação Espacial (LISA) • Indicadores locais Ii de Moran (Anselin, 1996) • Indicadores locais Gi e Gi * (Getis e Ord, 1992) • O indicador local de Moran Ii é assim definido: Ii > 0 “clusters” de valores similares (altos ou baixos). Ii < 0 “clusters” de valores distintos (Ex: uma localização com valores altos rodeada por uma vizinhança de valores baixos). • Normalizando as variáveis o indicador reduz-se a:
Indicadores Locais de Associação Espacial (LISA) • De forma similiar aos indicadores globais, a significância do índice local de Moran (Ii) deve ser avaliado, utilizando hipótese de normalidade ou simulação de distribuição por permutação aleatória nos valores dos atributos (Anselin, 1995). • Uma vez determinada a significância estatística de Moran (Ii) é muito útil gerar um mapa indicando as regiões que apresentam correlação local significativamente diferente do resto dos dados. • Este mapa é denominado por Anselin (1995) de “LISA MAP”. • Na geração do LISA MAP, os índices locais Ii são classificados como: – não significantes
Indicadores Locais de Associação Espacial (LISA) • Os indicadores locais Gi e Gi * (Getis e Ord, 1992): onde: – wij valor na matriz de proximidade para região i com a região j em função da distância. – xi e xj são os valores dos atributos considerados nas áreas i e j. – d é distância entre pontos – n o número de áreas (polígonos) • NOTA: a estatística Gi, inclui no numerador a soma de todos os valores de
Indicadores Locais de Associação Espacial (LISA) • Os indicadores locais Gi e Gi * (Getis e Ord, 1992): • onde: – wij valor na matriz de proximidade para região i com a região j em função da distância. – xi e xj são os valores dos atributos considerados nas áreas i e j. – d é distância entre pontos – n o número de áreas (polígonos)
Indicadores Locais de Autocorrelação Espacial não signif. 95% sign. 99% sign. • “Bolsões” de exclusão/inclusão social em São Paulo
Indicadores Locais de Associação Espacial (LISA) • Uma outra forma de análise é através do mapa denominado “Moran Map” (Anselin, 1999). Neste caso, os índices locais Ii são associados ao diagra-ma de espalhamento de Moran. Nota: este resultado apresenta somente as regiões para os quais os valores de Ii , foram considerados significantes (com intervalo >95%). % Idosos não significantes Q 1 [HH] Q 2 [LL]
- Uma escola apresentava no final do ano o seguinte quadro
- Anlise swot
- Mens rea actus reus
- Cómo se escribe 15 enteros 204 milésimos
- Partes da eucaristia
- Te invitamos a ser parte o hacer parte
- Este parte aquele parte
- Estrutura de dados
- Diagrama de fluxo de dados
- Estrutura de dados tipos
- Topologia estrela estendida
- Final inesperado de dados asn1
- Se tivermos 100 flores quantas dezenas teremos
- Sigsif base de dados
- Os dados x e y que faltam no quadro são
- Tipos abstratos de dados
- Uel as bolsas termicas consistem
- Uml banco de dados
- Instrumento de coleta de dados questionário
- Mapeamento mer
- Inequações com parenteses
- Dados referenciais
- Integridade referencial de dados
- Dtraduc
- Interface de dados
- Banco de dados
- Dependência funcional
- K]
- Como calcular os quartis
- Banco de dados em rh
- A condensação de grandes massas de dados
- Dados cimentacion
- Quantas possibilidades existem para
- Modelagem de dados
- Análise multivariada de dados hair
- Estrutura de dados
- Quais dados
- Korth silberschatz e sudarshan descrevem que na
- Estatística dados agrupados
- Uno de los jovenes ha decidido mostrar a sus compañeros
- Simave banco de itens 2021
- Banco de dados
- Banco de dados ii
- Fila estrutura de dados
- Interface de dados
- Banco de dados e sistemas de informações de rh
- Jose paulo antonio estao jogando