GEOSTATYSTYKA I ANALIZA PRZESTRZENNA Wykad dla III roku

  • Slides: 69
Download presentation
GEOSTATYSTYKA I ANALIZA PRZESTRZENNA Wykład dla III roku Geografii specjalność - geoinformacja Alfred Stach

GEOSTATYSTYKA I ANALIZA PRZESTRZENNA Wykład dla III roku Geografii specjalność - geoinformacja Alfred Stach Instytut Geoekologii i Geoinformacji Wydział Nauk Geograficznych i Geologicznych UAM

Semiwariogram empiryczny a Semiwariogram empiryczny potrzeby estymacji jest: • nieciągły (dyskretny) • chaotyczny

Semiwariogram empiryczny a Semiwariogram empiryczny potrzeby estymacji jest: • nieciągły (dyskretny) • chaotyczny

Wymagania algorytmów estymacji i symulacji • Wszystkie geostatystyczne algorytmy estymacji i symulacji przestrzennej wymagają

Wymagania algorytmów estymacji i symulacji • Wszystkie geostatystyczne algorytmy estymacji i symulacji przestrzennej wymagają podania w matematycznej (parametrycznej) formie modelu struktury przestrzennej analizowanej cechy • Nie mogą to być po prostu wartości empirycznych (to jest wyliczonych z danych pomiarowych) miar struktury przestrzennej, jak kowariogram, korelogram czy semiwariogram.

Wymagania algorytmów estymacji i symulacji • W macierzach krigingowych dla każdego oczka siatki interpolacyjnej

Wymagania algorytmów estymacji i symulacji • W macierzach krigingowych dla każdego oczka siatki interpolacyjnej potrzebne są wartości kowariancji pomiędzy danymi pomiarowymi znajdującymi się w sąsiedztwie szukania (ang. data covariances) oraz kowariancji danych do lokalizacji estymowanej nieznanej (ang. data-to -unknown covariances). • Oznacza to, że muszą one być możliwe do określenia dla dowolnej kombinacji odległości i kierunku. • Wszystkie zaś empiryczne miary autokorelacji przestrzennej są dyskretne, czyli nieciągłe, obliczane są bowiem jako średnie przedziałowe (odstępy odległości i sektory kierunków). • W estymacjach potrzebne są też często wartości kowariancji dla odległości i kierunków, dla których nie ma danych empirycznych. • Nie bywa jednak stosowane, wydawałoby się najprostsze, rozwiązanie, to jest interpolacja i ekstrapolacja kowariancji empirycznych.

Wymagania algorytmów estymacji i symulacji • • • Empiryczne miary struktury przestrzennej stanowią statystyki

Wymagania algorytmów estymacji i symulacji • • • Empiryczne miary struktury przestrzennej stanowią statystyki obliczane z próby i jako takie są tylko przybliżeniem relacji przestrzennych w całej populacji. Ich wiarygodność jest uzależniona z jednej strony od wielkości i reprezentatywności próby, a z drugiej – od skali zmienności analizowanej cechy Zawsze dochodzi jednak czynnik jakim są nieuniknione błędy, zarówno pomiaru cechy, jak i określenia lokalizacji stanowiska, gdzie pomiar został dokonany. Zazwyczaj analizowane są próby stanowiące milionowe, miliardowe lub nawet mniejsze części całej populacji , a zalecenie ich losowości często nie jest w pełni spełnione. Wszystkie wymienione czynniki, a także czułość stosowanych zazwyczaj miar struktury przestrzennej na naturalnie występujące wartości anomalne powoduje, że ich wykresy często są chaotyczne i nie odzwierciedlają wiarygodnie stosunków istniejących w całej zbiorowości. Matematyczny model może zredukować znaczenie tych wad, wygładzając chaotyczne fluktuacje danych empirycznych.

Kryterium połowicznej pozytywnej określoności (ang. positive semidefinite) • Estymowane lub symulowane wartości są w

Kryterium połowicznej pozytywnej określoności (ang. positive semidefinite) • Estymowane lub symulowane wartości są w geostatystyce traktowane jako zmienne losowe będące liniową kombinacją innych znanych zmiennych losowych. • Wariancja zaś jakiejkolwiek liniowej kombinacji Y zmiennych losowych Z(u ), u A, jest wówczas liniową kombinacją wartości kowariancji owych zmiennych i musi nieujemna (ang. non-negative) dla jakiejkolwiek z wybranych n lokalizacji u A i dla jakiejkolwiek wagi • Spełnienie tego warunku jest możliwe tylko przy zastosowaniu takich funkcji kowariancji C(h), nieparametrycznych czy też parametrycznych, które są pozytywnie połowicznie określone.

Kryterium połowicznej pozytywnej określoności (ang. positive semidefinite) • Stosowanie interpolowanych / ekstrapolowanych wartości empirycznych

Kryterium połowicznej pozytywnej określoności (ang. positive semidefinite) • Stosowanie interpolowanych / ekstrapolowanych wartości empirycznych miar struktury przestrzennej nigdy nie gwarantuje, że obliczenia estymacji / symulacji dadzą jakikolwiek wynik. • Gwarancję taką można mieć jedynie przy zastosowaniu modelu matematycznego o takiej postaci, który jest z góry pozytywnie połowicznie określony. • Modele takie określa się jako dozwolone (ang. permissible).

Model nuggetowy (losowy) Gaussowska symulacja bezwarunkowa dla zmiennej o średniej 0 i wariancji nuggetowej

Model nuggetowy (losowy) Gaussowska symulacja bezwarunkowa dla zmiennej o średniej 0 i wariancji nuggetowej równej 10

Model nuggetowy (losowy) • Zastosowanie modelu nuggetowego oznacza w praktyce stwierdzenie braku autokorelacji zjawiska.

Model nuggetowy (losowy) • Zastosowanie modelu nuggetowego oznacza w praktyce stwierdzenie braku autokorelacji zjawiska. • Wariancja procesu jest stała dla każdej odległości większej od zera. Ponieważ większość parametrów środowiskowych jest w jakiejś skali przestrzennej ciągłe, konieczność użycia tego modelu oznacza zazwyczaj, że odstęp próbkowania był większy niż zasięg autokorelacji. • Inną możliwość stwarza istnienie zjawiska w 100% losowego, nieciągłego, którego charakterystyki zmieniają gwałtownie przy przejściu z jednego punktu do drugiego. Obrazem symulacji bezwarunkowej przy użyciu tego modelu jest, zgodnie z terminologią stosowaną w analizie serii czasowych, „biały szum”, podobny do tego co jest obserwowane na ekranie telewizora (lampy katodowej), do którego nie dociera żaden sygnał

Model sferyczny o zasięgu a Gaussowska symulacja bezwarunkowa dla zmiennej o średniej 0 i

Model sferyczny o zasięgu a Gaussowska symulacja bezwarunkowa dla zmiennej o średniej 0 i zasięgu rzeczywistym (a) równym 10 i wariancji progowej równej 10

Model sferyczny • Model sferyczny może być stosowany w 1, 2 i 3 wymiarach,

Model sferyczny • Model sferyczny może być stosowany w 1, 2 i 3 wymiarach, i jest jednym z najczęściej stosowanych w geostatystyce do charakterystyki struktury przestrzennej. • Daje on reprezentację cech ciągłych, które mają podobną rozciągłość, a ich zmienność ma charakter przeplatających się nieregularnych płatów z wysokimi i niskimi wartościami. Średnia średnica owych płatów jest reprezentowana przez zasięg modelu. • Model sferyczny ma w początkowym odcinku charakter funkcji liniowej o nachyleniu 3 C/2 a.

Model wykładniczy o zasięgu praktycznym a Gaussowska symulacja bezwarunkowa dla zmiennej o średniej 0

Model wykładniczy o zasięgu praktycznym a Gaussowska symulacja bezwarunkowa dla zmiennej o średniej 0 i zasięgu praktycznym (a) równym 10 i wariancji progowej równej 10

Model wykładniczy • • • Jest podobnie często wykorzystywany jak model sferyczny. Funkcja ta

Model wykładniczy • • • Jest podobnie często wykorzystywany jak model sferyczny. Funkcja ta osiąga wariancję progową asymptotycznie i dlatego nie ma skończonego zasięgu. Zamiast niego podawany jest tak zwany zasięg „praktyczny” lub „efektywny”, zdefiniowany jako odległość na jakiej model osiąga 95% wartości wariancji progowej. Model wykładniczy ma również liniowy charakter w fazie początkowej, ale o większym nachyleniu niż w przypadku sferycznego: C/a. Funkcja ta odgrywa bardzo ważną rolę teoretyczną. Stanowi bowiem istotę losowości w ujęciu przestrzennym. Jest to semiwariogram procesów autoregresyjnych pierwszego rzędu i procesów Markowa. Można się spodziewać semiwariogramu wykładniczego wówczas, kiedy głównym źródłem zmienności cechy jest występowanie odmiennych typów systemów, a granice między typami występują losowo zgodnie z procesem Poissona. Przykładem może być sytuacja, kiedy zmienność przestrzenna pewnej cechy gleb, na przykład odczynu, jest uwarunkowana głównie różnicami pomiędzy typami gleb. Inaczej mówiąc, jest to semiwariogram cech ciągłych, których struktury mają losowy zasięg.

Model gaussowski o zasięgu praktycznym a Gaussowska symulacja bezwarunkowa dla zmiennej o średniej 0

Model gaussowski o zasięgu praktycznym a Gaussowska symulacja bezwarunkowa dla zmiennej o średniej 0 i zasięgu praktycznym (a) równym 10 i wariancji progowej równej 10

Model gaussowski … • również osiąga poziom wariancji progowej asymptotycznie, dlatego tak jak w

Model gaussowski … • również osiąga poziom wariancji progowej asymptotycznie, dlatego tak jak w poprzednim przypadku, zasięg praktyczny definiowany jest jako odległość dla której wartość semiwariancji wyliczona z modelu osiąga 95% wariancji progowej. • Model gaussowski odróżnia się od dwóch wymienionych poprzednio przede wszystkim parabolicznym kształtem w początkowym odcinku. Oznacza to, że „dotyka” on osi z zerowym nachyleniem. Stanowi to granicę zmienności losowej, przy której w rzeczywistości istnieje wartość stała i podwójnie różniczkowalna. • Model ten ze względu na swój deterministyczny charakter daje w wielu przypadkach nierealistyczne wyniki estymacji i zazwyczaj nie może być stosowany samodzielnie. • Jego użycie jest czasami uzasadnione przy analizie przestrzennej i prognozowaniu parametrów o bardzo regularnej i łagodnej zmienności przestrzennej, na przykład poziomu wód gruntowych w obszarach o mało zróżnicowanej rzeźbie i jednolitej budowie geologicznej.

Model liniowy z wariancją progową o zasięgu rzeczywistym a Gaussowska symulacja bezwarunkowa dla zmiennej

Model liniowy z wariancją progową o zasięgu rzeczywistym a Gaussowska symulacja bezwarunkowa dla zmiennej o średniej 0 i zasięgu rzeczywistym (a) równym 10 i wariancji progowej równej 10

Model potęgowy

Model potęgowy

Model potęgowy • Funkcja potęgowa rośnie w nieskończoność, nie ma zatem zarówno zasięgu, ani

Model potęgowy • Funkcja potęgowa rośnie w nieskończoność, nie ma zatem zarówno zasięgu, ani progu. Tego typu modele nazywa się w geostatystyce nieograniczonymi (ang. unbounded). • Interpretuje się jako reprezentację procesu losowego mającego charakter ruchów Browna. Przyjmując dla uproszczenia ruch cząsteczki w jednym wymiarze, jej prędkość lub moment pędu w położeniu x + h zależy od jej prędkości lub momentu pędu w bezpośrednio poprzednim bliskim położeniu x. Relację tą można zapisać równaniem: • gdzie to niezależne, losowe odchylenie gaussowskie, a to parametr. W najprostszym przypadku = 1, a wariogram procesu wygląda wówczas następująco:

Model potęgowy • Jeśli wykładnik k w równaniu wynosi 1, to wówczas mamy do

Model potęgowy • Jeśli wykładnik k w równaniu wynosi 1, to wówczas mamy do czynienia z modelem liniowym, gdzie gdy. Nazywany jest on często modelem ścieżki losowej (ang. random walk model). • Przy typowych ruchach Browna składnik jest dla każdego kroku niezależny. Jeśli jednak są przestrzennie skorelowane, to ślad ruchu cząsteczki jest bardziej „gładki” niż w klasycznym ruchu Browna. Wówczas to wykładnik k jest większy od 1, a krzywa wklęsła. • Z drugiej strony, kiedy odchylenia są odwrotnie (ujemnie) skorelowane, wówczas ścieżka ruchu jest bardziej chaotyczna. Wykładnik k z równania jest wtedy mniejszy od 1, a krzywa wariogramu wypukła. • Kiedy są idealnie skorelowane wówczas k = 2, a ślad ruchu cząsteczki jest płynny (gładki), co oznacza, że nie ma już charakteru losowego. W sytuacji gdy k 0 chaotyczność ruchu rośnie aż do poziomu białego szumu, którego obrazem jest model nuggetowy.

Porównanie kształtu najczęściej wykorzystywanych modeli

Porównanie kształtu najczęściej wykorzystywanych modeli

Symulacja warunkowa: zmienna b 1_03 b różne modele struktury – te same parametry (zasięg,

Symulacja warunkowa: zmienna b 1_03 b różne modele struktury – te same parametry (zasięg, wariancja progowa)

Inne, rzadziej stosowane, matematyczne modele struktury przestrzennej: cubic

Inne, rzadziej stosowane, matematyczne modele struktury przestrzennej: cubic

Inne, rzadziej stosowane, matematyczne modele struktury przestrzennej: cardinal sine

Inne, rzadziej stosowane, matematyczne modele struktury przestrzennej: cardinal sine

Inne, rzadziej stosowane, matematyczne modele struktury przestrzennej: stable

Inne, rzadziej stosowane, matematyczne modele struktury przestrzennej: stable

Inne, rzadziej stosowane, matematyczne modele struktury przestrzennej: gamma

Inne, rzadziej stosowane, matematyczne modele struktury przestrzennej: gamma

Liniowy model regionalizacji • W wielu sytuacjach, aby odwzorować dokładnie kształt semiwariogramu empirycznego konieczne

Liniowy model regionalizacji • W wielu sytuacjach, aby odwzorować dokładnie kształt semiwariogramu empirycznego konieczne jest połączenie dwóch, lub większej ilości modeli podstawowych g(h). • Nie wszystkie kombinacje dopuszczalnych modeli dają w efekcie funkcję dopuszczalną, to znaczy z nieujemną wariancją. • Najprostszym sposobem utworzenia modelu dopuszczalnego jest stworzenie najpierw funkcji losowej. Semiwariogram takiej funkcji jest z definicji dopuszczalny

Liniowy model regionalizacji • Praktycznie rzecz biorąc konieczne jest spełnienie dwóch warunków tak zwanego

Liniowy model regionalizacji • Praktycznie rzecz biorąc konieczne jest spełnienie dwóch warunków tak zwanego liniowego modelu regionalizacji (ang. linear regionalisation model): – – wszystkie użyte w modelu złożonym podstawowe funkcje gl(h) muszą być dopuszczalne, wariancja progowa bl każdego podstawowego modelu semiwariogramu musi być dodatnia, a wówczas: Model złożony (h) jest w takiej sytuacji wyrażony jako pozytywna liniowa kombinacja podstawowych modeli semiwariogramów gl(h). W literaturze przedmiotu popularna jest jego także alternatywna nazwa: „ nested model” czyli model zagnieżdżony.

Liniowy model regionalizacji

Liniowy model regionalizacji

Liniowy model regionalizacji – zmienna b 1_03 b

Liniowy model regionalizacji – zmienna b 1_03 b

Liniowy model regionalizacji – zmienna b 1_03 b

Liniowy model regionalizacji – zmienna b 1_03 b

Model zmiennej b 1_03 b - anizotropia Powierzchnia modelu semiwariogramu bezkierunkowego (izotropowego) Powierzchnia semiwariogramu

Model zmiennej b 1_03 b - anizotropia Powierzchnia modelu semiwariogramu bezkierunkowego (izotropowego) Powierzchnia semiwariogramu empirycznego

Model zmiennej b 1_03 b - anizotropia Powierzchnia modelu semiwariogramu anizotropowego Powierzchnia semiwariogramu empirycznego

Model zmiennej b 1_03 b - anizotropia Powierzchnia modelu semiwariogramu anizotropowego Powierzchnia semiwariogramu empirycznego

Model zmiennej b 1_03 b - anizotropia gamma (h) = 18 + 75 Sph(88)

Model zmiennej b 1_03 b - anizotropia gamma (h) = 18 + 75 Sph(88) + 69 Sph(632) dir(1) = 62°, ani(1) = 1, 6; dir(2) = 306°, ani(2) = 0, 49 325° 55° 10° 280°

Zmienna b 3 n_03 b – anizotropia gamma(h) = 52, 1 + 67, 0

Zmienna b 3 n_03 b – anizotropia gamma(h) = 52, 1 + 67, 0 Sph(104) + 67, 1 Sph(680) dir(1) = 59°, ani(1) = 7, 6 dir(2) = 263°, ani(2) = 0, 44 Powierzchnia semiwariogramu empirycznego

Zmienne b 1 -b 3 n_03 b – anizotropia gamma(h) = 21, 6 +

Zmienne b 1 -b 3 n_03 b – anizotropia gamma(h) = 21, 6 + 54, 4 Sph(97) + 60, 0 Sph(621) dir(1) = 61°, ani(1) = 16, 0 dir(2) = 256°, ani(2) = 0, 42 Powierzchnia semiwariogramu empirycznego

Spitsbergen – zmienna b 1_03 b Powierzchnia rzeczywista Interpolacja – zwykły kriging (OK)

Spitsbergen – zmienna b 1_03 b Powierzchnia rzeczywista Interpolacja – zwykły kriging (OK)

Spitsbergen – zmienna b 1_03 b Powierzchnia rzeczywista Błędy geometryczne interpolacji OK

Spitsbergen – zmienna b 1_03 b Powierzchnia rzeczywista Błędy geometryczne interpolacji OK

Spitsbergen – zmienna b 1_03 b Interpolacja co. OK z wykorzystaniem danych ilościowych Powierzchnia

Spitsbergen – zmienna b 1_03 b Interpolacja co. OK z wykorzystaniem danych ilościowych Powierzchnia rzeczywista skorelowanych (dodatkowe 100 punktów)

Spitsbergen – zmienna b 1_03 b Powierzchnia rzeczywista Błędy geometryczne interpolacji co. OK

Spitsbergen – zmienna b 1_03 b Powierzchnia rzeczywista Błędy geometryczne interpolacji co. OK

Podstawowe zasady przed tworzeniem liniowego modelu koregionalizacji 1. Semiwariogramy i kros semiwariogramy empiryczne będące

Podstawowe zasady przed tworzeniem liniowego modelu koregionalizacji 1. Semiwariogramy i kros semiwariogramy empiryczne będące podstawą szacowania LCM muszą być obliczane dla tej samej ilości i wielkości odstępów i dla tych samych kierunków. 2. Sporządzenie LCM dla Nv cech wymaga jednoczesnego modelowania Nv (Nv+1)/2 semiwariogramów i kros semiwariogramów. 3. Najwyższą, decydującą wagę przy podejmowaniu decyzji o postaci LCM ma forma semiwariogramu zmiennej pierwotnej, czyli tej, która ma być estymowana.

Liniowy model koregionalizacji (LCM) LCM jest zdefiniowany jako zbiór Nv modeli semiwariogramów i kros

Liniowy model koregionalizacji (LCM) LCM jest zdefiniowany jako zbiór Nv modeli semiwariogramów i kros semiwariogramów ij(h), takich że: gdzie każda funkcja gl(h) jest dopuszczalnym modelem semiwariogramu, i (L+1) macierzy współczynników stanowiących sill lub nachylenie modelu gl(h) są wszystkie połowicznie pozytywnie określone.

Kryterium połowicznej pozytywnej określoności macierzy (positive semi-definite) Symetryczna macierz jest połowicznie pozytywnie określona jeśli

Kryterium połowicznej pozytywnej określoności macierzy (positive semi-definite) Symetryczna macierz jest połowicznie pozytywnie określona jeśli jej wyznacznik oraz wszystkie jej główne podwyznaczniki nie są ujemne. Przykładowy liniowy model koregionalizacji dla Nv=3: Każda macierz koregionalizacji Bl jest połowicznie określona pozytywnie jeśli spełnione jest następujących siedem nierównosci

Kryterium połowicznej pozytywnej określoności macierzy (positive semi-definite) • Wszystkie elementy przekątnej nie są negatywne:

Kryterium połowicznej pozytywnej określoności macierzy (positive semi-definite) • Wszystkie elementy przekątnej nie są negatywne: • Wszystkie główne podwyznaczniki stopnia 2 nie są negatywne:

Kryterium połowicznej pozytywnej określoności macierzy (positive semi-definite) • Wyznacznik stopnia 3 nie jest negatywny:

Kryterium połowicznej pozytywnej określoności macierzy (positive semi-definite) • Wyznacznik stopnia 3 nie jest negatywny:

Pojęcie struktura oznacza: Podstawowe zasady w trakcie tworzeniem (a) typ modelu, (b) zasięg, liniowego

Pojęcie struktura oznacza: Podstawowe zasady w trakcie tworzeniem (a) typ modelu, (b) zasięg, liniowego modelu koregionalizacji (c) kierunek 1. Każda elementarna struktura pojawiająca się na kros semiwariogramie ij(h) musi istnieć w obu modelach semiwariogramów jednostkowych ii(h) i jj(h). 2. Jeśli elementarna struktura gl(h) nie występuje na semiwariogramie jednostkowym danej zmiennej, to musi być ona nieobecna także na wszystkich kros semiwariogramach zawierających ową zmienną.

Pojęcie struktura oznacza: Podstawowe zasady w trakcie tworzeniem (a) typ modelu, (b) zasięg, liniowego

Pojęcie struktura oznacza: Podstawowe zasady w trakcie tworzeniem (a) typ modelu, (b) zasięg, liniowego modelu koregionalizacji (c) kierunek 3. Każdy model jednostkowego czy też kros semiwariogramu ij(h) nie musi zawierać wszystkich (L + 1) elementarnych struktur. 4. Struktura gl(h) pojawiająca się na obu semiwariogramach jednostkowych ii(h) i jj(h) nie musi być obecna na kros semiwariogramie ij(h) obu zmiennych.

Najlepiej dopasowane modele izotropowe dla cech b 1_03 b i b 3 n_03 b

Najlepiej dopasowane modele izotropowe dla cech b 1_03 b i b 3 n_03 b tworzone jednocześnie zgodnie z zasadami LCM niezależnie b 1_03 b gamma(h) = 18, 0 + 78, 0 Sph(95) + 82, 0 Sph(628) b 3 n_03 b gamma(h) = 50, 0 + 49, 0 Sph(84) + 96, 5 Sph(589) b 1 -b 3 n_03 b gamma(h) = 22, 0 + 52, 8 Sph(150) + 72, 0 Sph(587) b 1_03 b gamma(h) = 19, 63563 + 78, 41449 Sph(95) + 76, 70560 Sph(620) b 3 n_03 b gamma(h) = 54, 82879 + 48, 98145 Sph(95) + 91, 90548 Sph(620) b 1 -b 3 n_03 b gamma(h) = 16, 46937 + 53. 95995 Sph(95) + 77, 51083 Sph(620)

Testowanie kryterium połowicznej pozytywnej określoności macierzy współczynników b 1_03 b gamma(h) = 19, 63563

Testowanie kryterium połowicznej pozytywnej określoności macierzy współczynników b 1_03 b gamma(h) = 19, 63563 + 78, 41449 Sph(95) + 76, 70560 Sph(620) b 3 n_03 b gamma(h) = 54, 82879 + 48, 98145 Sph(95) + 91, 90548 Sph(620) b 1 -b 3 n_03 b gamma(h) = 16, 46937 + 53. 95995 Sph(95) + 77, 51083 Sph(620) Macierz współczynników struktury nuggetowej Macierz współczynników 1 struktury sferycznej Macierz współczynników 2 struktury sferycznej

Testowanie kryterium połowicznej pozytywnej określoności macierzy współczynników • 3 pierwsze nierówności są spełnione ponieważ

Testowanie kryterium połowicznej pozytywnej określoności macierzy współczynników • 3 pierwsze nierówności są spełnione ponieważ wszystkie elementy przekątne każdej macierzy nie są negatywne.

Model „zwykły” a model LCM – b 1_03 b

Model „zwykły” a model LCM – b 1_03 b

Model „zwykły” a model LCM – b 3 n_03 b

Model „zwykły” a model LCM – b 3 n_03 b

Uproszczony model koregionalizacji • LCM jest bardzo skomplikowany; wymaga poszukiwania optymalnego rozwiązania metodą prób

Uproszczony model koregionalizacji • LCM jest bardzo skomplikowany; wymaga poszukiwania optymalnego rozwiązania metodą prób i błędów, albo posiadania oprogramowania wykonującego to zadanie metodą iteracyjną opracowaną na początku lat 90 -tych XX wieku (Goulard, Voltz 1992, program LCMFIT 2) • W ostatnim 15 -leciu opracowano dwa uproszczone modele koregionalizacji szczególnie przydatne do kokrigingu kolokacyjnego (Almeida, Journel 1994, Journel 1998)

Uproszczony model koregionalizacji: model Markowa I (MM 1) • W modelu Markowa I przyjmuje

Uproszczony model koregionalizacji: model Markowa I (MM 1) • W modelu Markowa I przyjmuje się następujące założenie dotyczące kroskorelogramu dwóch zmiennych Z i Y: gdzie z(h) = Cz(h)/Cz(0) jest korelogramem zmiennej pierwotnej, a zy(0) jest współczynnikiem korelacji pomiędzy zmienną pierwotną a wtórną, określonym z par danych obu zmiennych znajdujących się w tej samej lokalizacji {z(ua), y(ua)}

Uproszczony model koregionalizacji: model Markowa I (MM 1) • Do wykonania estymacji metodą kokrigingu

Uproszczony model koregionalizacji: model Markowa I (MM 1) • Do wykonania estymacji metodą kokrigingu przy użyciu modelu 1 Markowa potrzebne są zatem jedynie: – model semiwariancji zmiennej pierwotnej, – współczynnik korelacji liniowej zmiennej pierwotnej z wtórną, – wariancja zmiennej wtórnej. • Model struktury przestrzennej zmiennej wtórnej jest obliczany na podstawie podanych wcześniej wzorów

Uproszczony model koregionalizacji: model Markowa II (MM 2) • W opracowaniach w których dane

Uproszczony model koregionalizacji: model Markowa II (MM 2) • W opracowaniach w których dane zmiennej wtórnej pochodzą z teledetekcji ich liczba przewyższa setki, a nawet tysiące razy ilość danych zmiennej pierwotnej • Zachodzi wówczas „ekranowanie” danych zmiennej pierwotnej przez wtórną, a model zmiennej wtórnej jest łatwiej określić i jest on bardziej statystycznie wiarygodny

Uproszczony model koregionalizacji: model Markowa II (MM 2) • W modelu Markowa II przyjmuje

Uproszczony model koregionalizacji: model Markowa II (MM 2) • W modelu Markowa II przyjmuje się następujące założenie dotyczące kroskorelogramu dwóch zmiennych: gdzie y(h) = Cy(h)/Cy(0) jest korelogramem zmiennej wtórnej, a zy(0) jest współczynnikiem korelacji pomiędzy zmienną pierwotną a wtórną określonym z par danych obu zmiennych znajdujących się w tej samej lokalizacji {z 1(ua), y 2(ua)}

Uproszczony model koregionalizacji: model Markova II (MM 2) • Do wykonania estymacji metodą kokrigingu

Uproszczony model koregionalizacji: model Markova II (MM 2) • Do wykonania estymacji metodą kokrigingu przy użyciu modelu 2 Markowa potrzebne są zatem jedynie: – model semiwariancji zmiennej wtórnej, – model semiwariancji zmiennej pierwotnej, – współczynnik korelacji liniowej zmiennej pierwotnej z wtórną, • Ponieważ modele struktury przestrzennej zmiennej pierwotnej i wtórnej muszą być spójne z ich kroskorelogramem modelowanie dla zmiennej pierwotnej powinno być wykonywane przy pomocy liniowej kombinacji modelu zmiennej wtórnej i jakiegokolwiek innego dopuszczalnego modelu R(h):

„Techniczne” aspekty budowy modeli struktury przestrzennej • Modelowanie matematyczne struktury przestrzennej nie jest, jakby

„Techniczne” aspekty budowy modeli struktury przestrzennej • Modelowanie matematyczne struktury przestrzennej nie jest, jakby się wydawało, nawet przy aktualnym poziomie mocy obliczeniowej komputerów osobistych, zagadnieniem łatwym. • Wręcz przeciwnie, automatyczne algorytmy zdają egzamin jedynie przy izotropowych, i to raczej najprostszych przypadkach. Próby stworzenie takich uniwersalnych procedur podejmowane są od ponad 30 lat bez większego powodzenia. • W modułach modelowania struktury przestrzennej w większości dostępnych programów geostatystycznych dokonuje się tego na drodze manualnej lub półautomatycznej, przy czym i w tym drugim przypadku operator ma całkowitą kontrolę nad przebiegiem obliczeń, łącznie z możliwością całkowitego wyłączenia „automatyki” i / albo „ręcznej” modyfikacji wyników.

„Techniczne” aspekty budowy modeli struktury przestrzennej • Tam gdzie stosuje się wariant w 100%

„Techniczne” aspekty budowy modeli struktury przestrzennej • Tam gdzie stosuje się wariant w 100% manualny, operator obserwując na ekranie wykres semiwariogramu empirycznego (albo innej miary struktury przestrzennej), wybiera podstawowe składowe modelu: ilość, typ i następstwo struktur elementarnych, a następnie metodą prób i błędów optymalizuje ich parametry: zasięg, wariancje cząstkowe, kierunek i stopień anizotropii. • W procedurach półautomatycznych drugi z wymienionych wyżej etapów, to jest optymalizacja parametrów, dokonywana jest w mniejszym lub większym stopniu automatycznie. Jeśli operator nie jest zadowolony z końcowego wyniku, może dokonać jego modyfikacji, cały czas obserwując efekt swoich działań na ekranowym wykresie.

„Techniczne” aspekty budowy modeli struktury przestrzennej • Ten element procedury geostatystycznej jest bardzo często

„Techniczne” aspekty budowy modeli struktury przestrzennej • Ten element procedury geostatystycznej jest bardzo często krytykowany ze względu na subiektywizm. • Bywa jednak, że może to doprowadzić do radykalnego polepszenia wyników estymacji lub symulacji. Związane jest to bowiem z możliwością uwzględnienia wiedzy a priori, wiedzy eksperta, o naturze zmienności przestrzennej zjawiska, które wygenerowało obserwowany rozkład analizowanej cechy. Dane pomiarowe ze względu na małą próbę, czy błędy pomiarowe, mogą tych relacji nie wykazywać. • Kiedy na przykład zadaniem jest estymacja skażenia gleb wokół emitora, jakim może być komin elektrowni cieplnej, wiemy że musi ona wykazywać anizotropię o kierunku i rozmiarach uzależnionych od lokalnego reżimu wiatrów. Wiedzę tą możemy w trakcie modelowania wykorzystać, „wymuszając” uwzględnienie anizotropii.

„Techniczne” aspekty budowy modeli struktury przestrzennej • Zarówno przy ręcznym, jak i automatycznym modelowaniu

„Techniczne” aspekty budowy modeli struktury przestrzennej • Zarówno przy ręcznym, jak i automatycznym modelowaniu struktury przestrzennej potrzebne jest obiektywne kryterium jakości dopasowania modelu do danych empirycznych. • W pierwszym przypadku ma ono charakter pomocniczy. Operator może, ale nie musi, opierając się na obliczanych po każdej wprowadzonej przez niego zmianie w parametrach modelu, wartościach owego kryterium, dążyć do optymalizacji wyniku. • Optymalizacja automatyczna musi być dokonywana w odniesieniu do precyzyjnie zdefiniowanego jej celu, którym zazwyczaj jest minimalizacja albo maksymalizacja wartości jakiejś funkcji. Konieczne jest również podanie warunku zakończenia obliczeń – zazwyczaj dokonywanych metodą kolejnych przybliżeń (iteracyjnie).

„Techniczne” aspekty budowy modeli struktury przestrzennej • Najczęściej w geostatystyce stosowanym kryterium dopasowania modelu

„Techniczne” aspekty budowy modeli struktury przestrzennej • Najczęściej w geostatystyce stosowanym kryterium dopasowania modelu do danych empirycznych jest Ważona Suma Kwadratów (ang. Weighted Sum of Squares, WSS) różnic pomiędzy eksperymentalnymi , a modelowanymi (hk) wartościami semiwariogramu: • Waga przypisana do każdego odstępu hk jest zazwyczaj proporcjonalna do liczby N(hk) par danych, które są uwzględniane w obliczeniu wartości semiwariogramu empirycznego. Podstawą takiego rozwiązania jest założenie, że wiarygodność semiwariogramu empirycznego wzrasta wraz z wielkością próby. Nie jest to jednakże jedyny wariant wagi w kryterium WSS.

„Techniczne” aspekty budowy modeli struktury przestrzennej • Inny, równie często stosowany wariant wagi, przywiązuje

„Techniczne” aspekty budowy modeli struktury przestrzennej • Inny, równie często stosowany wariant wagi, przywiązuje większe znaczenie do semiwariogramów obliczanych dla pierwszych odstępów, poprzez podzielenie ilości par danych przez podniesioną do kwadratu wartość modelu: • W trzecim wariancie wiarygodność statystyczną wartości semiwariogramu empirycznego ocenia się nie poprzez ilość par danych, która posłużyła do jego obliczenia, ale poprzez zróżnicowanie indywidualnych wartości różnic obliczonych dla każdej pary: małe zróżnicowanie – duża wiarygodność. Waga WSS jest wówczas odwrotnie proporcjonalna do odchylenia standardowego indywidualnych wartości różnic.

„Techniczne” aspekty budowy modeli struktury przestrzennej • • Na koniec omawiania tego zagadnienia należy

„Techniczne” aspekty budowy modeli struktury przestrzennej • • Na koniec omawiania tego zagadnienia należy wspomnieć, że metoda WSS, jakkolwiek najbardziej popularna, nie jest jedynym rozwiązaniem problemu automatycznego dopasowania parametrów modeli struktury przestrzennej. Stosowane są również algorytmy tzw. maksymalnej wiarygodności (ang. maximum likelihood, ML ) lub ograniczonej ML (ang. restricted ML, REML), gdzie model tworzony jest bezpośrednio na podstawie surowych wartości różnic. Ponieważ jednak bazują one na założeniu rozkładu normalnego, ich oszacowania są często obciążone. Obliczenia wykonywane metodami ML i REML są także stosunkowo wolne przy dużych próbach. Jakość estymacji zależy głównie od poprawnego określenia „kształtu” modelu u jego początku, natomiast semiwariancje empiryczne pierwszych odstępów obliczane są zazwyczaj na podstawie znacznie mniejszej liczby par punktów niż dalsze.

A jak to się robi w pakiecie Variowin (program Model) • IGF to wskaźnik

A jak to się robi w pakiecie Variowin (program Model) • IGF to wskaźnik bezwymiarowy. • Im jego wartość jest mniejsza tym jakość dopasowania jest lepsza. • Ponieważ jest także miarą standaryzowaną umożliwia porównywanie jakości dopasowania różnych modeli do różnych danych eksperymentalnych. N – liczba kierunkowych wariogramów* użytych w modelu n(k) – liczba odstępów dla k-tego wariogramu P(i) – liczba par dla odstępu i h(i) – średnia odległość dla odstępu i hmax(k) – maksymalna odległość dla ktego wariogramu (i) – wartość wariogramu eksperymentalnego dla odstępu i *(i) – wartość modelu wariogramu dla średniej odległości odstępu i 2 – wariancja danych dla semiwariogramu i kowariancji, maksymalna wartość danych dla madogramu, 1 dla korelogramu i standaryzowanego semiwariogramu

Optymalizacja modelu struktury przestrzennej • Z półautomatycznym i ręcznym konstruowaniem złożonego (zagnieżdżonego) modelu struktury

Optymalizacja modelu struktury przestrzennej • Z półautomatycznym i ręcznym konstruowaniem złożonego (zagnieżdżonego) modelu struktury przestrzennej wiąże się jeszcze jeden istotny problem – niepewności co do wyboru optymalnej liczby i kombinacji funkcji podstawowych (elementarnych). • Z jednej strony model powinien być jak najlepiej dopasowany do danych eksperymentalnych, z drugiej zaś wiadomo, że ich niewielkie fluktuacje mogą być zupełnie przypadkowe. • Zagadnienie to można rozpatrywać w dwóch kontekstach. Pierwszy z nich ma charakter optymalizacyjny drugi – praktyczny.

Praktyczne podejście do problemu optymalizacji modelu struktury przestrzennej • Z praktycznego punktu widzenia najlepszym

Praktyczne podejście do problemu optymalizacji modelu struktury przestrzennej • Z praktycznego punktu widzenia najlepszym modelem jest nie ten, który został najlepiej dopasowany do danych obserwacyjnych, ale dający najbardziej dokładną prognozę. • Dlatego też ważnym etapem procedury geostatycznej jest wybór z kilku, jednego optymalnego modelu poprzez procedurę zwaną walidacją. • Polega ona na porównaniu rzeczywistych wartości analizowanej cechy z prognozowanymi na podstawie testowanych modeli. • Wykonuje się to albo metodą „walidacji podzbiorem” albo w sposób uproszczony tzw. „kroswalidacją”

Optymalizacja matematyczna modelu struktury przestrzennej • Optymalizacyjne podejście do zagadnienia budowy złożonego modelu semiwariancji

Optymalizacja matematyczna modelu struktury przestrzennej • Optymalizacyjne podejście do zagadnienia budowy złożonego modelu semiwariancji opiera się idei, że musi istnieć równowaga pomiędzy prostotą modelu, a więc także łatwością wykonywanych na jego podstawie estymacji, a jakością jego dopasowania do danych eksperymentalnych. • Polepszenie modelu poprzez minimalizację kryterium WSS może się dokonywać praktycznie w nieskończoność, jeśli zwiększać się będzie ilość funkcji elementarnych. • Jednakże kolejne komplikowanie jego postaci skutkuje coraz mniejszym przyrostem jakości dopasowania, dlatego ważne byłoby ustalenie kryterium, które umożliwiłoby w obiektywny i powtarzalny sposób zachowanie proporcji między dążeniem do prostoty modelu, a wiernością odwzorowania wyników pomiarów. • Webster i Mc. Bratney (1989) zaproponowali zastosowanie do tego celu kryterium informacyjnego Akaike (ang. Akaike Information Criterion)

Kryterium informacyjne Akaike (AIC) • gdzie: n jest liczbą punktów na wariogramie, p –

Kryterium informacyjne Akaike (AIC) • gdzie: n jest liczbą punktów na wariogramie, p – ilością parametrów modelu, a R stanowi średnią podniesionych do kwadratu różnic pomiędzy wartościami eksperymentalnymi a modelem. Do dalszego etapu procedury geostatystycznej wybiera się ten model, dla którego AIC jest najmniejsze • Fragment wzoru znajdujący się w nawiasie jest stały dla każdego konkretnego semiwariogramu, dlatego można go uprościć do postaci: • Minimalizacja kwadratów odchyleń (WSS) zmniejsza wartość R, lecz jeśli dalsze jego obniżanie dokonuje się jedynie poprzez zwiększanie p, to w pewnym momencie spadek AIC zostaje zatrzymany.