Terleti egyenltlensgi mutatk fldrajzi sszefggselemzsek dr Jeney Lszl
- Slides: 56
Területi egyenlőtlenségi mutatók, földrajzi összefüggés-elemzések dr. Jeney László egyetemi docens jeney@elte. hu Területi és térinformatikai kvantitatív elemzési módszerek I. Regionális és környezeti gazdaságtan mesterszak, levelező 2018/2019, I. félév BCE Geo Intézet
Területi fejlettségi különbségek mérése 2
Területi egyenlőtlenségi vizsgálatok jelentősége n Területi elemzések alapkérdése: egyenlőtlenségek vizsgálata – Mekkorák az egyenlőtlenségek? Nagy vagy kicsi? – Hogyan alakul? Nő vagy csökken? – Mi az oka ezen folyamatoknak? n A népesség és a gazdaság térben egyenlőtlenül helyezkedik el, okai: – Eltérő természetföldrajzi adottságok – Erőforrások szórtsága – Eltérő történelmi fejlődésmenet
Területi különbség és területi egyenlőtlenség n Nem azonosság: 1. Területi különbség, differenciáltság („differentiation”): pusztán térben különböző előfordulás (pl. természetföldrajzi eltérések, területi specializáció) 2. Területi egyenlőtlenség („inequality”): különbségek mentén társadalmi értéktartalom is megjelenik (pl. jövedelmi, egészségügyi eltérések) n Differenciáltsághoz is kötődhet értéktartalom diverzitás, mint egyenlőtlenségi kategória – – – Ökológia: faji sokszínűség Közgazdaságtan: gazdasági tevékenységek sokszínűsége Társadalomkutatás: multikulturalitás (XX. sz. : a „diverzitás százada”)
Kiegyenlítettség ≠ kiegyenlítődés n Állapotjellemzők (statikus szemlélet): mekkora az egyenlőtlenség (nagy vagy kicsi)? – Differenciáltság–kiegyenlítettség n Változás iránya (dinamikus szemlélet): hogyan változik az egyenlőtlenség (növekszik vagy csökken)? – Differenciálódás vagy kiegyenlítődés (utóbbit soha nem éri el teljesen, helyette inkább közeledés, különbségek csökkenése) – Divergencia vagy konvergencia – Polarizáció, tagolódás vagy nivelláció
Területi elemzések legvitatottabb kérdésköre n 1. Vizsgálati különbségek területi egyenlőtlenségek eltérő megítélése Tárgy – Település, járás, megye, régió, nagyrégió – Városok: székhelyek, városok, városias karakterű települések, nagy népességű települések 2. Mérték, mutatószám – Pl. képzettség esetében: írni-olvasni tudók, diplomások, átlagosan elvégzett osztályszám 3. Térségi szint, aggregáltság – Település, városkörzet, megye 4. Egyenlőtlenségi mutató – Range-típusú mutatószámok vagy relatív szórás 5. Időtáv – Rövidebb vagy hosszabb
Különböző területi egyenlőtlenségi mutatók egyenlőtlenségek eltérő alakulása n A népsűrűség területi egyenlőtlenségének hosszú távú alakulása különböző területi egyenlőtlenségi mutatókal Mexikóban (1890 -2000)
Különböző területi szintek egyenlőtlenségek eltérő alakulása Az adóköteles jövedelmek területi egyenlőtlenségeinek változása különböző területi szinteken, Robin Hood index, 1998– 2002
Megoldások a területi egyenlőtlenségi vizsgálatok eltérő eredményeire n Egyidejűleg van jelen a kiegyenlítődés és a differenciálódás – Egyes szférák, térségi szintek polarizálódnak, mások homogenizálódnak n Összetett közelítés, többfajta tesztelés – Többfajta jelzőszám – Többfajta egyenlőtlenségi index – Többfajta térségi szint n Választott közelítés egyértelmű, pontos meghatározása – – n Milyen egyenlőtlenségi mutatót választunk? Milyen térségi szintre vonatkozik a mérés? Mi a vizsgált jelenség? Mi a vizsgálat időtávja? Nem minden közelítés azonos súlyú, fontosságú
Területi egyenlőtlenségi indexek n Sokféle egyenlőtlenségi index, mutatószám létezik – P. B. Coulter (1989): 50 különböző egyenlőtlenségi index n Jellemzőik – – n Monotonitás: nagyobb egyenlőtlenség nagyobb indexérték Nem-negativitás: csak pozitív számok lehetnek Folytonosság: egy intervallumba esnek az értékek Szimmetria: „A” annyira különbözik „B”-től, mint „B” „A”-tól Nem kötődik közvetlenül a térbeliséghez – Területi egyenlőtlenségi indexek többsége nem csak a területi egyenlőtlenségek mérésére használható (pl. társadalmi csoportok, ágazatok közötti egyenlőtlenségekre is) – Csak az eloszlás határozza meg az indexértéket (egyenlőtlenségi mutató azonos akár ellentétes térbeli konfigurációnál is)
Területi egyenlőtlenségek mérésére szolgáló statisztikai eszközök n A területi polarizáltság mérőszámai – Relatív terjedelem/Relatív range (Q) – Duál mutató/Éltető–Frigyes index (D) n Szórás-típusú területi egyenlőtlenségi indexek – Súlyozott relatív szórás (V) n Területi eloszlást mérő egyenlőtlenségi indexek – Hirschman–Herfindahl index (K) – Hoover-index/Krugman-index (H) n Területi egyenlőtlenségek összetettebb mérési módszerei – Gini együttható (G) n n Távolságfüggvények Korrelációs mérőszámok
Melyik területi egyenlőtlenségi indexet használjuk? n Meghatározó: 1. Vizsgálati kérdés 2. Rendelkezésre álló adatbázis 3. Kutató habitusa n Jobb: – Korlátos (normalizált) index: véges értékkészlet (zárt intervallum: szélsőértékekhez viszonyíthatjuk) szórás típusú mutatók hátránya n Sok esetben több index kiszámítása szükséges (egy számítás nem számítás) – Földrajzi (területi) összehasonlítás – Időbeli összehasonlítás – Jelzőszámok közötti öszehasonlítás
A területi polarizáltság mérése: Duál mutató 13
Duál mutató n A területi polarizáltság mérőszámai: – Relatív range, range arány – Duál mutató n Duál mutató – Az adatsor 2 részcsoportja átlagainak hányadosa – Egyszerű, világos tartalom igen elterjedt n Adatsor elemeinek részcsoportokra bontása – Adott adatsor értékei alapján: átlag alatti és feletti értékek (leggyakrabban) – Adott adatsor értékei alapján: csak a meghatározott számú a legnagyobb és a legkisebb értékek (maximum és minimum esetén range arány) – Más adatsor értékei alapján (pl. nyugat–kelet, népességszám) n Jövedelmi egyenlőtlenségekre (átlag feletti és alatti csoport között): Éltető– Frigyes index – Éltető Ödön és Frigyes Ervin magyar statisztikusok írták le, 1968. 14
Duál mutató n n Jele: D Képlete: – Nem fajlagos mutatók esetén – Fajlagos mutatók esetén n Kiszámítása: – Adatsort valamilyen ismérv alapján 2 csoportra kell bontani – Mindkét csoport esetében ki kell számítani az átlagot (fajlagos mutatók esetében a súlyozott átlagokat) – A mutató e 2 csoportátlag hányadosa, ahol a nagyobb érték szerepel a számlálóban n Értékkészlete: 1 < D < ∞ 15
Súlyozatlan duál mutató kiszámításának lépései (nem fajlagos mutatóknál) 1. Vizsgálni kívánt adatsor egy új oszlopba másolása – 2. Adatsor kijelölése – 3. 4. 5. 6. 7. 8. Érdemes a területi egységek neveit is átmásolni Ha mellette szerepel más adatsor is (pl. a területi egységek nevei) akkor az egészet együtt kell kijelölni Adatsor sorba rendezése a vizsgált mutató alapján Adatsor (sima) átlagának kiszámítása (függvényvarázsló: átlag) Érdemes színezéssel elkülöníteni az adatsor átlag feletti és alatti értékeit Ki kell számítani az adatsor átlag feletti értékeinek (sima) átlagát (függvényvarázsló: átlag) Ki kell számítani az adatsor átlag alatti értékeinek (sima) átlagát (függvényvarázsló: átlag) Átlag feletti értékek átlagának az átlag alatti értékek átlagával elosztása 16
Súlyozatlan duál mutató kiszámítása Excelben (+minimális érték esete) A B xa C xa D xb E xb 2 1. régió 24 24 10 10 3 2. régió 4 12 10 10 4 3. régió 0 4 10 10 5 4. régió 12 0 10 10 1 6 átlag 7 átlag feletti értékek átlaga 8 átlag alatti értékek átlaga 9 10 10 =ÁTLAG(C 2: C 5) =ÁTLAG(E 2: E 5) 18 értelmezhetetlen =ÁTLAG(C 2: C 3) 2 értelmezhetetlen =ÁTLAG(C 4: C 5) duál 9 =C 7/C 8 duál 17 értelmezhetetlen
Súlyozott duál mutató kiszámításának lépései (fajlagos mutatóknál) 1. Vizsgálni kívánt adatsor és a hozzá tartozó súly új oszlopokba másolása – 2. Átmásolt adatsorok kijelölése – 3. 4. 5. 6. 7. 8. Érdemes a területi egységek neveit is átmásolni Ha mellette szerepel más adatsor is (pl. a területi egységek nevei) akkor az egészet együtt kell kijelölni Adatsor sorba rendezése a vizsgált mutató alapján Adatsor súlyozott átlagának kiszámítása Érdemes színezéssel elkülöníteni az adatsor átlag feletti és alatti értékeit Ki kell számítani az adatsor súlyozott átlag feletti értékeinek súlyozott átlagát Ki kell számítani az adatsor súlyozott átlag alatti értékeinek súlyozott átlagát Súlyozott átlag feletti értékek súlyozott átlagának a súlyozott átlag alatti értékek súlyozott átlagával elosztása 18
Súlyozott duál mutató kiszámítása Excelben (+ minimális érték esete) A 1 B ya C ya D fa E xa F yb G yb H fb I Xb 2 1. régió 24 24 10 10 1 10 3 2. régió 4 12 10 10 3, 5 35 4 3. régió 0 4 3, 5 14 10 10 4, 5 45 5 4. régió 12 0 4, 5 0 10 10 1 10 összeg/átlag 5 10 50 10 10 100 =E 6/D 6 =SZUM(D 2: D 5) =SZUM(E 2: E 5) 18 2 36 értelmezhetetlen 8 14 értelmezhetetlen 6 7 átlag feletti értékek 8 átlag alatti értékek 9 duál =E 7/D 7 1, 75 =E 8/D 8 10, 29 =C 7/C 8 duál értelmezhetetlen 19
A területi koncentráció mérése: Hirschman–Herfindahl index 20
Területi egyenlőtlenségek mérésére szolgáló statisztikai eszközök n Területi egyenlőtlenségi indexek, leggyakrabban használtak: – A területi polarizáltság mérőszámai n n Relatív terjedelem/Relatív range (Q) Duál mutató/Éltető–Frigyes index (D) – Szórás-típusú területi egyenlőtlenségi indexek n Súlyozott relatív szórás (V) – Területi eloszlást mérő egyenlőtlenségi indexek n n Hirschman–Herfindahl index (K) Hoover-index/Krugman-index (H) – Területi egyenlőtlenségek összetettebb mérési módszerei n n n Gini együttható (G) Távolságfüggvények Korrelációs mérőszámok
Hirschman–Herfindahl index n n n Egy jelenség földrajzi koncentrációjának mérésére használt mutatószám Csak összegezhető (nem fajlagos) mutatóra számítható Képlete – Xi = nem fajlagos mutató i régióban – Σxi = nem fajlagos mutató a teljes régióban n Értékkészlete: 1/n ≤ K ≤ 1 – Minél nagyobb az értéke, annál nagyobb az egyenlőtlenség – Előfordulhat, hogy alacsonyabb területi szinten csökken az értéke n Mértékegysége: nincs
Hirschman–Herfindahl index kiszámításának lépései 1. 2. 3. Összegezzük a vizsgált adatsort Minden térség esetében elosztom az adott térség értékét az előbb kiszámított összeggel (Excel $) Minden térség esetében a kapott hányadosokat négyzetre emelem (Excel jobb oldali Alt+3 együtt, majd 2 = ^2) – 2– 3. lépések egy oszlopban is megoldhatók 4. Az így kapott értékeket összegzem
Hirschman–Herfindahl index kiszámítása Excelben A 1 B C D xi hányados négyzet 2 1. régió 8 0, 4 =B 2/B$6 0, 16 =C 2^2 3 2. régió 4 0, 2 0, 04 4 3. régió 6 0, 3 0, 09 5 4. régió 2 0, 1 0, 01 6 összesen 20 =SZUM(B 2: B 5) 1 7 Hirshman– Herfindahl i. 0, 3 =SZUM(D 2: D 5)
Hirschman–Herfindahl index elméleti maximuma A 1 B C D xi hányados négyzet 2 1. régió 0 0 =B 2/B$6 0 =C 2^2 3 2. régió 0 0 0 4 3. régió 20 1 1 5 4. régió 0 0 0 6 összesen 20 =SZUM(B 2: B 5) 1 7 Hirshman– Herfindahl i. 1 =SZUM(D 2: D 5)
Hirschman–Herfindahl index elméleti minimuma (4 elem esetén) A 1 B C D xi hányados négyzet 2 1. régió 5 0, 25 =B 2/B$6 0, 0625 =C 2^2 3 2. régió 5 0, 25 0, 0625 4 3. régió 5 0, 25 0, 0625 5 4. régió 5 0, 25 0, 0625 6 összesen 20 =SZUM(B 2: B 5) 1 7 Hirshman– Herfindahl i. 0, 25 =SZUM(D 2: D 5)
Területi eloszlások összevetése: Hoover index 27
Hoover index n n Egyik legelterjedtebb, legáltalánosabban használt területi egyenlőtlenségi index Két mennyiségi ismérv területi megoszlásának eltérését méri – Az egyik ismérv, társadalmi-gazdasági jelenség mennyiségének hány százalékát kell a területi egységek között átcsoportosítani ahhoz, hogy területi megoszlása a másik jellemzőével azonos legyen – Területi kutatásokban leggyakrabban a népesség területi eloszlásával vetjük össze más társadalmi-gazdasági ismérvével n n 1941: E. M. Hoover, amerikai agrárközgazdász Használja a földrajz, szociológia, közgazdaságtan, ökológia is
Hoover index n Két nem fajlagos mutató területi megoszlása közötti eltérést mérhetjük vele – Egy fajlagos mutató számlálója és nevezője között is lehet n Képlete: n xi és yi: két megoszlási viszonyszám, melyekre fennállnak – xi = i régió részesedése x nem fajlagos mutatóból – yi = i régió részesedése y nem fajlagos mutatóból az alábbi összefüggések – Σxi = 100 – Σyi = 100 n A mutató szimmetrikus, a két összevetett megoszlás (xi és yi) szerepe, sorrendje felcserélhető Értékkészlete: 0 ≤ H ≤ 100 n Mértékegysége: % n – Minél nagyobb az értéke, annál nagyobb az egyenlőtlenség
Hoover index kiszámításának lépései 1. 2. 3. 4. Mindkét nem fajlagos mutató adatsorának értékeit összegezzük Minden térség esetében kiszámítjuk az adott térség százalékos részesedését az összes mennyiségből (mindkét mutató esetében) Minden térség esetében kivonjuk az egyik mutató szerinti százalékos részesedésből a másik mutató szerinti százalékos részesedést Minden térség esetében az így kapott különbségek abszolút értékét vesszük (ABS) – 2– 4. lépések egy oszlopban is megoldhatók 5. 6. Az abszolút értékeket összegzem A kapott összeg értékét megfelezem
Hoover index kiszámítása Excelben A 1 B C D E F G xi yi xi% yi% xi%–yi% absz 40% =B 2/B$6* 100 40% =C 2/C$6* 100 0% =D 2 -E 2 0% 2 1. régió 8 4 3 2. régió 4 1 20% 10% 10% 4 3. régió 6 3 30% 0% 0% 5 4. régió 2 2 10% 20% – 10% 6 összesen 20 10 100% 0% 20% 7 Hoover index =SZUM( B 2: B 5) =SZUM( C 2: C 5) =ABS(F 2) =SZUM(G 2: G 5) 10% =G 6/2
Hoover index elméleti maximuma A 1 B C D E F G xi yi xi% yi% xi%–yi% absz 60% =B 2/B$6* 100 0% =C 2/C$6* 100 60% =D 2 E 2 60% =ABS(F 2) 2 1. régió 12 0 3 2. régió 8 0 40% 0% 40% 4 3. régió 0 0 0% 0% 5 4. régió 0 10 0% 100% – 100% 6 összesen 20 10 100% 0% 200% 7 Hoover index =SZUM( B 2: B 5) =SZUM( C 2: C 5) =SZUM(G 2: G 5) 100% =G 6/2
Hoover index elméleti minimuma A 1 B C D E F G xi yi xi% yi% xi%–yi% absz 40% =B 2/B$6* 100 40% =C 2/C$6* 100 0% =D 2 -E 2 0% 2 1. régió 8 4 3 2. régió 4 2 20% 0% 0% 4 3. régió 6 3 30% 0% 0% 5 4. régió 2 1 10% 0% 0% 6 összesen 20 10 100% 0% 0% 7 Hoover index =SZUM( B 2: B 5) =SZUM( C 2: C 5) =ABS(F 2) =SZUM(G 2: G 5) 0% =G 6/2
„Pszeudo-egymutatós” egyenlőtlenségi index n Két nem fajlagos mutató területi eloszlása közötti eltérés mérése – Pl. nép-jöv, kisebbség-egész társadalom stb. n Egy fajlagos mutató területi egyenlőtlenségének mérése – Pl. Jöv/fő, kisebbségek aránya
Hoover index használhatósága n Egyik legjobban interpretálható eredményt adja a területi egyenlőtlenségi indexek közül – Értékei 0– 100 között mozognak: a 100 magas, a 0 alacsony érték (szórás-típusú területi egyenlőtlenségi mutatóknak nincs maximuma) – H = 33% az egyik mutató 33 %-át kell a régiók között átcsoportosítani ahhoz, hogy a területi megoszlása megegyezzen a másikéval
Hoover index más neveken n Robin Hood index („Rózsa Sándor” index) n Dinamikus értelmezés (itt lehet az egy évre jutó változást is mérni, ha 2 helyett 2 t-vel osztunk) – Népesség és jövedelem között – Korábbi és későbbi állapotok között n (Településszociológiában Duncan&Duncan házaspár) n Egyes változatoknál nem százalékban fejezzük ki, ekkor értékkészlete: 0 ≤ H ≤ 1 Krugman index (Földrajz és kereskedelem c. könyv, 1993. ) n – Disszimilaritási index: rész–rész viszonylatban – Szegregációs index: rész–egész viszonylatban, vagy rész–többi rész viszonylatban – Ha nem osztjuk el 2 -vel (nehezebben értelmezhető) – 0 ≤ H ≤ 200 (vagy 0 ≤ H ≤ 2)
Hoover index vizsgálati lehetőségei n n Magyarország 2005 jöv-nép megyei szint Egy számítás önmagában általában kevés összehasonlítás kell: – – – Területek között: pl. Szlovákiára is Időbeni állapotok között: pl. 1990 -re is Mutatók között: pl. személygépkocsi és a népesség között is – Területi szinteken (Hoover-index specialitása): pl. települési szinten is
Különböző területi szintek egyenlőtlenségek eltérő alakulása n Az adóköteles jövedelmek területi egyenlőtlenségeinek változása különböző területi szinteken, Robin Hood index, 1998 – 2002
Földrajzi összefüggések elemzése: sztochasztikus módszerek 39
Társadalmi jelenségek együttmozgása n n Földrajzi összefüggések elemzése: sztochasztikus módszerek Tagoltság vizsgálata: szinte sohasem szűkül le egy-egy jelenség (mutatószám) térbeli eloszlásának elemzésére – Már a fajlagos adatok egyenlőtlenségeinek mérésekor is 2 jelenséget kapcsolunk össze n n Térbeli együttmozgások elemzése: kifejezetten területi kölcsönhatások (néha ok-okozati kapcsolatok) is megjelennek Összefüggések mérése: korreláció- és regressziószámítás – Erősség: milyen erős az összefüggés – Irány: egyenes (+) vagy fordított (–) arányosság
Szignifikancia n n n Megbízható (szignifikáns) összefüggés: ha viszonylag nagy elemszámú mintából, hosszú adatsorból számítjuk Erős szignifikancia: megfigyelési egységek körét véletlenszerűen újabbakkal bővítve, nagy valószínűséggel nem változik az összefüggés iránya és szorossága Meghatározza: – Elemszám (1000 vagy 10 területi egységre mérünk) – Kapcsolat szorossági szintje (korreláció absz. 0, 9 vagy 0) n Szignifikancia-tesztek: pl. SPSS
Korreláció 42
Korreláció n n n Jelzőszámok közötti kapcsolat szorosságának meghatározására szolgáló eljárás (egyfajta sajátos egyenlőtlenségi mutató Egy mutatószámmal (r): korrelációs együttható Korreláció típusai területi elemzésekben – Lineáris korreláció azonos megfigyelési egységekre vonatkozó két adatsor között – Autokorreláció – Keresztkorreláció n n Ugyanígy lehet autoregresszió és keresztregresszió is Értékkészlete: – 1 ≤ r ≤ 1 Mértékegysége nincs Súlyozás problémája a korrelációszámításban
A korrelációs-együtthatók értékeinek értelmezése r értéke kapcsolat jellege r=1 Lineáris függvénykapcsolat, egyenes arányosság van a két jellemző között 0, 7 ≤ r < 1 Szoros kapcsolat, egyirányú együttmozgás 0, 3 ≤ r < 0, 7 Közepes erősségű kapcsolat, egyirányú együttmozgás 0 < r < 0, 3 Gyenge kapcsolat, egyirányú együttmozgás r=0 Nincs lineáris kapcsolat, a két jellemző korrelálatlan – 0, 3 < r < 0 Gyenge kapcsolat, ellentétes irányú együttmozgás – 0, 7 < r ≤ – 0, 3 Közepes erősségű kapcsolat, ellentétes irányú együttmozgás – 1 < r ≤ – 0, 7 Szoros kapcsolat, ellentétes irányú együttmozgás r = – 1 Lineáris függvénykapcsolat, fordított arányosság van a két jellemző között
Lineáris korreláció n Lineáris korreláció azonos megfigyelési egységekre vonatkozó két adatsor között – r = corr (xi; yi) n n Egyfajta sajátos egyenlőtlenségi mutató Legismertebb: Pearson-féle lineáris korrelációs együttható – Excel fx= KORREL() – Angol nyelvű Excel fx= CORREL() n Spearman-féle rangkorreláció – Ordinális (sorrendi) adatskála esetén – di: összetartozó rangszámok különbségei
Korrelációs mátrix hagyományos útja n n n f(x) függvényvarázsló segítségével számítható A mátrixban szereplő adatsorok egymás mellé rendezése úgy, hogy üres oszlop és egyéb adat ne legyen benne Mátrix keretének elkészítése: a fejléc átmásolása vízszintesen és függőlegesen, a bal fölső cella üres) Minden sorból egy korrelációs együttható kiszámítása, a sorban állandó jelzőszám tömbjének betűjeli lerögzítendők ($) (További egyszerűsítés is végezhető, de teljesen automatikusan nem lehet kitölteni minden cellát!) Ellenőrzés: átlóban 1 -esek szerepelnek, a mátrix az átlóra szimmetrikus
Korrelációs mátrix automatikus útja n n n File menüpont / Beállítások / Bővítmények / Analysis Tool. Pack kiválasztása (előtte legyen pipa) / OK Adatok menüpont / Adatelemzés / Korrelációanalízis / OK Korrelációanalízis ablak Bemeneti tartomány: oszlopok kijelölése (kivéve régiónevek) / Feliratok az első sorban kiválasztása (előtte legyen pipa) / Kimeneti beállítások: Új munkalapra kiválasztása (előtte legyen kijelölve)
Regresszió-elemzés 48
Regressziószámítás a regionális elemzésekben n n Változókapcsolatokat valószínűségi (sztochasztikus) függvénykapcsolatként értelmezi Függő és független (vagy magyarázó) változók – Független: x tengely, fajlagos mutató nevezője, bal oszlop – Függő: y tengely, fajlagos mutató számlálója, jobb oszlop n Típusai: – Lineáris vagy nem lineáris – Két- vagy többváltozós n Alkalmas becslésre, előrejelzésre
Regressziós diagram: pontdiagram speciális típusa n n n 2 dimenziós összehasonlítás Ha van a pontoknak irányultsága (vonalban vannak: van összefüggés a két adatsor között) regresszió: alkalmas az összefüggés elemzésére Fehér háttér Legyen tengelyfelirat Jelmagyarázat csak több adatsornál Forrás: KSH T-STAR
Kétváltozós lineáris regresszió n n Determinációs együttható (R 2) itt a Pearson-féle lineáris korrelációs együttható négyzete y = a + bx – x: magyarázó (független) változó – b: regressziós együttható (regressziós koefficiens): az egyenes meredekségét vagy dőlését jelöli (az x értékének egységnyi növekedése y értékének mekkora mértékű és milyen irányú változását vonja maga után – a: regressziós állandó (konstans): értéke megegyezik az egyenes y tengelyen tapasztalt metszéspontjával (a értéke egyenlő y értékével x = 0 helyen) – y: a függő változó regressziós egyenlet alapján becsült értéke
Kétváltozós lineáris regresszó számítása Excelben 1. 2. 3. 4. 5. 6. A két adatsor egymás mellé rendezése úgy, hogy a bal oldalon az x tengelyre kerülő változó legyen. Szórásdiagram készítése (pontdiagram) Formázási műveletek Jobb klikk valamely pontra: trendvonal felvétele Egyenlet és R 2 látszik Számítás
Kétváltozós lineáris regressziós összefüggések
Nem lineáris összefüggések n Nem lineáris regressziós egyenletek alaptípusai – – – n Logaritmikus: y = a + (b * lnx) Polinomiális: y = a + (b 1 * x) + (b 2 * x 2) + … + (bn * xn) Exponenciális y = a * bx Hiperbolikus y = a + b / x Hatványkitevős y = a * xb Determináció együttható (R 2)dönti el, melyik írja le legjobban az adott összefüggést – Azt a trendvonaltípust érdemes választani, amelynél magasabb az R 2 értéke n n Elemzésük és értelmezésük nehézkesebb, mint a lineáris egyenleteké Idősorok elemzésénél, trendszámításban gyakrabban használják mint a területi adatok keresztmetszeti vizsgálatában
Keresztkorreláció, keresztregresszió n n Két adatsor különböző (időben eltolt vagy térben szomszédos) megfigyelési egységekre vonatkozó értékei közötti kapcsolat Időbeli keresztkorreláció – r = corr (xi yi–k) n Területi keresztkorreláció – r = corr (xi ys(i))
Autokorreláció, autóregresszió n n Egyazon adatsor különböző (időben eltolt vagy térben szomszédos) megfigyelési egységekre vonatkozó értékei közötti kapcsolat Időbeni autokorreláció: minden i-edik időponthoz tartozó xi értékhez ugyanezen x változónak egy k évvel eltolt (k évvel korábbi) adatát rendelve számítjuk adatsor hossza k évvel csökken – r = corr (xi xi–k) n Területi autokorreláció: i-edik megfigyelési területegység xi adatához a vele szomszédos területegységek értékeit (átlagát) számítjuk – r = corr (xi xs(i))