Adattpusok adatsorok jellegad rtkei dr Jeney Lszl egyetemi
- Slides: 17
Adattípusok, adatsorok jellegadó értékei dr. Jeney László egyetemi adjunktus jeney@caesar. elte. hu Regionális és környezeti elemzési módszerek I. BME Regionális és környezeti gazdaságtan mesterszak (MSc) 2013/2014, II. félév BCE Gazdaságföldrajz és Jövőkutatás Tanszék
Mérési skálák
Statisztikai fogalmak n Sokaság: – A megismerni kívánt, megfigyelt egységek halmaza n Ismérvek: – A sokaság jellemzésére, részekre bontására alkalmas vizsgálati szempontok n Területi elemzések: legalább 2 ismérv – Területi ismérv – Változók: időbeli, mennyiségi, minőségi ismérvek n Adatok jól csoportosíthatók az összehasonlíthatóságuk szerint mérési (vagy adat) skálák rendszere 3
A mérési skálák rendszere Mérési skálák Tulajdonság Sajátosságok Jellemző példák Arány xa / xb Megkülönböztetés, Van elméleti sorrend, minimum, különbség, arány azonos előjelű Népességszám, jövedelem, utasforgalom Intervallum xa – xb Megkülönböztetés, Pozitív és sorrend, különbség negatív értékek Vándorlási különbözet Ordinális (sorrendi) xa ≥ xb Megkülönböztetés, sorrend Nehezen mérhető, csak sorrendbe állítható Sorrendek, rangok, eltérő funkcionális szintek Nominális xa ≠ xb Megkülönböztetés Nem számszerű Név, születési 4 hely, nem
Mérési skálák hierarchiája n n Mindegyik mérési skála rendelkezik az alatt lévő tulajdonságaival A „hierarchia csúcsán” az arányskála áll – Legteljesebb összehasonlításra ad lehetőséget n Mérési skála meghatározza a matematikaistatisztikai módszereket – Brazil válogatott nem 63 X jobb mint a magyar – 0 átlagú adatsort nem lehet az átlag %-ában megadni n Többváltozós vizsgálatoknál: – Többféle mérési skála, de azonos mérési skálájú adatokra van szükség adat-transzformáció 5
Mérési skálák transzformációja n Leggyakrabban: – intervallum- vagy arányskálán mért jellemzők ordinális adatskálára átalakítása (pl. komplex mutatóknál: rangsorolás) n Azonos értékek: rangszámok is azonosak – Páratlan számú (pl. 3) adat egyezése: középső rangszám (8. , 9. és 10. helyett 9. , 9. és 9. ) – Páros számú (pl. 2) adat egyezése: rangszámok átlaga (4. és 5. helyett 4, 5. és 4, 5. ) n Nincs holtversenyben elsőség – 1. és 2. helyett 1, 5. és 1, 5 (1. és 1. helyett) 6
Adatsorok 2 fő típusa: nem fajlagos és fajlagos mutatók n Nem fajlagos (abszolút) mutatók – Pl. népességszám, GDP, személygépkocsik száma, terület, városlakók száma – Jelölése: xi azaz x abszolút mutató értéke adott „i” régióban n Fajlagos mutatók (relatív vagy származtatott mutatók) – Pl. egy főre jutó GDP, ezer lakosra jutó személygépkocsik, népsűrűség, városlakók aránya – Lehet százalékos részesedés is: pl. városlakók aránya – Jelölése: yi azaz y fajlagos mutató értéke adott „i” régióban – Általában 2 nem fajlagos mutató hányadosa, pl. GDP és népesség (ritkán 2 fajlagos mutató hányadosa, pl. megyei GDP/fő az országos átlagos GDP/fő %-ában) – Esetükben súlyozni kell (pl. súlyozott átlag, súlyozott szórás) – A súly a fajlagos mutató képletének nevezőjében van, jelölése fi azaz f súly értéke adott „i” régióban 7 – Súly gyakran népességszám, de nem mindig
Nem fajlagos – fajlagos mutatók valamint a súly közötti átszámítások n Ha a nem fajlagos mutató (GDP) és a súly (népességszám) ismert – A fajlagos mutató (GDP/fő): a nem fajlagos mutató és a súly hányadosa n Ha a nem fajlagos (GDP) és a fajlagos mutató ismert (GDP/fő) – A súly (népesség): a nem fajlagos és a fajlagos mutató hányadosa n Ha a fajlagos mutató (GDP/fő) és a súly (népesség) ismert 8 – Nem fajlagos mutató (GDP): a fajlagos mutató és a súly szorzata
Adatsorok jellegadó értékei
Adatsorok jellegadó értékei n Középértékek – Számtani átlag / súlyozott számtani átlag – Mértani átlag – Helyzeti középértékek (módusz, medián) n Szélső értékek – Maximum – Minimum n Adatsor terjedelme és szórása (átvezet a területi egyenlőtlenségi mutatók felé) – Terjedelem-típusú mutatók – Szórás-típusú mutatók
Középértékek: átlagok n Számtani átlag – Az eredeti számok helyébe helyettesítve azok összege változatlan – n db adat (xi) – Excel fx= ÁTLAG() n Súlyozott számtani átlag – n db fajlagos adat (yi) – Súly (fi): a fajlagos mutató nevezőjében szereplő adat n Mértani átlag – Az eredeti számok helyébe helyettesítve azok szorzata változatlan – n db adat (xi)
Helyzeti középértékek n Medián – Az az érték, aminél kisebb és nagyobb adatok száma egyenlő (felező pont) – Extrém adatokat tartalmazó adatsorok esetében érdemes használni – Kvantilisek: kvartilis (negyedelő), kvintilis (ötödölő), decilis (tizedelő), percentilis (századoló) – Medián/átlag: egyenlőtlenségi mutató (minél kisebb, annál nagyobb az egyenlőtlenség) – Excel fx= MEDIÁN() n Módusz („divatos érték”) – A legtöbbször előforduló érték – Lehet többmóduszú (többcsúcsú) adatsor is – Excel fx= MÓDUSZ()
A szélső értékek és a terjedelem típusú egyenlőtlenségi mutatók n Maximum – Az adatsor legnagyobb értéke (xmax) – Excel fx= MAX() n Minimum – Az adatsor legkisebb értéke (xmin) – Excel fx= MIN() n Alapja a terjedelem típusú egyenlőtlenségi mutatóknak – Range (szóródás terjedelme) – Range-arány (adatsor terjedelme) – Relatív range
Súlyozatlan relatív terjedelem kiszámításának lépései (abszolút mutatóknál) 1. 2. 3. 4. 5. Ki kell számítani az adatsor maximumát (függvényvarázsló: max) Ki kell számítani az adatsor minimumát (függvényvarázsló: min) Ki kell vonni a maximális értékből a minimálist (ez a terjedelem) Ki kell számítani az adatsor (sima) átlagát (függvényvarázsló: átlag) El kell osztani a terjedelmet az átlaggal
Súlyozatlan relatív terjedelem kiszámítása Excelben A 1 B C xa xb 2 1. régió 24 10 3 2. régió 4 10 4 3. régió 0 10 5 4. régió 12 10 maximum 24 10 =MAX(B 2: B 5) =MAX(C 2: C 5) 0 10 =MIN(B 2: B 5) =MIN(C 2: C 5) 6 7 minimum 8 terjedelem 9 átlag 10 relatív terjedelem 24 10 =ÁTLAG(B 2: B 5) 2, 4 0 =B 6 -B 7 =B 8/B 9 10 =C 6 -C 7 =ÁTLAG(C 2: C 5) 0 =C 8/C 9
Súlyozott relatív terjedelem kiszámításának lépései (fajlagos mutatóknál) 1. 2. 3. 4. 5. Ki kell számítani az adatsor maximumát (függvényvarázsló: max) Ki kell számítani az adatsor minimumát (függvényvarázsló: min) Ki kell vonni a maximális értékből a minimálist (ez a terjedelem) Ki kell számítani az adatsor súlyozott átlagát El kell osztani a terjedelmet a súlyozott átlaggal
Súlyozott relatív terjedelem kiszámítása Excelben A 1 2 1. régió B C D E F G ya fa xa yb fb Xb 24 10 1 10 =B 2*C 2 =E 2*F 2 3 2. régió 4 3, 5 14 10 3, 5 35 4 3. régió 0 4, 5 0 10 4, 5 45 5 4. régió 12 10 1 10 6 összeg 10 50 10 100 7 max. 24 8 min. 0 9 terj. =MAX(B 2: B 5) =MIN(B 2: B 5) 24 10 s. átlag 5 11 rel terj 4, 8 =MAX(E 2: E 5) 10 =MIN(E 2: E 5) 0 =B 6 -B 7 =E 6 -E 7 10 =D 6/C 6 =B 9/B 10 10 rel terj 0 =G 6/F 6 =E 9/E 10