Kvantitatv mdszerek 6 Dr habil Kosztyn Zsolt Tibor
Kvantitatív módszerek 6. Dr. habil. Kosztyán Zsolt Tibor Kvantitatív Módszerek Intézeti Tanszék
Matematikai statisztika A statisztikai megfigyelés véletlen tömegjelenségekre irányul. A statisztikai minta véletlen jelenségre vonatkozó véges számú megfigyelés eredménye. Események bekövetkezésének, illetve be nem következésének hosszú megfigyelés során valószínűsége van.
Hipotézisvizsgálat A statisztika egyik fő alkalmazási területe a döntések alátámasztása statisztikai hipotézisek vizsgálatával. 1. Null-hipotézis (H 0): különbség hiányát állítja 2. Alternatív hipotézis (Hl): különbség meglétét állítja
Hipotézisvizsgálat A nullhipotézis ismeretében egy próbastatisztikát számítunk, amelynek ismerjük az eloszlását. Az eloszlást ismerve megmondhatjuk, milyen valószínűséggel kaphatunk egy próbastatisztika értéket, ha a hipotézis igaz. Ha a valószínűség kicsi, a hipotézist elvetjük, azaz valószínűtlen, hogy H 0 igaz lenne.
Hipotézisvizsgálat Elsőfajú hiba: H 0 igaz, de elvetjük A hiba elkövetési valószínűségét szignifikancia-szintnek nevezzük (p=0, 05) 95%, hogy H 0 igaz Másodfajú hiba: H 0 nem igaz, de elfogadjuk. Baloldali tesztek H 0 = H 1 < Kétoldali tesztek H 0 = H 1 ≠ Jobboldali tesztek H 0 = H 1 >
Statisztikai próbák 1. Parametrikus próbák: normál eloszlású minták két mintát kell összevetnünk Átlagok azonosak-e: kétmintás t-próba Szórások azonosak-e: F-próba 2. Nem parametrikus próbák: teszt alkalmazása nem függ a változók eloszlásától; függetlenség- és homogenitás vizsgálat – c 2 próba, KSpróba
Összefüggés-vizsgálat Több megfigyelt tényező hogyan függ egymástól Ellenőrzött, laboratóriumi körülmények között az összefüggés függvénykapcsolatként írható le. A társadalomtudomány területén előforduló jelenségek annyira bonyolultak, hogy az események bekövetkezése sokszor a véletlentől is függ.
Összefüggés-vizsgálat Sztochasztikus kapcsolat: a független változó értéke nem határozza meg egyértelműen a függő változó értékét, (pl. véletlenszerűen ingadozik egy legvalószínűbb érték körül. )
Összefüggés-vizsgálat 1. 2. Egyik változó változásával a másik milyen irányba és mennyit változik? REGRESSZIÓ-ANALÍZIS Két változó között milyen irányú és mennyire szoros kapcsolat van? KORRELÁCIÓ-ANALÍZIS
Regresszió-analízis Két változó kapcsolatát leíró függvényt kapjuk eredményül. Sokszor feltételezünk ok-okozati kapcsolatot, de a vizsgálat nem bizonyítja azt! Grafikusan pontdiagramra fektetett egyenes, ha lineáris összefüggést feltételezünk.
Regresszió-analízis
1. példa
Regresszió-analízis - SPSS
Regresszió-analízis - SPSS H 1 SSR SSE SST H 0 H 1
Determinációs együttható négyzete “Regression” “Total” “Residual”
R 2 = SSR/SST
Regresszió-analízis A regressziós egyenes a vizsgálati tartományon belül érvényes, azon túl, hosszabb távon nem alkalmas predikciós célokra A regressziós egyenes egyenlete: Y=függő/magyarázott változó X=független/magyarázó változó Kapcsolat lehet pozitív ↗↗ , vagy negatív↗↘ Egyenes illesztése legkisebb négyzetek módszerével történik.
Regresszió-analízis alkalmazhatóságának feltételei 1. 2. 3. 4. 5. E(u)=0 VAR(u)=s 2 A hibatagok függetlenek egymástól. x és u függetlenek. u ~ N(0, s)
Normalitás feltétel
Homoszkedaszticitás
A standard lineáris modell
Többváltozós regresszióanalízis x 1 x 2 x 3 xk y 1 y 2 yn 1. 2. 3. 4. 5. 6. Lineáris-e a regresszió? Nem feltétlen, de legtöbb esetben jó közelítésként Mit jelent a Ha korrelációs használható. a linearitás nem teljesül, akkor át kell konvertálni olyan modellé, amely kölcsönösen együttható értéke? egyértelmű az eredeti modellünkre. R=1 esetén: LINEÁRIS függvénykapcsolat a Az alkalmazhatóság feltételei megegyeznek a lineáris Milyen feltételek mellett magyarázó és a magyarázott változók között! regressziós modell alkalmazásának feltételeivel. R=0 esetén: nincs LINEÁRIS függvénykapcsolat használható a lineáris regressziósa magyarázó és a magyarázott változók között! modell? R=-1 esetén: (negatív) LINEÁRIS függvénykapcsolat E(ui)=0, i : =1, 2, …, n (szisztematikus hibát nem vétettünk) van x és y között! VAR(ui)=s 2, i : =1, 2, …, n (nincs heteroszkedaszticitás) ui és uj függetlenek minden i-re és j-re (nincs autokorreláció) xi determinisztikus nem valószínűségi változó ui ~N(0, s 2), i : =1, 2, …, n az xj-k között nincs lineáris összefüggés (nincs multikollinearitás)
Többváltozós regresszióanalízis Magyarázó változók redukálása: Miért? Kevesebb magyarázó változó → Kisebb a hiba varianciája. DE! torzított lesz a becslés! Hogyan? Összes lehetséges megoldás FORWARD eljárás Fokozatos „beléptetés”. Mindig a legnagyobb parciális korrelációval rendelkező változót veszi be. „kiléptetés”. Mindig a legkisebb parciális BACKWARD eljárás Fokozatos korrelációval rendelkező változót veszi ki. STEPWISE eljárás Minden iterációban léphetnek be és léphetnek ki is elemek. Viszont a probléma nem lineáris. Nem biztos, hogy optimális lesz a megoldás.
2. példa Mi hat a jövedelemre? Feltételezhetjük pl. , hogy Az iskolai végzettség/elvégzett iskolai osztályok A munkavállaló neme A munkavállaló kora ? Modell egyenlet: FOJOV=b 0+b 1 ISKOSZT+b 2 NEME+b 3 KOR+u Dummy-változó
Beállítás – SPSS-ben
Eredmények (1) Valamennyi magyarázó változó szükséges! Kicsi a magyarázó képesség! A modellünk és a magyarázó változóink is szignifikánsak!
Eredmények (2) Nem normális eloszlást követ Nem homoszkedasztikus
Javítási lehetőségek A magyarázóképesség javítására: Új változók keresése (pl. a település típusa, foglalkoztatás
Eredmények
Korreláció-elemzés Függ-e egymástól két változó? A változók normál eloszlásúak Korrelációs együttható, vagy determinációs tényező (r): Két adatsor (minta) közötti lineáris összefüggés erősségét mérő szám.
Korreláció-elemzés Pearson féle korrelációs együttható: r -1<=r<=1 Nincs kapcsolat, ha értéke nulla, vagy ahhoz r=± 1 közeli. 1>|r|≥ 0, 75 Az összefüggés 0, 75>|r|≥ 0, 5 jellemzésére az r 0, 5>|r|≥ 0, 25 számértéke alapján 0, 25>|r|≥ 0 különböző fokozatokat r=0 állítottak fel. Függvénykapcsolat Nagyon szoros kapcs. Szoros kapcsolat Laza kapcsolat Nagyon laza kapcs. Nincs kapcsolat
Köszönöm a megtisztelő figyelmet! Elérhetőség: kzst@gtk. uni-pannon. hu
- Slides: 32