Alapfogalmak Statisztika II VEGTGAM 22 S Ketskemty Lszl

  • Slides: 32
Download presentation
Alapfogalmak Statisztika II. VEGTGAM 22 S Ketskeméty László: Statisztika II.

Alapfogalmak Statisztika II. VEGTGAM 22 S Ketskeméty László: Statisztika II.

A sztochasztikus folyamat 9/9/2021 Ketskeméty László: Statisztika II. 2

A sztochasztikus folyamat 9/9/2021 Ketskeméty László: Statisztika II. 2

A sztochasztikus folyamat 9/9/2021 Ketskeméty László: Statisztika II. 3

A sztochasztikus folyamat 9/9/2021 Ketskeméty László: Statisztika II. 3

Jellemzők 9/9/2021 Ketskeméty László: Statisztika II. 4

Jellemzők 9/9/2021 Ketskeméty László: Statisztika II. 4

Jellemzők Parciális autokorrelációs függvény (PACF): 9/9/2021 Ketskeméty László: Statisztika II. 5

Jellemzők Parciális autokorrelációs függvény (PACF): 9/9/2021 Ketskeméty László: Statisztika II. 5

Jellemzők keresztkovariancia függvény (CVF) keresztkorrelációs függvény (CCF) 9/9/2021 Ketskeméty László: Statisztika II. 6

Jellemzők keresztkovariancia függvény (CVF) keresztkorrelációs függvény (CCF) 9/9/2021 Ketskeméty László: Statisztika II. 6

Xt és Yt autokorrelációs és keresztkorrelációs együtthatóinak szemléltetése t-k ccf. XY(-k)= ccf. YX(k) t+k

Xt és Yt autokorrelációs és keresztkorrelációs együtthatóinak szemléltetése t-k ccf. XY(-k)= ccf. YX(k) t+k t r. XX(k) Xt ccf. XY(k) 9/9/2021 r (k) Ketskeméty László: Statisztika YY II. Y 7 t

Gyenge stacionaritás 9/9/2021 Ketskeméty László: Statisztika II. 8

Gyenge stacionaritás 9/9/2021 Ketskeméty László: Statisztika II. 8

Erős stacionaritás Az N-dimenziós eloszlások nem függenek a paraméter helyétől, hanem csak azok egymáshoz

Erős stacionaritás Az N-dimenziós eloszlások nem függenek a paraméter helyétől, hanem csak azok egymáshoz viszonyított helyzetétől. Az eloszlások a paraméterek eloszlásával szemben invariánsak. erős stacionaritás 9/9/2021 gyenge stacionatritás Ketskeméty László: Statisztika II. 9

Néhány fontosabb sztochasztikus folyamat Ha a komponensek nemcsak korrelálatlanok, hanem függetlenek is, akkor független

Néhány fontosabb sztochasztikus folyamat Ha a komponensek nemcsak korrelálatlanok, hanem függetlenek is, akkor független vagy tiszta fehér zajról beszélünk. Amennyiben a komponensek normális eloszlásúak is, akkor a fehér zaj Gaussi vagy normális is. 9/9/2021 Ketskeméty László: Statisztika II. 10

Néhány fontosabb sztochasztikus folyamat ARIMA(0, 0, q)=MA(q) modellek: ahol Gaussi tiszta fehérzaj folyamat, azaz

Néhány fontosabb sztochasztikus folyamat ARIMA(0, 0, q)=MA(q) modellek: ahol Gaussi tiszta fehérzaj folyamat, azaz teljesen független, normális eloszlású változók sorozata A mozgóátlag a folyamat egy fehérzaj folyamat elemeinek lineáris kombinációjaként áll elő. Xt és Xt-1 q-1 változóban közös. Az MA(q) folyamat együtthatói a Ketskeméty László: Statisztika 11 b 0 , b 9/9/2021 , …, b 1 q. II.

Néhány fontosabb sztochasztikus folyamat Autoregresszív folyamatok ARIMA(p, 0, 0)=AR(p) Az autoregresszív folyamat a megelőző

Néhány fontosabb sztochasztikus folyamat Autoregresszív folyamatok ARIMA(p, 0, 0)=AR(p) Az autoregresszív folyamat a megelőző p megfigyelt érték lineáris kombinációja és egy független et hiba összegeként regresszálódik. Az AR(p) folyamat együtthatói az a 1 , …, ap , . 9/9/2021 Ketskeméty László: Statisztika II. 12

Néhány fontosabb sztochasztikus folyamat Általános autoregresszív és mozgóátlag folyamatok, ARIMA(p, 0, q)=ARMA(p, q) Integrált

Néhány fontosabb sztochasztikus folyamat Általános autoregresszív és mozgóátlag folyamatok, ARIMA(p, 0, q)=ARMA(p, q) Integrált autoregresszív és mozgóátlag folyamatok, ARIMA(p, d, q) modellek: A d-edik deriváltsor ARMA(p, q) sor első deriváltsor második deriváltsor Ketskeméty László: Statisztika 9/9/2021 II. Stb. 13

A legáltalánosabb esetben még szezonalitás is van, ekkor a jelölés: ARIMA(p, d, q)(P, D,

A legáltalánosabb esetben még szezonalitás is van, ekkor a jelölés: ARIMA(p, d, q)(P, D, Q) Az általános formulában P a szezonális autoregresszió rendje, Q a szezonális mozgóátlag rendje, D pedig a szezonális differenciálás foka, amelyek mind az s hosszúságú szezonalitás egész számú többszöröseiként értendők. Pl. Egy s hosszúságú szezonalitást tartalmazó idősor szezonális differenciálásának a definíciója: d. Yt = Yt – Yt-s A deriválás célja itt is az, hogy az idősort stacionerré tegyük: az eredeti idősor derivált sora így lesz ARMA típusú. 9/9/2021 Ketskeméty László: Statisztika 14 II.

AR(4) AR(6) 9/9/2021 MA(4) ARIMA(2, 1, 0) Ketskeméty László: Statisztika II. ARMA(4, 4) ARIMA(6,

AR(4) AR(6) 9/9/2021 MA(4) ARIMA(2, 1, 0) Ketskeméty László: Statisztika II. ARMA(4, 4) ARIMA(6, 1, 0) 15

Néhány fontosabb sztochasztikus folyamat Markov-folyamat 9/9/2021 Ketskeméty László: Statisztika II. 16

Néhány fontosabb sztochasztikus folyamat Markov-folyamat 9/9/2021 Ketskeméty László: Statisztika II. 16

Néhány fontosabb sztochasztikus folyamat Harmonikus folyamat 9/9/2021 Ketskeméty László: Statisztika II. 17

Néhány fontosabb sztochasztikus folyamat Harmonikus folyamat 9/9/2021 Ketskeméty László: Statisztika II. 17

Néhány fontosabb sztochasztikus folyamat Gauss-folyamat 9/9/2021 Ketskeméty László: Statisztika II. 18

Néhány fontosabb sztochasztikus folyamat Gauss-folyamat 9/9/2021 Ketskeméty László: Statisztika II. 18

Az idősorok alkalmazásai Előrejelzés, predikció vagy extrapoláció Célunk, hogy a múltbeli lefolyás alapján a

Az idősorok alkalmazásai Előrejelzés, predikció vagy extrapoláció Célunk, hogy a múltbeli lefolyás alapján a folyamat jövőbeli lefolyását szabályozott pontossággal megbecsüljük. 9/9/2021 Ketskeméty László: Statisztika II. 19

Az idősorok alkalmazásai Adatpótlás, interpoláció Ilyenkor az a feladat, hogy az idősor adott időléptékű

Az idősorok alkalmazásai Adatpótlás, interpoláció Ilyenkor az a feladat, hogy az idősor adott időléptékű realizációja alapján „köztes” időpontokban becsüljük meg a lehetséges értékeket. Például egy hiányzó hőmérsékleti adatot egy idősorban, vagy napi adatsorban a „délelőtti” (félnapi) adatokat. 9/9/2021 Ketskeméty László: Statisztika II. 20

Az idősorok alkalmazásai Folyamatszabályozás Ilyenkor a vizsgált idősor egy most éppen zajló gyártási folyamat

Az idősorok alkalmazásai Folyamatszabályozás Ilyenkor a vizsgált idősor egy most éppen zajló gyártási folyamat adatait tartalmazza. Célunk, hogy kontrolláljuk a folyamatot, ellenőrizzük, hogy minden szabályosan történik, vagy be kell-e avatkoznunk. 9/9/2021 Ketskeméty László: Statisztika II. 21

Az idősorok modelljei • Determinisztikus modellek • Simító eljárások, exponenciális szűrések • Spektrálfelbontás •

Az idősorok modelljei • Determinisztikus modellek • Simító eljárások, exponenciális szűrések • Spektrálfelbontás • Box-Jenkins modellezés 9/9/2021 Ketskeméty László: Statisztika II. 22

Az idősorok modelljei I. • Dekompozíciós vagy determinisztikus modellek A trendfüggvény ADDITÍV MODELL A

Az idősorok modelljei I. • Dekompozíciós vagy determinisztikus modellek A trendfüggvény ADDITÍV MODELL A ciklikus. MODELL hatás MULTIPLIKATÍV A szezonális hatás 9/9/2021 Ketskeméty László: Statisztika II. A zaj (hibatag) 23

Dekompozíciós (determinisztikus) modellek I. X 1, X 2, …, Xt, …, XN Az idősor

Dekompozíciós (determinisztikus) modellek I. X 1, X 2, …, Xt, …, XN Az idősor adatok X t = T t + St + C t + Z t Tt A trendfüggvény St A szezonális hatás Ct A ciklikus hatás Zt A zaj 9/9/2021 t = 1, 2, …, N (additív modell) A hosszútávú tendenciát kifejező, a teljes időtartományon megmutatkozó hatás Rövidebb ismétlődő periódusokban jelentkező hatás Hosszabb, szabálytalanul ismétlődő ciklikus hatás A mérési hibatag: fehér zaj Ketskeméty László: Statisztika (0 várhatóértékű, kis szórású) II. 24

Dekompozíciós (determinisztikus) modellek I. X 1, X 2, …, Xt, …, XN Az idősor

Dekompozíciós (determinisztikus) modellek I. X 1, X 2, …, Xt, …, XN Az idősor adatok Xt = Tt * St *Ct * Zt Tt A trendfüggvény St A szezonális hatás Ct A ciklikus hatás Zt A zaj 9/9/2021 t = 1, 2, …, N (multiplikatív modell) A hosszútávú tendenciát kifejező, a teljes időtartományon megmutatkozó hatás Rövidebb ismétlődő periódusokban jelentkező hatás Hosszabb, szabálytalanul ismétlődő ciklikus hatás A mérési hibatag: fehér zaj Ketskeméty László: Statisztika (1 várhatóértékű, kis szórású) II. 25

Az idősorok modelljei II. • Simító eljárások (exponenciális szűrés) A simító eljárások a sztochasztikus

Az idősorok modelljei II. • Simító eljárások (exponenciális szűrés) A simító eljárások a sztochasztikus modellezésnél egyszerűbb, áttekinthetőbb modelleket állítanak fel. A determinisztikus modellezésnél jobban figyelembe veszik az idősor véletlen jellegét, belső összefüggéseit. Ugyanakkor a „valódi” sztochasztikus modellezésnél egyszerűbb, áttekinthetőbb modelleket állítanak fel. Egyfajta „közbenső” pontosságú és komplexitású modell-családot alkotnak. Ez a modell-család onnan kapta a nevét, hogy az idősor t-edik elemét a múltbeli elemek exponenciálisan csökkenő súlyokkal vett lineáris kombinációjával becsüli. 9/9/2021 Ketskeméty László: Statisztika II. 26

Az idősorok modelljei III. • Sztochasztikus modellek (ARIMA-modellek ) A legárnyaltabb, legösszetettebb elemzés a

Az idősorok modelljei III. • Sztochasztikus modellek (ARIMA-modellek ) A legárnyaltabb, legösszetettebb elemzés a Box és Jenkins által kidolgozott ARIMA-modellekben lehetséges. Az ARIMA-modellek feltételeznek az idősor adatai között meglévő, valamilyen belső sztochasztikus koherenciát, ami tartósan megvan, kimutatható, és feltehetőleg a jövőbeni lefolyás során is jelen lesz. 9/9/2021 Ketskeméty László: Statisztika II. 27

Az idősorok modelljei III. • Sztochasztikus modellek (ARIMA-modellek ) • A legárnyaltabb, legösszetettebb elemzés

Az idősorok modelljei III. • Sztochasztikus modellek (ARIMA-modellek ) • A legárnyaltabb, legösszetettebb elemzés a Box és Jenkins által kidolgozott ARIMA modellekben lehetséges. • Az ARIMA modellek az idősor adatai között valamilyen meglévő, belső sztochasztikus koherenciát feltételeznek, ami tartósan megvan, kimutatható, és feltehetőleg a jövőbeni lefolyás során is jelen lesz. • Ha ezt a belső koherenciát sikerül azonosítani, az ennek alapján felállított ARIMA modell igen pontos előrejelzéseket képes adni. 9/9/2021 Ketskeméty László: Statisztika II. 28

Az idősorok modelljei III. • Sztochasztikus modellek (ARIMA-modellek ) • Az ARIMA modellek lényege,

Az idősorok modelljei III. • Sztochasztikus modellek (ARIMA-modellek ) • Az ARIMA modellek lényege, hogy az időben lejátszódó folyamatokat saját korábbi értékeik, valamint a véletlen hatások (zajok) függvényeként írják le, meghatározó szerepet biztosítva ezzel a véletlen és a tehetetlenség folyamatalkotó szerepének. • Elsősorban a folyamatokban meglévő rövidtávú ingadozások leírására és előrejelzésére alkalmasak. • Mivel az egyes időpontokra gyakran csak egy-egy megfigyelés - a megfigyelt idősor - áll rendelkezésre, a változókra nézve korlátozó feltételezéseket kell bevezetni. • Ilyen feltételezés a stacioneritás: E(Xt), Var(Xt) és Cov(Xt, Xt-k) időbeli állandósága (a folyamat csak akkor stabil, ha „időinvariáns”). 9/9/2021 Ketskeméty László: Statisztika II. 29

Az idősorok modelljei III. • Sztochasztikus modellek (ARIMA-modellek ) • Az ARIMA betűszó egy

Az idősorok modelljei III. • Sztochasztikus modellek (ARIMA-modellek ) • Az ARIMA betűszó egy rövidítés: ARIMA = Auto. Regressive Integrated Moving Averages • Az AR (Auto. Regressive) modell szerint az Xt idősor t időpontbeli értékét a múltbeli idősor értékek súlyozott összege (lineáris kombinációja) és egy korrelálatlan hibatag összege adja meg. • Az MA (Moving Averages) modell szerint az Xt idősor t időpontbeli értéke a múltbeli fehérzaj értékek súlyozott összegeként (lineáris kombinációjaként) állítható elő. • Az I (Integrated) modellt akkor alkalmazzuk, ha az Xt idősor nem stacioner, de véges számú deriválással azzá tehető. Tipikusan ez a helyzet, ha az idősor kumulatív hatásokat tükröz. Pl. a raktárkészletet nem határozzák meg egyetlen időszak beszerzései és eladásai, ezek csupán a raktárkészlet változásait határozzák meg. 9/9/2021 Ketskeméty László: Statisztika II. 30

Alkalmazási területek • Közgazdaságtan • Természettudományok • Meteorológia • Orvostudomány • Szociológia • Pszichológia

Alkalmazási területek • Közgazdaságtan • Természettudományok • Meteorológia • Orvostudomány • Szociológia • Pszichológia • Biztosítás • Ipar, gépgyártás • • • 9/9/2021 Ketskeméty László: Statisztika II. 31

Alkalmazási területek Idősorelemzések gyakorlati alkalmazásai: meteorológiai adatok (pl. napi átlaghőmérsékletek, csapadékmennyiségek, napsütéses órák száma,

Alkalmazási területek Idősorelemzések gyakorlati alkalmazásai: meteorológiai adatok (pl. napi átlaghőmérsékletek, csapadékmennyiségek, napsütéses órák száma, UV sugárzás intenzitása, etc. ), gazdasági adatok (pl. éves GDP, adósságállomány, acélgyártás, búzatermelés, napi tőzsdeindexek, etc. ), mezőgazdasági adatok (pl. éves búzatermelés, bortermelés, megművelt földterület, etc. ), egészségügyi adatok (pl. bizonyos új megbetegedések napi száma, új AIDS fertőzöttek évi száma, etc. ), munkapszichológiai adatok (pl. munkahelyi emberi hibák, balesetek napi száma, éves fluktuáció, etc. ), biológiai jelek, mintázatok (pl. EKG, EEG, EMG, PET, f. MRI, etc. ), etc. mérési adatok elemzése, feldolgozása. 9/9/2021 Ketskeméty László: Statisztika II. 32