Operasjonsanalytiske emner Del 23 Forecasting 1 Mnster Prognosemodeller

  • Slides: 32
Download presentation
Operasjonsanalytiske emner Del 23 Forecasting 1 - Mønster Prognosemodeller basert på Tidsserieanalyse BØK 710

Operasjonsanalytiske emner Del 23 Forecasting 1 - Mønster Prognosemodeller basert på Tidsserieanalyse BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 1

Introduksjon til tidsserieanalyser En tidsserie er en samling av observasjoner for en kvantifiserbar variabel

Introduksjon til tidsserieanalyser En tidsserie er en samling av observasjoner for en kvantifiserbar variabel registrert i kronologisk tidsrekkefølge. Eksempel Børsindekser Historiske data over salg, lager, antall kundebesøk, rentesatser, kostnader, etc. Bedrifter er ofte interessert i å predikere tidsserie-variabler. Ofte finnes ikke uavhengige variabler (X) som kan benyttes i en regresjonsmodell for en tidsserievariabel (Y). I tidsserieanalyserer vi den historiske utviklingen til en variabel (Y) for å kunne predikere dens framtidige utvikling. BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 2

Prediksjoner basert på tidsserieanalyse Som å kjøre en bil ved å se på veien

Prediksjoner basert på tidsserieanalyse Som å kjøre en bil ved å se på veien via speilet bakover: Vi ser hvor veien har svingt tidligere, og forsøker å styre bilen deretter! BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 3

Noen tidsserieuttrykk Stasjonære data – en tidsserievariabel som ikke viser noen signifikant trend opp

Noen tidsserieuttrykk Stasjonære data – en tidsserievariabel som ikke viser noen signifikant trend opp eller ned over tid. Ikke-stasjonære data – en tidsserievariabel som viser en tydelig trend opp eller ned over tid. Sesong data – en tidsserievariabel som viser et repeterende mønster med jevne intervall over tid. BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 4

Typer mønster i tidsseriedata Horisontal Når observasjonene varierer rundt et konstant nivå eller gjennomsnitt.

Typer mønster i tidsseriedata Horisontal Når observasjonene varierer rundt et konstant nivå eller gjennomsnitt. Det er ingen konsistente vedvarende økninger eller reduksjoner over tid. En slik tidsserie har et stasjonært gjennomsnitt. BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 5

Typer mønster i tidsseriedata Trend Når observasjonene øker eller faller vedvarende over en lengre

Typer mønster i tidsseriedata Trend Når observasjonene øker eller faller vedvarende over en lengre tidsperiode. Trend er lang-tids komponenten som representerer en vedvarende endring over tid. Observert verdi Syklus topp Trendlinje Syklus bunn Tid BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 6

Typer mønster i tidsseriedata Sykluser Når observasjonene inneholder økninger og reduksjoner uten fast lengde,

Typer mønster i tidsseriedata Sykluser Når observasjonene inneholder økninger og reduksjoner uten fast lengde, tyder det på sykliske variasjoner. Sykluser er bølgelignende endringer rundt en trendlinje, eller et ellers stabilt gjennomsnitt. Sykluser er som regel et resultat av generelle økonomiske variasjoner. BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 7

Typer mønster i tidsseriedata Sesonger Sesongvariasjoner er vedvarende repeterende mønster, vanligvis over ett år.

Typer mønster i tidsseriedata Sesonger Sesongvariasjoner er vedvarende repeterende mønster, vanligvis over ett år. Sesonglengden kan være kvartal, måned, etc. Årsaken kan være årstiden/været, helgedager(jul), skolestart, etc. Det kan være sesongvariasjoner rundt et stabilt nivå (horisontalt), eller rundt en trendlinje. BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 8

Sesongvariasjoner Kilowatts 1200 1000 800 600 400 200 0 1 5 9 BØK 710

Sesongvariasjoner Kilowatts 1200 1000 800 600 400 200 0 1 5 9 BØK 710 OPERASJONSANALYTISKE EMNER 13 17 21 25 29 33 37 41 45 Rasmussen 9

Utforske datamønster med autokorrelasjonsanalyse Når en variabel måles over tid, vil ofte observasjoner fra

Utforske datamønster med autokorrelasjonsanalyse Når en variabel måles over tid, vil ofte observasjoner fra forskjellige perioder korrelere med hverandre. Autokorrelasjon er korrelasjoner mellom observasjoner fra samme tidsserie, men forskjøvet i tid. Mønster som trend og sesongvariasjoner kan ofte avsløres via autokorrelasjonsanalyse. BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 10

Autokorrelasjonsanalyse Autokorrelasjonskoeffisienten rk for”lag k” måler autokorrelasjonen mellom Yt og Yt-k BØK 710 OPERASJONSANALYTISKE

Autokorrelasjonsanalyse Autokorrelasjonskoeffisienten rk for”lag k” måler autokorrelasjonen mellom Yt og Yt-k BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 11

Correlogram 1. 0 0. 8 ACF 0. 6 Upper ACF 0. 4 Lower 0.

Correlogram 1. 0 0. 8 ACF 0. 6 Upper ACF 0. 4 Lower 0. 2 0. 0 -0. 2 1 2 3 4 5 6 -0. 4 -0. 6 -0. 8 -1. 0 BØK 710 OPERASJONSANALYTISKE EMNER Observation/Lags Rasmussen 12

Autokorrelasjonsanalyse (Ex. 3 -1) BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 13

Autokorrelasjonsanalyse (Ex. 3 -1) BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 13

Autokorrelasjonsanalyse Hvis en serie er ”random”, så er rk for enhver k nær null.

Autokorrelasjonsanalyse Hvis en serie er ”random”, så er rk for enhver k nær null. Påfølgende verdier i tidsserien er ikke korrelerte. Hvis en serie har trend, så vil Yt og Yt-1 være sterkt korrelert, og autokorrelasjonskoeffisienten er typisk signifikant forskjellig fra 0 for de første k ”lags”, og reduseres gradvis mot 0 når k øker. BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 14

Autokorrelasjonsanalyse Hvis en serie har sesong, så vil Yt og Yt-p være sterkt korrelert,

Autokorrelasjonsanalyse Hvis en serie har sesong, så vil Yt og Yt-p være sterkt korrelert, der p angir antall sesonger pr. syklus. For kvartalsdata vil r 4, r 8, etc. ha signifikante verdier. For månedsdata vil korrelasjonskoeffisienter som er multiplum av 12 ha høye verdier, osv. BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 15

Signifikanstest av autokorrelasjon Variansen til autokorrelasjonskoeffisienten har ingen funnet et eksakt uttrykk for. Hvis

Signifikanstest av autokorrelasjon Variansen til autokorrelasjonskoeffisienten har ingen funnet et eksakt uttrykk for. Hvis tidsserien er helt tilfeldig (”random”) er rk normalfordelt med: BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 16

Signifikanstest av autokorrelasjon Om en antar at før lag k (k>1) er alle rk

Signifikanstest av autokorrelasjon Om en antar at før lag k (k>1) er alle rk ≠ 0 og etter lag k er alle rk = 0, da kan følgende formel benyttes: BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 17

Konfidensintervall for autokorrelasjon rk= observert korrelasjon ρk = «sann» korrelasjon For alle k, forkast

Konfidensintervall for autokorrelasjon rk= observert korrelasjon ρk = «sann» korrelasjon For alle k, forkast H 0 hvis |t| > t /2; df=n-k Konfidensintervall: Aksepter H 0 hvis: BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 18

Signifikanstest av autokorrelasjon I steden for å teste alle rk verdiene en og en,

Signifikanstest av autokorrelasjon I steden for å teste alle rk verdiene en og en, kan en komplementær metode være å teste et helt sett av rk verdier, f. eks. teste om de 10 første er signifikant forskjellig fra et sett der alle 10 er null. En vanlig portmanteau test (Ljung & Box): BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 19

Signifikant Q Qm har en chi-kvadrat fordeling med m (antall ”lags”) frihetsgrader. Hvis Q

Signifikant Q Qm har en chi-kvadrat fordeling med m (antall ”lags”) frihetsgrader. Hvis Q anvendes på autokorrelasjonene i residualene av en prediksjonsmetode, er antall frihetsgrader lik m minus antall parameter i metoden som er estimert basert på dataene. CHIINV(α; df) brukes for å finne kritisk øvre verdi. BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 20

Tilfeldig datamønster? (Ex. 3 -3) En tallserie på 40 data er genert tilfeldig. Autokorrelasjonskoeffisientene

Tilfeldig datamønster? (Ex. 3 -3) En tallserie på 40 data er genert tilfeldig. Autokorrelasjonskoeffisientene bør da teoretisk være null. Hvert tilfeldig utvalg av alle mulige utvalg på 40 vil produsere forskjellige autokorrelasjoner. De fleste utvalg vil ha rk ≈ 0, men noen kan tilfeldigvis produsere store rk. BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 21

Tilfeldig datamønster? (Ex. 3 -3) BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 22

Tilfeldig datamønster? (Ex. 3 -3) BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 22

Stasjonære data En stasjonær dataserie har stabilt/konstant gjennomsnitt og varians over tid. Numbers 1000

Stasjonære data En stasjonær dataserie har stabilt/konstant gjennomsnitt og varians over tid. Numbers 1000 900 800 700 600 500 400 300 200 100 0 1 3 5 7 9 BØK 710 OPERASJONSANALYTISKE EMNER 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 Rasmussen 23

Har datene trend? En stasjonær dataserie varierer rundt et konstant nivå, uten vedvarende endringer.

Har datene trend? En stasjonær dataserie varierer rundt et konstant nivå, uten vedvarende endringer. En serie som inneholder trend er ikke-stasjonær. For ikke-stasjonære data vil autokorrelasjonen være høy for flere perioder/lags. Differanser brukes for å fjerne trend fra en ikkestasjonær dataserie. BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 24

Fjerne trend vha. differanser BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 25

Fjerne trend vha. differanser BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 25

Data med trend (Ex. 3 -4) Revenue 60000 50000 40000 30000 20000 10000 0

Data med trend (Ex. 3 -4) Revenue 60000 50000 40000 30000 20000 10000 0 1 3 5 7 9 BØK 710 OPERASJONSANALYTISKE EMNER 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 Rasmussen 26

Data med trend (Ex. 3 -4) ACF Upper Lower LBQ Q 0. 955 0.

Data med trend (Ex. 3 -4) ACF Upper Lower LBQ Q 0. 955 0. 308 -0. 308 41. 98 3. 84 0. 914 0. 517 -0. 517 81. 44 5. 99 0. 874 0. 652 -0. 652 118. 38 7. 81 0. 794 0. 755 -0. 755 149. 69 9. 49 0. 716 0. 831 -0. 831 175. 79 11. 07 0. 4 0. 634 0. 887 -0. 887 196. 81 12. 59 0. 2 0. 545 0. 929 -0. 929 212. 76 14. 07 0. 452 0. 959 -0. 959 224. 06 15. 51 0. 363 0. 979 -0. 979 231. 55 16. 92 0. 279 0. 991 -0. 991 236. 12 18. 31 0. 196 0. 999 -0. 999 238. 46 19. 68 0. 118 1. 003 -1. 003 239. 33 21. 03 0. 052 1. 004 -1. 004 239. 51 22. 36 BØK 710 OPERASJONSANALYTISKE EMNER Forts. Correlogram 1. 0 0. 8 ACF 0. 6 0. 0 -0. 2 1 2 3 4 5 6 7 8 9 10 11 12 13 -0. 4 -0. 6 -0. 8 -1. 0 Observation/Lags Rasmussen 27

Differansedata (Ex. 3 -4) Forts Diff. 5000 0 1 3 5 7 9 11

Differansedata (Ex. 3 -4) Forts Diff. 5000 0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 -5000 -10000 -15000 -20000 BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 28

Differansedata (Ex. 3 -4) Forts Upper Lower LBQ Q -0. 083 0. 312 -0.

Differansedata (Ex. 3 -4) Forts Upper Lower LBQ Q -0. 083 0. 312 -0. 312 0. 31 3. 84 0. 057 0. 314 -0. 314 0. 46 5. 99 0. 305 0. 315 -0. 315 4. 85 7. 81 0. 020 0. 342 -0. 342 4. 87 9. 49 -0. 040 0. 342 -0. 342 4. 95 11. 07 -0. 043 0. 343 -0. 343 5. 05 12. 59 0. 044 0. 343 -0. 343 5. 15 14. 07 Correlogram Upper 0. 8 Lower 0. 6 0. 4 0. 2 0. 0 1 2 3 4 5 6 7 8 9 10 11 12 13 -0. 2 -0. 091 0. 344 -0. 344 5. 60 15. 51 -0. 089 0. 346 -0. 346 6. 04 16. 92 -0. 4 -0. 022 0. 348 -0. 348 6. 07 18. 31 -0. 6 -0. 052 0. 348 -0. 348 6. 23 19. 68 -0. 220 0. 349 -0. 349 9. 21 21. 03 -1. 0 -0. 045 0. 362 -0. 362 9. 34 22. 36 BØK 710 OPERASJONSANALYTISKE EMNER ACF 1. 0 ACF Observation/Lags Rasmussen 29

Er det sesongvariasjoner? Hvis en dataserie inneholder sesongvariasjoner, vil et mønster av svingninger repeteres

Er det sesongvariasjoner? Hvis en dataserie inneholder sesongvariasjoner, vil et mønster av svingninger repeteres med jevne mellomrom (vanligvis hvert år). Observasjoner for tilsvarende periode i forskjellige år vil være korrelerte. Autokorrelasjonskoeffisientene for k=p, 2 p, etc. vil være signifikant forskjellig fra null. (p=4 for kvartal, 12 for mnd. ) BØK 710 OPERASJONSANALYTISKE EMNER Rasmussen 30

Data med sesonger (Ex. 3 -5) Sales 500 450 400 350 300 250 200

Data med sesonger (Ex. 3 -5) Sales 500 450 400 350 300 250 200 150 100 1 5 9 BØK 710 OPERASJONSANALYTISKE EMNER 13 17 21 25 29 33 37 41 Rasmussen 31

Data med sesonger (Ex. 3 -5) ACF Upper Lower LBQ Q 0. 393 0.

Data med sesonger (Ex. 3 -5) ACF Upper Lower LBQ Q 0. 393 0. 278 -0. 278 8. 50 3. 84 0. 154 0. 318 -0. 318 9. 83 5. 99 1. 0 0. 294 0. 324 -0. 324 14. 77 7. 81 0. 8 0. 744 0. 344 -0. 344 47. 11 9. 49 0. 6 0. 151 0. 452 -0. 452 48. 47 11. 07 0. 4 -0. 153 0. 456 -0. 456 49. 90 12. 59 0. 2 -0. 047 0. 460 -0. 460 50. 04 14. 07 0. 347 0. 460 -0. 460 57. 72 15. 51 -0. 2 -0. 183 0. 480 -0. 480 59. 90 16. 92 -0. 435 0. 485 -0. 485 72. 53 18. 31 -0. 6 -0. 315 0. 515 -0. 515 79. 33 19. 68 -0. 8 0. 091 0. 529 -0. 529 79. 91 21. 03 -1. 0 -0. 353 0. 531 -0. 531 88. 90 22. 36 BØK 710 OPERASJONSANALYTISKE EMNER Forts. ACF Correlogram Upper Lower 0. 0 1 2 3 4 5 6 7 8 9 10 11 12 13 Observation/Lags Rasmussen 32