Understanding Auto Regressive Moving Average Model – ARIMA

Farhad Malik
Farhad Malik

Follow

Sep 19, 2018 · 6 min read

In my article “How Do I Predict Time Series?”, I provided an overview of time series analysis. Core of the article focused on the concept that future values in a time series are dependent on its past values.

This article serves as an overview of a powerful yet simple model known as ARIMA. Additionally it provides a comparison of two models: GARCH and EWMA. Both models assume that the recent events have higher precedence than former events. This model is important in data science and neural networks.

Please read FinTechExplained disclaimer.

ARIMA stands for Auto Regressive Integrated Moving Average. ARIMA is a simple stochastic time series model that we can use to train and then forecast future time points.

ARIMA can capture complex relationships as it takes error terms and observations of lagged terms. These models rely on regressing a variable on past values.

ARIMA is Auto Regressive — (AR)

Auto Regressive (AR) property of ARIMA is referred to as P.

Past time points of time series data can impact current and future time points. ARIMA models take this concept into account when forecasting current and future values. ARIMA uses a number of lagged observations of time series to forecast observations. Minden egyes múltbeli kifejezésre súlyt alkalmaznak, és a súlyok aszerint változhatnak, hogy mennyire frissek.

AR(x) azt jelenti, hogy az ARIMA-modellben x késleltetett hibatermet fognak használni.

AARIMA az autoregresszióra támaszkodik. Az autoregresszió egy olyan folyamat, amely egy változót regresszál önmagának múltbeli értékeire. Az autokorrelációk fokozatosan lebomlanak és megbecsülik, hogy a fehér zaj milyen mértékben jellemzi az adatsort.

ARIMA integrált – (I)

Ha létezik trend, akkor az idősor nem stacionáriusnak tekinthető és szezonalitást mutat. Az integrált egy olyan tulajdonság, amely csökkenti a szezonalitást egy idősorból. Az ARIMA modellek olyan mértékű differenciálással rendelkeznek, amely kiküszöböli a szezonalitást. A differenciálással kapcsolatos további információk a “Hogyan jelezzek előre idősorokat?” című cikkemben találhatók.”

Az ARIMA D tulajdonsága a differenciálás mértékét jelenti.

Az ARIMA mozgóátlag – (MA)

A korábbi időpontok hibás kifejezései a jelenlegi és a jövőbeli pontok megfigyelésének előrejelzésére szolgálnak. A mozgóátlag (MA) eltávolítja a nemdeterminizmust vagy a véletlenszerű mozgásokat egy idősorból. A Q tulajdonság az ARIMA-ban a mozgóátlagot képviseli. Ezt úgy fejezzük ki, hogy MA(x), ahol az x a korábbi megfigyeléseket jelenti, amelyeket a jelenlegi megfigyelés kiszámításához használunk.

A mozgóátlag-modelleknek rögzített ablakuk van, és a súlyok az időhöz viszonyítva vannak. Ez azt jelenti, hogy az MA modellek jobban reagálnak az aktuális eseményre és változékonyabbak.

P (autoregresszív), D (integrált) és Q (mozgóátlag) az ARIMA modell három tulajdonsága

A koefficiensek kiszámítása rekurzív módon történik. A modellt úgy választjuk ki, hogy a modellből számított becsült eredmények közelebb legyenek a tényleges megfigyelt értékekhez. Ez a folyamat iteratív jellegű.

EWMA Vs GARCH

Az alábbiakban két fő modellt szerettem volna kiemelni: EWMA és GARCH. Az EWMA és a GARCH modellek a modellperzisztencia fogalma körül forognak.

A modellperzisztencia azt az arányt írja le, amellyel a megfigyelés egy nagy elmozdulást követően visszatér a hosszú távú értékéhez. Ha volatilitást figyelünk meg, akkor a magas perzisztencia azt jelenti, hogy ha a piacon sokkszerű mozgás történik, akkor a volatilitás hosszabb idő alatt tér vissza az átlaghoz.

A megbízható modellek perzisztenciájának 1-nél kisebbnek kell lennie.

Az 1-nél nagyobb perzisztencia azt jelenti, hogy a modell nem stabil, és nincs visszatérés az átlaghoz.

EWMA Is Exponentially Weighted Moving Average

Az EWMA egy mozgóátlag (MA) modell. Az idősoros adatok varianciáját az előző napi becsült variancia és az előző napi hozam súlyozott átlagának figyelembevételével jelzi előre. Az EWMA tehát az idősorok aktuális értékeinek lineáris regressziós modelljét használja az aktuális és a korábbi megfigyeletlen véletlen sokkokkal szemben. Ezek a véletlen sokkok ismert fehér zaj hibatételek.

A modell feltételezi, hogy a jövőbeli előrejelzések a történelmi események függvényei. Ugyanakkor azt is feltételezi, hogy a közelmúltbeli eseményeknek nagyobb az elsőbbsége, mint a korábbi eseményeknek.

Az EWMA súlyokat alkalmaz a korábbi és a legutóbbi hozamokra (ún. innováció) úgy, hogy a közelmúltbeli megfigyelések nagy súlyt kapnak. A súlyok az időben visszafelé haladva exponenciális ütemben csökkennek. A súlyok összege 1. A súlyok úgy vannak hozzárendelve, hogy a legújabb megfigyeléseknek nagyobb jelentőséget tulajdonítanak, mint a régebbi megfigyeléseknek.

Ez az oka annak, hogy a modellt exponenciálisan súlyozott mozgóátlag (EWMA) előrejelző modellnek nevezik.

A rekurzív EWMA-modell magas szinten a következőképpen írható fel:

Változó a megfigyelés alatt = Jelenlegi sokk + Utolsó sokk x Az utolsó sokk súlya az EWMA(1) modell esetében

Autokorrelációt a következőképpen számítjuk: Coefficient for lagged random shock / (1 + Coefficient for lagged random shock)

This formula ensures that the weight is smaller for distant observations when compared to recent observations to indicate that recent observations have more importance.

GARCH -Generalised Autoregressive Conditional Hetroskedastic model

GARCH is an alternative method for calculating conditional variance (co variance). The model assumes that the return at time (t) has a particular distribution and the standard deviation of the distribution is indexed by time.

GARCH assumes that the latest return of the stock is dependent on the previous return. Ezért a variancia a korábbi hozamoktól függ.

A GARCH három terminus függvénye:

  1. Long Term Variance
  2. Square of Last Return
  3. Previous Variance

A terminusok mindegyikére egy súlyt alkalmazunk. Ezeket a kifejezéseket GAMMA, ALPHA és BETA néven ismerjük. A GARCH szerinti feltételes variancia kiszámításának képlete:

(Gamma x Hosszú távú variancia) + (Alpha x Utolsó hozam négyzete) + (Beta x Korábbi variancia)

A GARCH alapvető szabálya, hogy a Gamma + Alpha + Beta összege 1 legyen. A GAMMA, ALPHA és BETA úgy kerül kiszámításra, hogy a becsült és a ténylegesen megfigyelt értékek a lehető legközelebb legyenek egymáshoz.

A hosszú távú átlagos varianciaarányt ezután a következőképpen számoljuk ki: = (Gamma)/(1-Alfa-Béta)

A hosszú távú variancia az adatok “ragaszkodásáról” árulkodik egy értékhez, pl. 1% azt jelenti, hogy az adatok az idő előrehaladtával 1 felé mozognak. Lényegében súlyt rendel az átlagos hosszú távú varianciabecsléshez, ami azt jelenti, hogy a modell felismeri a volatilitás átlag-visszatérő jellemzőjét, amelyet fentebb modellperzisztenciaként is magyaráztunk. A béta a bomlási ráta, és exponenciális.

EWMA hasonlóságok a GARCH-hoz

Láthatjuk, hogy az EWMA a GARCH speciális esete, mert az EWMA-ban a Gamma x hosszú távú szórás 0-ra van állítva. Ez kikényszeríti, hogy az ALPHA és a BETA összege 1 legyen, mert az EWMA-ban csak az előző hozam négyzetét és az előző varianciát vesszük figyelembe.

Ez állandó perzisztenciával rendelkezik, ezért a hosszabb távú előrejelzések különböznek a GARCH és az EWMA modellek között.

Végezetül szeretném elmagyarázni, hogy miért érdemes a GARCH-ot választani az EWMA-val szemben.

Mikor használjuk a GARCH-ot az EWMA-val szemben?

A GARCH modellek GAMMA és hosszú távú varianciaaránya segít a historikus volatilitás jobb magyarázatában.

A GARCH modellek jól modellezik a volatilitás klaszteresedését. A volatilitási klaszterezés az a fogalom, amely azt jelzi, hogy a magas időszaki volatilitást általában magas volatilitású időszakok követik.

Mikor használjunk EWMA-t a GARCH felett?

Ha észrevesszük, hogy a GARCH modellben az alfa + béta > 1, akkor az EWMA modellt kell használnunk, mert akkor stabilabb, mint a GARCH.

Ne feledjük, hogy az alfa + béta az úgynevezett perzisztencia, és a perzisztencia mindig kisebb, mint 1 egy stabil modell esetében.

ARIMA feltételezések

AARIMA modell számos feltételezésen alapul, többek között:

  • Data does not contain anomalies
  • Model parameters and error term is constant
  • Historic timepoints dictate behaviour of present timepoints which might not hold in stressed market data conditions
  • Time series is stationary

Summary

This article provided an overview of ARIMA and highlighted main differences between EWMA and GARCH. These models can be used to forecast time series.

Hope it helps. Please let me know if you have any feedback.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.