In my article „How Do I Predict Time Series?“, I provided an overview of time series analysis. Core of the article focused on the concept that future values in a time series are dependent on its past values.
This article serves as an overview of a powerful yet simple model known as ARIMA. Additionally it provides a comparison of two models: GARCH and EWMA. Both models assume that the recent events have higher precedence than former events. This model is important in data science and neural networks.
Please read FinTechExplained disclaimer.
ARIMA stands for Auto Regressive Integrated Moving Average. ARIMA is a simple stochastic time series model that we can use to train and then forecast future time points.
ARIMA can capture complex relationships as it takes error terms and observations of lagged terms. These models rely on regressing a variable on past values.
- ARIMA is Auto Regressive — (AR)
- ARIMA je integrovaná – (I)
- ARIMA je klouzavý průměr – (MA)
- EWMA Vs GARCH
- EWMA je exponenciálně vážený klouzavý průměr
- GARCH -Generalised Autoregressive Conditional Hetroskedastic model
- Podobnost EWMA s GARCH
- Kdy bychom měli použít GARCH místo EWMA?
- Kdy bychom měli použít EWMA místo GARCH?
- Předpoklady modelu GARIMA
- Summary
ARIMA is Auto Regressive — (AR)
Auto Regressive (AR) property of ARIMA is referred to as P.
Past time points of time series data can impact current and future time points. ARIMA models take this concept into account when forecasting current and future values. ARIMA uses a number of lagged observations of time series to forecast observations. Na každý z minulých členů se aplikuje váha a váhy se mohou lišit podle toho, jak jsou aktuální.
AR(x) znamená, že v modelu ARIMA bude použito x zpožděných chybových členů.
ARIMA se opírá o AutoRegression. Autoregrese je proces regrese proměnné na její minulé hodnoty. Autokorelace se postupně rozpadají a odhadují, do jaké míry charakterizuje řadu dat bílý šum.
ARIMA je integrovaná – (I)
Pokud existuje trend, pak se časová řada považuje za nestacionární a vykazuje sezónnost. Integrovanost je vlastnost, která snižuje sezónnost z časové řady. Modely ARIMA mají určitý stupeň diferenciace, který eliminuje sezónnost. Více informací o diferenciaci je uvedeno v mém článku „Jak předpovídat časové řady?“
Vlastnost D modelu ARIMA představuje stupeň diferenciace.
ARIMA je klouzavý průměr – (MA)
K předpovědi pozorování současného a budoucího bodu se používají chybové termíny předchozích časových bodů. Klouzavý průměr (MA) odstraňuje neurčitost nebo náhodné pohyby z časové řady. Vlastnost Q představuje klouzavý průměr v ARIMA. Vyjadřuje se jako MA(x), kde x představuje předchozí pozorování, která se používají k výpočtu aktuálního pozorování.
Modely klouzavého průměru mají pevné okno a váhy se vztahují k času. To znamená, že modely MA více reagují na aktuální událost a jsou volatilnější.
P (AutoRegresivní), D (Integrovaný) a Q (Klouzavý průměr) jsou tři vlastnosti modelu ARIMA
Koeficienty se počítají rekurzivně. Model se volí takový, aby se odhadované výsledky vypočtené z modelu blížily skutečným pozorovaným hodnotám. Tento proces má iterační charakter.
EWMA Vs GARCH
V této části jsem chtěl upozornit na dva hlavní modely: EWMA a GARCH. Modely EWMA a GARCH se točí kolem konceptu perzistence modelu.
Perzistence modelu popisuje míru, s jakou se pozorování po velkém pohybu vrátí ke své dlouhodobé hodnotě. Pokud pozorujeme volatilitu, pak vysoká perzistence znamená, že pokud dojde k nárazovému pohybu na trhu, bude volatilitě trvat déle, než se vrátí ke střední hodnotě.
Persistence spolehlivých modelů by měla být nižší než 1.
Persistence vyšší než 1 znamená, že model není stabilní a nedochází k návratu ke střední hodnotě.
EWMA je exponenciálně vážený klouzavý průměr
EWMA je model klouzavého průměru (MA). Předpovídá rozptyl v datech časových řad pomocí váženého průměru odhadovaného rozptylu předchozího dne a výnosu předchozího dne. EWMA tedy využívá lineární regresní model současných hodnot časové řady vůči současným i předchozím nepozorovaným náhodným šokům. Tyto náhodné šoky jsou známé chybové členy bílého šumu.
Model předpokládá, že budoucí předpovědi jsou funkcí historických událostí. Zároveň však předpokládá, že nedávné události mají vyšší prioritu než dřívější události.
EWMA aplikuje váhy na předchozí a nejnovější výnosy (tzv. inovace) tak, že nedávná pozorování mají vyšší váhu. Váhy klesají exponenciální rychlostí s postupem času zpět. Součet vah je roven 1. Váhy jsou přiřazeny tak, aby se nejnovější pozorování považovala za důležitější než starší pozorování.
Z tohoto důvodu je model znám jako prognostický model s exponenciálně váženým klouzavým průměrem (EWMA).
Na vysoké úrovni lze rekurzivní model EWMA zapsat takto:
Proměnná v pozorování = aktuální šok + poslední šok x váha posledního šoku pro model EWMA(1)
Autokorelace se vypočítá jako: Coefficient for lagged random shock / (1 + Coefficient for lagged random shock)
This formula ensures that the weight is smaller for distant observations when compared to recent observations to indicate that recent observations have more importance.
GARCH -Generalised Autoregressive Conditional Hetroskedastic model
GARCH is an alternative method for calculating conditional variance (co variance). The model assumes that the return at time (t) has a particular distribution and the standard deviation of the distribution is indexed by time.
GARCH assumes that the latest return of the stock is dependent on the previous return. Rozptyl je tedy podmíněn předchozími výnosy.
GARCH je funkcí tří členů:
- Dlouhodobý rozptyl
- Čtverec posledního výnosu
- Předchozí rozptyl
Každému z členů je přiřazena váha. Tyto termíny se označují jako GAMMA, ALPHA a BETA. Vzorec pro výpočet podmíněné variance podle GARCH je:
(Gamma x dlouhodobá variance) + (Alfa x čtverec posledního výnosu) + (Beta x předchozí variance)
Základním pravidlem GARCH je, že Gamma + Alfa + Beta by měly dát dohromady 1. V případě, že je to možné, je to možné. GAMMA, ALFA a BETA se počítají tak, aby odhadované a skutečně pozorované hodnoty byly co nejblíže.
Dlouhodobá průměrná míra kovariance se pak vypočítá jako = (Gamma)/(1-Alfa-Beta)
Dlouhodobá variance vypovídá o „přilnavosti“ dat k určité hodnotě, např. 1 % znamená, že data se budou s postupem času pohybovat směrem k 1. V podstatě jde o přiřazení váhy průměrnému odhadu dlouhodobé variance, což znamená, že model uznává charakteristiku mean revertingu volatility, která je výše vysvětlena také jako perzistence modelu. Beta je míra rozpadu a je exponenciální.