Understanding Auto Regressive Moving Average Model – ARIMA

Farhad Malik
Farhad Malik

Follow

Sep 19, 2018 · 6 min read

In my article „How Do I Predict Time Series?“, I provided an overview of time series analysis. Core of the article focused on the concept that future values in a time series are dependent on its past values.

This article serves as an overview of a powerful yet simple model known as ARIMA. Additionally it provides a comparison of two models: GARCH and EWMA. Both models assume that the recent events have higher precedence than former events. This model is important in data science and neural networks.

Please read FinTechExplained disclaimer.

ARIMA stands for Auto Regressive Integrated Moving Average. ARIMA is a simple stochastic time series model that we can use to train and then forecast future time points.

ARIMA can capture complex relationships as it takes error terms and observations of lagged terms. These models rely on regressing a variable on past values.

ARIMA is Auto Regressive — (AR)

Auto Regressive (AR) property of ARIMA is referred to as P.

Past time points of time series data can impact current and future time points. ARIMA models take this concept into account when forecasting current and future values. ARIMA uses a number of lagged observations of time series to forecast observations. Jedem der vergangenen Terme wird ein Gewicht zugewiesen, und die Gewichte können je nach Aktualität variieren.

AR(x) bedeutet, dass x verzögerte Fehlerterme im ARIMA-Modell verwendet werden.

ARIMA beruht auf Autoregression. Autoregression ist ein Prozess der Regression einer Variablen auf vergangene Werte ihrer selbst. Autokorrelationen klingen allmählich ab und schätzen den Grad, in dem weißes Rauschen eine Datenreihe charakterisiert.

ARIMA ist integriert – (I)

Wenn ein Trend existiert, dann wird die Zeitreihe als nicht stationär betrachtet und zeigt Saisonalität. Integriert ist eine Eigenschaft, die die Saisonalität aus einer Zeitreihe reduziert. ARIMA-Modelle haben einen Grad an Differenzierung, der die Saisonalität eliminiert. Weitere Informationen zur Differenzierung finden Sie in meinem Artikel „Wie kann ich Zeitreihen vorhersagen?“.

D-Eigenschaft von ARIMA steht für den Grad der Differenzierung.

ARIMA ist gleitender Durchschnitt – (MA)

Fehlerterme früherer Zeitpunkte werden zur Vorhersage aktueller und zukünftiger Beobachtungspunkte verwendet. Der gleitende Durchschnitt (MA) entfernt Nicht-Determinismus oder zufällige Bewegungen aus einer Zeitreihe. Die Eigenschaft Q stellt den gleitenden Durchschnitt in ARIMA dar. Sie wird als MA(x) ausgedrückt, wobei x für frühere Beobachtungen steht, die zur Berechnung der aktuellen Beobachtung verwendet werden.

Modelle des gleitenden Durchschnitts haben ein festes Fenster und die Gewichte sind relativ zur Zeit. Dies bedeutet, dass die MA-Modelle stärker auf aktuelle Ereignisse reagieren und volatiler sind.

P (AutoRegressiv), D (Integriert) und Q (Gleitender Durchschnitt) sind die drei Eigenschaften des ARIMA-Modells

Koeffizienten werden rekursiv berechnet. Das Modell wird so gewählt, dass die aus dem Modell berechneten Schätzergebnisse näher an den tatsächlich beobachteten Werten liegen. Dieser Prozess ist iterativer Natur.

EWMA vs. GARCH

In diesem Abschnitt möchte ich zwei Hauptmodelle hervorheben: EWMA und GARCH. EWMA- und GARCH-Modelle drehen sich um das Konzept der Modellpersistenz.

Modellpersistenz beschreibt die Rate, mit der die Beobachtung nach einer großen Bewegung zu ihrem langfristigen Wert zurückkehrt. Wenn wir die Volatilität beobachten, bedeutet eine hohe Persistenz, dass die Volatilität bei einer Schockbewegung auf dem Markt länger braucht, um zum Mittelwert zurückzukehren.

Die Persistenz zuverlässiger Modelle sollte unter 1 liegen.

Eine Persistenz von mehr als 1 bedeutet, dass das Modell nicht stabil ist und es keine Rückkehr zum Mittelwert gibt.

EWMA ist ein exponentiell gewichteter gleitender Durchschnitt

EWMA ist ein Modell des gleitenden Durchschnitts (MA). Es prognostiziert die Varianz in Zeitreihendaten, indem es den gewichteten Durchschnitt der geschätzten Varianz des Vortages und der Rendite des Vortages nimmt. EWMA verwendet also ein lineares Regressionsmodell der aktuellen Werte von Zeitreihen gegen die aktuellen und früheren unbeobachteten Zufallsschocks. Diese zufälligen Schocks sind bekannte Fehlerterme des weißen Rauschens.

Das Modell geht davon aus, dass zukünftige Prognosen eine Funktion historischer Ereignisse sind. Es geht jedoch auch davon aus, dass die jüngsten Ereignisse einen höheren Stellenwert haben als frühere Ereignisse.

EWMA wendet auf die früheren und die jüngsten Renditen Gewichte an (bekannt als Innovation), so dass die jüngsten Beobachtungen stark gewichtet werden. Die Gewichte nehmen exponentiell ab, wenn die Zeit rückwärts läuft. Die Gewichte summieren sich zu 1. Die Gewichte werden so zugewiesen, dass den jüngsten Beobachtungen mehr Bedeutung beigemessen wird als den älteren Beobachtungen.

Das ist der Grund, warum das Modell als Exponentially Weighted Moving Average (EWMA) Prognosemodell bekannt ist.

Auf einer hohen Ebene kann das rekursive EWMA-Modell wie folgt geschrieben werden:

Variable unter Beobachtung = Aktueller Schock + Letzter Schock x Gewicht des letzten Schocks für EWMA(1)-Modell

Die Autokorrelation wird berechnet als: Coefficient for lagged random shock / (1 + Coefficient for lagged random shock)

This formula ensures that the weight is smaller for distant observations when compared to recent observations to indicate that recent observations have more importance.

GARCH -Generalised Autoregressive Conditional Hetroskedastic model

GARCH is an alternative method for calculating conditional variance (co variance). The model assumes that the return at time (t) has a particular distribution and the standard deviation of the distribution is indexed by time.

GARCH assumes that the latest return of the stock is dependent on the previous return. Daher ist die Varianz von den vorherigen Renditen abhängig.

GARCH ist eine Funktion dreier Terme:

  1. Langfristige Varianz
  2. Quadrat der letzten Rendite
  3. Vorherige Varianz

Jedem der Terme wird ein Gewicht zugewiesen. Diese Terme werden als GAMMA, ALPHA und BETA bezeichnet. Die Formel zur Berechnung der bedingten Varianz unter GARCH lautet:

(Gamma x Langfristige Varianz) + (Alpha x Quadrat der letzten Rendite) + (Beta x Vorherige Varianz)

Die Grundregel von GARCH ist, dass Gamma + Alpha + Beta sich zu 1 addieren sollten. GAMMA, ALPHA und BETA werden so berechnet, dass die geschätzten und die tatsächlich beobachteten Werte so nahe wie möglich beieinander liegen.

Die langfristige durchschnittliche Kovarianzrate wird dann berechnet als = (Gamma)/(1-Alpha-Beta)

Die langfristige Varianz gibt Aufschluss über die „Klebrigkeit“ der Daten an einem Wert, z. B. bedeutet 1 %, dass sich die Daten im Laufe der Zeit in Richtung 1 bewegen. Im Wesentlichen wird der durchschnittlichen langfristigen Varianzschätzung ein Gewicht zugewiesen, was bedeutet, dass das Modell die mittelwertumkehrende Eigenschaft der Volatilität erkennt, die oben auch als Modellpersistenz erklärt wird. Beta ist die Zerfallsrate und sie ist exponentiell.

EWMA Ähnlichkeiten mit GARCH

Wir können sehen, dass EWMA ein Spezialfall von GARCH ist, weil Gamma x Langzeitvarianz in EWMA auf 0 gesetzt wird. Dies erzwingt, dass ALPHA und BETA sich zu 1 addieren, weil wir in EWMA nur die quadrierte frühere Rendite und die frühere Varianz berücksichtigen.

Es hat eine permanente Persistenz und die längerfristigen Prognosen sind daher zwischen GARCH- und EWMA-Modellen unterschiedlich.

Schließlich möchte ich erklären, warum man GARCH gegenüber EWMA wählen sollte.

Wann sollte man GARCH gegenüber EWMA verwenden?

GAMMA und die langfristige Varianzrate von GARCH-Modellen helfen dabei, die historische Volatilität besser zu erklären.

GARCH-Modelle sind gut geeignet, um Volatilitätscluster zu modellieren. Volatilitätsclusterung ist das Konzept, das besagt, dass auf Perioden mit hoher Volatilität tendenziell Perioden mit hoher Volatilität folgen.

Wann sollten wir EWMA über GARCH verwenden?

Wenn wir feststellen, dass im GARCH-Modell Alpha + Beta > 1 sind, dann müssen wir das EWMA-Modell verwenden, weil es dann stabiler ist als GARCH.

Erinnern Sie sich, dass Alpha + Beta als Persistenz bekannt ist und die Persistenz für ein stabiles Modell immer kleiner als 1 ist.

ARIMA-Annahmen

DasARIMA-Modell basiert auf einer Reihe von Annahmen, darunter:

  • Data does not contain anomalies
  • Model parameters and error term is constant
  • Historic timepoints dictate behaviour of present timepoints which might not hold in stressed market data conditions
  • Time series is stationary

Summary

This article provided an overview of ARIMA and highlighted main differences between EWMA and GARCH. These models can be used to forecast time series.

Hope it helps. Please let me know if you have any feedback.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.