Understanding Auto Regressive Moving Average Model – ARIMA

Farhad Malik
Farhad Malik

Follow

Sep 19, 2018 · 6 min read

In my article «How Do I Predict Time Series?», I provided an overview of time series analysis. Core of the article focused on the concept that future values in a time series are dependent on its past values.

This article serves as an overview of a powerful yet simple model known as ARIMA. Additionally it provides a comparison of two models: GARCH and EWMA. Both models assume that the recent events have higher precedence than former events. This model is important in data science and neural networks.

Please read FinTechExplained disclaimer.

ARIMA stands for Auto Regressive Integrated Moving Average. ARIMA is a simple stochastic time series model that we can use to train and then forecast future time points.

ARIMA can capture complex relationships as it takes error terms and observations of lagged terms. These models rely on regressing a variable on past values.

ARIMA is Auto Regressive — (AR)

Auto Regressive (AR) property of ARIMA is referred to as P.

Past time points of time series data can impact current and future time points. ARIMA models take this concept into account when forecasting current and future values. ARIMA uses a number of lagged observations of time series to forecast observations. Se aplica un peso a cada uno de los términos pasados y los pesos pueden variar en función de lo recientes que sean.

AR(x) significa que se van a utilizar x términos de error rezagados en el modelo ARIMA.

ARIMA se basa en la Autorregresión. La autoregresión es un proceso de regresión de una variable sobre valores pasados de sí misma. Las autocorrelaciones decaen gradualmente y estiman el grado en que el ruido blanco caracteriza una serie de datos.

ARIMA es Integrado – (I)

Si existe una tendencia entonces la serie de tiempo se considera no estacionaria y muestra estacionalidad. La integración es una propiedad que reduce la estacionalidad de una serie temporal. Los modelos ARIMA tienen un grado de diferenciación que elimina la estacionalidad. Más información sobre la diferenciación se describe en mi artículo «¿Cómo puedo predecir las series de tiempo?».

La propiedad D de ARIMA representa el grado de diferenciación.

ARIMA es Media Móvil – (MA)

Los términos de error de los puntos de tiempo anteriores se utilizan para predecir la observación actual y futura. La media móvil (MA) elimina el no determinismo o los movimientos aleatorios de una serie temporal. La propiedad Q representa la media móvil en ARIMA. Se expresa como MA(x) donde x representa las observaciones anteriores que se utilizan para calcular la observación actual.

Los modelos de media móvil tienen una ventana fija y los pesos son relativos al tiempo. Esto implica que los modelos MA son más sensibles al evento actual y son más volátiles.

P (Autorregresivo), D (Integrado) y Q (Media Móvil) son las tres propiedades del modelo ARIMA

Los coeficientes se calculan recursivamente. El modelo se elige de forma que los resultados estimados calculados a partir del modelo se acerquen más a los valores reales observados. Este proceso es de naturaleza iterativa.

EWMA Vs GARCH

En esta sección, quería destacar dos modelos principales: EWMA y GARCH. Los modelos EWMA y GARCH giran en torno al concepto de persistencia del modelo.

La persistencia del modelo describe la tasa a la que la observación volverá a su valor a largo plazo tras un gran movimiento. Si estamos observando la volatilidad, entonces una alta persistencia significa que si hay un movimiento de choque en el mercado, entonces la volatilidad tardará más tiempo en volver a la media.

La persistencia de los modelos fiables debe ser inferior a 1.

La persistencia mayor que 1 significa que el modelo no es estable y no hay reversión a la media.

EWMA es la media móvil ponderada exponencialmente

EWMA es un modelo de media móvil (MA). Prevé la varianza en los datos de las series temporales tomando la media ponderada de la varianza estimada del día anterior y la rentabilidad del día anterior. Por lo tanto, el EWMA utiliza un modelo de regresión lineal de los valores actuales de las series temporales frente a las perturbaciones aleatorias no observadas actuales y anteriores. Estas perturbaciones aleatorias son términos de error de ruido blanco conocidos.

El modelo asume que las previsiones futuras son una función de los eventos históricos. Sin embargo, también asume que los eventos recientes tienen mayor precedencia que los eventos anteriores.

EWMA aplica ponderaciones a los retornos anteriores y a los más recientes (conocidos como innovación) de tal manera que las observaciones recientes tienen una mayor ponderación. Las ponderaciones disminuyen a un ritmo exponencial a medida que el tiempo retrocede. Las ponderaciones suman 1. Las ponderaciones se asignan para considerar que las últimas observaciones tienen más importancia que las observaciones más antiguas.

Esta es la razón por la que el modelo se conoce como modelo de previsión de media móvil ponderada exponencialmente (EWMA).

En un nivel alto, el modelo EWMA recursivo se puede escribir como:

Variable bajo observación = Choque actual + Último choque x Peso del último choque para el modelo EWMA(1)

La autocorrelación se calcula como: Coefficient for lagged random shock / (1 + Coefficient for lagged random shock)

This formula ensures that the weight is smaller for distant observations when compared to recent observations to indicate that recent observations have more importance.

GARCH -Generalised Autoregressive Conditional Hetroskedastic model

GARCH is an alternative method for calculating conditional variance (co variance). The model assumes that the return at time (t) has a particular distribution and the standard deviation of the distribution is indexed by time.

GARCH assumes that the latest return of the stock is dependent on the previous return. Por lo tanto, la varianza es condicional a los rendimientos anteriores.

GARCH es una función de tres términos:

  1. Varianza a largo plazo
  2. Cuadrado del último rendimiento
  3. Varianza anterior
  4. Se aplica un peso a cada uno de los términos. Estos términos se conocen como GAMMA, ALFA y BETA. La fórmula para calcular la varianza condicional bajo GARCH es:

    (Gamma x Varianza a largo plazo) + (Alfa x Cuadrado de la última rentabilidad) + (Beta x Varianza anterior)

    La regla fundamental de GARCH es que Gamma + Alfa + Beta deben sumar 1. GAMMA, ALFA y BETA se calculan de forma que los valores estimados y los reales observados sean lo más cercanos posible.

    La Tasa de Covarianza Promedio a Largo Plazo se calcula entonces como = (Gamma)/(1-Alpha-Beta)

    La Varianza a Largo Plazo nos habla de la «adherencia de los datos» a un valor, por ejemplo, el 1% significa que los datos se moverán hacia 1 a medida que avanza el tiempo. Esencialmente, se asigna un peso a la estimación de la varianza media a largo plazo, lo que implica que el modelo reconoce la característica de reversión media de la volatilidad, que también se explica anteriormente como persistencia del modelo. Beta es la tasa de decaimiento y es exponencial.

    Similitudes de EWMA con GARCH

    Podemos ver que EWMA es un caso especial de GARCH porque Gamma x Varianza a Largo Plazo se establece en 0 en EWMA. Esto obliga a que ALPHA y BETA sumen 1 porque en EWMA sólo tenemos en cuenta la rentabilidad anterior al cuadrado y la varianza anterior.

    Tiene persistencia permanente y las previsiones a más largo plazo son por tanto diferentes entre los modelos GARCH y EWMA.

    Por último, quería explicar por qué uno elegiría GARCH en lugar de EWMA.

    ¿Cuándo deberíamos utilizar GARCH en lugar de EWMA?

    La tasa de varianza a largo plazo y GARCH ayudan a explicar mejor la volatilidad histórica.

    Los modelos GARCH son buenos para modelar la agrupación de la volatilidad. La agrupación de la volatilidad es el concepto que indica que la volatilidad de un período alto tiende a ser seguida por períodos de alta volatilidad.

    ¿Cuándo debemos utilizar EWMA en lugar de GARCH?

    Si observamos que en el modelo GARCH, alfa + beta > 1 entonces debemos utilizar el modelo EWMA porque entonces es más estable que GARCH.

    Recuerde que alfa + beta se conoce como persistencia y la persistencia es siempre menor que 1 para un modelo estable.

    Supuestos de ARIMA

    El modelo ARIMA se basa en una serie de supuestos que incluyen:

    • Data does not contain anomalies
    • Model parameters and error term is constant
    • Historic timepoints dictate behaviour of present timepoints which might not hold in stressed market data conditions
    • Time series is stationary

    Summary

    This article provided an overview of ARIMA and highlighted main differences between EWMA and GARCH. These models can be used to forecast time series.

    Hope it helps. Please let me know if you have any feedback.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.