In my article «How Do I Predict Time Series?», I provided an overview of time series analysis. Core of the article focused on the concept that future values in a time series are dependent on its past values.
This article serves as an overview of a powerful yet simple model known as ARIMA. Additionally it provides a comparison of two models: GARCH and EWMA. Both models assume that the recent events have higher precedence than former events. This model is important in data science and neural networks.
Please read FinTechExplained disclaimer.
ARIMA stands for Auto Regressive Integrated Moving Average. ARIMA is a simple stochastic time series model that we can use to train and then forecast future time points.
ARIMA can capture complex relationships as it takes error terms and observations of lagged terms. These models rely on regressing a variable on past values.
- ARIMA is Auto Regressive — (AR)
- ARIMA es Integrado – (I)
- ARIMA es Media Móvil – (MA)
- EWMA Vs GARCH
- EWMA es la media móvil ponderada exponencialmente
- GARCH -Generalised Autoregressive Conditional Hetroskedastic model
- Similitudes de EWMA con GARCH
- ¿Cuándo deberíamos utilizar GARCH en lugar de EWMA?
- ¿Cuándo debemos utilizar EWMA en lugar de GARCH?
- Supuestos de ARIMA
- Summary
ARIMA is Auto Regressive — (AR)
Auto Regressive (AR) property of ARIMA is referred to as P.
Past time points of time series data can impact current and future time points. ARIMA models take this concept into account when forecasting current and future values. ARIMA uses a number of lagged observations of time series to forecast observations. Se aplica un peso a cada uno de los términos pasados y los pesos pueden variar en función de lo recientes que sean.
AR(x) significa que se van a utilizar x términos de error rezagados en el modelo ARIMA.
ARIMA se basa en la Autorregresión. La autoregresión es un proceso de regresión de una variable sobre valores pasados de sí misma. Las autocorrelaciones decaen gradualmente y estiman el grado en que el ruido blanco caracteriza una serie de datos.
ARIMA es Integrado – (I)
Si existe una tendencia entonces la serie de tiempo se considera no estacionaria y muestra estacionalidad. La integración es una propiedad que reduce la estacionalidad de una serie temporal. Los modelos ARIMA tienen un grado de diferenciación que elimina la estacionalidad. Más información sobre la diferenciación se describe en mi artículo «¿Cómo puedo predecir las series de tiempo?».
La propiedad D de ARIMA representa el grado de diferenciación.
ARIMA es Media Móvil – (MA)
Los términos de error de los puntos de tiempo anteriores se utilizan para predecir la observación actual y futura. La media móvil (MA) elimina el no determinismo o los movimientos aleatorios de una serie temporal. La propiedad Q representa la media móvil en ARIMA. Se expresa como MA(x) donde x representa las observaciones anteriores que se utilizan para calcular la observación actual.
Los modelos de media móvil tienen una ventana fija y los pesos son relativos al tiempo. Esto implica que los modelos MA son más sensibles al evento actual y son más volátiles.
P (Autorregresivo), D (Integrado) y Q (Media Móvil) son las tres propiedades del modelo ARIMA
Los coeficientes se calculan recursivamente. El modelo se elige de forma que los resultados estimados calculados a partir del modelo se acerquen más a los valores reales observados. Este proceso es de naturaleza iterativa.
EWMA Vs GARCH
En esta sección, quería destacar dos modelos principales: EWMA y GARCH. Los modelos EWMA y GARCH giran en torno al concepto de persistencia del modelo.
La persistencia del modelo describe la tasa a la que la observación volverá a su valor a largo plazo tras un gran movimiento. Si estamos observando la volatilidad, entonces una alta persistencia significa que si hay un movimiento de choque en el mercado, entonces la volatilidad tardará más tiempo en volver a la media.
La persistencia de los modelos fiables debe ser inferior a 1.
La persistencia mayor que 1 significa que el modelo no es estable y no hay reversión a la media.
EWMA es la media móvil ponderada exponencialmente
EWMA es un modelo de media móvil (MA). Prevé la varianza en los datos de las series temporales tomando la media ponderada de la varianza estimada del día anterior y la rentabilidad del día anterior. Por lo tanto, el EWMA utiliza un modelo de regresión lineal de los valores actuales de las series temporales frente a las perturbaciones aleatorias no observadas actuales y anteriores. Estas perturbaciones aleatorias son términos de error de ruido blanco conocidos.
El modelo asume que las previsiones futuras son una función de los eventos históricos. Sin embargo, también asume que los eventos recientes tienen mayor precedencia que los eventos anteriores.
EWMA aplica ponderaciones a los retornos anteriores y a los más recientes (conocidos como innovación) de tal manera que las observaciones recientes tienen una mayor ponderación. Las ponderaciones disminuyen a un ritmo exponencial a medida que el tiempo retrocede. Las ponderaciones suman 1. Las ponderaciones se asignan para considerar que las últimas observaciones tienen más importancia que las observaciones más antiguas.
Esta es la razón por la que el modelo se conoce como modelo de previsión de media móvil ponderada exponencialmente (EWMA).
En un nivel alto, el modelo EWMA recursivo se puede escribir como:
Variable bajo observación = Choque actual + Último choque x Peso del último choque para el modelo EWMA(1)
La autocorrelación se calcula como: Coefficient for lagged random shock / (1 + Coefficient for lagged random shock)
This formula ensures that the weight is smaller for distant observations when compared to recent observations to indicate that recent observations have more importance.
GARCH -Generalised Autoregressive Conditional Hetroskedastic model
GARCH is an alternative method for calculating conditional variance (co variance). The model assumes that the return at time (t) has a particular distribution and the standard deviation of the distribution is indexed by time.
GARCH assumes that the latest return of the stock is dependent on the previous return. Por lo tanto, la varianza es condicional a los rendimientos anteriores.
GARCH es una función de tres términos:
- Varianza a largo plazo
- Cuadrado del último rendimiento
- Varianza anterior
Se aplica un peso a cada uno de los términos. Estos términos se conocen como GAMMA, ALFA y BETA. La fórmula para calcular la varianza condicional bajo GARCH es:
(Gamma x Varianza a largo plazo) + (Alfa x Cuadrado de la última rentabilidad) + (Beta x Varianza anterior)
La regla fundamental de GARCH es que Gamma + Alfa + Beta deben sumar 1. GAMMA, ALFA y BETA se calculan de forma que los valores estimados y los reales observados sean lo más cercanos posible.
La Tasa de Covarianza Promedio a Largo Plazo se calcula entonces como = (Gamma)/(1-Alpha-Beta)
La Varianza a Largo Plazo nos habla de la «adherencia de los datos» a un valor, por ejemplo, el 1% significa que los datos se moverán hacia 1 a medida que avanza el tiempo. Esencialmente, se asigna un peso a la estimación de la varianza media a largo plazo, lo que implica que el modelo reconoce la característica de reversión media de la volatilidad, que también se explica anteriormente como persistencia del modelo. Beta es la tasa de decaimiento y es exponencial.