Quiz: Modelos ARIMA y SARIMA

Modelos ARIMA

ARIMA es un acrónimo que significa AutoRegressive Integrated Moving Average. Es una clase de modelos que explica una serie de tiempo dada en función de sus propios valores pasados, es decir, su propia lags. Puede ser percibido como una regresión lineal de los datos pasados.

Los componentes de los modelos ARIMA son:

  • AR: Autoregression. Un modelo que utiliza la relación dependiente entre una observación y un número de observaciones rezagadas (lagged observations).
  • I: Integrated. El uso de la diferenciación de las observaciones en bruto (por ejemplo, restar una observación de una observación en el paso de tiempo anterior) para hacer que la serie de tiempo sea estacionaria.
  • MA: Moving Average. Un modelo que utiliza la dependencia entre una observación y un error residual de un modelo de media móvil aplicado a observaciones rezagadas.

Un modelo ARIMA se denota como ARIMA(p,d,q) donde:

  • p es el número de términos autorregresivos (AR part). Permite incorporar el efecto de los valores pasados en nuestro modelo.
  • d es el número de diferencias no estacionales necesarias para la estacionariedad.
  • q es el número de errores de pronóstico rezagados en la ecuación de predicción (MA part).

Modelos SARIMA

Los modelos SARIMA (Seasonal Autoregressive Integrated Moving Average) son una extensión de los modelos ARIMA que soportan directamente las series de tiempo univariadas con un componente estacional.

Un modelo SARIMA se denota como SARIMA(p,d,q)(P,D,Q)m donde:

  • p, d, q son los parámetros del modelo ARIMA para las tendencias no estacionales.
  • P, D, Q son los parámetros del modelo ARIMA para las tendencias estacionales.
  • m se refiere al número de periodos en cada temporada.

Ejemplo en Python

Aquí hay un ejemplo de cómo ajustar un modelo ARIMA y SARIMA a una serie de tiempo en Python usando la biblioteca statsmodels.

import pandas as pd
from statsmodels.tsa.arima.model import ARIMA
from statsmodels.tsa.statespace.sarimax import SARIMAX

# Cargar datos
series = pd.read_csv('your_data.csv', header=0, index_col=0, parse_dates=True, squeeze=True)

# Ajustar modelo ARIMA
model_arima = ARIMA(series, order=(5,1,0))
model_arima_fit = model_arima.fit(disp=0)
print(model_arima_fit.summary())

# Ajustar modelo SARIMA
model_sarima = SARIMAX(series, order=(1, 1, 1), seasonal_order=(1, 1, 1, 12))
model_sarima_fit = model_sarima.fit(disp=False)
print(model_sarima_fit.summary())

Por favor, reemplace 'your_data.csv' con la ruta a su archivo de datos. Los parámetros (5,1,0) y (1, 1, 1, 12) son solo ejemplos y deben ser ajustados a sus datos específicos.

Detalles adicionales sobre los modelos ARIMA

Los modelos ARIMA son aplicados en algunos casos donde los datos muestran evidencia de no estacionariedad, donde una etapa inicial de diferenciación (correspondiente al componente ‘I’ en el modelo) puede ser aplicada una o más veces para eliminar la tendencia no estacionaria.

El componente AR del modelo ARIMA indica que la variable evolutiva de interés es regresada en sus propios valores rezagados, es decir, anteriores. Por ejemplo, si p es 5, los predictores para x(t) serán x(t-1)….x(t-5).

El componente MA del modelo ARIMA indica que el error de regresión es en realidad una combinación lineal de términos de error cuyos valores ocurrieron contemporáneamente y en varios momentos en el pasado.

El componente I del modelo ARIMA indica que los datos se han diferenciado al menos una vez para hacer la serie estacionaria.

Detalles adicionales sobre los modelos SARIMA

Los modelos SARIMA añaden una capa adicional de complejidad al modelado de series temporales. Estos modelos incorporan elementos de estacionalidad tanto en el componente AR como en el MA del modelo. Esto significa que el modelo no sólo considera las relaciones de los datos consigo mismo (AR), los errores (MA) y las diferencias para la estacionariedad (I), sino que también tiene en cuenta la estacionalidad de los datos.

El componente SAR del modelo SARIMA indica que la serie temporal tiene correlaciones estacionales autorregresivas. Por ejemplo, si P es 2, los predictores para x(t) serán x(t-12) y x(t-24) si la serie es mensual.

El componente SMA del modelo SARIMA indica que la serie temporal tiene correlaciones estacionales de media móvil. Por ejemplo, si Q es 1, los predictores para x(t) serán los errores en los periodos t-12 y t-24 si la serie es mensual.

El componente SI del modelo SARIMA indica que los datos se han diferenciado al menos una vez para eliminar la estacionalidad.

El parámetro m en el modelo SARIMA se refiere al número de periodos por temporada, y es fundamental para modelar correctamente la estacionalidad. Por ejemplo, m sería 4 para datos trimestrales, 12 para datos mensuales, o 7 para datos diarios si se espera una estacionalidad semanal.

QUIZ:

A continuación responde el siguiente quiz: https://forms.gle/aA9Mx1D5BNvhb1SL7