Proyecto Final- Series de tiempo
1. Introducción al Análisis de Series de Tiempo:
2. Exploración de la Base de Datos
2.1 ¿Qué tipo de información se puede obtener al visualizar una serie de tiempo? Menciona al menos tres aspectos que se pueden identificar mediante la visualización.
2.2 Identifica las variables disponibles y la naturaleza de los datos de series de tiempo.
2.3 Realiza un análisis exploratorio de los datos consignados en esta base de datos. ¿Qué tipo de análisis estadístico se puede realizar en una serie de tiempo para comprender mejor sus características? Utiliza una librería Python para trazar la serie de tiempo de la variable seleccionada, identificando tendencias, estacionalidad y otros patrones visuales.
Run to view results
Run to view results
Run to view results
Run to view results
Run to view results
Run to view results
Run to view results
Run to view results
Run to view results
2.4. Calcula estadísticas descriptivas básicas de la serie de tiempo, como la media, la mediana, la desviación estándar, etc ¿Qué puedes concluir acerca de estos resultados?
Run to view results
3. Preparación de los datos Realiza el preprocesamiento necesario en la base de datos, como la limpieza de datos faltantes, la conversión de tipos de datos y la selección de la variable de interés.
4. Modelado y predicción: Utiliza statsmodels u otra biblioteca para ajustar un modelo de series de tiempo apropiado a los datos y realizar predicciones futuras. Pueden seleccionar una ventana temporal para la predicción, sustentando adecuadamente por qué.
Run to view results
Run to view results
El resultado del test ADF muestra un estadístico de 0.81 y un p-valor de 0.99, lo que indica una evidencia débil contra la hipótesis nula. En otras palabras, no se puede rechazar la idea de la serie no es estacionaria. Esto significa que sus valores presentan una tendencia o variación dependiente del tiempo, y será necesario aplicar transformaciones (como la diferenciación) antes de ajustar un modelo de series temporales.
Diferenciación Ayuda a eliminar los cambios de los datos y hace que sean estacionarios.
Run to view results
Run to view results
Run to view results
Verificamos si nuestros datos ahora son estacionarios.
Run to view results
Teniendo en cuenta estos resultados, debe hacerse una segunda diferencia, en la cual se mueva un espacio frente a la anterior
Run to view results
Run to view results
El segundo test arrojó un p-valor < 0.05, indicando que ahora la serie es estacionaria. Con esto, los datos ya están listos para el análisis de autocorrelación y modelado.
Run to view results
Correlograma
Run to view results
Se emplean los gráficos de autocorrelación (ACF) y autocorrelación parcial (PACF) para identificar patrones temporales y determinar los posibles parámetros (p y q) del modelo ARIMA.
Run to view results
ARIMA
Run to view results
Run to view results
Run to view results
Run to view results
SARIMAX
Run to view results
Run to view results
Run to view results
Run to view results
Realizamos una predicción de pasajeros para los próximos 3 años
Una vez validado el modelo SARIMAX, se realiza una proyección para los próximos tres años, generando 36 periodos adicionales.
Run to view results
Run to view results
Run to view results
Run to view results
Run to view results
Run to view results
Run to view results
5. Evaluación
Run to view results
Run to view results