Evaluación de modelos de aprendizaje automático para la predicción de ventas de boletos en juegos de béisbol en Tijuana
Citation
Share
Date
Abstract
La predicción de ventas de boletos en la industria del entretenimiento es un elemento crucial para la planificación y éxito de eventos deportivos. No solo permite una gestión más eficiente de los recursos, sino que también potencia estrategias de marketing efectivas. En este contexto, esta tesis se enfoca en desarrollar un sistema de predicción de ventas de boletos para partidos de béisbol en Tijuana, México. Para el desarrollo, se utiliza un conjunto de datos segmentado por puntos de venta, específicamente gasolineras, junto con las ventas correspondientes en cada punto. Este conjunto de datos comprende variables cruciales como Evento, Día/Semana, Mes, Año, Zona, Precio y Número de Boletos Vendidos. Para el entrenamiento, se implementan diversos modelos de aprendizaje automático, incluyendo algoritmos como Árbol de Decisión, Máquinas de Vectores de Soporte, Regresor de Gradient Boosting, Redes Neuronales LSTM, Adaboost, Random Forest, XGBoost y LightGBM. Adicionalmente, para comparar con técnicas estadísticas clásicas, se exploraron los modelos ARIMA y SARIMA. Tras el entrenamiento y la generación de predicciones, se lleva a cabo una comparación exhaustiva para determinar el rendimiento óptimo utilizando la métrica de desempeño del Error Absoluto Medio Porcentual (MAPE). Destacando el modelo XGBoost que muestra el mejor desempeño con un MAPE de 0.31, consolidándose como la elección idónea para la predicción de ventas de boletos en este contexto. Esta investigación no solo proporciona un sistema para pronosticar ventas de boletos, sino que también sienta bases sólidas para futuras investigaciones en la gestión de ventas de boletos en eventos deportivos dentro de la industria del entretenimiento.