Análisis de Sentimiento de las Reseñas de los Consumidores del Restaurante
Fuente de datos: https://www.kaggle.com/datasets/vigneshwarsofficial/reviews
Descripción del dataset
La mayoría de los restaurantes solicitan reseñas a los clientes y, en función de las reseñas, el restaurante puede mejorar la satisfacción del cliente. Así que los comentarios juegan un papel vital para el crecimiento exitoso del restaurante.
El conjunto de datos consta de 1,000 filas y 2 columnas. La columna de Comentario consta de las reseñas de los clientes y la columna Me gusta consta de 0 y 1. Si la revisión es positiva, 1 y si es negativa, 0.
Instalación e importación de las librerías
Importación del dataset
Análisis de los valores nulos del dataset
Análisis Exploratorio de Datos (EDA)
Creación de la clase que tendrá los métodos para el análisis de sentimientos
Aplicación de los métodos de la clase en la columna del dataframe
Pipeline del Aprendizaje Automático de Clasificación - Modelo Multinomial Naive Bayes
Predicción del Modelo Multinomial Naive Bayes
Al tener un accuracy del 81.20% por parte del modelo Multinomial Naive Bayes entrenado en función de las reseñas histórica de los consumidores del restaurante, tenemos que al insertar una nueva reseña 'This restaurant is amazing, the food is delicious and the service is exceptional', el modelo es capaz de predecir al 88.9% que tal comentario emitido por un cliente es de carácter positivo en cuanto a la satisfacción de dicho consumidor con respecto al servicio y producto del restaurante.
Gráficos de Nubes de Palabras (Word Cloud)
Pipeline del Aprendizaje Automático de Clasificación - Modelo Extreme Gradient Boosting (XGBoost)
Predicción del Modelo XGBoost
Al tener un accuracy del 72.80% por parte del modelo Extreme Gradient Boosting (XGBoost) entrenado en función de las reseñas histórica de los consumidores del restaurante, tenemos que al insertar una nueva reseña 'This restaurant is amazing, the food is delicious and the service is exceptional', el modelo es capaz de predecir al 78.1% que tal comentario emitido por un cliente es de carácter positivo en cuanto a la satisfacción de dicho consumidor con respecto al servicio y producto del restaurante.
Elección del modelo para el presente caso práctico
Luego de realizar el entrenamiento y la validación, tanto del modelo Multinomial de Naive Bayes y el Modelo Extreme Gradiente Boosting, concluyo que el modelo MultinomialNB tiene un mejor performance con respecto al modelo XGBoost porque alcanzó un accuracy del 81.2% frente al 72.8% del modelo XGBoost. En líneas generales, el primer modelo tiene un mayor nivel de predictibilidad en cuanto a la evaluación si un comentario de un consumidor de un restaurante es positivo o negativo.