Análisis de la Personalidad del Consumidor
Fuente y diccionario de datos: https://www.kaggle.com/datasets/imakash3011/customer-personality-analysis
Autor: Urdanegui Bisalaya, Sebastian Marat | Data Scientist | Data Analyst 📊
Librerías a importar
Cargar el dataset
Descripción estadística del dataset
Limpieza de los datos
Análisis de valores nulos en el dataframe
Solución a los valores nulos del dataframe
Análisis de distribución del feature que presenta valores nulos
Al analizar el boxplot de la variable "Income" tengo que la presencia de outliers es mínima y gran parte de los datos (aproximadamente, 95%) se encuentra dentro del rango intercuartílico, por ello, tomaré la decisión de introducir la media de los valores de la variable "Income" en los valores nulos del mismo.
Transformación de variable object a datetime
Observé que la variable "Dt_Customer" es del tipo "object", sin embargo, la variable hace referencia a la fecha en el que el cliente fue dado de alta por la empresa, entonces, el tipo debería ser "datetime".