Nos valemos del dataframe de ventas concretadas (df_orders) cómo base de nuestro cuarto dataframe, ya que es el más grande y es el que contiene la información necesaria para completar los campos que necesitamos, un vistazo a nuestra nueva copia se ve así:
Luego de correr el código o pipeline, el dataframe adopta esta forma:
Con el dataframe listo, podemos responder la pregunta haciendo las siguientes operaciones:
Tomamos como muestra, los primeros cinco productos, con eso tenemos el top cinco de productos para representar de forma visual estos datos:
Con el dataframe inicial, se agrupan las filas por producto, se suman los totales, se aplica ordenamiento descendente en base al total facturado por producto, y se eliminan las columnas restantes:
Así queda plasmado el top cinco de productos en un grafico circular:
Todo parece indicar que a fin de mes, las ventas cayeron un 56% aproximadamente, quizá una buena idea sea crear promociones pasada la segunda semana y ofertas flash de últimos días del mes.
Por alguna razón, los escritorios experimentaron un incremento significativo en su demanda, para luego ser el producto con más caída en ventas, mientras que los coolers fueron el producto más estable en términos de unidades vendidas.