# A veces necesitamos instalar nuevas librerías en nuestros proyectos
!pip install openpyxl==3.0.10
# Imports
import numpy as np
import pandas as pd
import sqlite3 as sql3
import matplotlib.pyplot as plt
import seaborn as sns
import openpyxl #Para levantar excel de otros paquetes (no office)
# Exploración del df de artículos
print('Muestra de datos')
print(df_articles.head())
print('\nForma del dataframe')
print(df_articles.shape)
print('\nBuscar valores nulos')
print(df_articles.isnull().sum())
print('\nFormato de los datos del dataframe')
print(df_articles.dtypes)
# Cambiar a float los precios unitarios
df_articles['unit_price'] = df_articles['unit_price'].astype(float)
print(df_articles.dtypes)
# RESOLUCIÓN GRÁFICA
sns.barplot(x=my_df2.index, y=my_df2['quantity'], data=my_df2, order=my_df2.sort_values('quantity', ascending=False).index).set(title='Cantidad de ventas por articulo')
plt.xlabel('Articulos')
plt.ylabel('Cantidad')
plt.xticks(rotation=90)
plt.show()
# RESOLUCIÓN GRÁFICA
plt.pie(x=mas_ingresos['total_amount'], labels=mas_ingresos.index)
plt.title('Articulos con mas ingresos')
plt.show()
# RESOLUCIÓN GRÁFICA
plt.bar(my_df4.index, my_df4['total_amount'])
plt.title('Monto Total de ventas por vendedor')
plt.xlabel('Vendedores')
plt.ylabel('Monto Total')
plt.xticks(rotation=75)
plt.show()
# RESOLUCIÓN GRÁFICA
plt.bar(my_df5.index, my_df5['total_amount'])
plt.title('Monto Total de ventas por semana')
plt.xlabel('Semana')
plt.ylabel('Monto Total')
plt.xticks([1,2,3,4])
plt.show()
# RESOLUCIÓN
my_df6 = my_df.groupby('country_name').sum().sort_values('total_amount', ascending=False)
print(my_df6[['quantity']+['total_amount']])
plt.bar(my_df6.index, my_df6['total_amount'])
plt.title('Monto Total de ventas por pais')
plt.xlabel('Paises')
plt.ylabel('Monto Total')
plt.xticks(rotation=75)
plt.show()
# RESOLUCIÓN
my_df7 = my_df.groupby(['article_name', 'country_name']).sum().sort_values('quantity', ascending=False).head(10)
print(my_df7[['quantity']+['total_amount']])
sns.relplot(x='country_name', y='article_name', data=my_df7, hue='quantity')
plt.title('Articulos que mas de venden por pais')
plt.xlabel('Paises')
plt.ylabel('Productos')
plt.xticks(rotation=75)
plt.show()
# RESOLUCIÓN
my_df8 = my_df.groupby(['seller_name', 'country_name']).sum().sort_values('total_amount', ascending=False).head(5)
print(my_df8[['quantity']+['total_amount']])
sns.relplot(x='country_name', y='seller_name', data=my_df8, hue='total_amount')
plt.title('Vendedores que mas facturan por pais')
plt.xlabel('Paises')
plt.ylabel('Vendedores')
plt.xticks(rotation=75)
plt.show()