# Levanto los datos en 3 diferentes dataframes
# ARTÍCULOS
conn = sql3.connect('/work/Data/articles.db')
sql_query = pd.read_sql_query('SELECT * FROM articles', conn)
df_articles = pd.DataFrame(sql_query, columns=['article_id','article_name','unit_price'])
print(df_articles)
# VENDEDORES
df_sellers = pd.read_excel('/work/Data/sellers.xlsx')
print(df_sellers)
# ÓRDENES
df_orders = pd.read_csv('/work/Data/orders.csv')
print(df_orders)
# Exploración del df artículos
print('Muestra de datos')
print(df_articles.head())
print('\nFormato del dataframe')
print(df_articles.shape)
print('\nBúsqueda de valores nulos')
print(df_articles.isnull().sum())
print('\nFormato de los datos')
print(df_articles.dtypes)
# Exploración del df vendedores
print('Muestra de datos')
print(df_sellers.head())
print('\nFormato del dataframe')
print(df_sellers.shape)
print('\nBúsqueda de valores nulos')
print(df_sellers.isnull().sum())
print('\nFormato de los datos')
print(df_sellers.dtypes)
# Exploración del df de órdenes
print('Muestra de datos')
print(df_orders.head())
print('\nFormato del dataframe')
print(df_orders.shape)
print('\Búsqueda de valores nulos')
print(df_orders.isnull().sum())
print('\Formato de los datos')
print(df_orders.dtypes)
#Artículos mejor vendidos por semana
for i in range(1,5):
my_df6 = ((my_df[(my_df['week'] == i)]).groupby('article_name').sum()).sort_values('total_amount', ascending=False).head(3)
print('\nArt. Mejor Vendidos, Semana:',i)
print('\n',my_df6[['quantity']+['total_amount']])
#Artículo Top 3 NO vendido por los países que menos generan ingresos
print('Los países que menos ingresos generaron este mes, no vendieron Notebook')
my_df73=((my_df[((my_df['article_name'] == 'Notebook'))&((my_df['country_name'] =='Puerto Rico') | (my_df['country_name'] == 'Paraguay') | (my_df['country_name'] == 'Ecuador') | (my_df['country_name'] == 'Uruguay') | (my_df['country_name'] == 'Bolivia')) ]).groupby(['article_name']).sum()).sort_values('total_amount')
print(my_df73)