Análisis de los 25 retailers más grandes de Estados Unidos
# Importar librerías
from IPython.display import display
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
# Importar datos aquí
df = pd.read_csv("largest_us_retailers.csv")
df.head()
df.describe()
df.info()
I. Preguntas del negocio
sns.boxplot(df["Sales"][1:-1])
promedio = str(df["Sales"][1:-1].mean().round(2))
plt.title("Promedio:"+ promedio)
# sns.histplot(df[1:-1], x="Sales")
# plt.title("La mayoria de la empresas sin contar la numero uno gano entre: 18,201 y 34,340.3")
f, (ax_box, ax_hist) = plt.subplots(2, sharex=True, gridspec_kw={"height_ratios": (.15, .85)})
sns.histplot(df, x="Sales", ax=ax_hist)
sns.boxplot(df["Sales"], ax=ax_box)
txt_1 = "La mayoria de las compañias gano entre: 16,592 y 48,668.3"
plt.figtext(0.5, 1, txt_1, wrap=True, horizontalalignment='center', fontsize=12)
f, (ax_box, ax_hist) = plt.subplots(2, sharex=True, gridspec_kw={"height_ratios": (.15, .85)})
con = sns.histplot(df, x="Stores", ax=ax_hist)
sns.boxplot(df["Stores"], ax=ax_box)
txt_1 = "La mayoria de las compañias tiene entre: 231 y 2,233 tiendas"
plt.figtext(0.5, 1, txt_1, wrap=True, horizontalalignment='center', fontsize=12)
sns.scatterplot(data=df, x = 'Stores', y = "Sales")
txt = "La compañia con mas tiendas no es la numero uno en ventas \n La numero uno en ventas tiene menos de un tercio en comparacion de la que tiene mas tiendas"
plt.figtext(0.5, 1, txt, wrap=True, horizontalalignment='center', fontsize=12)
max_sales = df["Sales"].max()
min_sales = df["Sales"].min()
range_sales = max_sales - min_sales
print("Ventas maximas:", max_sales)
print("Ventas minimas:", min_sales)
print("Rango entre las venats:", range_sales)
more_stores = df.nlargest(5, "Stores")
more_sales = df.nlargest(5, "Sales")
print("Compañias con mas tiendas físicas")
display(more_stores)
print("De las cinco compañias con mas tiendas físicas, solo dos estan entre las que mas ventas tienen")
pd.merge(more_stores,more_sales,on='Company')
print("La categoria con mas ventas es: Supercenters")
sns.barplot(data=df, x="Sales", y="Category")
company_supercenters = df[(df["Category"]=="Supercenters")]
sns.barplot(data=company_supercenters, x="Sales", y="Company")
plt.title("Compañias dentro de la categoria Supercenters", size=12)
sns.barplot(data=df, x = 'Sales/Avg. Store' , y="Company")
plt.title("Costco Es la compañia que genera mas ventas por tienda")
print("Amazon y Apple no cuentan con tiendas fisicas")
print("amazon esta en el lugar numero 7 en ventas")
print("Apple esta en el lugar nuero 12 en ventas")
print("Sus ventas si destacan sobrelas que tienen tiendas físicas")
df[df['Stores'].isnull()]
idx_no_stores =[6, 11]
clrs = ["red" if x in idx_no_stores else "red" for x in df["Company"] ]
ax = sns.barplot(data=df, x="Sales", y="Company")
for bar in ax.patches:
if bar.get_y().round() in idx_no_stores:
bar.set_color('red')
else:
bar.set_color('grey')
sns.scatterplot(data=df, x="Sales/Avg. Store", y="Stores")
txt = "En la grafrica se puede notar que a en la matoria de las compañias a moyor tiendas tiene menores son sus ventas por tienda"
plt.figtext(0.5, 1, txt, wrap=True, horizontalalignment='center', fontsize=12)
sns.jointplot(data=df, x="Store Count Growth", y="Sales/Avg. Store")
"Sales/Avg. Store"