Segmentación de datos
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.read_csv('Analisis2.csv', sep =';')
df.columns = [column.strip() for column in df.columns]
df.dtypes
Numero de compras
fig, (ax1, ax2, ax3, ax4) = plt.subplots(1,4, figsize=(24, 4))
fig.suptitle(f'Número de compras', fontsize=16)
sns.scatterplot(data=df, x='EDAD', y='Numero de compras en el ultimo ano', hue='GENERO', ax=ax1)
ax1.set_title('Diagrama de dispersión', fontsize=14)
ax1.set_xlabel('Edad', fontsize=14)
ax1.set_ylabel('Compras en el ultimo año', fontsize=14)
ax1.grid(True)
sns.boxplot(x=df['GENERO'], y=df['Numero de compras en el ultimo ano'], data=df, ax=ax2)
ax2.set_title('Diagrama de cajas', fontsize=14)
ax2.set_xlabel('Genero', fontsize=14)
ax2.set_ylabel('Compras en el ultimo año', fontsize=14)
ax2.grid(True)
sns.barplot(x='GENERO', y='Numero de compras en el ultimo ano', data=df, ax=ax3)
ax3.set_title('Diagrama de barras', fontsize=14)
ax3.set_xlabel('Genero', fontsize=14)
ax3.set_ylabel('Compras en el ultimo año', fontsize=14)
ax3.grid(True)
sns.histplot(df, x='Numero de compras en el ultimo ano', hue = 'GENERO', multiple='stack', ax=ax4)
ax4.set_title('Histograma', fontsize=14)
ax4.set_xlabel('Compras en el ultimo año', fontsize=14)
ax4.set_ylabel('Frecuencia', fontsize=14)
ax4.grid(True)
Analisis de Edad
fig, (ax1, ax2, ax3, ax4) = plt.subplots(1,4, figsize=(28, 4))
fig.suptitle(f'Total de compras', fontsize=16)
sns.scatterplot(data=df, x='EDAD', y='Valor total de compras en el ultimo ano', hue='GENERO', ax=ax1)
ax1.set_title('Diagrama de dispersión', fontsize=14)
ax1.set_xlabel('Edad', fontsize=14)
ax1.set_ylabel('Total compras en el ultimo año', fontsize=14)
ax1.grid(True)
sns.boxplot(x=df['GENERO'], y=df['Valor total de compras en el ultimo ano'], data=df, ax=ax2)
ax2.set_title('Diagrama de cajas', fontsize=14)
ax2.set_xlabel('Genero', fontsize=14)
ax2.set_ylabel('Total compras en el ultimo año', fontsize=14)
ax2.grid(True)
sns.barplot(x='GENERO', y='Valor total de compras en el ultimo ano', data=df, ax=ax3)
ax3.set_title('Diagrama de barras', fontsize=14)
ax3.set_xlabel('Genero', fontsize=14)
ax3.set_ylabel('Total compras en el ultimo año', fontsize=14)
ax3.grid(True)
sns.histplot(df, x='Valor total de compras en el ultimo ano', hue = 'GENERO', multiple='stack', ax=ax4)
ax4.set_title('Histograma', fontsize=14)
ax4.set_xlabel('Total de compras', fontsize=14)
ax4.set_ylabel('Frecuencia', fontsize=14)
ax4.grid(True)
Valor Total de compras
fig, (ax1, ax2, ax3, ax4) = plt.subplots(1,4, figsize=(28, 4))
fig.suptitle(f'Total de compras', fontsize=16)
sns.scatterplot(data=df, x='EDAD', y='Valor total de compras en el ultimo ano', hue='GENERO', ax=ax1)
ax1.set_title('Diagrama de dispersión', fontsize=14)
ax1.set_xlabel('Edad', fontsize=14)
ax1.set_ylabel('Total compras en el ultimo año', fontsize=14)
ax1.grid(True)
sns.boxplot(x=df['GENERO'], y=df['Valor total de compras en el ultimo ano'], data=df, ax=ax2)
ax2.set_title('Diagrama de cajas', fontsize=14)
ax2.set_xlabel('Genero', fontsize=14)
ax2.set_ylabel('Total compras en el ultimo año', fontsize=14)
ax2.grid(True)
sns.barplot(x='GENERO', y='Valor total de compras en el ultimo ano', data=df, ax=ax3)
ax3.set_title('Diagrama de barras', fontsize=14)
ax3.set_xlabel('Genero', fontsize=14)
ax3.set_ylabel('Total compras en el ultimo año', fontsize=14)
ax3.grid(True)
sns.histplot(df, x='Valor total de compras en el ultimo ano', hue = 'GENERO', multiple='stack', ax=ax4)
ax4.set_title('Histograma', fontsize=14)
ax4.set_xlabel('Total de compras', fontsize=14)
ax4.set_ylabel('Frecuencia', fontsize=14)
ax4.grid(True)
hace cuanto fue su ultima compra
fig, (ax1, ax2, ax3, ax4) = plt.subplots(1,4, figsize=(28, 4))
fig.suptitle(f'Tiempo sin comprar', fontsize=16)
sns.scatterplot(data=df, x='EDAD', y='Hace cuanto dias fue su ultima compra', hue='GENERO', ax=ax1)
ax1.set_title('Diagrama de dispersión', fontsize=14)
ax1.set_xlabel('Edad', fontsize=14)
ax1.set_ylabel('Tiempo sin comprar', fontsize=14)
ax1.grid(True)
sns.boxplot(x=df['GENERO'], y=df['Hace cuanto dias fue su ultima compra'], data=df, ax=ax2)
ax2.set_title('Diagrama de cajas', fontsize=14)
ax2.set_xlabel('Genero', fontsize=14)
ax2.set_ylabel('Tiempo sin comprar', fontsize=14)
ax2.grid(True)
sns.barplot(x='GENERO', y='Hace cuanto dias fue su ultima compra', data=df, ax=ax3)
ax3.set_title('Diagrama de barras', fontsize=14)
ax3.set_xlabel('Genero', fontsize=14)
ax3.set_ylabel('Tiempo sin comprar', fontsize=14)
ax3.grid(True)
sns.histplot(df, x='Hace cuanto dias fue su ultima compra', hue = 'GENERO', multiple='stack', ax=ax4)
ax4.set_title('Histograma', fontsize=14)
ax4.set_xlabel('Tiempo sin comprar', fontsize=14)
ax4.set_ylabel('Frecuencia', fontsize=14)
ax4.grid(True)