fig, axes = plt.subplots (1,2, figsize = (10,4)) # Aumentamos el tamaño del lienzo
# Grafica 1, histograma. Todo se agrega sobre axes[0]
axes[0].hist(iris['sepal_length'], # datos
bins = 10, # cantidad de barras
color = 'violet'); # color
axes[0].set_xlabel('Largo del sépalo (cm)')
axes[0].set_ylabel('Frecuencia')
# Grafica 2, diagrama de dispersión. Todo se agrega sobre axes[1]
axes[1].scatter(iris['sepal_length'], # grafico de dispersion
iris['petal_length'],
marker = 'o', # se puede modificar el marcador
color = 'red');
axes[1].set_xlabel('Largo del sépalo (cm)')
axes[1].set_ylabel('largo del pétalo')
# A partir de un dataframe se pueden crear graficas usando matplotlib
# bar y barh hace referencia a gráficos de barras
iris.groupby('species').mean()['sepal_width'].plot(kind = 'barh')
plt.xlabel('Ancho del sépalo (cm)')
plt.ylabel('Especie de la flor')
# Histograma simple
sns.histplot(data = iris, # datos
x = 'sepal_length', # variable
bins= 14, # cantidad de barras
kde = True) # kernel density estimation (opcional)
plt.xlabel('Largo del sépalo (cm)')
plt.ylabel('Frecuencia')
# Codificando una variable cualitativa dentro de un histograma
sns.histplot(data = iris,
x = 'sepal_length',
bins= 14,
kde = True,
hue = 'species') # se añade otra variable a la visualización
plt.xlabel('Largo del sépalo (cm)')
plt.ylabel('Frecuencia')
sns.kdeplot(data=iris, #Set de datos
x="sepal_length", #Variable a graficar
hue="species", #códificación por especie
multiple="stack" #Apilación de las distrubuciones
);
sns.pairplot(data = iris,
hue = 'species',
corner = True, # para simplificar la gráfica solo se muestran la mitad de los gráficos
palette = 'mako');