Introducción
¿Qué es la visualización de datos?
Importancia de la visualización de datos: disminuye la carga cognitiva
Herramientas más comunes para visualizar datos
¿ Cómo usar correctamente una gráfica? Ejemplos y usos de visualizaciones
Buenas practicas para visualización de datos: user personas, mentiras estadísticas y principios de Gestalt
Caso Target: conflictos de ética en la ciencia de datos y Big Data
Elige las gráficas correctas para tus reportes
Graficas de barras
Grafica de pie
Grafica de dispersión o scatter plot
Graficas de burbujas
Gráficas de mapas
Graficas de heatmap o de mapas de calor
Graficas de Tablas
Data viz para BI
¿Cómo afecta la visualización de datos en tu negocio?
Explora, descubre, pregunta: toma decisiones inteligentes con análisis de datos
Reto
import pandas as pd
df = pd.ExcelFile('superstore.xls')
import seaborn as sns
df = df.parse('Orders')
df = df.set_index('Row ID')
df['Order Date'] = pd.to_datetime(
df['Order Date'],
dayfirst = True,
errors = 'coerce'
)
df['Ship Date'] = pd.to_datetime(
df['Ship Date'],
dayfirst = True,
errors = 'coerce'
)
sales_category = df['Category'].value_counts()
sales_category
ax = sales_category.plot(kind="bar", fontsize = 15, color=['red', 'orange', 'blue'], figsize=(10,10))
ax.set_xticklabels(ax.get_xticklabels(),rotation =45)
ax.set_xlabel('Categorías', fontsize=15)
ax.set_ylabel('Ventas', fontsize=15, rotation = 90)
ax.set_title('Categorías más vendidas', fontsize = 20)
cs = df.groupby('Customer Name')['Sales'].sum()
pr = cs.loc[cs>12000]
pr.sort_values().plot(kind='barh', figsize=(20,10), fontsize=18)
new_data = df[['Order Date', 'Sales']]
new_data.set_index('Order Date', inplace=True)
new_data['freq'] = new_data.index.quarter
new_data['year'] = new_data.index.year
/shared-libs/python3.7/py-core/lib/python3.7/site-packages/ipykernel_launcher.py:1: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead
See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
"""Entry point for launching an IPython kernel.
/shared-libs/python3.7/py-core/lib/python3.7/site-packages/ipykernel_launcher.py:2: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead
See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
pivot = pd.pivot_table(
new_data,
index='year',
values='Sales',
aggfunc='sum',
columns='freq'
)
pivot
pivot.plot(kind='bar', figsize=(5,5), fontsize=18)