Apuntes del Curso de Estadística Descriptiva para Data Science.
Tipos de datos:
Los datos se dividen en 2 categorías: Los datos categóricos y numéricos.
Los datos categóricos, son todos aquellos datos que no son números, por ejemplo: categorías de películas, géneros, métodos de pago, etc.
Los datos numéricos, como te podrás imaginar son todos aquellos datos que son números, como el peso de una persona, su altura, etc.
Pero estas categorías tienen sub-divisiones. En el caso de los datos categóricos, las sub-divisiones serian los datos "ordinales" y "nominales". Su diferencia radica en que los datos ordinales contienen una relación de orden entre las categorías. Y los que no contengan esta relación son simplemente nominales.
Las sub-divisiones de los datos numéricos, son los "discretos" y "continuos". La diferencia entre ambos radica en que los datos discretos son un número entero y exacto, en cambio un dato continuo es aquel numero que contiene un decimal.
A continuación exploraremos un dataset que contiene todos estos tipos de datos.
Pandas contiene un metodo para poder saber el tipo de dato de cada columna: { pandas.DataFrame.dtypes }
This chart is empty
Chart was probably not set up properly in the notebook
Medida de Tendencia Central
Medidas de Tendencia Central mas importantes
Dato timportante: La moda no aplica para datos numericos continuos.