Conociendo nuestros datos de ping眉inos. 馃椇馃Л馃惂
Instalar librer铆as necesarias
Run to view results
Importar librer铆as
Run to view results
Run to view results
Establecer apariencia general de los gr谩ficos
Run to view results
Cargar los datos
Utilizando el paquete palmerpenguins
Datos crudos
Run to view results
Datos previamente procesados
Run to view results
Utilizando los conjuntos de datos de seaborn
Run to view results
Utilizando la interfaz de Deepnote importando con PANDAS
Links de importaci贸n de datos:
Run to view results
Colecta y validaci贸n de datos
驴Qu茅 tipo de dato son las variables del conjunto de datos?
Run to view results
驴Cu谩ntas variables de cada tipo de dato tenemos en el conjunto de datos?
Run to view results
驴Cu谩ntas variables y observaciones tenemos en el conjunto de datos?
Run to view results
驴Existen valores nulos explicitos en el conjunto de datos?
Run to view results
De tener observaciones con valores nulos, 驴cu谩ntas tenemos por cada variable?
Run to view results
驴Cu谩ntos valores nulos tenemos en total en el conjunto de datos?
Run to view results
驴Cu谩l es la proporci贸n de valores nulos por cada variable?
Run to view results
驴C贸mo podemos visualizar los valores nulos en todo el conjunto de datos?
Run to view results
驴Cu谩ntas observaciones perdemos si eliminamos los datos faltantes?
Run to view results
Conteos y proporciones
Preludio: 驴Qu茅 estad铆sticos describen el conjunto de datos?
Todas las variables
Run to view results
Solo las num茅ricas
Run to view results
Solo categ贸ricas - 1
Run to view results
Solo categ贸ricas - 2
Run to view results
驴C贸mo visualizar los conteos?
Pandas
Run to view results
驴C贸mo visualizar las proporciones?
Run to view results
Medidas de tendencia central
Media o promedio
Run to view results
Mediana
Run to view results
Moda
Run to view results
Medidas de dispersi贸n
驴Cu谩l es el valor m谩ximo de las variables? rango
Run to view results
驴Cu谩l es la desviaci贸n est谩ndar de las variables?
Run to view results
驴Cu谩l es el rango intercuart铆lico?
Run to view results
Run to view results
驴C贸mo puedo visualizar la distribuci贸n de una variable?
Histograma
Run to view results
Diagrama de caja / boxplot
Run to view results
Distribuciones: PMFs, CDFs y PDFs
Funciones de probabilidad de masas (PMFs)
nos dice la probabilidad que una variable DISCRETA aleatoria tome un valor determinado. ej cual es la probabilidad que en mi salon haya personas con 23 a帽os
Utilizando seaborn
Run to view results
Utilizando empiricaldist
Run to view results
Funciones empir铆cas de probabilidad acumulada (ECDFs)
probabilidad que una variable DISCTRETA igual o menor a un valor ej cual es la probabilidad que en mi salon haya personas con 23 a帽os o menos
Utilizando seaborn
Run to view results
Utilizando empiricaldist
Run to view results
Comparando distribuciones
Run to view results
Funciones de densidad de probabilidad
nos dice la probabilidad que una variable CONTINUA aleatoria tome un valor determinado. ej cual es la probabilidad qUE UN pinguino mida 2.3445, CALCULA LA PROBAIBILIDAD DE MANERA CONTINUA NO COMO PMF QUE HABIAN LUGARES QUE NO TENIAN VALOR
Run to view results
Ley de los Grandes N煤meros y Teorema del L铆mite Central
Ley de los Grandes N煤meros
si voy incrementando el tama帽o de la muestra va a tender a la probabilidad te贸rica eje lanzar dados
Run to view results
Teorema del l铆mite central
Run to view results
Run to view results
Estableciendo relaciones: Gr谩fica de puntos
Run to view results
Estableciendo relaciones ENTRE PARES DE VARIABLES: Gr谩ficos de viol铆n y boxplots
Run to view results
Estableciendo relaciones: Matrices de correlaci贸n
COEFICIENTE DE CORELACI脫N ENTRE 1 = CORRELACI脫N PERFECTA POSITIVA. -1 CORRELACI脫N PERFECTA NEGATIVA. 0 NADA DE CORRELACI脫N.
驴Existe una correlaci贸n lineal entre alguna de nuestras variables?
Run to view results
驴Como puedo visualizar los coeficientes de correlaci贸n?
Run to view results
Run to view results
驴C贸mo podr铆a representar una variable categ贸rica como num茅rica discreta?
Run to view results
驴Cu谩l es una l铆mitante de los coeficientes de correlaci贸n lineal?
S贸lo nos ayuda a determinar la posible existencia de una correlaci贸n lineal, sin embargo, su ausencia no significa que no exista otro tipo de correlaci贸n
Run to view results
Run to view results
El coeficiente de correlaci贸n no nos habla del impacto de la relaci贸n
UN COEFICIENTE DE CORRELACION PERSE NO TE DIRA EL IMPACTO, EN ESTE CASO ES ALLTO PERO EL IMPACTO ES POCO SON VALORES MUY BAJOS Y EL QUE LA CORRELACION ES UN POCO MAS VAJA SON VARIABLES QUE TIENEN MAS IMPACTO EN EL CONTEXTO
Run to view results
Estableciendo relaciones: An谩lisis de regresi贸n simple
Run to view results
Limitaciones del an谩lisis de regresi贸n simple
La regresi贸n lineal simple no es sim茅trica
Run to view results
La regresi贸n no nos dice nada sobre la causalidad, pero existen herramientas para separar las relaciones entre varias variables
La pendiente es -0.634905, lo que significa que cada mil铆metro adicional de profundidad del pico es asociado a un decremento de -0.634905 mil铆metros de la longitud del pico de un ping眉ino.
An谩lisis de regresi贸n m煤ltiple********************
Olvid茅 mi b谩scula para pesar a los ping眉inos, 驴Cu谩l ser铆a la mejor forma de capturar ese dato?
Creando modelos
Run to view results
Run to view results
Run to view results
Run to view results
Run to view results
Visualizando resultados
Run to view results
Run to view results
An谩lisis de regresi贸n log铆stica
Run to view results