import pandas as pd
import numpy as np
data = pd.read_csv('users.csv')
data
idint64
0 - 199
nombreobject
Mr Gary Berry2%
Mr Jerome Thomas0.5%
195 others97.5%
0
0
Mr Jerome Thomas
1
1
Mr Gary Berry
2
2
Mr Noham Dubois
3
3
Mrs Naja Johansen
4
4
Mr Damien Marchand
5
5
Mr Harri Althoff
6
6
Mr Noah Olsen
7
7
Ms Britta Weinert
8
8
Mr Jakob Russell
9
9
Miss Emilia Laitinen
Mostrar en consola el nombre de todos los usuarios que no poseen correos electrónicos
# solución propia
data[data['email'].isnull()]['nombre']
# todos los usuarios tienen correo electrónico
Listar el nombre y correo del usuario más joven de Canadá
# solución propia
data[data['pais'] == 'Canada'].sort_values('edad')[['nombre','email']].head(1)
nombreobject
emailobject
184
Mr Philip Bélanger
philip.belanger@example.com
Listar el nombre y correo de los usuarios más jóvenes de Alemania y Canadá
# solución propia
data.iloc[data[data['pais'].isin(['Germany','Canada'])]['edad'].sort_values().head(2).index.values]
idint64
nombreobject
88
88
Mrs Hilda Epp
184
184
Mr Philip Bélanger
Mostrar los usuarios con mayor edad
data.sort_values('edad', ascending = False).head()
idint64
nombreobject
82
82
Miss Elsie Lawrence
29
29
Mr Ilyès Lemaire
135
135
Mr Ray Henry
153
153
Mrs Sophie Lewis
13
13
Mr Gerardo Garrido
Listar los cinco países con mayor cantidad de usuarios
data.groupby(by = 'pais')['pais'].count().sort_values(ascending = False).head(5)
Obtener el país con más usuarios
# solución propia
data.groupby('pais')['pais'].count().sort_values(ascending = False).head(2)
# fueron dos países los que tienen la mayor cantidad de usuarios
Obtener el país con más usuarios cuya edad sea mayor a 50
# Solución propia
data[data['edad'] > 50].groupby('pais')['pais'].count().sort_values(ascending = False).head(1)
Obtener la suma total de todos los usuarios de Canadá y Alemania
# Solución propia
data[data['pais'].isin(['Canada','Germany'])]['pais'].count()
Mostrar en consola la cantidad de países en el dataset
# Solución propia
data.groupby('pais')['pais'].count().size
Obtener el promedio de edad de cada uno de los países
# solución propia
data.groupby('pais').mean('edad')['edad']
Mostrar en consola el país con más hombres
data[data['genero'] == 'male'].groupby('pais')['pais'].count().sort_values(ascending = False).head(1)