ASIA POPULATION 2020 [EDA]

IMPORTS

import pandas as pd import matplotlib.pyplot as plt import seaborn as sns sns.set(style='darkgrid')

LOADING DATA

df = pd.read_csv('/work/AsiaPopulation2020.csv')

DATA DESCRIPTION

df.head()

df.shape

df.describe()

sns.heatmap(df.isna())

FILLNA

df[df['UrbanPop'].isna()]

df.UrbanPop.fillna(100, inplace=True)

sns.heatmap(df.isna());

df.dtypes

EXPLORATORY DATA ANALYSIS (EDA)

df.sample(3)

WHICH ASIAS MOST POPULOUS COUNTRIES?

plt.figure(figsize=(15,7)) sns.barplot(x='Country', y='Population' ,data=df.nlargest(10, 'Population')); plt.title('The most populous countries in Asia');

WHAT ARE THE 10 LEAST URBANIZED COUNTRIES IN ASIA?

plt.figure(figsize=(15,7)) g = sns.barplot(x='Country', y='UrbanPop' ,data=df.nsmallest(10, 'UrbanPop')); for p in g.patches: height = p.get_height() g.text(p.get_x()+p.get_width()/2., height/2, '{}%'.format(round(height)), ha="center", color='white') plt.ylabel('Urbanization rate') plt.title('The 10 biggest countries in Asia');

WHICH COUNTRY WITH THE MOST DENSITY IN ASIA?

plt.figure(figsize=(15,7)) g = sns.barplot(x='Country', y='Density', data=df.nlargest(10, 'Density')); for p in g.patches: height = p.get_height() g.text(p.get_x()+p.get_width()/2., height/2, '{}'.format(round(height)), ha="center", color='white') plt.title("The 10 densest countries in Asia");

WHAT ARE THE 10 BIGGEST COUNTRIES IN ASIA?

plt.figure(figsize=(15,7)) g = sns.barplot(x='Country', y='LandArea' ,data=df.nlargest(10, 'LandArea')); plt.title('The 10 biggest countries in Asia');

WHICH ARE THE 10 COUNTRIES WITH THE HIGHEST AVERAGE AGE IN ASIA?

plt.figure(figsize=(15,7)) g= sns.barplot(x='Country', y='MedAge', data=df.nlargest(10, 'MedAge')); plt.title('Average age in Asia'); for p in g.patches: height = p.get_height() g.text(p.get_x()+p.get_width()/2., height/2, '{}'.format(round(height)), ha="center", color='white')

As we can see, Japan has the highest average age in Asia

WHAT IS THE PROPORTION OF THE POPULATION IN RELATION TO THE WORLD?

plt.figure(figsize=(15,7)) g = sns.barplot(x='Country', y='WorldShare' ,data=df.nlargest(10, 'WorldShare')); g.annotate("China and India together represent 36.17% of the world's population", xy=(0.5, 6), xytext=(3, 5),arrowprops=dict(facecolor="black", shrink=0.09),) for p in g.patches: height = p.get_height() g.text(p.get_x()+p.get_width()/2., height/2, '{}'.format(round(height)), ha="center", color='white') plt.title('The most populous countries in Asia');

Correlation

correlations = df.corr()

f, ax = plt.subplots(figsize = (10,5)) sns.heatmap(correlations, annot = True);

.css-15w88e5{color:var(--chakra-colors-fg-neutral-primary);font-weight:inherit;letter-spacing:-0.09px;}IMPORTS

LOADING DATA

DATA&nbsp;DESCRIPTION

FILLNA

EXPLORATORY&nbsp;DATA&nbsp;ANALYSIS&nbsp;(EDA)

WHICH&nbsp;ASIAS&nbsp;MOST&nbsp;POPULOUS&nbsp;COUNTRIES?

WHAT&nbsp;ARE&nbsp;THE&nbsp;10&nbsp;LEAST&nbsp;URBANIZED&nbsp;COUNTRIES&nbsp;IN&nbsp;ASIA?

WHICH&nbsp;COUNTRY&nbsp;WITH&nbsp;THE&nbsp;MOST&nbsp;DENSITY&nbsp;IN&nbsp;ASIA?

WHAT&nbsp;ARE&nbsp;THE&nbsp;10&nbsp;BIGGEST&nbsp;COUNTRIES&nbsp;IN&nbsp;ASIA?

WHICH&nbsp;ARE&nbsp;THE&nbsp;10&nbsp;COUNTRIES&nbsp;WITH&nbsp;THE&nbsp;HIGHEST&nbsp;AVERAGE&nbsp;AGE&nbsp;IN&nbsp;ASIA?

WHAT&nbsp;IS&nbsp;THE&nbsp;PROPORTION&nbsp;OF&nbsp;THE&nbsp;POPULATION&nbsp;IN&nbsp;RELATION&nbsp;TO&nbsp;THE&nbsp;WORLD?

Correlation

Creare your chart

IMPORTS

DATA DESCRIPTION

EXPLORATORY DATA ANALYSIS (EDA)

WHICH ASIAS MOST POPULOUS COUNTRIES?

WHAT ARE THE 10 LEAST URBANIZED COUNTRIES IN ASIA?

WHICH COUNTRY WITH THE MOST DENSITY IN ASIA?

WHAT ARE THE 10 BIGGEST COUNTRIES IN ASIA?

WHICH ARE THE 10 COUNTRIES WITH THE HIGHEST AVERAGE AGE IN ASIA?

WHAT IS THE PROPORTION OF THE POPULATION IN RELATION TO THE WORLD?