7. EDA:Diagnosis of diabetes.

import pandas as pd import numpy as np #1,2 diabetes_data = pd.read_csv('diabetes.csv') print(diabetes_data.head())

#3 print(len(diabetes_data.columns))

#4 print(len(diabetes_data))

#5 print(diabetes_data.isnull().sum())

#6 print(diabetes_data.describe())

#7,8,9 diabetes_data[['Glucose', 'BloodPressure', 'SkinThickness', 'Insulin', 'BMI']] = diabetes_data[['Glucose', 'BloodPressure', 'SkinThickness', 'Insulin', 'BMI']].replace(0, np.NaN)

#10 print(diabetes_data.isnull().sum())

#11,12,13 print(diabetes_data[diabetes_data.isnull().any(axis=1)])

print(diabetes_data.info())

#14,15 print(diabetes_data.Outcome.unique())