import pandas as pd
import numpy as np
data=pd.read_excel("Dataset_pandas_assign.xlsx",engine="openpyxl")
data.head()
data = data.iloc[1:]
data.info()
This chart is empty
Chart was probably not set up properly in the notebook
data.head()
age=data.groupby('Пол', as_index=False)['Возраст, полных лет'].mean()
roadaccidents=data['Дата проишествия'].count()
roadaccidents_by_genders=data.groupby('Пол',as_index=False)['Дата проишествия'].count()
age['Процент']=((roadaccidents_by_genders['Дата проишествия']/roadaccidents)*100).round(1)
age
age_drive = data.groupby('Пол',as_index=False)['Стаж вождения'].mean().round(1)
bonus_malus=data.groupby('Пол',as_index=False)['КБМ'].mean()
age_drive['bonus_malus']=(bonus_malus['КБМ']).round(1)
age_drive['разница']=(age_drive['Стаж вождения']-(bonus_malus['КБМ'])).round(1)
age_drive
data['Год выпуска'] = pd.to_datetime(data['Год выпуска'])
data.groupby(data['Год выпуска'].dt.year)['Год выпуска'].count().sort_values(ascending=False)
bonus_malus=data.groupby('КБМ',as_index=False)['Страховая премия'].mean().round(1)
contract=data['Страховая премия'].mean()
bonus_malus['pay for contract']=(contract).round(1)
bonus_malus
city = data[data['Город'].isin(['Алматы', 'Уральск', 'Нур-Султан', 'Шымкент', 'Караганда'])]
city = city.groupby(['Город'])['Модель'].agg([pd.Series.mode])
city
car_crush = data[data['Цвет']=='черный']
car_crush=len(car_crush)
print('black cars are:', car_crush)
car_crush = data[data['Цвет']=='белый']
car_crush=len(car_crush)
print('white cars are:', car_crush)
femcar = data[(data['Город'].isin(['Алматы','Нур-Султан', 'Шымкент','Караганда'])) & (data['Пол']=='Ж')]
femcar = femcar.groupby(['Город'])['Модель'].agg([pd.Series.mode])
femcar
car_crush = data.groupby('Город',as_index=False)['Дата проишествия'].count().sort_values('Дата проишествия', ascending=False)
car_crush
one_more = data.groupby('Unique number',as_index=False)['Марка'].count().sort_values('Марка', ascending=False)
one_more=one_more[one_more['Марка']>1]
one_more
car_crush = data.groupby('Unique number',as_index=False)['Дата проишествия'].count().sort_values('Дата проишествия', ascending=False)
car_crush=car_crush[car_crush['Дата проишествия']>1]
car_crush
car_crush = data.groupby('КБМ',as_index=False)['Дата проишествия'].count().sort_values('Дата проишествия')
car_crush