import pandas as pd
data=pd.read_excel("Dataset_pandas_assign.xlsx",engine="openpyxl")
data.head()
data = data.iloc[1:]
avg_age=data.groupby('Пол', as_index=False)['Возраст, полных лет'].mean().round(0)
road_accidents = data['Дата проишествия'].count()
road_accidents_genders = data.groupby('Пол', as_index=False)['Дата проишествия'].count()
avg_age['Процент дорожно-транспортных происшествий, %'] = ((road_accidents_genders['Дата проишествия'] / road_accidents) * 100).round(1)
avg_age
avg_drive = data.groupby('Пол', as_index=False)['Стаж вождения'].mean().round(1)
avg_bm = data.groupby('Пол', as_index=False)['КБМ'].mean().round(1)
avg_drive['Разница'] = ((avg_drive['Стаж вождения']) - (avg_bm['КБМ'])).round(1)
avg_drive
year = data['Год выпуска'] = pd.to_datetime(data['Год выпуска'])
data.groupby (data['Год выпуска'].dt.year)['Год выпуска'].count().sort_values(ascending=False)[:10]
avg_sum = data.groupby('КБМ',as_index=False)['Страховая премия'].mean().round(1)
avg_sum
city = data[data['Город'].isin(['Нур-Султан','Алматы','Атбасар','Петропавловск','Кокшетау'])]
city = city.groupby(['Город'])['Модель'].agg(pd.Series.mode)
city
light =['серебристый металлик архивный', 'белый', 'серебристый', 'золотистый металлик', 'комбинированный', 'белый металлик', 'вишневый', 'бежевый ', 'голубой']
dark = ['черный', 'синий', 'серый', 'серый металлик', 'черный металлик', 'темно-синий металлик', 'темно-синий','красный','зелёный', 'синий металлик', 'зеленый металлик']
colour = data['Цвет'].mode()
colour.loc[colour.isin (['черный', 'синий', 'серый', 'серый металлик', 'черный металлик', 'темно-синий металлик', 'темно-синий','красный','зелёный', 'синий металлик', 'зеленый металлик'])] = 'Темный'
colour.loc[colour.isin (['серебристый металлик архивный', 'белый', 'серебристый', 'золотистый металлик', 'комбинированный', 'белый металлик', 'вишневый', 'бежевый ', 'голубой'])] = 'Светлый'
colour
city = data[data['Город'].isin(['Нур-Султан','Алматы','Шымкент'])]
city = city.groupby(['Город'])['Модель'].agg(pd.Series.mode)
data['Пол'] == 'Ж'
city
city = data.groupby('Город',as_index=False)['Дата проишествия'].count().sort_values('Дата проишествия', ascending=False).head(10)
city.rename(columns = {'Дата проишествия':'Количество'}, inplace = True)
city
car = data.groupby('Unique number', as_index=False)['Модель'].count()
more = car['Модель'] > 1
car = car[more]
acc = data.groupby('Unique number', as_index=False)['Дата проишествия'].count()
more_acc = acc['Дата проишествия'] > 1
acc = acc[more_acc]
car
data.groupby ('КБМ') ['Дата проишествия'].count()