data =
data.shape
le nombre des modalitées associées à
checking_status
'no checking' 394
'<0' 274
'0<=X<200' 269
'>=200' 63
Name: checking_status, dtype: int64
*************************************
le nombre des modalitées associées à
credit_history
'existing paid' 530
'critical/other existing credit' 293
'delayed previously' 88
'all paid' 49
'no credits/all paid' 40
Name: credit_history, dtype: int64
*************************************
le nombre des modalitées associées à
purpose
radio/tv 280
'new car' 234
furniture/equipment 181
'used car' 103
business 97
education 50
repairs 22
'domestic appliance' 12
other 12
retraining 9
Name: purpose, dtype: int64
*************************************
le nombre des modalitées associées à
savings_status
'<100' 603
'no known savings' 183
'100<=X<500' 103
'500<=X<1000' 63
'>=1000' 48
Name: savings_status, dtype: int64
*************************************
le nombre des modalitées associées à
employment
'1<=X<4' 339
'>=7' 253
'4<=X<7' 174
'<1' 172
unemployed 62
Name: employment, dtype: int64
*************************************
le nombre des modalitées associées à
personal_status
'male single' 548
'female div/dep/mar' 310
'male mar/wid' 92
'male div/sep' 50
Name: personal_status, dtype: int64
*************************************
le nombre des modalitées associées à
other_parties
none 907
guarantor 52
'co applicant' 41
Name: other_parties, dtype: int64
*************************************
le nombre des modalitées associées à
property_magnitude
car 332
'real estate' 282
'life insurance' 232
'no known property' 154
Name: property_magnitude, dtype: int64
*************************************
le nombre des modalitées associées à
other_payment_plans
none 814
bank 139
stores 47
Name: other_payment_plans, dtype: int64
*************************************
le nombre des modalitées associées à
housing
own 713
rent 179
'for free' 108
Name: housing, dtype: int64
*************************************
le nombre des modalitées associées à
job
skilled 630
'unskilled resident' 200
'high qualif/self emp/mgmt' 148
'unemp/unskilled non res' 22
Name: job, dtype: int64
*************************************
le nombre des modalitées associées à
own_telephone
none 596
yes 404
Name: own_telephone, dtype: int64
*************************************
le nombre des modalitées associées à
foreign_worker
yes 963
no 37
Name: foreign_worker, dtype: int64
*************************************
le nombre des modalitées associées à
class
good 700
bad 300
Name: class, dtype: int64
*************************************
from sklearn.model_selection import StratifiedKFold
Stkf = StratifiedKFold(5,shuffle=True,random_state=2021)
train =
test =
SyntaxError: invalid syntax (<ipython-input-7-56b1e8792992>, line 1)
FEATURES =
TARGET =
lr_pred_proba =
lr_pred_label =
### Train knn
k = 2
knn_2_pred_proba =
knn_2_pred_label =
knn_best_k_pred_proba =
knn_best_k_pred_label =
FEATURES = FEATURES + ["pca_1","pca_2","label_predit_k_means"]