# Calculs & dataframes
import pandas as pd
import numpy as np
import scipy.stats as stat
import pingouin as pg
# Régression linéaire
import statsmodels.api as sm
import statsmodels.formula.api as smf
from statsmodels.stats.outliers_influence import OLSInfluence, variance_inflation_factor
from sklearn.preprocessing import StandardScaler # pour centrer-réduire les données
# Librairies pour graphiques
import matplotlib.pyplot as plt
%matplotlib inline
from matplotlib.colors import ListedColormap, LinearSegmentedColormap
import seaborn as sns
import plotly.express as px
from plotly.subplots import make_subplots
import plotly.graph_objects as go
plt.rcParams.update(plt.rcParamsDefault)
/opt/venv/lib/python3.7/site-packages/scipy/stats/stats.py:1604: UserWarning:
kurtosistest only valid for n>=20 ... continuing anyway, n=18
/opt/venv/lib/python3.7/site-packages/scipy/stats/stats.py:1604: UserWarning:
kurtosistest only valid for n>=20 ... continuing anyway, n=18
Avec une p-valeur de 0.91 > 0.05, on ne rejette pas l'hypothèse nulle de normalité des résidus
Sur les 18 mesures, 0 sont des mesures atypiques, soit 0.0 % .
Sur les 18 mesures, 1 sont des mesures influentes, soit 5.6 % .
Nombre de mesures influentes et atypiques : 0
En pratique, une valeur VIFj>10 (sauf la constante) indique un problème de colinéarité éventuel.
VIF Factor features
0 6289.241111 const
1 9.051010 REV_MEDIAN
2 2.647508 TX_INFL
3 7.166693 TXCDD_EMBAUCHE
4 11.472018 PROD_HW_I15
5 10.481492 BALANCE_BS
6 11.266381 DEP_GEN_PTPIB
/opt/venv/lib/python3.7/site-packages/scipy/stats/stats.py:1604: UserWarning:
kurtosistest only valid for n>=20 ... continuing anyway, n=18