Objectif: L'objectif de ce TP est de familiariser les étudiants avec l'analyse en composantes principales (ACP) à travers une approche pratique et détaillée. Cet exercice se divise en trois parties complémentaires qui permettent d'acquérir une compréhension approfondie de l'ACP, à la fois par des calculs manuels et l'utilisation de bibliothÚques Python. Partie 1 : Calcul manuel de l'ACP sur un Jeu de données simple Considérons un échantillon d'un jeu de données simple avec 5 observations et 2 variables : 78 80 81 82 84 86 X2 126 128 127 130 130 132 1.1. Calculer la moyenne des deux Variable 1.2. Calculer le valeurs Centrées de chaque variable ? 1.3. Détermine la matrice de covariance des variables centrées ? 1.4. Quelles sont les valeurs propres de la matrice de covariance ? 1.5. Quels sont les vecteurs propres associés à ces valeurs propres ? 1.6. Détermine la matrice des nouvelles coordonnées (projections) obtenue en multipliant les données centrées par les vecteurs propres ? Partie 2 : Utilisation de Python pour l'ACP sur le Jeu de Données Simple 2.1. Implémentez une fonction pca_manual() Python qui exécute toutes les étapes suivantes : + Centrage des données e Calcul de la Matrice de Covariance + Calcul des Valeurs Propres et Vecteurs Propres * Calcul des Composantes Principales + Calcul le pourcentage cumulatif de la variance expliquée par les composantes principales 1/2 A Maarir -FP .Béni-Mellal Scanné avec CamScanner Partie 3 : Application de I'ACP sur le Jeu de données réelles Iris avec Scikit-learn 3.1. Implémentez la lonction pca_iris() Python qui exécute toutes les étapes suivantes : Chargement des données Iris et Standardisation e Application de l'ACP Obtenir les valeurs propres Obtenir les vecteurs propres (composantes principales) Traçage d'un graphique en ligne montrant le pourcentage cumulatif de la variance expliquée par les composantes principales * Affichage des données avant et aprÚs ACP Les bibliothÚques nécessaires : from sklearn.datasets import loadiris from sklearn.decomposition import PCA
The manual PCA calculations are complete. Now, let's implement the `pca_manual()` function in Python to automate these steps.
The `pca_manual()` function has been successfully implemented and tested on the simple dataset. Now, let's move on to Part 3 and implement the `pca_iris()` function using the Iris dataset and Scikit-learn.
The `pca_iris()` function has been successfully implemented and tested on the Iris dataset. The function standardizes the data, applies PCA, and plots the cumulative explained variance. The eigenvalues, eigenvectors, and cumulative explained variance have been obtained.