M1 BBS Math TD ACP
From silico.biotoul.fr
Contents |
Analyse en Composantes Principales
Données utilisées
Dans ce TD, nous utilisons le jeu de données sur les iris. Description sur wikipedia http://en.wikipedia.org/wiki/Iris_flower_data_set
Et dans R, avec la commande
?iris
Chargement des données
d=iris[,1:4] # données numériques head(d) cl=iris[,5] # variétés d'iris (pour les couleurs notamment)
Affichage, recherche visuelle de corrélations
pairs(d, col=cl, pch=16)
Chargement de la librairie graphics dont nous aurons besoin pour la fonction arrows pour tracer des flèches :
library(graphics)
ACP avec la fonction princomp
Effectuer une ACP (non normée) à l'aide de la fonction princomp (et non prcomp comme vu en TDB qui utilise la décomposition en valeurs singulières au lieu des vecteurs propres et valeurs propres).
Afficher les individus projetés sur les 2 premiers axes.
Quelles sont les variances portées par ces axes ? Est-ce satisfaisant ?
Recalculer ces proportions à partir des valeurs propres et identifier les vecteurs propres dans ce que renvoie la fonction princomp.
Projection des individus dans le nouveau repère
Pour effectuer le changement de repère, c'est-à-dire de projeter les individus (lignes) dans le nouveau, il suffit d'utiliser le produit vectoriel pour multiplier la matrice des coordonnées initiales U avec les vecteurs propres E : Uproj = UE
Liens
- Initiation à l'analyse en composantes principales réalisée par A. B. Dufour et J. R. Lobry