Analyse factorielle de données mixtes (PCAmix)

Utilisez l'analyse factorielle de données mixtes (PCAmix) pour analyser un tableau des observations décrites à la fois par des variables quantitatives et par des variables qualitatives.

Qu’est-ce que l’Analyse en composantes Principales ?

L'analyse factorielle de données mixtes est une méthode initialement développées par Hill et Smith (1972). Différentes variantes de cette méthodes ont ensuite été développées ( Escofier 1979, Pagès 2004). La méthode utilisée dans XLSTAT est la méthode appelée PCAmix développée par Chavent et al (2014). Cette méthode peut être vue comme un mélange de deux méthodes d'analyse factorielle bien connues : l'analyse en Composantes Principales (ACP) qui permet d'étudier un tableau observations/variables quantitatives et l'analyse des correspondances multiples (ACM) qui elle permet l'étude d'un tableau observations/variables qualitatives.

Comme les autres méthodes d'analyse factorielle, la méthode PCAmix permet de réduire la dimensionnalité des données et ainsi identifier les proximités entre les variables mais également les proximités entre les observations.

Options de la fonctionnalité PCAmix dans XLSTAT

Différentes options sont disponibles tant pour la gestion des calculs que pour l'affichage des résultats. L'utilisateur a la possibilité de filtrer les facteurs, d'introduire des observations/variables supplémentaires, de filtrer les variables et les observations affichées dans les graphiques et de personnaliser les graphiques. 

Résultats de la fonctionnalité PCAmix dans XLSTAT

La méthode PCAmix fournit les mêmes résultats classiques qu'une autre méthode d'analyse factorielle : les coordonnéesfactorielles, les contributions et les cosinuscarrés. Ces résultats s'interprètent exactement de la même manière qu'en ACP ou en ACM.

Une sortie spécifique à PCAmix est appelée les squared loadings des variables. Le squaredloading entre une variable quantitative et un axe factoriel est égal à la corrélation au carré entre la variable et l'axe. Le squared loading entre une variable qualitative et un axe factoriel est égal au rapport de corrélation entre la variable et l'axe.

Graphiques de la fonctionnalité PCAmix dans XLSTAT

Graphique de corrélations : graphique mettant en jeu des corrélations entre des composantes et des variables initiales. Ce graphique est communément appelé cercle de corrélation.

Carte factorielle des modalités : graphique des coordonnées principales des modalités des variables qualitatives actives et supplémentaires.

Graphique mixte : graphique mixte représentant les squared loadings des variables quantitatives et qualitatives.

Graphique des observations : graphique de représentation des observations dans le nouvel espace.