CLASSIFICATION ASCENDANTE HIÉRARCHIQUE (CAH)
Utilisez la classification ascendante hiérarchique pour constituer des groupes d'individus similaires (classes) sur la base de leur description par un ensemble de variables quantitatives, qualitatives binaires (0/1), ou éventuellement de tous types.
Plusieurs méthodes d'agrégation sont disponibles :
Méthode de Ward (iniertie)
Méthode de Ward (variance)
Lien complet
Lien simple
Lien fort
Lien flexible
Lien moyen
Lien proportionnel
XLSTAT propose plusieurs similarités/dissimilarités qui sont adaptées à un type de données particulier.
Pour les données quantitatives :
| Similarité | Dissimilarité |
|---|---|
| Corrélation de Pearson | Distance euclidienne |
| Corrélation de Spearman | Distance du khi’² |
| Corrélation de Kendall | Distance de Manhattan |
| Inertie | Dissimilarité de Pearson |
| Covariance (n) | Dissimilarité de Spearman |
| Covariance (n-1) | Dissimilarité de Kendall |
| Similarité générale | Dissimilarité générale |
Pour les données binaires (0/1) :
Similarité/Dissimilarité
Indice de Jaccard
Indice de Dice
Indice de Sokal & Sneath (2)
Indice de Rogers & Tanimoto
Indice de Sokal & Michener
Indice de Sokal & Sneath (1)
Phi de Pearson
Indice de Ochiai
Indice de Kulczinski
Remarque : pour les variables qualitatives non binaires il est préférable d'effectuer au préalable une analyse des correspondances multiples (ACM) et de considérer les coordonnées des individus sur les axes factoriels comme de nouvelles variables.
