Partitioning Around Medoids

Le Partitioning Around Medoids (PAM) est un algorithme d'apprentissage automatique (Machine Learning) non supervisé pour l'analyse de regroupement (clustering)

L'algorithme PAM recherche k objets représentatifs dans un ensemble de données (appelés k médoïdes), puis il attribue chaque objet au médoïde le plus proche afin de créer des clusters. Son but est de minimiser la somme des dissemblances entre les objets d'un cluster et le centre du même cluster (médoïde). Il est connu pour être un algorithme plus robuste que celui des k-means puisqu’il est considéré comme moins sensible aux valeurs aberrantes.

Le Partitioning Around Medoids implémenté dans XLSTAT-R appelle la fonction PAM de la librairie cluster de R (Martin Maechler, Peter Rousseeuw, Anja Struyf, Mia Hubert). Parmi les sorties, la fonction offre un outil utile pour déterminer le nombre de k appelé le graphique silhouette