Medoidによる分割

Partitioning Around Medoids (Medoidによる分割)は、クラスタリング分析のための教師なし機械学習アルゴリズムである。

PAM アルゴリズムは、データセット内にk 個の代表オブジェクト(k medoids)を探索し、クラスタを作成するために、最も近いmedoidに各オブジェクト割り当てる。これは、クラスタ内のオブジェクトと同じクラスタの中心(medoid)との間の非類似度の合計を最小化する。これは、外れ値に敏感でないと考えられるので、k-meansのロバスト・バージョンとして知られる。

XLSTAT-R で実装されているPartitioning Around Medoids は、Rのclusterパッケージのpam関数 (Martin Maechler, Peter Rousseeuw, Anja Struyf, Mia Hubert)を呼び出す。この関数は、silhouette プロットと呼ぶkの数を決定する便利なツールも提供する。