単変量クラスタリング

単変量クラスタリングの原理

単変量クラスタリングは,N 個の1次元の(単変量で記述される)オブザベーションをk 個の均質なクラスに分ける.

等質度は,ここでは,クラス内分散の合計を用いて測定される.クラスの等質度を最大化するために,したがって,我々はクラス内分散の合計を最小化しようとする.

XLSTAT で用いられる単変量クラスタリングのアルゴリズム

ここで使用するアルゴリズムは,とても速く,W.D. Fisher (1958)が提案した手法を使用する.この手法は,量的変数を離散順序変数に変えるプロセスと見ることができる.たとえば,カラースケールを作成するマッピング・アプリケーションや,均質なセグメントを作成するマーケティングなど,たくさんのアプリケーションがある.

XLSTATでの単変量クラスタリングの結果

  • クラス・セントロイド: この表は,さまざまな記述子についてのクラス・セントロイドを示します.
  • クラス・セントロイド間の距離: この表は,さまざま記述子についてのクラス・セントロイド間のユークリッド距離を示します.
  • 中心オブジェクト: この表は,各クラスのセントロイドへの最近傍オブジェクトの座標を示します.
  • 中心オブジェクト間の距離: この表は,さまざま記述子についてのクラス中心オブジェクト間のユークリッド距離を示します.
  • クラスごとの結果: クラスの記述統計量(オブジェクトの数,重みの合計,クラス内分散,セントロイドへの最小距離,セントロイドへの最大距離,セントロイドへの平均距離)が,表の最初の部分に表示されます.2番目の部分はオブジェクトを示します.
  • オブジェクトごとの結果: この表は,初期のオブジェクトの順序で各オブジェクトの割り当てクラスを示します.

含まれる機能: