相関および類似度/非類似度行列

XLSTATでの類似度および非類似度ツール

XLSTATは,変数間の関係性をそれらの近接を定量化することによって,類似度および非類似度の観点から説明することを支援する.

このツールは,行(通常はオブザベーション)または列(通常は変数)にあるオブジェクトの系列間のたくさんの近接測度を提供する.

類似度と非類似度

2つのオブジェクト間の近接は,どのポイントでそれらが類似しているか(類似度)または非類似しているか(非類似度)を測定することによって定量化されます.データの性質によって異なる指標が提供される:

量的データの類似度および非類似度

量的データからの計算によって提案された類似度係数には,次のものがある: Cosine, 共分散 (n-1), 共分散 (n), イナーシャ, Gower 係数, Kendall 相関係数, Pearson 相関係数, Spearman 相関係数.

量的データからの計算によって提案されら非類似度係数には,次のものがある:

  • Bhattacharyaの距離,
  • Bray and Curtisの距離,
  • Canberraの距離,
  • Chebychevの距離,
  • Chi² 距離,
  • Chi² メトリック,
  • Chord 距離,
  • 2乗 chord 距離,
  • ユークリッド距離,
  • 測地的距離,
  • Kendallの非類似度,
  • マハラノビス距離,
  • マンハッタン距離,
  • 落合の指標,
  • Pearsonの非類似度,
  • Spearmanの非類似度.

バイナリ・データの類似度および非類似度

バイナリ・データからの計算によって提案された類似度および非類似度(単純変換つき)係数には,次のものがある:

  • Dice 係数(Sorensen 係数としても知られている),
  • Jaccard 係数,
  • Kulczinski 係数,
  • Pearson Phi,
  • 落合係数,
  • Rogers & Tanimoto 係数,
  • Sokal & Michener's 係数(単純マッチング係数),
  • Sokal & Sneathの係数 (1),
  • Sokal & Sneathの係数 (2).

質的データの類似度および非類似度

質的データからの計算によって提案された類似度係数には,次のものがある: Cooccurrence, Percent agreement.

質的データからの計算によって提案された非類似度には,次のものがある: Percent disagreement