CLUSCATA

解説

今日、CATAタスクが広く使用されています。しかしながら、審査員の間で製品の認知がしばしば異なります。したがって、審査員のクラスタ分析が不可欠でしょう。CLUSCATA法は、この文脈に当てはまります。さらに、この戦略は、どのクラスのパターンにも適合しない審査員を脇に置くことを可能にします。CLUSCATAは、CATAデータへの CLUSTATIS の改変とみなすことができます。

CLUSCATAの原理

CLUSCATAの目的は、審査員のクラスを出来る限り均質に構成することであり、審査員の各クラスは、CATATISで決定される潜在敵な表(コンセンサスという)で表現されます。したがって、構成されたクラス間の差を判断するために、最終的に各クラスが CATATISで分析されることとは自然なことです。CLUSCATA は、分割アルゴリズムによって "再配置(consolidate)"される階層型アルゴリズムで構成されています (すなわち、分割アルゴリズムはデンドログラムをカットして初期化されます)。興味深いオプションは、どのクラスにも適合しない審査員を脇に置くための(追加クラスに応じて) "K+1" 個のクラスの作成です。各クラスのコンセンサスとある審査員の間の類似度(落合係数)がすべて弱いとみなされるなら、その審査員はこのクラスに置かれます。

データの構造

2種類の形式があります:

  1. すべてのデータが水平に融合されている(水平形式)。
  2. すべてのデータが垂直に融合されている(垂直形式)。

データ入力では、XLSTATはすべてのデータを選択して、形式を選択するように求めます。垂直形式の場合、製品と審査員のラベルが必須です。

結果の解釈

k個の 因子の空間での製品と属性の表現は、予防措置の意味で、製品と属性の間の近接を視覚的に解釈することを可能にします。

グラフの中心から遠いほど、平面への製品または属性の投影の信頼性が高くなります。

因子の数

結果の解釈のためにいくつの因子を維持するべきかを決定するのに、一般的に2つの手法が用いられます:

- 固有値の減少曲線を見る。保持するべき因子の数は、曲線の最初の 変わり目に対応する。

- 因子軸で表現される累積変動パーセンテージを用いて、特定のパーセンテージのみを用いることもできる。

グラフィック表現

表現空間の軸に関連する変動パーセンテージの合計が十分に高い場合のみ、各クラス内のオブジェクトのグラフィカル表現が信頼できます。このパーセンテージが高い(たとえば80%)なら、その表現は信頼できるとみなされます。パーセンテージが低いなら、最初の2因子軸でなされる解釈を検証するために、複数の軸の対で表現を生成することが推奨されます。

クラスタ分析の品質

階層クラスタリングの品質を判断するために、2個のクラスの融合によって起こるクラス内分散(CLUSCATA基準誤差)の増加を使用することができます。この増加は、審査員の2個のクラスが同じクラスにグループ分けされるデンドログラムの高さに等しいです。

各クラスの均質度と全体の均質度も重要な指標 (1/m から 1の間で、m は審査員の数) で、クラスタ分析の品質を判定することを可能にします。 併合とクラス "K+1"の追加が均質度を増大しうることに注意するべきです。

出力

記述統計: 審査員によってチェックされた数が表示されます。

類似度行列 (S): すべての審査員の間の類似度指標の行列が表示されます。類似度指標は、0から1の間に含まれます。1に近いほど、より強い類似度です。この指標は、落合係数です。

ノードの統計: この表は、デンドログラム内で連続するノードのデータを示します。最初のノードには、審査員が1増加した指標があります。したがって、ある審査員または審査員のグループがデンドログラムで審査員の他のグループにクラスタされているかどうかを、いつでも簡単に確認できます。

水準バー・チャート: この表は、2つのクラスを併合するときのCLUSCATA最小化基準の増大(クラス内分散の増大に相当)であるデンドログラムのノードの統計を表示します。

デンドログラム: 完全なデンドログラムが、審査員の斬新的なクラスタリングを表示します。打ち切りがリクエストされると、打ち切りが実行された水準を破線がマークします。打ち切りされたデンドログラムは、打ち切り後のクラスを示します。

クラスの構成:

審査員ごとの結果: この表は、この表は、初期の審査員の順序で各審査審のクラスの割り当てを示します。併合がリクエストされた場合、併合の前と後の結果が提供されます。 "クラス K+1"をチェックした場合、何人かの審査員が併合の後に欠損値を持つ可能性があります。これは、彼らが主要なクラスのどれにも置かれていない (彼らはクラス "K+1"に置かれている)ことを意味します。

クラスごとの結果: 結果がクラスごとに提供されます。したがって、各クラスで審査員の一覧が表示されます。

クラスあたりの審査員の数: 各クラス内の審査員の数が示されます。

計算されたロー・パラメータ: クラス"K+1"を追加することを選んだ場合のみ結果が表示されます。ロー・パラメータは、 審査員があるクラスに属するために、そのクラスのコンセンサスと持つ必要のある最小の類似度を表します。この条件がどのクラスとも合わない場合、その審査員はクラス "K+1"に置かれます。このパラメータは、各審査審のそのクラスへの、および隣接するクラスへの近接によって計算されます。

クラス k の分析:

このセクションでは、CATATIS法によるそれぞれのクラスの分析が表示されます。

CAの固有値: CA の固有値および対応するチャート(スクリー・プロット)が表示されます。

製品座標: 因子空間でのコンセンサスの製品の座標が、(選ばれた因子の数に応じて)対応するチャートとともに表示されます。

属性座標: 因子空間でのコンセンサスの属性の座標が、(選ばれた因子の数に応じて)対応するチャートとともに表示されます。

コンセンサス・コンフィギュレーション: コンセンサス・コンフィギュレーションが表示されます。これは、審査員データの重み付き平均に一致します。

類似度 審査員/コンセンサス: 審査審とコンセンサスの間の類似度指標が、関連する棒グラフとともに表示されます。CATATISの重みのように、これらの係数は、非典型的な審査員を検出することを可能にします。これらの係数の平均は 0 から 1の間で、重みよりも解釈が簡単です。

重み: CATATISで計算される重みが、関連する棒グラフとともに表示されます。重みが大きいほど、その審査員はコンセンサスにより寄与しています。全体的観点から CATATISは最も近い審査員により重みを与えることがわかっており、他よりもかなり低い重みは、その審査員が非典型的であることを意味します。.

指標:

均質度: 各クラスの均質度が表示されます。1/m (m はクラスの審査員の数) から 1の間の値をとり、審査員の均質度とともに増加します。2番目のステップでは、各クラスの均質度の重み付き平均である全体均質度が表示されます。

全体誤差/クラス内分散: CLUSCATA基準の誤差が表示されます。これはクラス内分散に一致します。

 

ternary diagramneural network diagram

Excelで動作する統計解析ソフトウェア。

14日間無償トライアルあり。