CLUSTATIS

コンフィギュレーション/表の均質なクラスを構築するにはCLUSTATISを使用します。 官能分析の文脈で、この機能は被験者の製品に対する認知に基づいて、彼らのクラスタ分析を実行することを可能にします。

Excel内でCLUSTATISの方法により表をクラスタリング

データが変数のさまざまなブロックで構成されているケースがより頻繁になってきています。官能分析では、とくに多くのタスクが、コンフィギュレーション/表(たとえば、プロジェクティブ・マッピング/ナッピング、コンベンショナル・プロファイリング、フリーチョイス・プロファイリング)を提供して各消費者/審査員/被験者によるこの種のデータを導くので、この現象に悩まされます。被験者間の認知がしばしば異なり、被験者のクラスタリングが必要でしょう。CLUSTATIS法は、この文脈にフィットします。さらに、この戦略は、構築されたどのクラスにも適合しないコンフィギュレーションを脇に置くことを可能にします。それは、官能分析の枠組みで非典型的(仲間外れ)な被験者に対応します。

CLUSTATISとは何か?

解説

CLUSTATIS は、各コンフィギュレーションのスカラー積の行列に基づくクラスタリング手法で、列数の異なるコンフィギュレーションを考慮することができます。この手法の目的は、できるだけ均質なコンフィギュレーションのクラスを構成することで、コンフィギュレーションの各グループは、STATISによって決定される潜在コンフィギュレーション(コンセンサスという)で表現されています。したがって、構成されたクラス間の差を判断するために、最終的に各クラスがSTATISで分析されるのは当然です。CLUSTATIS は、分割アルゴリズムによって "再配置(consolidate)"できる階層アルゴリズムで構成されています(すなわち、分割アルゴリズムは、デンドログラムをカットして初期化されます)。興味深いオプションは、どのクラスにも適合しない表を脇に置くためのクラス"K+1" (追加のクラスに対応)の作成です。各クラスのコンセンサスとあるコンフィギュレーションの間の類似度 (RV係数)がすべて弱いとみなされる場合、そのコンフィギュレーションはこのクラスに置かれます。

データの構造

2とおりのケースがあります:

1.  p 個の変数の数が、 m 個のコンフィギュレーションの数と一致する。

2. 変数の数 p が1個のコンフィギュレーションからその他に変化する。

データ入力のために、XLSTATは m 個の連続するコンフィギュレーションに対応するコンフィギュレーションを選択し、構造のケースを選択することを求めます。

スケーリング

コンフィギュレーション内のデータが同じ尺度でない場合、各コンフィギュレーションの変数をスケール(縮約)することを推奨します。たとえば、 0から 20までの間のレーティングはそれに当てはまりませんが、いくつかの記録が 0から10までで、その他が 0 から 20であるような場合は、これが推奨されます。

結果の解釈

各クラスについて、因子空間でのオブジェクトの表現は、予防措置の意味でオブジェクト間の近接を視覚的に解釈することができます。オブジェクトがグラフの中心から遠いほど、平面上でのそのオブジェクトの投影は信頼できます。

クラス "K+1" は、どのクラスにも適合しない表を格納しているので、このクラスはグループの数にとても依存します。

因子の数

結果の解釈のためにいくつの因子を維持するべきかを決定するのに、一般的に2つの手法が用いられます:

- 固有値の減少曲線を見る。保持するべき因子の数は、曲線の最初の 変わり目に対応する。

- 因子軸で表現される累積変動パーセンテージを用いて、特定のパーセンテージのみを用いることもできる。

グラフィック表現

表現空間の軸に関連する変動パーセンテージの合計が十分に高い場合のみ、各クラス内のオブジェクトのグラフィカル表現が信頼できます。このパーセンテージが高い(たとえば80%)なら、その表現は信頼できるとみなされます。パーセンテージが低いなら、最初の2因子軸でなされる解釈を検証するために、複数の軸の対で表現を生成することが推奨されます。

クラスタ分析の品質

階層クラスタリングの品質を判断するために、2個のクラスの融合によって起こるクラス内分散(CLUSCATA基準誤差)の増加を使用することができます。この増加は、審査員の2個のクラスが同じクラスにグループ分けされるデンドログラムの高さに等しいです。

各クラスの均質度と全体の均質度も重要な指標 (1/m から 1の間で、m は審査員の数) で、クラスタ分析の品質を判定することを可能にします。再配置とクラス "K+1"の追加が均質度を増大しうることに注意するべきです。

XLSTATでのCLUSTATIS分析の結果

記述統計: 記述統計の表は、選択されたすべての変数の簡単な統計量を示します。これは、オブザベーション(オブジェクト)の数、欠損値の数、非欠損値の数、平均および標準偏差(不偏)を含みます。

RV 行列: すべてのコンフィギュレーションの間のRV 係数の行列が表示されます。RV係数は、含まれる2個のコンフィギュレーションの間の0から1の間の類似度の指標です。1に近いほど、類似度が強くなります。

ノードの統計: この表は、デンドログラム内で連続するノードのデータを示します。最初のノードには、コンフィギュレーションの数が1増加した指標があります。したがって、あるコンフィギュレーションまたはコンフィギュレーションのグループがデンドログラムでコンフィギュレーションの他のグループにクラスタされているかどうかを、いつでも簡単に確認できます。

水準棒グラフ: この表は、2つのクラスを併合するときのCLUSCATA最小化基準の増大(クラス内分散の増大に相当)であるデンドログラムのノードの統計を表示します。

デンドログラム: 完全なデンドログラムが、コンフィギュレーションの漸進的なクラスタリングを表示します。打ち切りがリクエストされると、打ち切りが実行された水準を破線がマークします。打ち切りされたデンドログラムは、打ち切り後のクラスを示します。

クラスの構成:

コンフィギュレーションごとの結果: この表は、この表は、初期のコンフィギュレーションの順序で各コンフィギュレーションのクラスの割り当てを示します。再配置がリクエストされた場合、再配置の前と後の結果が提供されます。 "クラス K+1"をチェックした場合、何人かのコンフィギュレーションが再配置の後に欠損値を持つ可能性があります。これは、それらが主要なクラスのどれにも置かれていない (彼らはクラス "K+1"に置かれている)ことを意味します。

クラスごとの結果: 結果がクラスごとに提供されます。したがって、各クラスでコンフィギュレーションの一覧が表示されます。

クラスあたりのコンフィギュレーションの数: 各クラス内のコンフィギュレーションの数が示されます。

クラス kの分析:

このセクションでは、STATIS法によるそれぞれのクラスの分析が表示されます。

固有値: 固有値および対応するチャート(スクリー・プロット)が表示されます。

コンセンサス座標: 因子空間でのコンセンサス座標が、(選ばれた因子の数に応じて)対応するチャートとともに表示されます。

コンセンサス・コンフィギュレーション: コンセンサス・コンフィギュレーションが表示されます。これは(全体的に縮約されかつ変数ごとにも縮約された可能性のある)初期コンフィギュレーションのスカラー積行列の重み付き平均に一致します。

RV コンフィグ/コンセンサス: コンフィギュレーションとコンセンサスの間の RV係数が、関連する棒グラフとともに表示されます。STATISの重みのように、これらの係数は、非典型的(仲間はずれ)なコンフィギュレーションを検出することを可能にします。これらの係数の利点は、それらが 0から 1の間であり、重みよりも解釈が簡単なことです。

重み: STATISで計算される重みが、関連する棒グラフとともに表示されます。 重みが大きいほど、そのコンフィギュレーションがコンセンサスにより寄与しています。全体的観点から最も近いコンフィギュレーションにより 重みを与えることがわかっており、他よりも低い重みは、そのコンフィギュレーションが非典型であることを意味します。

指標:

均質度: 各クラスの均質度が表示されます。1/m (m はクラスのコンフィギュレーションの数) から 1の間の値をとり、コンフィギュレーションの均質度とともに増加します。2番目のステップでは、各クラスの均質度の重み付き平均である全体均質度が表示されます。

全体誤差/クラス内分散: CLUSTATIS基準の誤差が表示されます。これはクラス内分散に一致します。

コンセンサス間のRV : 各クラスのコンセンサスの間のRV 係数の行列が表示されます。この行列は、クラスがお互いにどれだけ近いかを示します。

XLSTATソフトウェアを用いてExcel内でCLUSTATISを実行する方法に関するチュートリアル

このチュートリアル は、XLSTATソフトウェアを用いてExcel内でCLUSTATIS分析を実行することを助けます。

ternary diagramneural network diagram

Excelで動作する統計解析ソフトウェア。

14日間無償トライアルあり。