CATA データ分析

CATA (check-all-that-apply) 調査は、Adamsらによって提案された2007年以降、官能製品評価においてますます一般的になっている。CATA 調査は、訓練された審査員の代わりに、より市場を代表する消費者に焦点を当てることができる。 それらは準備が簡単で、回答する参加者にとっても簡単である。原理は、回答者がそう感じているか否かの属性またはディスクリプターによる質問を受けること、それらを1つまたは複数の製品に適用することである。これを行う場合、彼/彼女は、単に属性にチェックを入れるだけでよく、それ以外は、何もする必要がない。嗜好に対する属性とリンクするスコアに、異なる尺度での他の質問を追加することができる。調査の各製品に全体のレーティングを与えることを参加者が求めると、さらなる分析と選好モデリングが可能となる。Aresら. (2014)は、CATA 質問の順序を各審査員でランダム化して、再現性を改善することを推奨している。

 

XLSTATのCATAデータ分析ツールは、CATAデータの分析を自動化するために開発された。K個の属性についてP個の製品(しばしば、製品の1つは仮想の理想製品のことがよくある)ごとにN人の審査員を調査したとしよう。K属性のCATAデータは、バイナリ形式(チェックが1で非チェックが0)で記録されていると仮定される。XLSTATでは現在、2つの形式が採用されている:

- 1番目の形式では、XLSTATは、Excel内にP行とぞれぞれK列のN個のグループが並んだ表があることを想定している。 そして、XLSTATが想定するK個から値Nを指定するだけでよい。審査員に彼の選好を答えるように依頼する場合、XLSTATにその場所を知らせることができるように、K列の各グループ内にその列を加えることができる。各グループが K+1 列を持っていて、製品の1つが理想製品である場合、その位置を指定できる。

- 2番目の形式では、XLSTATは、Excel内にP x N 行と K 列の表があることを想定している。そして、その表を選択する必要がある。2つの追加のフィールドで、製品識別子と審査員識別子を選択する必要がある。各審査員に製品をレーティングするように依頼した場合、選好データに対応する列を選ぶ必要がある。製品の1つが理想製品である場合、XLSTATがそれを識別できるように、その名前を指定することができる。 

 

CATAデータでXLSTATが実行する分析は、CATAデータによって提供される可能性を深く調査したMeyners ら (2013) の論文に基づいている。

 

結果の最初の部分は、各属性について別々に審査員x製品の表で実行されたCochranのQ検定である。CochranのQ検定は、我々がここで生のCATAデータで持っている対応のあるバイナリ標本の比較ができる。この検定は、さまざまな製品を比較することを可能にする。Marascuilo アプローチに基づく一対比較が実行される。それらは、製品間に差がないという帰無仮説の棄却の原因となる製品を識別するために使用される。CochranのQ検定は、製品が2つだけの場合、McNemar 検定に相当する。

 

CATA分析の第2ステップは、N 人の個人のCATA 表の合計(各セルごとの最大値がN)に関する分析である。その分析の目的は、理想製品がある場合はそれも含む製品をマップ上に位置付けて、製品が相対的にどのように位置づけられるかを分析することである。現在のところ、この分析は、カイ2乗距離に基づいており、今後、Hellinger距離(XLSTATの類似度・非類似度ツールでどのようなものかを参照できるBhattacharya距離としても知られる) に拡張される予定である。いくつかの属性で周辺度数がヌル値である場合、その対応する属性は、コレスポンデンス分析から外される。

 

次の分析は、製品と審査員の組み合わせごとに1行、属性ごとに1列からなり、そして理想製品がある場合は除去されている“垂直” のデータセットを使用する。選好データの列がある場合は、それを含めることができる。XLSTATは、(バイナリ・データによく適する)四文相関を用いて、このデータセットでの属性間の相関を計算し、選好データがある場合は、各属性と選好データ間の双列相関を珪砂する。する。双列相関は、バイナリ変数と量的変数の間の相関えお測定するために開発された(詳細は、データ記述/双列相関を参照)。 さまざまな次元の最適な可視化を可能にするために、XLSTAT は、もし必要であれば、Lingoes補正を用いて、主座標分析を計算する。この手法は、 第1軸に最も多い情報量が負荷されるように座標が自動で開店されるので、MDS に好ましい。

 

選好データがある場合、次の分析は、ペナルティ分析からなる。ペナルティ分析は、属性がチェックされているかどうかを識別しようとし、低い選好、効果なし、または高い選好を導く。

 

最初の結果は、K個(属性ごとに1個)の 2x2 表で、左側に理想製品について記録された値、上側に調査された製品ついて得られた値がある。表のセルには、平均選好(審査員と製品での平均)および、この0 や1の組み合わせに対応するすべてのレコードの%が入っている。

 

理想製品\製品

0

1

0

6.2 (12%)

7.4 (8%)

1

5.1 (39%)

7.2 (41%)

 

これらの表に格納された結果から、すでに我々は、属性が審査員によってどのようにみなされるかに関する仮定を作成できる。任意の属性について、もしその属性が理想製品でチェックされていて(2番目の行)、チェックされた製品の選好(セル[1,1])が、チェックされていない製品(セル[1,0])よりも高いならば、その属性は “なければならない(must have)”である。対称的に、もしその属性が理想製品でチェックされておらず(1番目の行)、チェックされていない製品の選好(セル [0,0]))が、チェックされた場合(セル[0,1])よりも高いならば、その属性は“あってはならないmust not have)”である。もしその属性が理想製品でチェックされておらず(1番目の行)、チェックされた製品の選好(セル[0,1])が、チェックされていない場合(セル[0.0])とほぼ同じ(XLSTATでは、これを1より小さい絶対差として設定している)なら、その属性は “害はないdoes not harm)”である。最後に,  (セル [0,1]) > (セル [0,0])ならば、 “あればよいnice to have)”となる。 いくつかの表は、3つのケースに対応するであろう。 XLSTATは、各表を1つのケースのみに関連づけるが、ユーザーは結果をコントロールしたいかもしれない。XLSTATは、各2x2 表を上記で定義されたルールを同じ順序で関連づけようとする。

最後にXLSTATは、ペナルティ表を計算し、いくつかの属性が統計的観点から明らかに「なければならない」または「あってはならない」属性であるかを決定するために、2つのペナルティ分析を実行する。これらの分析は、以下を可能にする:

-       セル [1,1] とセル [1,0] の間の差が有意(“nice to have”)であるか否かの検定

-       セル[0,0] とセル[0,1] の間の差が有意([0,0] > [0,1]) ならば"nagative")であるか否(“does not harm”)かの検定。