信頼性分析
この機能は、Cronbachのアルファを含む信頼性指標を計算できる。XLSTATアドオン統計解析ソフトウェアを用いて、Excel 内で信頼性分析を実行できる。

信頼性分析とは何か?
信頼性分析はいろいろな分野で使用されるが、とくに社会科学でよく使用される。この用語は心理統計学に由来する。したがって、我々は、複数の質問からなるテストを定義する。それらの質問は要素(エレメント)と呼ばれる。それらの要素は、要因(因子)、測定尺度、潜在変数または概念とも呼ばれる均質な構成内で収集される。1つの例として、グラフィカルなスキルが、測定の尺度の水準を測定したい要因だとする。信頼性分析の目的は、この測定の尺度の信頼性を評価することであり、言い換えると、質問構成は首尾一貫して同じことを測定する。グラフィカルなスキルの場合、勘に頼る質問は、尺度の一貫性を引き下げるだろう。
統計家にとって、質問はしばしばリッカート尺度(Likert-type scale、レーティングの回答)で測定された変数である。個人のグループで採取されたテストの結果は、個人/変数配列で収集される。信頼性分析も使用されそうな品質管理など、他の分野との互換性を確実にするために、それらの配列はXLSTAT内でオブザベーション/変数でラベルづけされる。
XLSTATに実装されている手法は、同じ現象に対応するさまざまな質問への結果が首尾一貫していることを確実にすることにより、尺度の内部(内的)一貫性を推定するために使用される。さらに、それらは、2つの異なる時間に同じ個人に対して行われる2つのテストの間の信頼性も測定する。
内部分析は、尺度の内部一貫性に関する指標を提供することにより、どの要素が相関しているかを判断できるだけでなく、不要な要素を識別して、それらを除外することができる。
折半信頼性 分析は、テストの2つの部分の間の同等性(平行形式の信頼性)を測定する。このタイプの分析は、同じ手段と同じ人々を用いて、同じことを意味する項目の2つの類似する集合で使用される。
評価者間分析は、各被験者の評価の変動をすべての被験者での合計変動と比較して、信頼性を測定する。この分析は、評価が評価者によって多様であるという仮定に基づいて開発された。
内部信頼性
Cronbachのアルファ
Cronbachのアルファ指標 は、項目の集合がどれだけ密接に関連しているかという内的一貫性を測定する。それは尺度の信頼性であると見なされる。
この指標は、数学的には尺度の2つの等しい部分の間のすべての相関の平均に相当する。
多くの論者は、0.65 から 0.8 の間の(または多くの場合、より高い)最小アルファ係数を推奨する。0.5 よりも低いのは、通常、採用できない。
XLSTATは、Cronbachのアルファを計算する前にすべての項目の値が標準化(中心化・尺度化変数)された場合に得られるであろう信頼性に相当する標準化アルファ係数も提供する。
Guttmanの信頼性係数 (ラムダ1-6)
Guttman はL1 から L6の6個の信頼性係数を開発した。それらの4つ(L1、L3、L5、 L6) は、内部一貫性を推定するのに使用され、残りの2つ(L2 と L4) は、折半信頼性のために使用される:
- L1: 他のラムダの計算で使用される中間の係数。
- L2: 平行測定の場合に内部スコア相関を推定。これは、Cronbachのアルファよりも複雑で、テストの真の信頼性をよりよく表現する。
- L3: Cronbachのアルファに相当。
- L4: Guttman 折半信頼性 (以下の説明を参照)。
- L5: 他の項目がお互いに共変しないのに反して、1つの項目が他の項目と強く共変する場合に推奨される。
- L6: 項目重相関係数と比較して、項目間相関が低い場合に推奨される(要素の数が多いほどよりよい推定になる)。
折半信頼性
Spearman-Brown 信頼性
尺度の信頼性を計算するもう1つの方法は、それをランダムに2つの部分に分割することである。もし尺度が完全に信頼できるなら、我々は2つの半分が完全に相関する(R = 1)ことを期待できる。信頼性が悪い場合は不完全な相関となる。折半信頼性は、Spearman-Brown係数を用いて推定できる。 2つが異なるサイズの場合、この係数のより正確な推定が使用される(Horstの式)。
Guttman 折半信頼性 (折半モデル):
Guttmanの折半信頼性 (L4) は、Spearman-Brown係数に似ているが、両者が持つ信頼性または分散が等しい(タウ等価)とはみなさない。
評価者間信頼性
クラス間相関係数(ICC: Intra-class Correlation Coefficient)
信頼性は、クラス間相関係数(ICC)のような係数による評価者間信頼性を用いてテストすることもできる。この係数は、複数の亜種があるが、一般的には、被験者間の変動に起因するオブザベーションの分散の一部として定義できる。ICC値は、通常、0 から 1の間の値をとる。
各質問に評価者が与えるスコアの間での変動が小さいと、ICC値が高い。