外れ分散に関するCochran C 検定

検定の原理

CochranのC 検定 (Cochran 1941) は、分散の系列の等質性を識別し調査するために開発された(とりわけ,Bartlettの検定,Brown-Forsythe,Levene またはHartley).Cochranの検定は,特定の質問に答えるために開発された: 分散が等質であるか?または,最も高い分散が他よりも異なるか? XLSTAT は,2つの選択肢を提供し.非釣り合い型のケースに対する釣り合い型のケースの拡張のために,t'Lam (2010) の結果を用いる.

外れ値の検出

統計学では, 外れ値とは任意の変数について記録された値で,他の値よりも並はずれて疑わしく低いか高いと見られる値である.2種類の外れ値を区別することができる:

  • An 外れ値は,単純に(計測器での)読み取り誤差,(キーボード)記録誤差,または観察された現象を他と比較にならないようにかく乱した特別なイベントによるものであリ得る.このような場合,もし可能であれば,外れ値を訂正するか,さもなくば,それが計画された分析(記述分析,モデリング,予測)をかく乱するのを避けるために除去しなければならない.
  • また,外れ値は,特殊なイベントに起因する場合があるが,しかし,それでも既知であるか,調査することが興味深い場合がある.たとえば,川の水で特定のバクテリアの存在を調査している場合,バクテリアのない標本やたくさんのバクテリアを持つ標本があるかもしれない.もちろん,これらのデータは,保持することが重要である.使用するモデルは,潜在的なバラツキを反映するべきである.

データ中に外れ値がある場合,調査のステージによって, 我々は,できる限り検定を用いて,レポート中でそれらを(表またはグラフィカルな表現で)フラグづけし,削除するか,それらを取り扱える手法を用いるなどして識別しなければならない.

外れ値を識別するには,さまざまなアプローチがある.たとえば,伝統的な線形回帰では,Cookの d 値を使用するか,あるいは,1つまたは2つの値が異常であるかどうかを見るために,Grubbs 検定で標準化残差を検証することができる.伝統的な Grubbs 検定は,1個の外れ値の識別をサポートするが,ダブル Grubbs 検定は,2個識別することができる.同じ標本でこれらを繰り返し使用することは推奨されていない.しかしながら,2個を超える外れ値があると本当に疑わしいなら適切な場合もある.

標本が副標本に分割できる場合,我々はある標本からもう1つの標本への変化に注目できる.CochranのC 検定と Mandelの h および k 統計量は,このような調査に適した手法の一部である.

XLSTATによる結果

CochranのC 検定の結果が表示される.検定の単一の繰り返しがリクエストされたか,外れ値であるとして識別されたオブザベーションがない場合は,検定の解釈が提供される.
複数回の繰り返しがリクエストされた場合は,各オブザベーションについて, それが標本から除去された繰り返しを示す表も表示される.

リクエストされた場合は,z-スコアが表示される.

参考文献

Barnett V. and Lewis T. (1980). Outliers in Statistical Data. John Wiley and Sons, Chichester, New York, Brisbane, Toronto.

Cochran W.G. (1941). The distribution of the largest of a set of estimated variances as a fraction of their total. Ann. Eugen. 11, 47-52.

Hawkins D.M. (1980). Identification of Outliers. Chapman and Hall, London.

International Organization for Standardization (1994). ISO 5725-2: Accuracy (trueness and precision) of measurement methods and results—Part 2: Basic method for the determination of repeatability and reproducibility of a standard measurement method, Geneva.