欠損値

ほとんどのXLSTATの機能は、欠損値を取り扱うオプションを含みます。ただし、わずかのアプローチだけが利用可能です。このツールは、高度な欠損値処理法を用いてデータセットを補完または洗浄することを可能にします。

3種類の欠損値があります (Allison, 2001): 完全にランダムに欠損するデータ (MCAR)、ランダムに欠損するデータ(MAR) および、ランダムには欠損しないデータ (NMAR)。

欠損値を引き起こすイベントが、観察可能な変数と観察不可能なパラメータに独立である場合、データは完全にランダムに欠損 します(MCAR)。それは全体的にランダムに発生するはずです。データが MCARの場合、そのデータで実行される分析は非バイアス(不偏)です。

欠損値を引き起こすイベントが、特定の変数に関係するけれども、欠損値を持つ変数の値には関係しない場合、データはランダムに欠損 します (MAR)。これは、最もよくあるケースです。

特定の原因でデータが欠損する場合、データはランダムには欠損しません (NMAR) 。これの例は、アンケートでのフィルタされた質問です(質問が一部の回答者のみを意図していて、他の回答者は回答していない場合)。

このツールで利用可能な手法は、MCAR とMAR のケースです。

ユーザーのニーズとデータに応じて、異なる手法が利用可能です:

  • 量的データに関しては、XLSTATは以下を可能にします:

    • 欠損値を持つオブザベーションを除去。

    • 平均補完法を使用。

    • 最近傍アプローチを使用。

    • NIPALS アルゴリズムを使用。

    • MCMC 多重代入法を使用。

  • 質的データに関しては、XLSTATは以下を可能にします:

    • 欠損値を持つオブザベーショを除去。

    • 最頻値補完法を使用。

    • 最近傍アプローチを使用。