1標本のラン検定

1標本のラン検定の定義

一連のバイナリ・イベントがランダムに分布しているとみなせるかどうかを検定するには,1標本のラン検定を使用する..

ラン(連)とは,異なるイベントまたは無イベントが前後する同一のイベントの連続である. ここで用いるラン検定は,2項変数のみに適用される.たとえば,ABBABBBの中には,4つのラン(A,BB,A,BBB)がある.

1標本のラン検定は,一連のバイナリ・イベントがランダムに分布しているか否かを検定するのに使用される.

1標本のラン検定の仮説

両側検定の場合,帰無仮説 (H0) と対立仮説 (Ha)は::

  • H0: データはランダムに分布している.
  • Ha: データはランダムに分布していない.

片側検定の場合,左側(下側)検定と右側(上側)検定を区別する必要がある.左側検定では,以下の仮説を使用する:

  • H0: データはランダムに分布している.
  • Ha: 2種類のイベントの間で反発がある.

右側検定では,以下の仮説を用いる:

  • H0: データはランダムに分布している.
  • Ha: T2種類のイベントは交互である.

1標本のラン検定の期待値と分散

ラン R の数の期待値は,次式で与えられる:

E(R) = 2mn/N

ここで m はタイプ1のイベントの数で, n はタイプ 2のイベントの数で,N は合計の標本サイズである.

ラン R の数の分散は,次式で与えられる:

V(R) = 2mn(2mn – N)/[N²(N-1)]

R の最小値は,常に 2である.最大値は,2Min(m, n) – tで与えられる.ここで t は , m=nなら1で,それ以外は 0 である.

r が標本で測定されたランの数であるなら, m または n が無限に近づくとき,漸近的に次式となることがWald と Wolfowitz によって示されている.

(r - E(R)) / √V(R) --> N(0,1)

ここで N(0,1) は,標準正規分布である.

1標本のラン検定の p-値

XLSTATは,p-値を計算する3つの方法を提供する.p-値は以下に基づいて計算できる:

  • Rの正確な分布,
  • Rの漸近分布,
  • P 個のモンテ・カルロ並べ替えに基づく近似された分布.可能な並べ替えの数が高い(それはN!に等しい)ので,近似が精密になるように,P は高い値に設定しなければならない

XLSTATでの1標本のラン検定

XLSTATは,入力として連続値データまたはバイナリのカテゴリカル・データを受け付ける.連続値データでは,データがバイナリ標本に変換されるように,カットオフ・ポイントが選ばれなければならない.

特定の構造が識別できないなら,標本はランダムに分布しているとみなされる.極端なケースは,左側に1種類のすべてのオブザベーション,そして右側に残りのすべてのオブザベーションがある反発と,2種類の要素ができるだけ互い違いにある交互である.前出のケースでいうと,反発は “AABBBBB” または “BBBBBAA”のようになり,交互は “BABABBB” とか “BABBABB” とか “BBABABB” とか “BBABBAB” とか “BBBABAB”である.