ノンパラメトリック回帰 (Kernel and Lowess)

ノンパラメトリック回帰を使用するとき

ノン・パラメトリック回帰は,線形回帰などのより伝統的な回帰手法に関する仮説が検証できない場合,または,モデルの予測品質のみに興味があり,その構造には興味がない場合に使用できる.

XLSTATでのノンパラメトリック回帰

XLSTATは,2種類のノンパラメトリック回帰を提供する: カーネル および Lowess.

カーネル回帰

カーネル回帰(Kernel regression は,スムージング(平滑化)手法のファミリに属するモデリング・ツールである.線形回帰が現象の説明と予測の両方に使用される(あとでそれを予測することを可能にする現象の理解)のとは異なり,カーネル回帰はほとんど予測のために使用される.モデルの構造は一定ではなく複雑で,フィルタまたはブラックボックスのように動作する.カーネル回帰にはたくさんのバリエーションが存在する.

あらゆるモデリング手法と同様,サイズ nlearn の学習標本が,モデルのパラメータを推定するために使用される.そして,サイズ nvalid の標本が,モデルの品質を評価するために使用される.最後に,モデルは,従属変数 Y の値が未知のサイズnpredの予測標本に適用できる.

カーネル回帰の特徴は:

  1. 学習標本のオブザベーションをそれらの予測されるオブザベーションからの "距離"によって,重みづけするためにカーネル関数を使用する.

    XLSTAT で利用可能なカーネル関数は:

    • 一様
    • 三角
    • Epanechnikov
    • 4次
    • Triweight
    • Tricube
    • ガウス
    • コサイン
  2. バンド幅が各変数に関連づけられる.これは,カーネルおよびオブザベーションの重みの計算に関与し,予測するオブザベーションからどれだけ遠いかによって,オブザベーションの影響を低減または増強しながら,変数の相対重みを差別化または再スケールする.
  3. モデルを学習標本のオブザベーションに適合させるときに多項式次数を用いる.多項式のパラメータの推定で考慮に入れる学習標本のサイズを制限するために,2つの戦略が提案されている:移動窓およびk 最近傍.

LOWESS 回帰

LOWESS 回帰(またはLocally weighted regression and smoothing scatter plots )は,散布図で滑らかな曲線を作成するために導入された.

LOWESS 回帰は,多項式回帰に基づき,オブザベーションを重みづけするためにカーネル関数を必要する点では,カーネル回帰とよく似ている.

XLSTATでのノンパラメトリック回帰の結果

  • 記述統計量: 記述統計量の表は,選択されたすべての変数の簡単な統計量を示す.量的変数についえは,欠損値の数,欠損値の数,平均および標準偏差(非バイアス)が表示される.従属変数を含む質的変数については,カテゴリごとに度数とパーセンテージが表示される.
  • 相関行列: この表は,選択された変数間の相関を表示する.
  • 適合度係数:この表は以下の統計量を示す:
    • 決定係数 R2;
    • モデルの誤差(または残差)の平方和(それぞれSSE またはSSR );
    • モデルの誤差(または残差)の2乗の平均(MSE または MSR);
    • モデルの誤差(または残差)の平均平方根(RMSE または RMSR).
  • 予測値と残差: 各オブザベーションについて入力データ,モデルによって予測された値,および残差を与える表.

 XLSTATでのノンパラメトリック回帰のグラフ

量的説明変数を1つだけまたはテンポラル変数(ダイアログ・ボックスの"チャート"タブで"時間の関数として"オプション)を選択した場合,最初のグラフは,データとモデルによって作られる予測値の曲線を示す." X1の関数として" オプションを選択した場合,最初のグラフは,観察されたデータと予測値を選択された最初の説明変数の関数として示す.

2番目のグラフは,残差の棒グラフを表示する.