Cochrane-Orcutt モデル
Cochrane-Orcutt 推定の原理:
1949年にD.Cochrane と G. Orcutt が開発したCochrane-Orcutt 推定は、線形モデルの誤差項中の系列相関を考慮する有名な計量経済学のアプローチです。系列相関の場合、標準(誤差ではなく偏差)が不偏でないので、通常の線形回帰手法は無効です。
XLSTATにおける Cochrane-Orcutt 推定の結果:
適合度統計: 適合に関する統計量が、この表に示されます:
オブザベーション: 計算に使用されているオブザベーションの数。下に示す式で、 n はオブザベーションの数。
重みの合計: 計算で使用されているオブザベーションの重みの合計。下の式で、W は重みの合計。
DF: 選ばれたモデルの自由度の数(誤差項に対応)。
R²: モデルの決定係数。0 から 1 の間の値を取るこの係数は、モデルの係数がユーザーによって固定されていない場合のみ表示される。R² は、モデルによって説明される従属変数の変動の比率として解釈される。R² が 1 に近いほどよいモデルである。 R² の問題は、モデルの適合に使用される変数の数を考慮に入れていないことである。
修正済み R²: モデルの修正済み決定係数。修正済みR² は、R² がゼロに近い場合は負になる。この係数は、モデルの定数がユーザーによって固定されていない場合のみ計算される。修正済み R² は、モデル中で使用される変数の数を考慮に入れたR² の修正である。
MSE: 平均2乗誤差 (MSE).
RMSE: 平均2乗誤差平方根 (RMSE) は MSEの平方根。
MAPE: 平均絶対パーセンテージ誤差。
DW: Durbin-Watson 統計。この係数は、1次の自己相関係数で、残差の独立性が線形回帰の基本仮説の1つであることを前提にして、モデルの残差が自己相関していないことを確認するために用いられる。ユーザーは、残差の独立性仮説が承認されるかどうかを確認するには、Durbin-Watson 統計の表を参照できる。
Cp: Mallows Cp 係数。Cp が p*に近いほど、 モデルは偏向していない。
AIC: 赤池情報量基準。赤池 (1973) が提案したこの基準は、情報理論から派生したもので、Kullback(カルバック)と Leibler(ライブラー)の情報量 (1951)を用いている。これは、新しい説明変数の追加がモデルに十分な情報を供給ないなら、モデルにペナルティを課すモデル選択基準である。情報量は、MSEで測定されている。目的は、AIC 基準を最小化することである。
SBC: Schwarzのベイジアン基準。Schwarz (1978) が提案したこの基準は、AICに似ていて、それを最小化することが目的。
PC: 雨宮の予測基準。雨宮(1980) が提案したこの基準は、修正済み R² のようにモデルの節減の量を考慮に入れる。
分散分析表: これは説明変数の説明力を評価するために使用されます。モデルの定数が任意の値に設定されていない場合、最終モデルの適合(最小2乗)を従属変数の等しい定数のみを含む初歩モデルの適合と比較して、説明力を計算します。モデルの定数が設定されている場合、従属変数が設定された定数に等しい場合のモデルについて、比較がなされます。
モデルのパラメータ表: これは、パラメータの推定、対応する標準誤差、Studentのt、対応する確率、および信頼区間を表示します。
モデル式: そして、モデルの式が表示されて、解釈を簡単にし、モデルの再利用をできるようにします。
自己相関係数: 自己相関係数の推定値。
標準化係数の表: 標準化係数の表は、変数の相対重みを比較するために使用されます。係数の絶対値が高いほど、対応する変数の重みがより重要になります。標準化係数の信頼区間が値0を含む場合(これは正規化係数のグラフで簡単に確認できます)、モデル中の変数の重みが有意ではありません。
予測値と残差の表: 予測値と残差の表は、各オブザベーションについて、その重み、質的説明変数の値を示し、観察された従属変数の値が1個だけの場合は、モデルの予測値、残差と信頼区間が適合された予測値とともに示されます。2種類の信頼区間が表示されます:平均の信頼区間(説明変数の任意の値の集合で、無限のオブザベーションについて、予測がなされる場合に対応)と、単独の予測値の区間(説明変数の任意の値についての単独の予測値の場合に対応)。 2番目の区間は、常に1番目よりも大きく、ランダムな値が大きくなっています。検証データが選択された場合、それらが表の最後に表示されます。
XLSTATにおけるCochrane-Orcutt 推定のグラフィカルな結果:
続くチャートは、上記の結果を示します。
モデル中にたった1つだけの説明変数がある場合、表示される1番目のチャートは、観察された値、回帰線、2種類の予測値の信頼区間を示します。
2番目のチャートは、説明変数の関数として、正規化残差を示します。原理的には、残差はX軸の周りをランダムに分布しているはずです。何らかの傾向や形がある場合、それはモデルに問題があることを示します。
次に3つのチャートが示されます。それぞれ、従属変数の関数としての標準化残差の進展、予測値とオブザベーションの間の距離(理想モデルでは、ポイントがすべての2分線上に乗るでしょう)、および棒グラフ上の標準化残差。最後のチャートは、標本が正規分布していて、データの約95%が区間に含まれることを仮定して、異常な数の値が区間 ]-2, 2[ の外側にあるかどうかを素早く示します。
Excelで動作する統計解析ソフトウェア。
含まれる機能: