線形回帰

このツールを使用して,説明または予測のための単純または複数の線形回帰モデルを作成する.XLSTATソフトウェアを使用してExcelで利用できる.

Untitled.png

線形回帰とは何か ?

線形 回帰 は , 疑い なく 最も よく 使わ れる統計 的 モデリング手法 である. 通常 , 単回帰 (1 つ の 変数 変数 のみ)) と 重 回帰 (複数 の 説明)) は 区別 さ れ ます が , 的 な コンセプト と) は 区別 さ れ ます が , 的 な コンセプト と と 計算方法は同一である.

線形 回帰 の 原理 は , p 個 の 量 的 説明 変数 x 1 , x 2 ,…, x pの 線形 結合 によって , 量 的 従属 変数 y を モデル する こと である. オブザベーション について , 線形 回帰 式 は 次 する こと である オブザベーション オブザベーション について , 線形 回帰 式 は 次式で書かれる:

y je = une 1 x 1i + une 2 x 2i + ... + une p x pi + e je

ここ で y iは オブザベーション i で の 従属 変数 の 観察 値 , x kiは オブザベーション i で 変数 k が とる , , e iは モデル の 誤差 である である

モデル が 通常 の 最 小 2 乗 法 (OLS) を 用い て 見つけ られる (2 乗 誤差 ei² の 合計 を 最小化) ので , 多く の 人 が が は 線形 と 同じ 同じ で は? と 考え がち である. は そう そう ではなく ではなく で? と 考え がち である 実際 は そう そう ではなく ではなく? ,OLSは単に回帰直線の式を求めることができる手法の名前である.

線形回帰の仮説は,誤差 ei が同じ正規分布N(0,s)に従い独立であるということである.

さらに : 線形回帰での変数選択

線形 回帰 で は , すべて の 変数 が 重要 である か , または 有意 である わけ ではない .xlstat で 利用 可能 な 4 つの 手法 の 1 つ を 用い , , 重要 な な それら を 選択 する する つ 用い て , 最も な な それら を 選択 する ことができる ことができる:

  • ベスト モデル: この 手法 は , すべて の モデル の 中 から 最良 の モデル を 選ぶ ことができ , "最 小 変数" から "最 大 変数" まで の 変数 の 数 取り扱う ことができ ます ます さらに , , 最良 変数 の 数 を ことができ ます ます さらに , 最良 モデル を 決定 する する 取り扱う ことができ ます. さらに , 最良 モデル 決定 決定 するため の 複数 の "基準" を 選ぶ ことができる. さらに ユーザー は , ベスト モデル を 決定 する ため に 複数 の の "基準" を 選択 :: 修正 済み 済み , , 2 乗 誤差 誤差 誤差 "MSE) AIC,SchwarzのSBC,雨宮のPC.
  • ステップ ワイズ: 選択 プロセス は , モデル へ の 最大 寄与 度 を 持つ 変数 を 追加 し て 開始 する (使用 さ れる 基準 は スチューデント の T 統計量). 第 2 の 変数 が , その T に 関連 する する が 投入 投入 投入 投入の 確率 "より 低い 場合 , それ は モデル に 追加 さ れる. 第 3 の 変数 が 追加 さ れる , , モデル 中 の 変数 変数 の 除去 影響 が 評価 さ れる (ここ で も T 統計 量 を 使用). 確率 確率 ((で も T 統計 量 を 使用).. 確率 確率 が が が が が が が が が が が が が が が が も除去 の 確率 "より 大きい 場合 , その 変数 は 除去 さ れる. この 手順 は , それ 以上 追加 し たり 除去 する 変数 なく なる なる まで 続け られる. たり 除去 除去 変数 が なく なる まで 続け られる.
  • フォワード: この 手順 は , 変数 が 追加 さ れる のみ で 除去 さ れ ない こと を 除い て は , ステップ ワイズ 選択 と 同じ である.
  • バック ワード: この 手順 は , すべて の 変数 を 一 度 に 追加 し て 開始 する. そして , ステップ ワイズ 選択 で 使用 れる 手順 手順 に て , 変数 除去 除去 さ れる さ れる 手順 に て , 変数 除去 除去 さ れる.

線形回帰の仮定の検証方法 ?

残差に関する線形回帰の主要な2つの仮定を検証しなければならない:

  • それらは正規分布に従わなければならない
  • それらは独立でなければならない

前提 と なる 仮説 が 正しく 検証 さ れ て いる こと を レトロスペクティブ (遡及 的) に 確認 する に は 、 線形 回帰 の 結果 で 提案 さ れ て 様々 な 検定 を 使用 する する. 提案 れ て いる 様々 検定 検定 を 使用 する.

残差 の 正規 性 は , 特定 の グラフ を 分析 する か ,残差 に 関する Shapiro-Wilk 検定 を 実行 し て 確認 できる. これ を する に は , の 仮定 サブタブ サブタブ で の の 検定 を に する が が 仮定 サブタブ で で の 検定 を 有効 する 必要 が が ある.残差の独立性は,特定のグラフを分析するか,Durbin-Watson 

分散不均一性, 自己相関の補正方法?

前 に 述べ た よう に , 誤差項 が 独立 であり , 同一 に 分布 し , かつ 正規 分布 する こと 仮定 仮定 さ れる 線形 で は , 誤差項 の 分散 一 性 性 と 性 が 重要 , 誤差項 分散 分散 一 性 と 独立 性 が ​​重要 な である である.

Xlstat は , Newey et West (1987) が 提案 し た 推定 量 など の さまざま な 手法 で 発生 し 得る 分散 不 均 一 性 と 自己 相関 を 修正 する ことができる.. 不 均 一 と 自己 相関 を 修正 する ことができる.

XLSTATで試す

XLSTAT ?

  • . 変数 選択 の 要 約: 選択 手法 を 選ば れ た 場合 , xlstat は 選択 の 要約 を 表示 し ます. ステップ ワイズ について について は , 個 の ステップ に 対応 する 統計 量 が 表示 , れ の ステップ に 対応 する 統計 量 が 表示 さ ます ます.p から q の 値 を とる 変数 の 数 について の ベスト ・ モデル が 選択 さ れ た 場合 , 各数 変数 変数 について の ベスト モデル が , , する 統計 量 表示 表示 さ れ , 選ば れ 基準 について の ・ ・ モデル さ れ , 選ば れ 基準 について の ・ ・ モデル モデル モデル , , れ た について の ベスト ・ モデル モデル モデル太字で表示されます.
  • Nom de domaine :
    • Nom de domaine :
    • Mot de passe :
    • DF :
    • R²: モデルの決定係数.値が 0 から1の間のこの係数は,モデルの定数がユーザーによって固定されていない場合のみ表示される.R² は,モデルによって説明される従属変数の変動の比率として解釈される. R² が 1に近いほど,良いモデルである.R² の問題は,モデルを適合するために使用している変数の数を考慮に入れていないことである.
    • 修正済み R²: モデルの修正済み決定係数.修正済み R² は,R² がゼロに近い場合,負数になることがある.この係数は,モデルの定数がユーザーによって固定されていない場合のみ計算される.修正済み R² は,モデルに使用した変数の数を考慮に入れて,R² を修正したものである.
    • MSE: 平均2乗誤差(MSE) .
    • RMSE: 平均2乗誤差平方根 (RMSE) は MSEの平方根.
    • MAPE: 平均絶対誤差率(Mean Absolute Percentage Error ).
    • DW: Durbin-Watson 統計量.この係数は次数(order) 1の自己相関係数で,モデルの残差が自己相関していないことを確認するために使用する.残差の独立性が線形回帰の基本仮説の1つであることを仮定している.ユーザーは,残差の独立性仮説が採択できることを確認するために, Durbin-Watson 統計量の表を参照できる.
    • Cp: MallowsのCp 係数.Cp 係数が p*に近いほど,モデルは偏りが少ない.
    • AIC: 赤池情報量基準.赤池 (1973) によって提案されたこの基準は,情報理論から導かれたもので, Kullback とLeiblerの測度 (1951)を使用している.これは,新しい説明変数の追加がモデルに十分な情報量を提供しない場合,モデルを罰するモデル選択の基準である.情報量はMSEを用いて測定している.目的は AIC 基準を最小化することである.
    • SBC: Schwarzのベイジアン基準.Schwarz (1978) によって提案されたこの基準は,AIC に似ていて,やはり,目的はそれを最小化することである.
    • PC: 雨宮の予測基準.雨宮 (1980) によって提案されたこの基準は,モデルの節減を考慮に入れることが,修正済みR² に似ている.
    • Press RMSE: Pressの統計量は,対応するオプションがダイアログ・ボックスで有効にされた場合のみ表示される.Press RMSE がRMSEと比較できる.この2つの差が大きいと,そのモデルが,モデル中の特定のオブザベーションの有無に敏感であることを示す.
  • Type I SS 表: 誤差平方和 (SSE), 平均2乗誤差(MSE),Fisherの F,またはFisherのFに関係する確率について,徐々に説明変数を追加してモデルの適合に持つ影響を可視化するのに使用する.ある変数の確率が低いほど,モデルに対して,モデル中にすでに存在している他のすべての変数に対して,その変数の寄与度がより高い. Type I 表での平方和は,常にmodel SSとつじつまが合う.注意:モデル中での変数が選択される順序が,得られる値に影響する.
  • Type III SS 表: .誤差平方和 (SSE), 平均2乗誤差(MSE),Fisherの F,またはFisherのFに関係する確率について,説明変数を除去することが,まだ残っている他のすべての変数のモデルの適合に持つ影響を可視化するのに使用する.確率が低いほど,モデルに対して,モデル中にすでに存在している他のすべての変数に対して,その変数の寄与度がより高い.注意:Type I SSとは異なり,モデル中で変数が選択される順序が,得られる値に影響しない.
  • 分散分析表: .説明変数の説明力を評価するのに使用する.モデルの定数が任意の値に設定されていない場合,最終モデルの適合(最小2乗について)と従属変数の平均に等しい定数のみを含む初歩的なモデルを比較して,説明力が評価される.モデルの定数が設定された場合,従属変数が設定された定数に等しい場合のモデルに対して比較がなされる.
  • モデルのパラメータ表: パラメータの推定,対応する標準誤差,Studentのt,対応する確率,および信頼区間を表示する.
  • モデル式: モデルを読んだり再利用するのを簡単にするために,モデルの式が表示される
  • 標準化係数表: 標準化係数の表は,変数の相対重みを比較するのに使用する.係数の絶対値が大きいほど,対応する変数の重みがより重要である.標準化係数の信頼区間が値0(これは標準化係数のグラフで簡単に見られる)の場合,モデル中の変数の重みは有意でない.
  • 予測値と残差表: 予測値と残差の表は,各オブザベーションについて,その重み,質的説明変数の値を示す.従属変数の観察された値が1個だけの場合,モデルの予測値,残差,信頼区間(適合された予測値および,ダイアログ・ボックスでCookのDが起動された場合,CookのDとともに)が示される.2種類の信頼区間が表示される:平均の信頼区間(説明変数の特定の値の集合を持つ無限数のオブザベーションで予測がなされた場合に対応する)と単独の予測値(説明変数の任意の値についての単独の予測値の場合に対応する).2番目の区間は常に1番目よりも大きく,ランダムな値がより大きい.検証データが選択された場合,それらが表の最後に表示される.
  • 影響 度 診断 の 表 は , 各 オブザベーション について , その 重み , 対応 する 残差 , (RMSEで 割っ)) 標準化 残差 , スチューデント 化 残差 , 削除 残差 , 削除 後 スチューデント 残差 , 中心 残差 , 後 残差 , 削除 後 スチューデント 残差 , 中心 化 こ比 こ比 後 , 削除 後 スチューデント 残差 , 中心 化 こ比 こ比, マハラノビス 距離 , Cook の D , Covratio (共 分散 比) , Dffit , 標準化 Dffit , Dfbetas (モデル 係数 ごと に 1 個) および 標準化 Dfbetas を 示す.

最後 に , xlstat ソフトウェア は , excel 内 で 直接 回 帰線 を プロット する ことができる. この 記事 の 最初 に ある グラフ に 表示 表示 さ れ て 信頼 区間 の おかげ で 線形 回帰 の 誤差 を モニタ ことができる ことができる の おかげ で 線形 回帰 の 誤差 を する ことができる ことができる ことができる... 

ternary diagramneural network diagram

Excelで動作する統計解析ソフトウェア。

14日間無償トライアルあり。