DIRICHLET 回帰

Dirichlet(ディリクレ )回帰は,組成データを予測することを目的としており,エコロジー,健康,経済などの多数の分野で使用されている.XLSTATソフトウェアを用いてExcel内で利用可能である.

Untitled (5).png

Dirichlet 回帰は何に使用されるのか?

Dirichlet 回帰は,線形回帰またはロジスティック回帰と同様,1個または複数の説明変数に基づいて予測を行うことが目的である.ただし,多くの他の回帰とは異なり,Dirichlet回帰モデルは,説明される1つの変数の特定の値を予測するのではなく,組成データの複数の比率(割合)を予測する.この意味で,それはベータ係数の一般化であり,後者は2つの比率を予測することしかできない.

いつDirichlet回帰を使用するのか?

たとえば,応答変数が樹木の種類の比率であるとすると,Dirichlet 回帰は,さまざまな地理的区域での平均気温や平均湿度などの変数に応じて,樫の木,リンゴの木,白樺の木の比率を予測することを可能にする.

XLSTATでDirichlet 回帰はどのように動作するのか?

XLSTAT-Rで開発された Dirichlet 回帰関数は,RのDirichletRegパッケージのDirichReg関数 (Marco Johannes Maier)を呼び出し,データに対する深い洞察が得られる複数のオプションを提供する:

  • 説明する各変数の比率を格納している複数の列を選択
  • 複数の量的説明変数を選択
  • データ中の交互作用を含める
  • 一般の平均/分散モデルと代替の平均/分散モデルのいずれかを選択
  • 三角ダイアグラムでデータがどのように分布しているかを可視化

Dirichlet 回帰,ベータ回帰,線形回帰の違いは何か?

線形回帰とは何か?

Dirichlet回帰やベータ回帰とは異なり,線形回帰は比率を予測しない.これは1個または複数の量的変数に基づいて1個の量的変数を予測することからなり,変数間に線形の関係性が存在することを仮定する.これが線形回帰モデルの式である:

Y=X*β + ε ここで Y は予測される変数の値のベクトルで,Xは説明変数の値のベクトル(または行列), β は,回帰係数のベクトル,εは確率誤差である.XLSTATでの線形回帰について知りたい場合は,この機能を確認するとよい.

ベータ回帰とは何か?

ベータ回帰は,発生するイベント(およびその逆)の確率を予測するために使用される.これは,応答変数がベータ分布に従うことを仮定する: Y ~ B(μ,φ) ただし mu は平均で phi は p=μ*φが形状パラメータであるような精度(Precision)パラメータである.我々はデータによりこれらのパラメータを推定する必要がある.それをするために,各変数 y_t について,g(μ_t)=X*β+εであるようなリンク関数を用いて,上記の線形回帰法を用いて,値 g(μ_t)を特定する.これにより形状パラメータpを見つける前に各 μ_t と φ を推定できる.

ベータ回帰をいつ使用するかが疑問ですか? たとえば,喫煙,飲酒,平均睡眠時間などの複数の因子に基づいて,各フランス国民が健康であるか否かを予測したいとします.この場合,イベントは “健康である”であり,その逆は“不健康である”になるでしょう.そして我々は国民が健康である確率を推定しようとするでしょう.

Dirichlet 回帰とは何か?

Dirichlet 回帰についてはどうでしょうか? Dirichlet 回帰はベータ回帰の一般化です. 1つの確率または比率のみを予測するのではなく,これは同様なアプローチで3つ以上のアウトカムについて複数の 比率または確率を予測できる.我々は応答変数が Dirichlet分布に従うと仮定する.これはベータ分布に似ているが,複数のイベントとその逆を考慮に入れる.

これは上記で指定されたように,さまざまな種の比率を予測することに使用できるが,ベータ回帰の事例を単純な”健康”または”不健康”の代わりに,1から5の尺度での健康スコアに拡張することができる.

Dirichlet 回帰を実行する方法に関するチュートリアル

XLSTAT-Rを用いたDirichlet 回帰を実行する方法の事例はこちらである.

ternary diagramneural network diagram

Excelで動作する統計解析ソフトウェア。

14日間無償トライアルあり。