モンテカルロ・シミュレーション

モンテ・カルロ・シミュレーションは,不確実な値を含む可能性のあるモデルの統計的リスク分析における重要な意思決定ツールである.XLSTATを用いてExcelで利用可能.

sim-box-plots.png

XLSTATでのモンテ・カルロ・シミュレーションとは?

モンテ・カルロ・シミュレーションは,正確な値がわからないが,確実な理論的法則に従う確率変数の反復シミュレーションの方法により推定ができる,変数推定のための革新的手法であるシミュレーション・モデルを構築および計算することを可能にするモジュールである.モデルを実行する前に,入力および出力(また結果)変数に系列を定義して,モデルを作成する必要がある.

シミュレーション・モデルは,正確な値を持たないが,分布を知る,仮定する,計算することができる変数について,平均値や中央値などの情報を得ることができる.もしある”結果”変数が,これらの”分布”変数に,既知または仮定された式によって依存しているなら,”結果”変数もある分布を持つことになる.XLSTATは,ユーザーが分布を定義して,シミュレーションを通して,入力および出力変数の経験分布および対応する統計量を得ることができる.

シミュレーション・モデルは,保険,医薬,石油やガスの探索,会計,販売予測などの多数の分野で使用されている.

シミュレーション・モデルの構築には,4つの要素が関与する:

  • 分布 は,確率変数に関連する.XLSTATは,変数がとれる値での不確実性を記述するために, 20 個以上の分布から選ぶことができる(詳細は“分布の定義”の章を参照).たとえば,2つの限界の間で変化することがわかっているが,ある値がより確からしい(最頻値)量がある場合は,三角分布を選ぶことができる.シミュレーション・モデルの計算の各繰り返しでは,無作為抽出が定義した各分布で実行される.
  • シナリオ変数 は,2つの限界の間で量が変化できるトルネード分析を除いて,モデル中で固定された量をシミュレーション・モデルに組み込むことができる.
  • 結果変数 は,モデルの出力に対応します.それらは,直接または間接的に,1つまたは複数のExcel 関数を通して,分布が関係づけられた確率変数に,そしてもし利用可能であれば,シナリオ変数に従属する.シミュレーション・モデルの計算の最終目的は,結果変数の分布を得ることである.
  • 統計量 は,結果変数の任意の統計量を追跡することができる.たとえば,結果変数の標準偏差をモニターしたりできる.

正しいモデルは,少なくとも1つの分布と1つの結果からなる.モデルは,これらの4つの要素のいくつでも含むことができる.

モデルは,単一のExcelシートに限定することも,Excelフォルダ全体を使用することも可能である. 

シミュレーション・モデルは,分布によって記述される入力変数の間の従属性を考慮に入れることができる.2個の変数が通常,相関係数が0.4であるような関係であることがわかっているなら,シミュレーションを行う際に,両変数のサンプリングされた値が同じ性質を持つことが望まれる.XLSTATでは実行ダイアログ・ボックスで,モデルで使用される一部またはすべての入力確率変数に相関行列または共分散行列を入力することで,これが可能である.

XLSTATでのモンテ・カルロ・シミュレーションの設定方法?

一般タブ:

このオプションに制限されたモデルは,アクティブなシミュレーション・モデルのサイズを定義することができる.可能であればモデルを単一のExcelシートに制限するとよい. 次のオプションが利用可能である:

  • シート: アクティブなExcel内のシミュレーション関数のみが,シミュレーション・モデルで使用される.その他のシートは無視される.
  • ワークブック: アクティブなワークブックのすべてのシミュレーション関数が,シミュレーション・モデルに含まれる.このオプションは,1個のモデルで複数のExcelシートを使用することができる.

サンプリング法: このオプションは,標本生成の方法を選ぶことができる.2とおりの方法が利用可能である:

  • クラシック: モンテ・カルロ・シミュレーションを用いて標本が生成される.
  • ラテン超方格: ラテン超方格法を用いて標本が生成される.この手法は,同じサイズのセクションに変数の分布関数を分割し,各セクション内で同じサイズの標本を生成する.これはより速いシミュレーションの収束につながる.せきゅション数を入力することができる.デフォルト値は500.

 

シングル・ステップ・メモリ: 統計量フィールドを計算するために,シングル・ステップ・モードでストアされるシミュレーション・ステップの最大数を入力する.限界に達すると,窓が前に進む(最初の繰り返しは忘却され,新しい繰り返しがストアされる).デフォルト値は500.この値は,必要であれば,より大きくできる..

ステップごとの繰り返し数: 1つのステップで実行されるシミュレーションの繰り返しの数を入力する.デフォルト値は 1.

フォーマット・タブ:

Excel シート上で表示されるさまざまなモデル要素の形式を設定するために,このオプションを使用する:

  • 分布:入力確率変数の定義とそれらの対応する分布がストアされるセルのフォント色と背景色を定義できる.
  • シナリオ変数: シナリオ変数がストアされるセルのフォント色と背景色を定義できる.
  • 結果変数: 結果変数がストアされるセルのフォント色と背景色を定義できる.
  • 統計量: 統計量がストアされるセルのフォント色と背景色を定義できる.

収束 タブ:

停止条件: 収束基準が達するとシミュレーションを停止させるには,このオプションを有効にする.

  • 基準: 収束をテストするために使用する基準を選択する.3つのオプションがある:
  • 平均: 収束基準に達したかどうかを確認するために,シミュレーション・モデルのモニタされている“結果変数”の平均(下記参照)が使用される.
  • 標準偏差: 収束規準に達したかどうかを確認するために,シミュレーション・モデルのモニタされている“結果変数” の標準偏差(下記参照)が使用される.
  • パーセンタイル: 収束基準に達したかどうかを確認するために,シミュレーション・モデルのモニタされている“結果変数” のパーセンタイル(下記参照)が使用される. 使用するパーセンタイルを選ぶ.デフォルト値は90%である.
  • テスト頻度: 収束基準が再び確認される前に実行する繰り返し数を入力する.デフォルト値:100.
  • 収束:1つの確認から次への収束基準の進展でアルゴリズムが収束したことを意味する値を%で入力する.デフォルト値: 3%.
  • 信頼区間 (%): 選択された基準の周辺で計算される信頼区間のサイズを % で入力する.収束に達したか否かを決定するために,区間の上限を上記で定義された収束値と比較する.デフォルト値: 95%.
  • モニタされる結果: シミュレーション・モデルのどの結果変数が収束のためにモニタされるかを選択する.2つのオプションがある:
  • すべての結果変数: シミュレーション・モデルのすべての結果変数が,収束テストでモニタされる.
  • 有効な結果変数: ConvActive パラメータが1 に等しい結果変数のみがモニタされる.

参照 タブ:

Excel セルの参照: シミュレーション・モデルが生成される変数の中の参照方法を選択する:

  • 絶対参照: XLSTAT は,セルへの絶対参照(たとえば$A$4)を作成する.
  • 相対参照: XLSTAT は,セルへの相対参照(たとえば A4)を作成する.

注意: 絶対参照は,相対参照とは異なり, XLSTAT_Sim の数式をコピー&ペーストしても変化しない

結果 タブ:

結果のレベルをフィルタ: レポートに表示される詳細のレベルを選択する.これは,さまざまなモデル要素の記述統計表とヒストグラムをコントロールする:

  • すべて: モデルのすべての要素について詳細が表示される.
  • 有効: 表示パラメータの値が1に設定されている要素についてのみ詳細が表示される.
  • なし: モデルの要素について詳細を表示しない.

XLSTATでのモンテ・カルロ・シミュレーションの結果は?

モデルを実行すると,結果の系列が表示される.入力および結果変数の分布に関する情報などの重要な統計量を与える一方,変数間の関係を解釈することもできる.またシナリオ変数が含まれる場合は,感度分析も可能である.

記述統計

シミュレーションの後に生成されるレポートは,モデルの分布に関する情報を含む.結果を簡単に解釈するために,ユーザーは,レポートに統合するべき最も重要な指標を記述統計のい範囲から 選ぶことができる.関係性をグラフィカルに表示するチャートのセレクションも利用可能である. 

記述統計に関係する詳細と数式が,XLSTATの記述統計ツールの記述セクションで利用可能である.

相関

計算が終ると,シミュレーション・レポートはシミュレーション・モデルに含まれるさまざまな変数間の相関に関する情報を格納できる.3種類の相関係数が利用可能である :

Pearson 相関係数: この係数は,古典的な線形相関係数と一致する.この係数は,連続値データによく適する.その値は, -1から 1の範囲で,2つの変数の間の線形相関の度合いを定量化する.注意: 2乗 Pearson 相関係数は,ある変数の変動が他の変数によってどれだけ説明されるかの知見を与える.各係数で計算されるp値は,その係数が0から有意に異ならないという帰無仮説を検定できる.ただし,この結果の解釈には注意が必要で,2つの変数が独立であれば,それらの相関係数がゼロになるが,逆は必ずしも真ではない.

Spearman 相関係数 (rho): この係数は,オブザベーションの値ではなく,それらの順位に基づく.この係数は,順序データに適応する.Pearson相関と同様,説明される変動の観点でこの係数を解釈できるが,ここでは順位の変動を意味する.

Kendall 相関係数 (tau): Spearman 係数と同様,これは順序変数によく適しており,これも順次に基づいている.ただし,この係数は概念的にとても異なる.これは確率の観点で解釈できる: これは,変数が同じ方向に変化する確率と,変数が逆の方向に変化する確率の間の差である.オブザベーションの数が 50より低く,同値がない場合, XLSTAT は正確なp値を提供する.それ以外は,近似が使用される.後者は,9個以上のオブザベーションがある場合に信頼できることが知られている.

感度分析

感度分析は,1個の出力変数でのさまざまな入力変数の影響度に関する情報を表示する.シミュレーション結果と (上記で)選ばれた相関係数に基づいて,入力変数と出力変数の間の相関が計算されて,結果変数の影響度の降順で表示される.

トルネード分析とスパイダー分析

トルネード分析とスパイダー分析はシミュレーションの繰り返しには基づかないが,すべての入力変数(分布による確率変数とシナリオ変数)のポイント・バイ・ポイント分析に基づく.

トルネード分析の際,結果変数ごとに,各確率変数と各シナリオ変数が1個ずつ調査される.我々はそれらの値が2つの境界の間で変化するようにして,各確率変数とシナリオ変数が結果変数にどれだけ影響するかを知るために,結果変数の値を記録する.確率変数については,探索される値は,中央値付近またはデフォルトのセル値付近のいずれかにあり,境界はパーセンタイルまたは偏差で定義される.シナリオ変数については, 変数が定義されたときに指定された境界の間で分析が実行される.ポイントの数は,シミュレーション・モデルを実行する前にユーザーが定義できるオプションである.

スパイダー分析は,結果変数の最大変化と最小変化を表示するだけでなく,確率変数うとシナリオ変数の各データ・ポイントでの結果の変数の値も表示する.これは,分布変数と結果変数の間の従属性が単調であるか否かを確認するのに有用である.

XLSTATのモンテ・カルロ・シミュレーションで表示されるチャートは?

変数に関する情報を表示するために,以下のチャートが利用可能である:

  • 箱ひげ図: 量的データ標本の単変量表現は,”box plot”または"box and whisker diagrams"などと呼ばれる.XLSTATで提供されるバージョンでは,最小,第1四分位,中央値,平均,第3四分位が,それを超えると異常とみなされる両側の限界(”ひげ”の終端)とともに表示されるので,これは単純かつ完全な表現である.平均はred赤い +で表示され,黒い線は中央値である.
  • 散布図: これらの単変量表現は,標本の分布と可能な複数の最頻値の知見を提供する.すべてのポイントが平均および中央値とともに表される.
  • P-P プロット (正規分布): P-P プロット (Probability-Probabilityの略) は,標本の経験分布関数を同じ平均と偏差の正規分布変数と比較するために使用される.標本が正規分布に従うなら,データは平面の第1二分線に沿って並ぶ.
  • Q-Q プロット (正規分布): Q-Q プロット (Quantile-Quantileの略)は,標本の四分位を同じ平均と偏差の正規分布変数と比較するために使用される.標本が正規分布の従うなら,データは平面の第1四分位に沿って並ぶ.
ternary diagramneural network diagram

Excelで動作する統計解析ソフトウェア。

14日間無償トライアルあり。