正準コレスポンデンス分析 (CCA および偏CCA)

正準コレスポンデンス分析とは

正準コレスポンデンス分析(CCA:Canonical Correspondence Analysis)は,生態学者が多数の種を環境変数に関係づけることを可能にするために開発された.ただし,この手法は,他の分野でも使用できる.ジオマーケティング(地理マーケティング)やデモグラフィック分析(人口学的分析)では,これ利点を活用できる.

正準コレスポンデンス分析は, 2次元または3次元でサイト,オブジェクト,変数の同時表現を,任意の分散基準に最適な形で得ることを可能にする.

正準コレスポンデンス分析の原理

T1 をp 個のプロジェクトn個のサイトでのカウントに対応している分割表であるとする. この表は,2次元または3次元でサイトとオブジェクトの同時マップを得るために,コレスポンデンス分析コレスポンデンス分析(CA:Correspondence Analysis)を用いて分析できる.

T2 をq個の量的変数や質的変数に対応する同じ n 個のサイトで記録された測定値を格納する表であるとする.

C正準コレスポンデンス分析は,2つのパートに分かれている:

  1. T1 and T2.次元数がqに等しい空間での制約つき分析.このパートは,表T1 および T2の間の関係の分析に対応するので,主な目的の1つである.
  2. 残差の分析に対応する制約なしのパート.制約なしCCAでの次元数は, min(n-1-q, p-1)に等しい.

正準コレスポンデンス分析から派生する2つの手法

  • 偏 CCA :偏 CCA は,準備ステップを追加する.T2の表は,変数の2つのグループに細分される: 1番目のグループは,既知であるか調査の目的ではないので,効果を除去したい条件づけ変数を格納する.CCAがこれらの変数を用いて実行される.効果を分析したい2番目の変数のグループを用いて2番目の CCAが実行される.偏 CCA は,1番目のグループの効果を除去した後,2番目の変数のグループの効果を分析することを可能にする.
  • PLS- 正準コレスポンデンス分析: CCAに判別PLSを関係づけることができる.Addinsoftは,2つの手法の包括的で効果的な統合を提案する最初のソフトウェア開発者である.Tenenhaus提案に基づくデータの構築を用いて,使用できる変数の制約を避けるためにCCA 用に最適設計された直交PLS 成分を作成するため,もしくは, CCAを実行する前に最も影響の強い変数を選択するために,データにPLSステップが適用される.CCA ステップとの計算と結果は,旧式の CCAで行うそれと同一なので,ユーザーは,このアプローチを最も興味深い変数を識別する選択手法とみなすことができる.それらはモデル中に選択されているか,VIPのグラフで見ることができる(より詳細PLS 回帰の節を参照). 偏CCAの場合,準備ステップは不変である.

 XLSTATでの正準コレスポンデンス分析の結果

  • イナーシャ: この表は,制約つきCCAと制約なしCCAの間のイナーシャの分布を表示する.
  • 固有値とイナーシャのパーセンテージ:これら表では,CCA と制約なしCCA での固有値,対応するイナーシャ,および対応するパーセンテージが,制約つきイナーシャ(または制約なしイナーシャ)に関して,または合計イナーシャに関して表示される.
  • 重みつき平均: この表は,重みつき平均および全体の重みつき平均を表示する.
  • 主座標と標準座標: サイト,オブジェクトおよび変数の主座標と標準座標が表示されます.これらの座標は,さまざまなグラフを生成するために使用される.
  • 回帰係数: この表は,因子空間での変数の回帰係数を表示する.
  • サイトとオブジェクトのマップ:
    • サイトとオブジェクト / 対称チャート
    • サイト / 非対称
    • オブジェクト / 非対称c
    • サイト
    • オブジェクト
    このグラフは,サイト,オブジェクトおよび変数の間の関係性を可視化することを可能にする.質的変数が含まれた場合,対応するカテゴリが赤いくり抜き円で表示される.