媒介変数・交絡要因・コライダーの適切な処理法
SPSS・JASP対応の具体的手法とアルゴリズム
定義: XがYに与える影響の経路(メカニズム)
処理: 媒介分析で効果を分解
注意: コントロールすると効果が消える
定義: XとYの両方に影響する第三変数
処理: 統計モデルに含めて調整
注意: 無視すると偽の関連
定義: XとYから影響を受ける変数
処理: 統計モデルに含めない
注意: 調整すると偽の関連が生まれる
| 変数タイプ | 識別方法 | 処理方針 | 統計手法 | 解釈上の注意 |
|---|---|---|---|---|
| 媒介変数 | X → M → Y の経路上 | 媒介分析実行 | Bootstrap法、Sobel検定 | 直接効果と間接効果を分離 |
| 交絡要因 | C → X, C → Y | 統計モデルに含めて調整 | 重回帰分析、層別分析 | 調整後の効果を解釈 |
| コライダー | X → L ← Y | 統計モデルに含めない | 単回帰分析(コライダー除外) | 選択バイアスに注意 |
理論的背景: 媒介効果は「間接効果 = a×b」として計算されるが、この積の分布は正規分布に従わない。従来のt検定では正確な信頼区間が得られない。
Bootstrap法のメカニズム:
Sobel検定との比較: Sobel検定は正規分布を仮定するが、Bootstrap法は分布を仮定しないため、小サンプルや非正規分布でも正確。現在の金標準はBootstrap法。
実践的価値: 直接効果(c')と間接効果(ab)を分離することで、「効果があるか」だけでなく「なぜ効果があるのか」というメカニズムを解明できる。
理論的背景: 交絡要因Cが存在すると、X→Yの関係にC→X、C→Yの影響が混入し、真の因果効果が歪む。統計的調整により、Cの影響を「一定に保った状態」でのX→Y効果を推定する。
重回帰分析のメカニズム:
層別分析との関係: 重回帰分析は「連続的な層別分析」。Cを離散カテゴリーに分けて各層内でX→Y効果を見る層別分析の一般化版。
実践的価値: 観察研究において、ランダム化ができない状況で疑似的な「統制群」を作り出し、因果推論を可能にする。ただし、未測定交絡要因は除去できない限界がある。
理論的背景: コライダーL(X→L←Y)を統計モデルに含めると、本来独立だったXとYの間に人工的な関連(collider bias)が生まれる。これは「条件付け効果」として知られる現象。
コライダーバイアスのメカニズム:
具体例で理解: 「運動能力」と「学力」が「進学校合格」に影響する場合、進学校の生徒だけを分析すると運動能力と学力に負の相関が見える。実際は無関係でも、「どちらかが優秀なら合格」という選択効果によるもの。
対処法: コライダーを統計モデルに含めず、単回帰分析または完全に除外した分析を行う。サンプル選択時にもコライダーによる絞り込みを避ける。
実践的価値: 研究結果の妥当性を保つ。特に観察研究では、既存データベースや特定集団のデータを用いる際に、選択バイアスを防ぐ重要な原則。
これら3つの処理法は、すべて「因果関係の方向性」に基づいて決定される。DAGを正しく描くことで、どの変数をどう扱うべきかが論理的に決まり、恣意的な分析を避けることができる。統計は「道具」であり、DAGは「設計図」。正しい設計図なしに適切な道具は選べない。
| 効果の種類 | 意味 | 解釈の仕方 | 重要度の判断 |
|---|---|---|---|
| 直接効果 (c') | 媒介変数を通さない直接的影響 | 他の要因を除いた純粋な効果 | 統計的有意性とCIで判断 |
| 間接効果 (ab) | 媒介変数を通じた間接的影響 | メカニズムを示す重要な指標 | Bootstrap CIが0を含まない |
| 総効果 (c) | 全体的な影響の大きさ | 実践的意義を判断する基準 | 効果量の大きさで判断 |