3. DAGs(有向非循環グラフ)による因果推論
DAGsとは
DAGs(Directed Acyclic Graphs)は、変数間の因果関係を矢印で表現したグラフです。疫学研究における交絡調整戦略の決定に不可欠なツールとなっています。
基本構造の3パターン
鎖構造(Chain)
A → B → C
Aの効果がBを通じてCに伝わる(媒介)
重要: Bを調整するとA→Cの経路が遮断される
分岐構造(Fork)
A ← B → C
Bが共通原因(交絡因子)
重要: Bを調整することでA-C間の非因果的関連が除去される
合流構造(Collider)
A → B ← C
BはAとCの共通結果
注意! Bを調整すると逆にA-C間に関連が生じる
バックドア基準
因果効果を正しく推定するための調整変数選択の原則:
- 曝露から結果への全てのバックドア経路を遮断する
- Collider(合流点)やその子孫は調整しない
- 媒介変数は調整しない(総効果を求める場合)
間違い1: Collider Bias(合流点バイアス)
間違いの例:
年齢 → 入院 ← 重症度
↓ ↓
回復度 回復度
脳卒中患者の回復度研究で、入院患者のみを対象として年齢と回復度の関連を調査。入院は年齢と重症度の両方に影響される「collider」であり、これを条件づけることで年齢と重症度間に人工的な負の関連が生じる。
対策:
- 入院基準の明確化と標準化
- 外来患者も含めた全体集団での解析
- 入院理由による層別解析
間違い2: 媒介変数の過剰調整
間違いの例:
職業ストレス → 睡眠障害 → 高血圧
職業ストレスと高血圧の関連を調査する際に、睡眠障害を調整変数として投入。睡眠障害は媒介変数のため、調整により総効果が過小評価される。
対策:
- 因果経路の事前明確化
- 総効果と直接効果の区別
- 媒介分析手法の適用
間違い3: M-bias
間違いの例:
遺伝要因
↙ ↘
職業選択 疾患感受性
↓ ↓
職業曝露 → 疾患発症
職業曝露と疾患の関連研究で、職業選択を調整変数として使用。職業選択は曝露の決定因子でもあり、かつ遺伝要因を通じて疾患とも関連するため、調整により偽の関連が生じる可能性。
対策:
- 調整変数の因果的役割の慎重な検討
- 遺伝情報がある場合の直接調整
- 感度分析による結果の頑健性確認
脳卒中3次予防研究でのDAG
年齢・性別 → リハビリ強度 → 機能回復
↓ ↓ ↑
重症度 ─────────────────→ 機能回復
↓ ↑
併存疾患 ─────────────────→ 機能回復
重要な調整戦略:
- 年齢、性別、重症度、併存疾患を調整
- リハビリ強度は媒介変数の可能性があるため慎重に判断
- 社会支援は重症度と機能回復の両方に影響する可能性
産業保健研究でのDAG
社会経済地位 → 職業選択 → 職業曝露 → 健康アウトカム
↓ ↓ ↓ ↑
生活習慣 ─────────────────────────→ 健康アウトカム
↓ ↑
医療アクセス ─────────────────────→ 健康アウトカム
重要な調整戦略:
- 社会経済地位は重要な交絡因子
- 職業選択は媒介変数と交絡因子の両面を持つ
- 健康労働者効果を表現する経路の明確化
- 理論的知識の整理: 既存の文献から因果関係を整理
- 専門家との議論: 臨床医、産業医との協議でDAGを精緻化
- データによる検証: 実際のデータでDAGの妥当性を確認
- 感度分析: 異なるDAGでの結果の比較
- 透明性の確保: 研究論文でのDAG公開
インタラクティブDAG作成ツール
以下の要素をクリックして、脳卒中研究のDAGを作成してみましょう
年齢
重症度
リハビリ強度
機能回復
社会支援
DAGs理解度クイズ
パート2完了チェック
DAGsの基本概念とよくある間違いを理解できましたか?