📊 統計学習 パート2
生存時間分析とJASP実習

🎯 パート2の学習目標

1. 生存時間分析とは?

🏥 なぜ生存時間分析が必要なのか?

従来の統計手法の限界:

→ 打ち切りデータ(Censored Data)を適切に扱う必要

🔍 打ち切りデータ(Censored Data)の詳細解説

📊 打ち切りデータとは?

定義:イベント(死亡、病気の発症、故障など)の正確な発生時刻が観測できないデータ

📖 なぜ「打ち切り」と呼ぶのか?
観測が途中で「打ち切られる」ことから、この名前がついています。英語では「Censoring」です。

📊 打ち切りデータの視覚化

時間(月) 0 12 24 36 48 60 患者A 24ヶ月で死亡(イベント) 患者B 60ヶ月生存(研究終了) 患者C 36ヶ月で脱落 患者D 30ヶ月で他病死 打ち切りデータの例 イベント発生 研究終了 打ち切り

🔢 打ち切りデータの種類

① 右打ち切り(Right Censoring)- 最も一般的

状況:研究終了時点でまだイベントが発生していない

例:

  • 患者Aは研究開始から50ヶ月後も生存中 → 「50ヶ月以上生存」とわかる
  • 患者Bは30ヶ月目に引越しで追跡不可 → 「30ヶ月時点では生存」とわかる
  • 患者Cは他の病気で死亡 → 「研究対象の病気では40ヶ月以上生存」とわかる
データ表現: (観測時間, イベント=0)
患者A: (50, 0)、患者B: (30, 0)、患者C: (40, 0)

② 左打ち切り(Left Censoring)- 稀

状況:研究開始前にすでにイベントが発生していた

例:患者が「3年前から病気だった」と判明 → 「3年以前に発症」

③ 区間打ち切り(Interval Censoring)- 中程度

状況:イベント発生が2つの観測時点の間

例:6ヶ月検診では正常、12ヶ月検診で異常 → 「6〜12ヶ月間に発症」

⚠️ なぜ普通の統計手法では対応できないのか?

❌ 問題のある対処法

  • 除外する:「イベント未発生者を分析から除外」→ バイアス発生
  • 最悪想定:「研究終了直後にイベント発生と仮定」→ 過度に悲観的
  • 最良想定:「永遠にイベント発生なしと仮定」→ 過度に楽観的

✅ 正しい対処法:生存時間分析

  • 部分的情報を活用:「◯ヶ月時点では生存」という情報も貴重
  • 統計学的手法:カプランマイヤー法、COX回帰で適切に解析
  • 不確実性の管理:信頼区間で結果の精度を表現

📈 カプランマイヤー曲線(Kaplan-Meier Curve)

定義:時間経過に伴う生存確率の変化を示すグラフ

  • Y軸:生存確率(0〜1または0〜100%)
  • X軸:時間(月、年など)
  • 特徴:階段状の曲線(イベント発生時に確率が低下)

📊 カプランマイヤー曲線の例

0 12 24 36 48 60 時間(月) 0 20 40 60 80 100 生存率(%) 新薬 vs 従来薬の生存曲線 新薬群(5年生存率: 83%) 従来薬群(5年生存率: 65%) 打ち切り
📖 グラフの読み方:
• 階段状の下がり方:イベント(死亡)発生のタイミング
• 線の分離度:群間の差の大きさ
• 丸印:打ち切りデータ(その時点では生存)
• 60ヶ月時点:新薬群83%、従来薬群65%の生存率

2. 実例:がんの新薬効果研究

🧬 研究設定

1 対象:同じ種類のがん患者100名を無作為に2群に分割
2 群分け:
• 新薬群(50名):新開発の治療薬
• 従来薬群(50名):標準的な治療薬
3 追跡期間:5年間(60ヶ月)
4 エンドポイント:死亡(全生存期間:Overall Survival)

📊 サンプルデータ

患者ID 治療群 生存時間(月) イベント 備考
001新薬6005年生存
002新薬45145ヶ月で死亡
003新薬38038ヶ月で脱落
004従来薬24124ヶ月で死亡
005従来薬30030ヶ月で脱落
...............

イベント:1=死亡、0=打ち切り(生存または脱落)

3. カプランマイヤー法の計算

S(t) = ∏[1 - (死亡者数)/(リスク集合)]

📝 計算例(簡略版)

新薬群の計算:
時間(月)リスク集合死亡数生存確率
05001.00
125020.96
244730.90
364220.86
483810.83
603500.83

新薬群の5年生存率:83%

4. ログランク検定(Log-rank Test)

⚖️ ログランク検定とは

目的:2つ以上の群の生存曲線に有意差があるかを検定

帰無仮説:各群の生存曲線に差がない

対立仮説:各群の生存曲線に差がある

χ² = Σ[(観測死亡数 - 期待死亡数)² / 期待死亡数]
🔍 結果例:
χ² = 4.85, df = 1, p = 0.028
p < 0.05 → 新薬群と従来薬群の生存曲線に有意差あり

5. COX回帰分析

📊 COX比例ハザードモデル

目的:複数の要因が生存時間に与える影響を同時に評価

h(t) = h₀(t) × exp(β₁X₁ + β₂X₂ + ... + βₚXₚ)

解釈:

  • ハザード比(HR) = exp(β)
  • HR > 1:リスク増加要因
  • HR < 1:保護要因
  • HR = 1:影響なし

📊 ハザード比の視覚的理解

HR = 1.0 (基準) 0.50 新薬 50%リスク減少 1.03 年齢 3%リスク増加 4.00 進行病期 4倍リスク増加 0.5 1.0 4.0 ハザード比 (HR) 各要因のハザード比比較 保護効果 リスク増加
💡 ハザード比の読み方:
新薬のHR = 0.50: 従来薬に比べて死亡リスクが半分
年齢のHR = 1.03: 1歳増加で死亡リスクが3%増加
進行病期のHR = 4.00: 早期病期に比べて死亡リスクが4倍

🔬 COX回帰の結果例

変数β係数ハザード比(HR)95%信頼区間p値
治療群(新薬 vs 従来薬)-0.6930.500.28-0.890.019
年齢0.0251.031.01-1.050.032
病期(進行 vs 早期)1.3864.002.15-7.44<0.001
🎯 解釈:
新薬は従来薬に比べて死亡リスクを50%減少(HR=0.50)
• 年齢が1歳増加すると死亡リスクが3%増加
• 進行期は早期に比べて死亡リスクが4倍

6. JASPでの実践演習

6. サンプルデータとJASP日本語版での実践演習

📁 サンプルデータセット

研究課題:がんの新薬と従来薬の5年生存率比較研究

📊 データファイル構成

列名 説明 データ型 値の例
時間 生存時間(月) 尺度 24, 60, 36...
イベント 死亡の有無 名義 1=死亡, 0=打ち切り
治療群 使用薬剤 名義 1=新薬, 0=従来薬
年齢 患者年齢 尺度 45, 67, 52...
病期 がんの進行度 名義 1=進行期, 0=早期

💾 サンプルデータの入手方法

  1. 手動入力:以下の小規模データセットをJASPに直接入力
  2. CSVファイル:下記データをコピーしてExcelに貼り付け、CSV形式で保存
  3. 練習用データ:まずは20名分のデータで操作に慣れる
📋 練習用サンプルデータ(20名分)
時間,イベント,治療群,年齢,病期
24,1,0,65,1
60,0,1,52,0
36,0,0,48,1
45,1,0,72,1
60,0,1,55,0
18,1,0,68,1
60,0,1,43,0
32,1,1,61,1
60,0,1,49,0
28,1,0,59,1
54,0,1,56,0
15,1,0,74,1
60,0,1,47,0
42,1,0,63,1
60,0,1,51,0
21,1,0,69,1
58,0,1,45,0
35,1,1,58,1
60,0,1,53,0
26,1,0,66,1

使用方法:上記データをコピーして、メモ帳に貼り付け、「survival_data.csv」として保存してください。

💻 JASP日本語版とは?

JASP (Jeffreys's Amazing Statistics Program) は無料の統計ソフトウェアです。

特徴:

  • 無料でダウンロード可能
  • 日本語インターフェース対応
  • 直感的なGUIインターフェース
  • 生存時間分析に対応
  • 美しいグラフ出力

公式サイト: https://jasp-stats.org/

日本語設定:初回起動時に言語設定で「日本語」を選択

📋 JASP日本語版演習手順

💻 JASP日本語版 画面構成

JASP - 日本語版 回帰 記述統計 t検定 データビュー 時間 イベント 治療群 24 1 0 60 0 1 分析設定 生存回帰 カプラン・マイヤー Cox回帰 変数設定: 時間変数 イベント変数 群変数 分析結果 カプラン・マイヤー曲線 ログランク検定結果 カイ二乗値: 4.85 p値: 0.028 1 2 3
📝 操作の流れ:
データ入力・確認 → 分析手法選択・変数設定 → 結果確認・解釈

🗂️ データ準備

  1. JASP日本語版を起動し、新しいデータファイルを作成
  2. 以下の列を作成:
    • 時間:生存時間(月)
    • イベント:イベント発生(1=死亡、0=打ち切り)
    • 治療群:治療群(1=新薬、0=従来薬)
    • 年齢:年齢
    • 病期:病期(1=進行、0=早期)
  3. データを入力(サンプルデータをダウンロード可能)
  4. 重要:列のデータ型を正しく設定
    • 「時間」「年齢」→ 尺度
    • 「イベント」「治療群」「病期」→ 名義

📈 カプランマイヤー分析

  1. メニュー回帰生存回帰カプラン・マイヤー
  2. 時間変数に「時間」をドラッグ
  3. イベント変数に「イベント」をドラッグ
  4. 群変数に「治療群」をドラッグ
  5. 統計タブで以下をチェック:
    • 生存表
    • 平均生存時間
    • 中央生存時間
  6. タブで以下をチェック:
    • カプラン・マイヤー曲線
    • 信頼区間
    • リスク表
  7. 検定タブで以下をチェック:
    • ログランク検定
    • ブレスロー検定

⚖️ COX回帰分析

  1. メニュー回帰生存回帰Cox回帰
  2. 時間変数に「時間」をドラッグ
  3. イベント変数に「イベント」をドラッグ
  4. 共変量に「治療群」「年齢」「病期」をドラッグ
  5. 統計タブで以下をチェック:
    • 回帰係数
    • ハザード比
    • 信頼区間
    • モデル統計
  6. タブで以下をチェック:
    • 生存曲線
    • ハザード比の図
  7. 仮定タブで以下をチェック:
    • 比例ハザードの仮定
    • 残差プロット

7. 演習問題

🧪 実習課題 1:カプランマイヤー分析

提供されたサンプルデータを使用して、JASP日本語版でカプランマイヤー分析を実行してください。

課題:

  • 新薬群と従来薬群の5年生存率を求める
  • ログランク検定の結果を解釈する
  • 生存曲線グラフを作成する
📋 JASP日本語版での確認ポイント:
  • 生存表で各時点での生存率を確認
  • ログランク検定のp値をチェック
  • カプラン・マイヤー曲線で視覚的に差を確認
期待される結果:
  • 新薬群の5年生存率:約83%(生存表の60ヶ月時点で確認)
  • 従来薬群の5年生存率:約65%(生存表の60ヶ月時点で確認)
  • ログランク検定:カイ二乗値 = 4.85, p値 = 0.028
  • 結論:p < 0.05のため、新薬群は従来薬群に比べて有意に生存率が高い
📊 JASP日本語版での読み方:
検定統計量表でログランク検定のp値を確認
生存表で各群の生存率推移を確認
カプラン・マイヤー曲線で群間の差を視覚的に確認

🔬 実習課題 2:COX回帰分析

同じデータセットを使用して、治療効果を年齢と病期で調整したCOX回帰分析を実行してください。

課題:

  • 治療群のハザード比を求める
  • 年齢の影響を評価する
  • 病期の影響を評価する
📋 JASP日本語版での確認ポイント:
  • 回帰係数表でハザード比と信頼区間を確認
  • モデル統計でモデル全体の有意性を確認
  • ハザード比の図で各要因の効果を視覚化
期待される結果:
  • 治療群(新薬):ハザード比 = 0.50 (95%信頼区間: 0.28-0.89), p値 = 0.019
  • 年齢:ハザード比 = 1.03 (95%信頼区間: 1.01-1.05), p値 = 0.032
  • 病期(進行):ハザード比 = 4.00 (95%信頼区間: 2.15-7.44), p値 < 0.001
  • 結論:年齢と病期を調整しても、新薬の保護効果は有意
📊 JASP日本語版での読み方:
回帰係数表の「Exp(B)」列がハザード比
95%信頼区間で効果の範囲を確認
有意性列でp値を確認
生存曲線で調整後の予測曲線を確認

📊 実習課題 3:結果の解釈と報告

JASP日本語版で得られた結果を用いて、以下の質問に答えてください。

シナリオ:新薬のハザード比が0.60 (95%信頼区間: 0.45-0.80, p値=0.001)でした。

📋 報告すべきポイント:
  • 統計学的有意性の解釈
  • 臨床的意義の説明
  • 信頼区間の意味
  • 研究の限界
解釈と報告例:
  • 統計学的意義:新薬は従来薬に比べて死亡リスクを40%減少させる(ハザード比0.60)
  • 信頼区間:真のリスク減少効果は20%〜55%の範囲(95%信頼区間: 0.45-0.80)
  • 有意性:p < 0.001で高度に有意な差が認められた
  • 臨床的意義:1000人治療すると、約400人の死亡を防げる可能性
📝 論文での報告例:
「COX回帰分析の結果、年齢と病期を調整した後でも、新薬群は従来薬群と比較して有意に死亡リスクが低かった(調整ハザード比: 0.60, 95%信頼区間: 0.45-0.80, p=0.001)。」

📚 まとめ

🎯 重要ポイント

  1. 生存時間分析は打ち切りデータを適切に扱う手法
  2. カプランマイヤー曲線で時間経過による生存確率を視覚化
  3. ログランク検定で群間の生存曲線を比較
  4. COX回帰で複数要因の同時評価が可能
  5. JASPを使えば複雑な解析も直感的に実行可能

🏥 臨床での意義

新薬研究では、従来薬に比べて死亡リスクを50%減少させることが統計学的に証明され、がん治療の新たな選択肢として期待されます。

📖 次のステップ

JASP日本語版をダウンロードして、実際にサンプルデータで演習を行ってみましょう!

🔧 JASP日本語版 セットアップガイド

  1. 公式サイト(https://jasp-stats.org/)からダウンロード
  2. 初回起動時の設定画面で「言語: 日本語」を選択
  3. 「回帰」→「生存回帰」メニューを確認
  4. サンプルデータでテスト実行
💡 演習のコツ
• データ型設定(尺度/名義)を正しく行う
• 各タブ(統計・図・検定・仮定)を順番に確認
• 結果の表やグラフを印刷/保存して復習に活用
• 実際の論文と照らし合わせて理解を深める

統計学習の旅はまだ続きます...