従来の統計手法の限界:
→ 打ち切りデータ(Censored Data)を適切に扱う必要
定義:イベント(死亡、病気の発症、故障など)の正確な発生時刻が観測できないデータ
状況:研究終了時点でまだイベントが発生していない
例:
状況:研究開始前にすでにイベントが発生していた
例:患者が「3年前から病気だった」と判明 → 「3年以前に発症」
状況:イベント発生が2つの観測時点の間
例:6ヶ月検診では正常、12ヶ月検診で異常 → 「6〜12ヶ月間に発症」
定義:時間経過に伴う生存確率の変化を示すグラフ
| 患者ID | 治療群 | 生存時間(月) | イベント | 備考 |
|---|---|---|---|---|
| 001 | 新薬 | 60 | 0 | 5年生存 |
| 002 | 新薬 | 45 | 1 | 45ヶ月で死亡 |
| 003 | 新薬 | 38 | 0 | 38ヶ月で脱落 |
| 004 | 従来薬 | 24 | 1 | 24ヶ月で死亡 |
| 005 | 従来薬 | 30 | 0 | 30ヶ月で脱落 |
| ... | ... | ... | ... | ... |
イベント:1=死亡、0=打ち切り(生存または脱落)
| 時間(月) | リスク集合 | 死亡数 | 生存確率 |
|---|---|---|---|
| 0 | 50 | 0 | 1.00 |
| 12 | 50 | 2 | 0.96 |
| 24 | 47 | 3 | 0.90 |
| 36 | 42 | 2 | 0.86 |
| 48 | 38 | 1 | 0.83 |
| 60 | 35 | 0 | 0.83 |
新薬群の5年生存率:83%
目的:2つ以上の群の生存曲線に有意差があるかを検定
帰無仮説:各群の生存曲線に差がない
対立仮説:各群の生存曲線に差がある
目的:複数の要因が生存時間に与える影響を同時に評価
解釈:
| 変数 | β係数 | ハザード比(HR) | 95%信頼区間 | p値 |
|---|---|---|---|---|
| 治療群(新薬 vs 従来薬) | -0.693 | 0.50 | 0.28-0.89 | 0.019 |
| 年齢 | 0.025 | 1.03 | 1.01-1.05 | 0.032 |
| 病期(進行 vs 早期) | 1.386 | 4.00 | 2.15-7.44 | <0.001 |
研究課題:がんの新薬と従来薬の5年生存率比較研究
| 列名 | 説明 | データ型 | 値の例 |
|---|---|---|---|
| 時間 | 生存時間(月) | 尺度 | 24, 60, 36... |
| イベント | 死亡の有無 | 名義 | 1=死亡, 0=打ち切り |
| 治療群 | 使用薬剤 | 名義 | 1=新薬, 0=従来薬 |
| 年齢 | 患者年齢 | 尺度 | 45, 67, 52... |
| 病期 | がんの進行度 | 名義 | 1=進行期, 0=早期 |
使用方法:上記データをコピーして、メモ帳に貼り付け、「survival_data.csv」として保存してください。
JASP (Jeffreys's Amazing Statistics Program) は無料の統計ソフトウェアです。
特徴:
公式サイト: https://jasp-stats.org/
日本語設定:初回起動時に言語設定で「日本語」を選択
提供されたサンプルデータを使用して、JASP日本語版でカプランマイヤー分析を実行してください。
課題:
同じデータセットを使用して、治療効果を年齢と病期で調整したCOX回帰分析を実行してください。
課題:
JASP日本語版で得られた結果を用いて、以下の質問に答えてください。
シナリオ:新薬のハザード比が0.60 (95%信頼区間: 0.45-0.80, p値=0.001)でした。
新薬研究では、従来薬に比べて死亡リスクを50%減少させることが統計学的に証明され、がん治療の新たな選択肢として期待されます。
JASP日本語版をダウンロードして、実際にサンプルデータで演習を行ってみましょう!
統計学習の旅はまだ続きます...