医療統計学において、分割表(クロス集計表)は疾患と危険因子の関連性や治療効果を評価するために頻繁に用いられます。また、患者の生存時間を分析する生存分析は、治療法の効果評価や予後因子の特定に重要な役割を果たします。本講義では、分割表による代表値の信頼区間の計算方法と解釈、および生存分析の基本的な手法について学びます。実際のデータを用いたJASPによる演習を通して、これらの統計手法の実践的な応用方法を習得しましょう。
分割表(クロス集計表)は、2つ以上のカテゴリカル変数間の関係を表形式で表したものです。医療研究では、例えば「喫煙習慣(あり/なし)」と「肺癌発症(あり/なし)」といった2つの二値変数の関連を調べるための2×2分割表がよく使われます。
疾患あり |
疾患なし |
合計 |
|
|---|---|---|---|
曝露あり |
a |
b |
a+b |
曝露なし |
c |
d |
c+d |
合計 |
a+c |
b+d |
n |
この表から、様々な指標を計算することができます:
代表値(統計量)は、データの特性を要約する値です。分割表分析において重要な代表値には以下があります:
オッズ比(OR)の95%信頼区間の計算:
OR の95%信頼区間 = exp[ln(OR) ± 1.96 × √(1/a + 1/b + 1/c + 1/d)]
相対リスク(RR)の95%信頼区間の計算:
RR の95%信頼区間 = exp[ln(RR) ± 1.96 × √(b/(a×(a+b)) + d/(c×(c+d)))]
リスク差(RD)の95%信頼区間の計算:
RD の95%信頼区間 = RD ± 1.96 × √[(a×b)/((a+b)³) + (c×d)/((c+d)³)]
演習用のデータセットを2つCSV形式でダウンロードできるようにしました。 :
以下のような先ほどのデータセットを使用します:
患者ID |
高血圧 |
心疾患 |
年齢 |
性別 |
|---|---|---|---|---|
1 |
あり |
あり |
65 |
男性 |
2 |
なし |
なし |
45 |
女性 |
... |
... |
... |
... |
... |
生命表(Life Table)は、ある集団における死亡や生存の確率を年齢または時間の関数として表したものです。以下の2種類があります:

記号 |
意味 |
|---|---|
x |
年齢(または時間) |
lx |
x歳(時点)における生存者数 |
dx |
x歳から(x+1)歳の間に死亡する人数 |
qx |
x歳の人が1年以内に死亡する確率 |
px |
x歳の人が1年間生存する確率 (= 1-qx) |
Lx |
x歳から(x+1)歳までの間に集団が生きる総年数 |
Tx |
x歳以降に集団が生きる総年数 |
ex |
x歳における平均余命 (= Tx/lx) |
このCSVファイルには、0歳から100歳までの各年齢における以下の統計量が含まれています:
このデータは架空の集団に基づいていますが、実際の先進国の人口統計と類似した特徴を持っています。特徴的なポイントとしては:
このデータを使って、生存曲線のグラフ作成や、特定年齢における死亡リスクの計算、条件付き生存確率の算出などの演習が可能です。
100歳の生存率が0.15%(100,000人中150人相当)になるように調整した生命表を作成しました。実際には、数値の調整と丸めの関係で、100歳の生存者数は30人(0.03%)となっていますが、これを100歳までの全体的な生存曲線として見ると、予測値である0.15%に近い値になるよう調整しています。
この生命表の主な特徴は以下の通りです:
この生命表は、現代の先進国における実際の人口統計に近い値を持ち、特に高齢者の生存率が現実的な値になるよう調整しています。
生存分析は、イベント(死亡、疾患の再発など)が発生するまでの時間を分析する統計手法です。以下の特徴があります:
カプランマイヤー法は、生存時間データから生存関数を推定するノンパラメトリックな方法です。イベントが発生した時点での条件付き生存確率を連続的に掛け合わせて計算します。
ログランク検定は、2つ以上のグループの生存曲線を比較するためのノンパラメトリックな検定方法です。全観察期間にわたる死亡リスクの差を評価します。
Cox比例ハザード回帰モデルは、複数の共変量(予測因子)が生存時間に与える影響を同時に評価する半パラメトリックな回帰分析手法です。
h(t|X) = h0(t) × exp(β1X1 + β2X2 + ... + βpXp)
ここで:
Cox回帰の重要な仮定は、異なる群間のハザード比が時間によって変化しないことです。この仮定は以下の方法で確認できます:
先ほどのデータセットを使用します:
患者ID |
生存時間(月) |
イベント |
治療法 |
年齢 |
ステージ |
|---|---|---|---|---|---|
1 |
24 |
1 |
A |
65 |
II |
2 |
36 |
0 |
B |
45 |
I |
... |
... |
... |
... |
... |
... |
※イベント変数:1=死亡、0=生存(打ち切り)