同一データに対する最少二乗法と最尤法の比較2

最尤法を用いるための数理モデルを用いたデータ分析2
講師:木村 朗

1. 前回の復習

最小二乗法と最尤法の基本的な考え方

最小二乗法(OLS)

最小二乗法は、実測値と予測値の差(残差)の二乗和を最小化する手法です。

最小化: Σ(yᵢ - ŷᵢ)²

特徴:

  • 計算が比較的単純
  • 外れ値に敏感
  • 正規分布を暗黙に仮定

最尤法(MLE)

最尤法は、観測されたデータが得られる確率(尤度)を最大化するパラメータを推定する手法です。

最大化: L(θ|データ) = P(データ|θ)

特徴:

  • 様々な確率分布に適用可能
  • 分布の仮定によっては外れ値に頑健
  • 確率分布の形状を明示的に仮定

前回の主な結論

  1. 正規分布を仮定した場合、最小二乗法と最尤法は同じ推定値を与える
  2. データに外れ値が存在する場合、t分布などの重裾分布を仮定した最尤法がより頑健な推定値を与える
  3. JASPでは、通常の線形回帰(最小二乗法)とロバスト回帰(t分布などを仮定した最尤法)の両方が実行可能

2. 非線形関係における両手法の比較

線形・非線形関係とモデル化

実際のデータでは、変数間の関係が線形(直線的)とは限りません。非線形関係の場合、両手法の違いがより顕著になることがあります。

線形関係とは

変数間の関係がy = ax + bの形で表現できる場合、線形関係と呼びます。

非線形関係の例

  • 指数関係: y = aᵇˣ
  • 対数関係: y = a + b log(x)
  • 二次関係: y = ax² + bx + c
  • べき乗関係: y = axᵇ
  • 漸近関係: y = (ax)/(b+x)

非線形関係のモデル化アプローチ

  1. 変数変換: 非線形関係を線形関係に変換する(例:対数変換)
  2. 多項式回帰: 高次の項(x², x³など)を説明変数として追加
  3. 非線形回帰: 非線形モデルを直接当てはめる

医療データにおける非線形関係の例

以下に、医療データで見られる典型的な非線形関係の例を示します。

薬物濃度と効果の関係

多くの薬物では、濃度と効果の関係がシグモイド曲線(S字カーブ)を描きます。これはEmax(最大効果)モデルでよく表現されます。

効果 = (Emax × 濃度^n) / (EC50^n + 濃度^n)

ここで、Emaxは最大効果、EC50は50%の効果を示す濃度、nはヒル係数です。

年齢と疾患リスクの関係

多くの疾患では、年齢とリスクの関係は単純な直線ではなく、指数関数的に増加することがあります。

リスク = a × e^(b×年齢)

投与量と血中濃度の関係

肝臓での代謝が飽和する高用量では、投与量と血中濃度の関係が非線形になります(ミカエリス・メンテン式)。

血中濃度 = (Vmax × 投与量) / (Km + 投与量)

ここで、Vmaxは最大代謝速度、Kmはミカエリス定数です。

非線形関係における最小二乗法と最尤法の違い

最小二乗法の場合

非線形最小二乗法(NLS: Nonlinear Least Squares)では、残差の二乗和を最小化するパラメータを数値的に求めます。

最小化: Σ(yᵢ - f(xᵢ;θ))²

ここで、f(x;θ)は非線形関数、θはパラメータのベクトルです。

最尤法の場合

非線形モデルに対する最尤法では、まず確率分布を仮定し、尤度関数を最大化します。

最大化: L(θ|データ) = ∏ f(yᵢ|f(xᵢ;θ))

ここで、f(y|f(x;θ))は条件付き確率密度関数です。

主な違い

  • 誤差構造: 最小二乗法は加法的な誤差(y = f(x) + ε)を仮定することが多いのに対し、最尤法ではより柔軟な誤差構造(乗法的誤差など)も扱える
  • 異分散性: 最尤法では、観測値の分散がデータによって異なる場合(異分散性)を自然に扱える
  • 外れ値の扱い: 適切な確率分布(t分布など)を選ぶことで、最尤法は外れ値に頑健になる
  • 信頼区間: 両手法で計算方法が異なり、非線形性が強い場合には結果に差が出ることがある

3. 具体例:薬物反応曲線の分析

データセット:薬物濃度と効果

以下のデータは、ある降圧薬の濃度(μg/mL)と収縮期血圧の低下量(mmHg)の関係を示しています。

実験ID 薬物濃度(μg/mL) 血圧低下量(mmHg)
1 0.1 2
2 0.5 8
3 1.0 15
4 2.0 22
5 5.0 30
6 10.0 34
7 20.0 36
8 50.0 38

このデータから明らかに、薬物濃度と血圧低下量の関係は非線形であり、濃度が高くなるにつれて効果は頭打ちになっています。

モデル選択

このようなデータは、一般的にEmax(最大効果)モデルでよく表現されます:

E = (Emax × C) / (EC50 + C)

ここで:

  • E: 効果(血圧低下量)
  • C: 薬物濃度
  • Emax: 最大効果
  • EC50: 50%の最大効果を示す濃度

両手法によるモデル当てはめ

最小二乗法による当てはめ

非線形最小二乗法により、残差の二乗和を最小化するEmax, EC50を求めます。

最小二乗法の結果:

  • Emax = 39.5 mmHg
  • EC50 = 1.2 μg/mL
  • 残差平方和(RSS)= 18.7

最尤法による当てはめ

最尤法では、誤差分布を明示的に仮定します。ここでは誤差が正規分布N(0, σ²)に従うと仮定します。

最尤法の結果:

  • Emax = 39.5 mmHg
  • EC50 = 1.2 μg/mL
  • σ² = 2.67
  • 対数尤度 = -15.2

視覚的な比較

薬物濃度(μg/mL) 血圧低下量(mmHg) 0.1 0.5 1.0 2.0 5.0 10.0 20.0 50.0 0 10 20 30 40 データ点 Emaxモデル

このように、誤差が正規分布に従うと仮定した場合、両手法は同じパラメータ推定値を与えます。これは線形モデルの場合と同様です。

異分散性を考慮した場合の違い

薬物反応データでは、効果が大きくなるにつれて測定の変動も大きくなる(異分散性)ことがよくあります。この場合、両手法で違いが生じます。

加重最小二乗法

異分散性を考慮するために、加重最小二乗法(WLS: Weighted Least Squares)を使用できます。

最小化: Σ wᵢ(yᵢ - f(xᵢ;θ))²

ここで、wᵢは各データ点の重みで、通常は分散の逆数(1/σᵢ²)に設定します。

異分散性を考慮した最尤法

最尤法では、各データ点の条件付き分布を変えることで異分散性を扱います。例えば:

yᵢ ~ N(f(xᵢ;θ), g(xᵢ;φ))

ここで、g(xᵢ;φ)は分散を表す関数、φはそのパラメータです。

薬物動態学では、分散が平均の二乗に比例する(σᵢ² ∝ μᵢ²)ことがよくあります。

異分散性を考慮した結果の比較

分散が効果の大きさに比例する(σᵢ² = kμᵢ)と仮定して再分析した結果:

加重最小二乗法の結果

  • Emax = 41.2 mmHg
  • EC50 = 1.4 μg/mL
  • 加重残差平方和 = 4.8

異分散性を考慮した最尤法の結果

  • Emax = 40.8 mmHg
  • EC50 = 1.3 μg/mL
  • k = 0.15
  • 対数尤度 = -12.6

このように、異分散性を考慮すると両手法で若干異なる結果が得られます。特に、低濃度領域での適合度に違いが現れる傾向があります。

4. 変数変換による線形化

非線形関係を線形化する変換

非線形関係を解析する別のアプローチとして、変数変換による線形化があります。

代表的な変換

非線形関係