第8回~第15回の実践チュートリアル
疫学研究で得られるデータの特性と、それをJASPで分析する方法を学びましょう。
このチュートリアルでは、以下のデータセットを使用します:
これらのデータはこちらのリンクからダウンロードできます。(リンクが切れている場合は、検索の上DLしてください)
JASPを使って、暴露と疾病の関連を示すクロス集計表を作成し、リスク指標を計算しましょう。
// 2×2表の例
| 暴露あり | 暴露なし
-----------+----------+----------
疾病あり | a | b
-----------+----------+----------
疾病なし | c | d
オッズ比 (OR) = (a/c) / (b/d) = ad/bc
例:喫煙と肺がんの関連
| 喫煙あり | 喫煙なし
-----------+----------+----------
肺がんあり | 60 | 20
-----------+----------+----------
肺がんなし | 40 | 80
オッズ比 (OR) = (60×80) / (20×40) = 6
→ 喫煙者は非喫煙者に比べて肺がんのオッズが6倍
オッズ比が1より大きい:暴露と疾病に正の関連(リスク増加)
オッズ比が1:暴露と疾病に関連なし
オッズ比が1未満:暴露と疾病に負の関連(リスク減少)
交絡因子を考慮した分析方法を学びましょう。
交絡因子を考慮しないと、変数間の関連性が過大または過小評価される可能性があります。特に公衆衛生研究では、年齢、性別、社会経済的地位などが重要な交絡因子になることが多いです。
JASPでの分析結果を地理情報システム(GIS)と連携させ、疾病分布を視覚化する方法を学びましょう。
JASPには直接的なGIS機能がないため、以下の手順で作業します:
介入の効果を評価するための統計手法を学びましょう。
公衆衛生分野の時系列データの特性と、分析前の適切な処理方法を学びましょう。
このチュートリアルでは、以下のデータセットを使用します:
このようなSQLコマンドで取得したデータをCSVとして保存し、JASPにインポートすることができます。
インポートしたデータの構造を確認し、分析の準備をしましょう。
分析を容易にするために、変数にラベルやメタデータを追加しましょう。
公衆衛生データは多くの専門用語や略語を含むことが多いため、適切なラベル付けは分析結果の解釈や報告を容易にします。
公衆衛生分野における機械学習の基本概念と、JASPでの実装方法を学びましょう。
JASPで機械学習分析を行うには、Machine Learningモジュールをインストールする必要があります:
このチュートリアルでは、以下のデータセットを使用します:
これらのデータはこちらのリンクからダウンロードできます。
健康状態の分類予測に機械学習を活用する方法を学びましょう。
決定木は解釈が容易で、重要な予測因子とその閾値を視覚的に示してくれます。これは公衆衛生における介入ポイントの特定や、リスク層別化に役立ちます。
連続的な健康指標や医療費の予測に機械学習を活用する方法を学びましょう。
機械学習モデルの性能を適切に評価する方法を学びましょう。
モデルが訓練データに過度に適合し、新しいデータに対する一般化能力が低下する「過学習」に注意が必要です。これを防ぐために、クロスバリデーションや適切な特徴選択、正則化などの技術を活用しましょう。
機械学習モデルの結果を公衆衛生の文脈で解釈し、活用する方法を学びましょう。
公衆衛生分野では、モデルの決定過程を理解し説明できることが重要です。特に政策決定に影響する場合は、「ブラックボックス」モデルよりも解釈可能なモデル(決定木など)が好まれることが多いです。
複雑な公衆衛生問題を体系的に理解し、データ分析に適した形で構造化する方法を学びましょう。
JASPのネットワーク分析機能を使って、変数間の関係を視覚化します:
データマイニングや探索的分析を通じて、潜在的な公衆衛生課題を発見する方法を学びましょう。
単一の分析手法だけでなく、複数の手法を組み合わせて多角的にデータを探索することで、より包括的に課題を特定できます。異なる視点からの一貫した結果は、真の問題を示している可能性が高いです。
社会経済的要因が健康に与える影響を分析する方法を学びましょう。
健康格差を定量化するための指標を計算します:
// 集団間の格差指標の計算例(Data→Compute Column)
// 絶対的格差(リスク差)
abs(risk_group1 - risk_group2)
// 相対的格差(リスク比)
risk_group1 / risk_group2
健康格差の分析では、単純な2群比較だけでなく、社会経済階層全体に渡る勾配を評価することが重要です。また、異なる格差指標は異なる側面を捉えるため、複数の指標を組み合わせて総合的に評価しましょう。
異なるデータソースを統合して、より包括的な分析を行う方法を学びましょう。
個人レベルと地域レベルのデータを組み合わせた分析では、マルチレベルモデルが適しています。JASPでは直接的なサポートが限られているため、基本的なアプローチとして:
複数のデータソースを統合することで、単一のデータセットでは捉えられない複雑な関係を分析できます。例えば、健康調査データに地域の環境データや医療アクセスデータを組み合わせることで、健康結果の多面的な決定要因を評価できます。
これまでの分析を踏まえて、データ駆動型の公衆衛生研究プロジェクトを設計する方法を学びましょう。
適切なリサーチクエスチョンは以下の特性を持ちます:
JASPの特徴の一つであるベイズ統計分析の基礎を学びましょう。
ベイズ統計は、事前確率と観測データを組み合わせて事後確率を計算する統計的アプローチです。公衆衛生分析では、少ないデータでも意思決定に役立つ情報を提供できる点が有用です。
ベイズファクター(BF10)は、代替仮説と帰無仮説のどちらがデータをよく説明するかを示す指標です。BF10 > 1は代替仮説を支持し、BF10 < 1は帰無仮説を支持します。一般的に、BF10 > 3で代替仮説への「中程度の証拠」、BF10 > 10で「強い証拠」と解釈します。
研究の再現性を高めるためのJASPの機能を活用しましょう。
分析結果を効果的に共有・報告するための機能を学びましょう。
JASPの出力はAPA(米国心理学会)スタイルに準拠しているため、学術論文やレポートに直接使用できます。公衆衛生分野の多くのジャーナルもAPAスタイルを採用しています。
公衆衛生ビッグデータを効率的に分析するためのテクニックを学びましょう。
非常に大きなデータセットでは、分析前に適切なサンプリングやフィルタリングを行うことで処理速度を改善できます:
ビッグデータの一部のみを分析する場合は、サンプルが全体を代表しているかを慎重に検討する必要があります。特に公衆衛生データでは、特定の集団が過小代表されることがないよう注意しましょう。
データ分析結果に基づいて効果的な公衆衛生介入を計画する方法を学びましょう。
効果的な介入プログラムを設計するためのフレームワークを学びましょう。
良いロジックモデルは、明確なIF-THENの関係を示し、データに基づいた因果関係を反映しています。また、測定可能な指標を含み、プログラムの限界や前提条件も明示しています。
JASPで構築した統計モデルを使って、介入の潜在的効果をシミュレーションする方法を学びましょう。
// 回帰式に基づく介入効果のシミュレーション例
// 回帰式:health_outcome = 10 + 2*risk_factor + 3*protective_factor
// 現状の予測値
predicted_current = 10 + 2*risk_factor + 3*protective_factor
// 介入後の予測値(risk_factorが20%減少、protective_factorが30%増加と仮定)
predicted_intervention = 10 + 2*(risk_factor*0.8) + 3*(protective_factor*1.3)
// 予測される改善効果
improvement = predicted_intervention - predicted_current
個人レベルのモデルから集団レベルの効果を推定します:
JASPでのシミュレーションには限界があります。複雑なシミュレーションが必要な場合は、RやPythonなどの専用ソフトウェアの使用を検討してください。また、シミュレーション結果は使用するモデルの前提条件に大きく依存することを理解しておきましょう。
介入プログラムの効果を測定するための指標を設計する方法を学びましょう。
効果的な評価指標は以下の特性を持ちます:
JASPの分析結果を活用して、最も感度の高い指標を選択しましょう。例えば、「Regression」や「Factor Analysis」の結果から、介入効果を最も良く反映する変数を特定できます。
これまでの知識を活用して、データに基づく公衆衛生介入プログラムを設計しましょう。
以下の観点から介入プログラムを評価します:
効果的な公衆衛生介入の設計に役立つリソース:
データ分析結果を公衆衛生の文脈で適切に解釈する方法を学びましょう。
分析結果を解釈する際は、統計的有意性だけでなく、効果量、信頼区間、サブグループ分析、感度分析なども考慮することが重要です。特に公衆衛生分野では、小さな効果でも集団全体に適用されると大きな影響を持つことがあります。
データ分析結果を政策提言につなげる方法を学びましょう。
データ分析は政策決定の重要な要素ですが、唯一の要素ではありません。価値観、実現可能性、コスト、政治的背景、倫理的考慮なども政策決定に影響します。これらの要素を認識し、データの限界を明確に伝えることが重要です。
JASPの分析結果を活用して、説得力のある政策提言書を作成する方法を学びましょう。
対象者に合わせた言語と形式を使用しましょう。政策立案者は詳細な統計情報よりも、明確な問題定義、実践的な解決策、期待される結果に関心があります。複雑な分析結果は、直感的なビジュアルとストーリーテリングで伝えると効果的です。
異なるステークホルダーに対して分析結果を効果的に伝える方法を練習しましょう。
| ステークホルダー | 関心事 | コミュニケーション戦略 |
|---|---|---|
| 政策立案者 | コスト、便益、実現可能性、世論 | 簡潔な要約、視覚的な表現、明確な行動計画 |
| 医療専門家 | 臨床的意義、エビデンスの質、実践への応用 | 詳細な方法論、具体的なガイドライン、比較データ |
| 一般市民 | 個人への影響、実用的なアドバイス | わかりやすい言語、物語、実生活の例 |
| 資金提供者 | 投資収益率、影響力、持続可能性 | 数量化された成果、長期的ビジョン、成功指標 |
統計的な専門用語は最小限に抑え、メッセージを明確にしましょう。聴衆に関連する具体的な例や物語を使うと、抽象的な統計データが理解しやすくなります。また、質問や対話を促し、聴衆のニーズに応じて説明を調整しましょう。
データに基づく政策提言を批判的に評価する方法を学びましょう。
このチュートリアルでは、以下のデータセットを使用します:
これらのデータはこちらのリンクからダウンロードできます。
時系列データの長期的な傾向を分析する方法を学びましょう。
データが線形トレンドに従わない場合は、以下の方法を試してみましょう:
時系列データの季節的パターンを分析する方法を学びましょう。
// 季節変数の作成例(Data→Compute Column)
ifelse(month %in% c(12, 1, 2), "冬",
ifelse(month %in% c(3, 4, 5), "春",
ifelse(month %in% c(6, 7, 8), "夏",
ifelse(month %in% c(9, 10, 11), "秋", NA))))
時系列データのノイズを軽減し、傾向を明確にする方法を学びましょう。
JASPでは直接的な移動平均機能がないため、「Data」→「Compute Column」を使って実装します:
// 3点移動平均の計算(Data→Compute Column)
// 列名を「MA3」などに設定
(lag(cases, 1) + cases + lead(cases, 1)) / 3
// 5点移動平均の計算
(lag(cases, 2) + lag(cases, 1) + cases + lead(cases, 1) + lead(cases, 2)) / 5
※注意:JASPでこのような関数を使うには、「R関数を使用」のオプションをオンにする必要があります。
移動平均の期間は、データの特性に合わせて選択します:
時系列データを用いた簡単な予測手法を学びましょう。
得られた回帰式を使って将来の値を予測できます。例えば、時間変数のコード(例:次の月は25月目)に対応する予測値を計算します。
JASPで実装できる予測モデルには限界があります。より高度な時系列分析(ARIMA、指数平滑法、状態空間モデルなど)が必要な場合は、RやPythonなどの専用ソフトウェアの使用を検討してください。