JASPで学ぶ公衆衛生ビッグデータ分析

第8回～第15回の実践チュートリアル

第8回：疫学データの分析と解釈

1疫学研究デザインとデータ特性の理解

疫学研究で得られるデータの特性と、それをJASPで分析する方法を学びましょう。

主な疫学研究デザイン

横断研究：特定の時点での暴露と疾病の関係を調べる
コホート研究：特定の集団を追跡し、暴露と疾病発生の関係を調べる
症例対照研究：疾病群と非疾病群の過去の暴露を比較する
介入研究：特定の介入の効果を評価する

データセットの選択

このチュートリアルでは、以下のデータセットを使用します：

サンプルデータ：「Smoking and lung cancer.csv」（症例対照研究データ）
WHOの国別健康指標データ（横断研究データ）

これらのデータはこちらのリンクからダウンロードできます。(リンクが切れている場合は、検索の上DLしてください）

2クロス集計表とリスク指標の算出

JASPを使って、暴露と疾病の関連を示すクロス集計表を作成し、リスク指標を計算しましょう。

2×2クロス集計表の作成

「Frequencies」→「Contingency Tables」を選択
行変数に疾病状態（例：lung_cancer）、列変数に暴露状態（例：smoking）を指定
「Cells」タブで「Observed counts」にチェック

オッズ比の計算

「Statistics」タブで「Odds ratio」にチェック
「Confidence interval」で信頼区間（通常は95%）を設定


// 2×2表の例
           | 暴露あり | 暴露なし
-----------+----------+----------
疾病あり   |    a     |    b
-----------+----------+----------
疾病なし   |    c     |    d

オッズ比 (OR) = (a/c) / (b/d) = ad/bc

例：喫煙と肺がんの関連
           | 喫煙あり | 喫煙なし
-----------+----------+----------
肺がんあり |    60    |    20
-----------+----------+----------
肺がんなし |    40    |    80

オッズ比 (OR) = (60×80) / (20×40) = 6
→ 喫煙者は非喫煙者に比べて肺がんのオッズが6倍

オッズ比の解釈

オッズ比が1より大きい：暴露と疾病に正の関連（リスク増加）
オッズ比が1：暴露と疾病に関連なし
オッズ比が1未満：暴露と疾病に負の関連（リスク減少）

3交絡因子の調整

交絡因子を考慮した分析方法を学びましょう。

層別解析

「Frequencies」→「Contingency Tables」を選択
行変数と列変数を指定
交絡因子（例：年齢層、性別）を「Layer」欄に指定
「Statistics」タブで「Odds ratio」にチェック

ロジスティック回帰による交絡調整

「Regression」→「Logistic Regression」を選択
従属変数に疾病状態、共変量に暴露状態と交絡因子を指定
「Statistics」タブで「Odds ratios」にチェック

交絡調整の重要性

交絡因子を考慮しないと、変数間の関連性が過大または過小評価される可能性があります。特に公衆衛生研究では、年齢、性別、社会経済的地位などが重要な交絡因子になることが多いです。

4GISを用いた疾病マッピング

JASPでの分析結果を地理情報システム（GIS）と連携させ、疾病分布を視覚化する方法を学びましょう。

JASPには直接的なGIS機能がないため、以下の手順で作業します：

JASPで地域ごとの集計・分析を実施
結果をCSVファイルとしてエクスポート
QGISなどのGISソフトウェアでマッピング

演習：国別健康指標の分析と地図化

WHOの国別健康指標データをJASPで読み込む
「Descriptives」→「Descriptive Statistics」で国別の指標を集計
結果を右クリックし「Copy」→「Copy table」でエクスポート
QGISで世界地図シェープファイルを読み込み、集計結果と結合
色分け（コロプレス）マップを作成

GISリソース

QGIS（無料のGISソフトウェア）：https://qgis.org/ja/site/
世界地図シェープファイル：Natural Earth

5公衆衛生介入の効果評価

介入の効果を評価するための統計手法を学びましょう。

事前・事後比較（対応のあるt検定）

「T-Tests」→「Paired Samples T-Test」を選択
介入前と介入後の測定値を「Variables」欄に指定
「Descriptives」タブでグラフ表示のオプションを設定

介入群・対照群の比較（独立サンプルのt検定）

「T-Tests」→「Independent Samples T-Test」を選択
従属変数に測定値、グループ変数に介入状態（介入/対照）を指定
「Descriptives」タブでグラフ表示のオプションを設定

前へ：第7回チュートリアル次へ：第9回チュートリアル

第9回：時系列データ分析

1時系列データの特性と前処理

公衆衛生分野の時系列データの特性と、分析前の適切な処理方法を学びましょう。

時系列データの主な特性

トレンド：長期的な上昇・下降傾向
季節性：年間や月間などの周期的パターン
サイクル：非季節的な周期的変動
不規則変動：ランダムな変動

データセットの選択

このチュートリアルでは、以下のデータセットを使用します：

このようなSQLコマンドで取得したデータをCSVとして保存し、JASPにインポートすることができます。

4データの構造を確認する

インポートしたデータの構造を確認し、分析の準備をしましょう。

「Descriptives」→「Descriptive Statistics」をクリック
分析したい変数を「Variables」フィールドに移動
「Statistics」タブで基本統計量（N、Mean、SD など）を選択
「Plots」タブで適切なグラフ（ヒストグラム、箱ひげ図など）を選択

5データにラベルとメタデータを追加する

分析を容易にするために、変数にラベルやメタデータを追加しましょう。

データビューで変数名をダブルクリック
変数名、ラベル、値ラベルなどを編集
「OK」をクリックして変更を保存

データラベルの重要性

公衆衛生データは多くの専門用語や略語を含むことが多いため、適切なラベル付けは分析結果の解釈や報告を容易にします。

第10回：機械学習入門と健康予測モデル

1機械学習の基本概念

公衆衛生分野における機械学習の基本概念と、JASPでの実装方法を学びましょう。

機械学習の主なタイプ

教師あり学習：ラベル付きデータから予測モデルを構築（分類、回帰）
教師なし学習：データの隠れたパターンやグループを発見（クラスタリング、次元削減）
強化学習：報酬に基づいた試行錯誤によるポリシー学習

モジュールのインストール

JASPで機械学習分析を行うには、Machine Learningモジュールをインストールする必要があります：

「Modules」→「Module Library」を選択
「Machine Learning」モジュールを探して「Install」をクリック

データセットの準備

このチュートリアルでは、以下のデータセットを使用します：

「Diabetes_prediction.csv」（糖尿病予測データ）
「Healthcare_cost.csv」（医療費予測データ）

これらのデータはこちらのリンクからダウンロードできます。

2分類モデル - 糖尿病リスク予測

健康状態の分類予測に機械学習を活用する方法を学びましょう。

ロジスティック回帰による分類

「Regression」→「Logistic Regression」を選択
従属変数に目標変数（例：diabetes）、共変量に予測変数（例：age, bmi, glucose など）を指定
「Statistics」タブで「Classification table」と「ROC curve」にチェック

決定木による分類

「Machine Learning」→「Classification」→「Decision Tree」を選択
「Target」に目標変数、「Predictors」に予測変数を指定
「Training Parameters」タブでパラメータを調整
「Plots」タブで「Tree plot」と「ROC curve」にチェック

決定木の解釈

決定木は解釈が容易で、重要な予測因子とその閾値を視覚的に示してくれます。これは公衆衛生における介入ポイントの特定や、リスク層別化に役立ちます。

3回帰モデル - 医療費予測

連続的な健康指標や医療費の予測に機械学習を活用する方法を学びましょう。

線形回帰モデル

「Regression」→「Linear Regression」を選択
従属変数に目標変数（例：medical_cost）、共変量に予測変数を指定
「Method」で「Forward」や「Stepwise」などの変数選択方法を選択できます
「Statistics」タブで「Descriptives」と「Model fit」にチェック

回帰木モデル

「Machine Learning」→「Regression」→「Decision Tree」を選択
「Target」に目標変数、「Predictors」に予測変数を指定
「Training Parameters」タブでパラメータを調整
「Plots」タブで「Tree plot」と「Predicted vs. Observed」にチェック

4モデル評価とクロスバリデーション

機械学習モデルの性能を適切に評価する方法を学びましょう。

モデル評価指標

分類モデルの評価：
- 精度、感度、特異度
- AUC（Area Under the Curve）
- 混同行列（Confusion Matrix）
回帰モデルの評価：
- R²（決定係数）
- RMSE（Root Mean Square Error）
- MAE（Mean Absolute Error）

クロスバリデーションの設定

「Machine Learning」モジュールの各分析で「Model」タブを選択
「Cross-validation」セクションで「K-fold cross-validation」にチェック
「Number of folds」でフォールド数（通常は5または10）を設定
「Number of repeats」で繰り返し回数を設定

過学習に注意

モデルが訓練データに過度に適合し、新しいデータに対する一般化能力が低下する「過学習」に注意が必要です。これを防ぐために、クロスバリデーションや適切な特徴選択、正則化などの技術を活用しましょう。

5予測結果の解釈と応用

機械学習モデルの結果を公衆衛生の文脈で解釈し、活用する方法を学びましょう。

特徴重要度の分析

「Machine Learning」モジュールの「Post Hoc」タブを選択
「Feature importance」にチェックを入れる

予測結果の活用例

リスク層別化：高リスク集団の特定と優先的介入
リソース配分の最適化：予測された需要に基づくリソース配分
個別化された予防戦略：個人の特性に基づくテーラーメイド予防
政策シミュレーション：介入による予測結果の変化をシミュレーション

モデルの透明性と説明可能性

公衆衛生分野では、モデルの決定過程を理解し説明できることが重要です。特に政策決定に影響する場合は、「ブラックボックス」モデルよりも解釈可能なモデル（決定木など）が好まれることが多いです。

前へ：第9回チュートリアル次へ：第11回チュートリアル

第11回：公衆衛生課題の特定とデータ駆動型アプローチ

1システム思考と公衆衛生問題の構造化

複雑な公衆衛生問題を体系的に理解し、データ分析に適した形で構造化する方法を学びましょう。

システム思考の基本概念

要素間の相互関係：健康決定要因の複雑なネットワーク
フィードバックループ：相互に影響し合う因果関係
創発的性質：個々の要素からは予測できない集団レベルの現象
動的平衡：時間とともに変化するシステムの状態

JASP Network分析

JASPのネットワーク分析機能を使って、変数間の関係を視覚化します：

「Modules」→「Module Library」から「Network」モジュールをインストール
「Network」→「Bayesian Network Analysis」を選択
分析に含めたい変数を「Variables」欄に指定
「Plots」タブで「Network plot」にチェック

2データから課題を特定するアプローチ

データマイニングや探索的分析を通じて、潜在的な公衆衛生課題を発見する方法を学びましょう。

クラスタリングによる集団セグメンテーション

「Machine Learning」→「Clustering」→「K-Means Clustering」を選択
クラスタリングに使用する変数を「Variables」欄に指定
「Model」タブでクラスタ数を設定
「Plots」タブで「Cluster means」と「Cluster plot」にチェック

異常検出による問題領域の特定

「Descriptives」→「Descriptive Statistics」で外れ値を確認
「Exploratory Factor Analysis」で潜在的な構造を探索
「Regression」→「Linear Regression」の残差分析で予測から外れたケースを特定

多角的なデータ探索

単一の分析手法だけでなく、複数の手法を組み合わせて多角的にデータを探索することで、より包括的に課題を特定できます。異なる視点からの一貫した結果は、真の問題を示している可能性が高いです。

3健康の社会的決定要因とデータ分析

社会経済的要因が健康に与える影響を分析する方法を学びましょう。

多変量分析による社会的要因の影響評価

「Regression」→「Linear Regression」または「Logistic Regression」を選択
従属変数に健康指標、独立変数に社会経済的要因を指定
「Statistics」タブで「Estimates」と「Model fit」にチェック
「Plots」タブで「Residuals vs. fitted」にチェック

格差指標の計算と分析

健康格差を定量化するための指標を計算します：

絶対的格差：リスク差、率差など
相対的格差：リスク比、率比など
集約的指標：集中指数、傾斜指数など


// 集団間の格差指標の計算例（Data→Compute Column）
// 絶対的格差（リスク差）
abs(risk_group1 - risk_group2)

// 相対的格差（リスク比）
risk_group1 / risk_group2

格差分析の注意点

健康格差の分析では、単純な２群比較だけでなく、社会経済階層全体に渡る勾配を評価することが重要です。また、異なる格差指標は異なる側面を捉えるため、複数の指標を組み合わせて総合的に評価しましょう。

4複数のデータソースを組み合わせた分析

異なるデータソースを統合して、より包括的な分析を行う方法を学びましょう。

データの結合と前処理

各データソースをJASPに読み込む
共通の識別子（ID）に基づいてデータを結合する（JASPでは限定的な機能のため、事前にExcelやRなどで処理することが推奨）
変数の命名規則や単位を統一
欠損値や異常値の処理

マルチレベル分析

個人レベルと地域レベルのデータを組み合わせた分析では、マルチレベルモデルが適しています。JASPでは直接的なサポートが限られているため、基本的なアプローチとして：

地域レベルの変数を個人レベルのデータに結合
「Regression」→「Linear Regression」を使用
交互作用項を含めて階層的な影響を近似的に評価

データソース統合の利点

複数のデータソースを統合することで、単一のデータセットでは捉えられない複雑な関係を分析できます。例えば、健康調査データに地域の環境データや医療アクセスデータを組み合わせることで、健康結果の多面的な決定要因を評価できます。

5最終プロジェクトのテーマ設定とリサーチクエスチョン

これまでの分析を踏まえて、データ駆動型の公衆衛生研究プロジェクトを設計する方法を学びましょう。

リサーチクエスチョンの設定

適切なリサーチクエスチョンは以下の特性を持ちます：

JASPの特徴の一つであるベイズ統計分析の基礎を学びましょう。

ベイズ統計は、事前確率と観測データを組み合わせて事後確率を計算する統計的アプローチです。公衆衛生分析では、少ないデータでも意思決定に役立つ情報を提供できる点が有用です。

ベイズ版t検定

「T-Tests」→「Bayesian Independent Samples T-Test」を選択
従属変数と分類変数を指定
「Plots」タブでベイズファクターロビンズや事後分布のプロットを確認

ベイズ分析の解釈

ベイズファクター（BF10）は、代替仮説と帰無仮説のどちらがデータをよく説明するかを示す指標です。BF10 > 1は代替仮説を支持し、BF10 < 1は帰無仮説を支持します。一般的に、BF10 > 3で代替仮説への「中程度の証拠」、BF10 > 10で「強い証拠」と解釈します。

3再現性のある分析

研究の再現性を高めるためのJASPの機能を活用しましょう。

分析状態の保存と共有

「File」→「Save」で分析状態（データと設定）を.jaspファイルとして保存
同僚や共同研究者と.jaspファイルを共有することで、全く同じ分析を再現できます

Rコードの表示と活用

「Preferences」→「Advanced」→「Show R code in output」をオンに設定
分析を実行すると、出力に使用されたRコードが表示されます
このコードをコピーして、より高度なカスタマイズや他のソフトウェアでの再現に活用できます

4レポート作成と結果の出力

分析結果を効果的に共有・報告するための機能を学びましょう。

結果の編集とカスタマイズ

表や図を右クリックして「Edit」を選択すると、タイトルや外観を編集できます
「Copy」を選択すると、表や図をクリップボードにコピーして他のアプリケーションに貼り付けられます

結果のエクスポート

「File」→「Export Results」を選択
フォーマット（HTML、PDF）を選択
「Save」をクリックして保存

表のエクスポート

表を右クリックして「Copy」→「Copy table to clipboard」を選択
ExcelやWordなど他のアプリケーションに貼り付け
LaTeXフォーマットでコピーすることも可能（「Copy LaTeX code」）

APA形式の表

JASPの出力はAPA（米国心理学会）スタイルに準拠しているため、学術論文やレポートに直接使用できます。公衆衛生分野の多くのジャーナルもAPAスタイルを採用しています。

5大規模データセットの扱い方

公衆衛生ビッグデータを効率的に分析するためのテクニックを学びましょう。

メモリ管理

大規模データセットを扱う場合は、JASPに十分なメモリを割り当てることが重要です
「Preferences」→「Advanced」→「Maximum memory usage」で設定を調整できます

サンプリングとフィルタリング

非常に大きなデータセットでは、分析前に適切なサンプリングやフィルタリングを行うことで処理速度を改善できます：

ランダムサンプリング：事前にExcelやRなどでランダムサンプルを抽出してからJASPで分析
フィルタリング：「Data」→「Filters」で分析に必要なケースのみを選択

注意

ビッグデータの一部のみを分析する場合は、サンプルが全体を代表しているかを慎重に検討する必要があります。特に公衆衛生データでは、特定の集団が過小代表されることがないよう注意しましょう。

第12回：データ駆動型の介入計画

1エビデンスに基づく公衆衛生介入

データ分析結果に基づいて効果的な公衆衛生介入を計画する方法を学びましょう。

エビデンスの階層と評価

エビデンスレベル：
- レベル1：システマティックレビュー、メタ分析
- レベル2：ランダム化比較試験（RCT）
- レベル3：非ランダム化比較研究
- レベル4：観察研究（コホート、症例対照）
- レベル5：記述研究、ケースシリーズ
エビデンスの質評価：バイアスリスク、一貫性、精度、外部妥当性

JASPでのメタ分析

「Meta-Analysis」モジュールをインストール（「Modules」→「Module Library」）
「Meta-Analysis」→「Classical Meta-Analysis」を選択
効果量と標準誤差のデータを入力または読み込み
「Model」タブでモデルタイプ（固定効果/ランダム効果）を選択
「Plots」タブで「Forest plot」と「Funnel plot」にチェック

2プログラム理論とロジックモデル

効果的な介入プログラムを設計するためのフレームワークを学びましょう。

ロジックモデルの構成要素

インプット：プログラムに投入される資源（人員、資金、施設など）
活動：プログラムが実施する具体的な行動
アウトプット：活動の直接的な産物（サービス提供数、参加者数など）
アウトカム：短期、中期、長期的な変化や結果
外部要因：プログラムに影響を与える環境的要素

データに基づくロジックモデル作成

JASPの分析結果から重要な予測因子と経路を特定
因果関係の強さに基づいて優先的な介入ポイントを選定
「Regression」や「Correlation」の結果を用いて介入経路の妥当性を評価
予測モデルから期待される効果の大きさを推定

効果的なロジックモデルの特徴

良いロジックモデルは、明確なIF-THENの関係を示し、データに基づいた因果関係を反映しています。また、測定可能な指標を含み、プログラムの限界や前提条件も明示しています。

3介入効果予測のためのシミュレーション

JASPで構築した統計モデルを使って、介入の潜在的効果をシミュレーションする方法を学びましょう。

回帰モデルを使ったシミュレーション

「Regression」→「Linear Regression」で回帰モデルを構築
得られた回帰式を使って、介入後の値を予測
「Data」→「Compute Column」で予測値を計算


// 回帰式に基づく介入効果のシミュレーション例
// 回帰式：health_outcome = 10 + 2*risk_factor + 3*protective_factor

// 現状の予測値
predicted_current = 10 + 2*risk_factor + 3*protective_factor

// 介入後の予測値（risk_factorが20%減少、protective_factorが30%増加と仮定）
predicted_intervention = 10 + 2*(risk_factor*0.8) + 3*(protective_factor*1.3)

// 予測される改善効果
improvement = predicted_intervention - predicted_current

集団レベルの効果推定

個人レベルのモデルから集団レベルの効果を推定します：

介入の影響を受ける人口の割合を推定
「Descriptives」→「Descriptive Statistics」で現在の分布を把握
介入後の分布をシミュレーションし、集団指標の変化を計算

シミュレーションの限界

JASPでのシミュレーションには限界があります。複雑なシミュレーションが必要な場合は、RやPythonなどの専用ソフトウェアの使用を検討してください。また、シミュレーション結果は使用するモデルの前提条件に大きく依存することを理解しておきましょう。

4介入評価のための指標設計

介入プログラムの効果を測定するための指標を設計する方法を学びましょう。

SMART指標の設計

効果的な評価指標は以下の特性を持ちます：

Specific（具体的）：明確に定義された測定対象
Measurable（測定可能）：定量的に測定できる
Achievable（達成可能）：現実的に収集可能なデータ
Relevant（関連性）：介入目標に直接関連している
Time-bound（時間的制約）：測定期間が明確

指標タイプの選択

プロセス指標：介入の実施状況を評価（例：参加者数、提供したサービス数）
短期アウトカム指標：知識、態度、行動意図の変化
中期アウトカム指標：行動や環境の変化
長期アウトカム指標：健康状態、QOL、医療利用の変化

データ分析に基づく指標選択

JASPの分析結果を活用して、最も感度の高い指標を選択しましょう。例えば、「Regression」や「Factor Analysis」の結果から、介入効果を最も良く反映する変数を特定できます。

5グループワーク：介入プログラム設計

これまでの知識を活用して、データに基づく公衆衛生介入プログラムを設計しましょう。

介入プログラム設計の手順

問題分析：JASPの分析結果から主要な健康問題と関連要因を特定
ターゲット設定：最も支援が必要な、または介入効果が高い集団を特定
介入設計：エビデンスに基づく効果的な介入方法の選択
ロジックモデル作成：介入の理論的根拠と期待される効果の流れを図示
評価計画：効果測定のための指標と分析方法の設計

介入提案の相互評価

以下の観点から介入プログラムを評価します：

エビデンスの質：データ分析と既存研究に基づいているか
実現可能性：リソースと時間の制約内で実施可能か
効果の大きさ：期待される健康改善の程度は十分か
持続可能性：長期的に継続・拡大可能か
公平性：健康格差を悪化させないか、むしろ低減するか

介入設計のためのリソース

効果的な公衆衛生介入の設計に役立つリソース：

The Community Guide：エビデンスに基づく介入レコメンデーション
What Works for Health：健康改善のための政策とプログラム

前へ：第11回チュートリアル次へ：第13回チュートリアル

第13回：結果の解釈と政策提言

1公衆衛生データ分析結果の解釈

データ分析結果を公衆衛生の文脈で適切に解釈する方法を学びましょう。

統計的有意性と公衆衛生的重要性

統計的有意性：p値や信頼区間で評価（サンプルサイズに依存）
効果量：実質的な影響の大きさ（Cohen's d, オッズ比, リスク比など）
公衆衛生的重要性：集団レベルでの影響、健康格差への影響、コスト効果など

結果の文脈化

「ANOVA」や「Regression」の結果から効果量を抽出
観察された関連の強さを既存の科学的知見と比較
集団寄与危険割合（PAF）の推定（可能な場合）
結果が特定の集団にどのように影響するかを評価

結果解釈の多角的アプローチ

分析結果を解釈する際は、統計的有意性だけでなく、効果量、信頼区間、サブグループ分析、感度分析なども考慮することが重要です。特に公衆衛生分野では、小さな効果でも集団全体に適用されると大きな影響を持つことがあります。

2エビデンスから政策への橋渡し

データ分析結果を政策提言につなげる方法を学びましょう。

政策提言の基本要素

問題の明確な定義：データに基づく問題の範囲と影響の説明
政策オプション：複数の選択肢とそれぞれの長所・短所
推奨される行動：最も効果的と考えられる選択肢
実施計画：具体的な手順、タイムライン、リソース
評価計画：政策効果を測定する方法

JASPの分析結果を政策提言に変換

「Descriptives」の結果から問題の規模と分布を特定
「Regression」や「ANOVA」の結果から主要な決定要因を特定
「Machine Learning」モジュールの結果から高リスク集団を特定
政策オプションの理論的根拠として分析結果を引用
「Regression」モデルを使って政策介入の潜在的効果を予測

政策提言の限界を認識する

データ分析は政策決定の重要な要素ですが、唯一の要素ではありません。価値観、実現可能性、コスト、政治的背景、倫理的考慮なども政策決定に影響します。これらの要素を認識し、データの限界を明確に伝えることが重要です。

3効果的な政策提言書の作成

JASPの分析結果を活用して、説得力のある政策提言書を作成する方法を学びましょう。

政策提言書の構成

エグゼクティブサマリー（1-2ページ）：主要な問題、分析結果、推奨事項の概要
背景：問題の文脈と重要性
方法：データソースと分析手法の簡潔な説明
結果：主要な分析結果（JASPの表やグラフを含む）
政策オプション：可能な介入方法とそれぞれの長所・短所
推奨事項：エビデンスに基づく具体的な行動計画
実施戦略：タイムライン、リソース、障壁への対処法
評価計画：成功を測定する方法
付録：詳細な分析結果や補足資料

JASPの結果をエクスポートして活用

「File」→「Export Results」でHTML形式でエクスポート
表やグラフを右クリックして「Copy」→「Copy image」でコピー
コピーした表やグラフを文書に貼り付け
APA形式の結果表を使って専門性を示す

効果的な政策提言のコツ

対象者に合わせた言語と形式を使用しましょう。政策立案者は詳細な統計情報よりも、明確な問題定義、実践的な解決策、期待される結果に関心があります。複雑な分析結果は、直感的なビジュアルとストーリーテリングで伝えると効果的です。

4ロールプレイ：ステークホルダーへの結果説明

異なるステークホルダーに対して分析結果を効果的に伝える方法を練習しましょう。

ステークホルダー別のコミュニケーション戦略

ステークホルダー	関心事	コミュニケーション戦略
政策立案者	コスト、便益、実現可能性、世論	簡潔な要約、視覚的な表現、明確な行動計画
医療専門家	臨床的意義、エビデンスの質、実践への応用	詳細な方法論、具体的なガイドライン、比較データ
一般市民	個人への影響、実用的なアドバイス	わかりやすい言語、物語、実生活の例
資金提供者	投資収益率、影響力、持続可能性	数量化された成果、長期的ビジョン、成功指標

ロールプレイ演習

JASPの分析結果を基に、特定のステークホルダー向けのプレゼンテーションを準備
その対象者が持ちそうな質問や懸念を予測
専門用語をどの程度使用するか、どの結果を強調するかを調整
フィードバックを受けて改善

効果的なプレゼンテーションのコツ

統計的な専門用語は最小限に抑え、メッセージを明確にしましょう。聴衆に関連する具体的な例や物語を使うと、抽象的な統計データが理解しやすくなります。また、質問や対話を促し、聴衆のニーズに応じて説明を調整しましょう。

5ピアレビュー：政策提言の相互評価

データに基づく政策提言を批判的に評価する方法を学びましょう。

評価基準

このチュートリアルでは、以下のデータセットを使用します：

「Influenza_cases_monthly.csv」（月別インフルエンザ症例数データ）
「COVID19_daily_cases.csv」（日別COVID-19症例数データ）

これらのデータはこちらのリンクからダウンロードできます。

時系列データの前処理

日付形式の確認と変換（JASPでは「Data」→「Compute Column」を使用）
欠損値の処理（線形補間など）
異常値の検出と処理
必要に応じてデータの集計（日次→週次、月次など）

このプログラムを終了したら、ぜひ本格的な統計ソフトを活用して分析してみましょう。　SPSS　STATA　SAS 　等は商用ですが一定の評価がなされています。Pythonも統計部分はRを使っています。Rは統計処理に特化したプログラム言語であり、実はSーBasicという　先の3つのプログラムとDNAとRNAの関係にあるフリーソフトウェアとして開発されています。

　さらに、より数理的なデータ分析に興味を持ったら、ぜひ確率分布関数、微分積分の基礎、線形行列を復習してみることをおすすめします。　頑張ってください.　木村　朗（kimuakilabo)

JASPで学ぶ公衆衛生ビッグデータ分析

第8回：疫学データの分析と解釈

主な疫学研究デザイン

データセットの選択

2×2クロス集計表の作成

オッズ比の計算

オッズ比の解釈

層別解析

ロジスティック回帰による交絡調整

交絡調整の重要性

演習：国別健康指標の分析と地図化

GISリソース

事前・事後比較（対応のあるt検定）

介入群・対照群の比較（独立サンプルのt検定）

第9回：時系列データ分析

時系列データの主な特性

データセットの選択

データラベルの重要性

第10回：機械学習入門と健康予測モデル

機械学習の主なタイプ

モジュールのインストール

データセットの準備

ロジスティック回帰による分類

決定木による分類

決定木の解釈

線形回帰モデル

回帰木モデル

モデル評価指標

クロスバリデーションの設定

過学習に注意

特徴重要度の分析

予測結果の活用例

モデルの透明性と説明可能性

第11回：公衆衛生課題の特定とデータ駆動型アプローチ

システム思考の基本概念

JASP Network分析

クラスタリングによる集団セグメンテーション

異常検出による問題領域の特定

多角的なデータ探索

多変量分析による社会的要因の影響評価

格差指標の計算と分析

格差分析の注意点

データの結合と前処理

マルチレベル分析

データソース統合の利点

リサーチクエスチョンの設定

ベイズ版t検定

ベイズ分析の解釈

分析状態の保存と共有

Rコードの表示と活用

結果の編集とカスタマイズ

結果のエクスポート

表のエクスポート

APA形式の表

メモリ管理

サンプリングとフィルタリング

注意

分析計画の策定

良いプロジェクトテーマの例

第12回：データ駆動型の介入計画

エビデンスの階層と評価

JASPでのメタ分析

ロジックモデルの構成要素

データに基づくロジックモデル作成

効果的なロジックモデルの特徴

回帰モデルを使ったシミュレーション

集団レベルの効果推定

シミュレーションの限界

SMART指標の設計

指標タイプの選択

データ分析に基づく指標選択

介入プログラム設計の手順

介入提案の相互評価

介入設計のためのリソース

第13回：結果の解釈と政策提言

統計的有意性と公衆衛生的重要性

結果の文脈化

結果解釈の多角的アプローチ

政策提言の基本要素

JASPの分析結果を政策提言に変換