公衆衛生ビッグデータ分析:実践的アプローチ

初心者のためのビッグデータ活用と公衆衛生課題への応用 - 15回シラバス


このシラバスは、公衆衛生のビッグデータを活用した課題発見から報告までの一連のプロセスを学ぶ15回分の学習計画です。初心者向けにアクティブラーニングを取り入れた内容で、各回の難易度も明記しています。理論と実践のバランスを取りながら、学生が主体的に学べるよう設計されています。

週別カリキュラム

第1回:公衆衛生とビッグデータの基礎

☆☆☆☆ 入門
講義内容:
  • 公衆衛生学の基本概念と歴史
  • ビッグデータの定義と特性(Volume, Velocity, Variety, Veracity, Value)
  • 公衆衛生におけるデータ活用の意義と事例紹介
演習:
  • グループディスカッション:身近な公衆衛生問題をリストアップし、どのようなデータが関連するか考える
  • オープンアクセスの公衆衛生データポータルの閲覧体験(例:WHO Data Portal, CDC Data)
  • データを見る視点についてのワークショップ

第2回:データベースの基礎と公衆衛生データリソース

★★☆☆☆ 初級
講義内容:
  • データベースの基本構造と種類
  • 公衆衛生分野で利用可能なオープンデータベースの紹介
  • データへのアクセス方法と倫理的配慮
演習:
  • 実際のデータベースへのアクセスと基本操作(例:厚生労働省オープンデータ、OECD Health Statistics)
  • 簡単なSQL基礎コマンド(SELECT, FROM, WHERE)の実践
  • 興味のある公衆衛生トピックに関連するデータセットを見つけ共有

第3回:データ前処理の基礎

★★☆☆☆ 初級
講義内容:
  • データクリーニングの重要性と方法
  • 欠損値、外れ値、重複データの処理
  • データ形式の変換と正規化
演習:
  • Excelを使った基本的なデータクリーニング実習
  • R/Pythonの基本文法とデータ読み込み(初心者向けスクリプト使用)
  • 小規模なデータセットを用いた前処理の実践

第4回:記述統計学と公衆衛生データの可視化基礎

★★☆☆☆ 初級
講義内容:
  • 記述統計の基本(中心傾向、散布度、分布)
  • 公衆衛生データにおける適切なグラフ選択
  • 効果的なデータ可視化の原則
演習:
  • Excel/R/Pythonでの基本的なグラフ作成(棒グラフ、折れ線グラフ、散布図)
  • 公衆衛生データを用いた記述統計量の算出
  • ペアワーク:作成したグラフを相互評価し改善点を議論

第5回:探索的データ分析と仮説生成

★★★☆☆ 中級
講義内容:
  • 探索的データ分析(EDA)の概念と手法
  • データパターンの発見とその解釈
  • 公衆衛生分野における仮説生成のプロセス
演習:
  • 実際の公衆衛生データセットを使ったEDA実習
  • グループワーク:データパターンから複数の仮説を生成
  • 生成した仮説の検証可能性と意義を評価

第6回:統計ソフトウェアの基礎(R/Python)

★★★☆☆ 中級
講義内容:
  • R/Pythonの基本操作と統計パッケージの概要
  • データの読み込み、操作、基本的な分析手法
  • プログラミングの基本概念(変数、関数、ループ)
演習:
  • 統計ソフトウェアのインストールとセットアップ
  • 基本的なコマンドを用いたデータ操作の実習
  • サンプルスクリプトの修正と実行

第7回:相関と回帰分析

★★★☆☆ 中級
講義内容:
  • 相関分析の基礎と解釈
  • 単回帰分析と重回帰分析
  • 公衆衛生研究における因果関係と相関関係の区別
演習:
  • 公衆衛生データを用いた相関分析の実施
  • 回帰モデルの構築と解釈
  • 結果の視覚化と報告書作成

第8回:疫学データの分析と解釈

★★★☆☆ 中級
講義内容:
  • 疫学研究デザインとデータ特性
  • リスク評価の指標(相対リスク、オッズ比、寄与危険など)
  • 交絡因子とバイアスの理解
演習:
  • 実際の疫学データを用いたリスク評価の計算
  • 地理情報システム(GIS)を用いた疾病マッピング入門
  • ケーススタディ:公衆衛生介入の効果評価

第9回:時系列データ分析

★★★★ 中上級
講義内容:
  • 時系列データの特性と前処理
  • トレンド分析と季節性
  • 予測モデルの基礎(移動平均、指数平滑法)
演習:
  • 感染症データや健康指標の時系列分析
  • R/Pythonを用いた時系列グラフ作成と解釈
  • グループプロジェクト:特定の健康指標の時系列変化と関連要因の分析

第10回:機械学習入門と健康予測モデル

★★★★ 中上級
講義内容:
  • 機械学習の基本概念と種類
  • 教師あり学習(分類、回帰)の基礎
  • 公衆衛生におけるAI活用事例
演習:
  • シンプルな予測モデルの構築(決定木など)
  • クロスバリデーションとモデル評価
  • 予測結果の解釈と限界点の議論

第11回:公衆衛生課題の特定とデータ駆動型アプローチ

★★★★ 中上級
講義内容:
  • システム思考と公衆衛生問題の構造化
  • データから課題を特定するアプローチ
  • 健康の社会的決定要因とデータ分析
演習:
  • ケーススタディ:地域の健康課題の特定
  • 複数のデータソースを組み合わせた分析実習
  • 最終プロジェクトのテーマ設定とリサーチクエスチョン作成

第12回:データ駆動型の介入計画

★★★★ 中上級
講義内容:
  • エビデンスに基づく公衆衛生介入
  • プログラム理論とロジックモデル
  • 介入評価のための指標設計
演習:
  • データに基づく介入プログラムの設計演習
  • 介入効果予測のためのシミュレーション基礎
  • グループワーク:特定の公衆衛生課題に対する介入案の作成と相互評価

第13回:結果の解釈と政策提言

★★★☆☆ 中級
講義内容:
  • 公衆衛生データ分析結果の解釈
  • エビデンスから政策への橋渡し
  • 効果的な政策提言の方法
演習:
  • 分析結果に基づく政策提言書の作成
  • ロールプレイ:異なるステークホルダーへの結果説明
  • ピアレビュー:作成した政策提言の相互評価

第14回:データ可視化と効果的なプレゼンテーション

★★★☆☆ 中級
講義内容:
  • 高度なデータ可視化技術とツール
  • ストーリーテリングによるデータ提示
  • 異なる対象者に合わせた情報提供
演習:
  • インタラクティブな可視化ツールの使用(Tableau Public, Power BIなど)
  • ダッシュボード作成の基礎
  • 最終プロジェクトのプレゼンテーション準備

第15回:総合プロジェクト発表と振り返り

★★★★★ 上級
講義内容:
  • データ分析プロジェクトの全体像の復習
  • 効果的な学術・政策報告の要素
  • 公衆衛生分野におけるデータサイエンスの将来展望
演習:
  • 最終プロジェクトの発表(データ収集から分析、提言まで)
  • 専門家パネルからのフィードバック
  • 学習内容の振り返りと今後の学習計画作成

アクティブラーニング要素と工夫

本シラバスでは、以下のアクティブラーニング要素を取り入れ、学生の主体的な学びを促進します。

実データの活用

  • 各回の演習で実際の公衆衛生データを使用
  • 地域の健康データや国際比較データなど、現実の課題に即した素材