アジェンダへ

 ホームへ

stat001　　　Introduction　Statistcs　for　Health　Sciences

　　　　　　　医療統計学入門　最初の1歩

このコースの目的

このコースの学習到達目標

＊結果のプロセスが理解すること＞結果のプロセスが理解できること

検査技術学科において関連する科目は以下

検査技術学科シラバスは以下

＞腕試しに　確率と統計の基礎テスト

１．日常生活と医療における統計、その基になる確率、そして再び確率と統計を考える・・・

　
　　　物事は定義から・・・

　日常生活（にちじょうせいかつ）は、毎日繰り返される生活のこと。

具体的には、日々の生活の中で繰り返される出来事や習慣的動作、そこで用いられる物の考え方や知識（常識）、接する物品（その一部は日用品と呼ばれる）などから構成される。だが、その日常生活の内実を比較する時、歴史や文化に応じて、また個人によってもしばしば大きく異なる。自分の日常生活で当然であることが、他人の日常生活においては特別であったり、非常識であったりすることを知ることは、人に知的な驚きや教訓をもたらすことが多い。と同時に、余りにも異なる日常生活を送る人々の間に相通じる常識が見出されて驚きを誘うようなこともある。日常生活のパターンはそれが長続きするとしばしば伝統文化となる。また、時代の流れと共に移ろう風景や物の考え方や人々の心理は世相とも呼ばれる。

日々繰り返される物事の他にも、毎年繰り返される行事や伝統芸能、季節を特徴づける事物である風物詩なども、日常生活を理解する鍵として注目されることがある。

このような日常生活は、歴史学（とりわけ社会史）、文化人類学、民俗学、社会学、などの考察対象となる。

(出典　　wikipedia　http://ja.wikipedia.org/wiki/%E6%97%A5%E5%B8%B8%E7%94%9F%E6%B4%BB）

　

　　医療（いりょう、英語: medical treatment、health care）とは、人間の健康の維持、回復、促進などを目的とした諸活動について用いられる広範な意味を持った語である。

そもそも何が医療かということに関しては、「生物医学(biomedicine)的な根拠にのっとった近代医療のみを医療と見なす」という立場と、多元的医療システム観に基づき「その社会の一定程度の人に支持された、形式化された〈病・治療・健康〉をめぐる社会的文化的行為」とする立場に大きくわかれている^[1]と黒田浩一郎は述べた。その意味では、補完医療、代替医療や伝統医療といった認識はあくまで近代医療をカウンターモデルとして構成されており、前者の立場の変形である^[2]と池田光穂の著作では指摘されている。それらを総合したものは統合医療という呼称で呼ばれている。

(出典wikipedia　http://ja.wikipedia.org/wiki/%E5%8C%BB%E7%99%82）

　統計（とうけい）は、現象を調査することによって数量で把握すること、または、調査によって得られた数量データのことである。

　

　　統計の変遷

　国家を統治するための基礎資料として活用されてきた歴史があり、建造物建設のための調査や兵役や徴税のための調査といったように、人口や土地等については古くから統計が取られている。

　また、近代国家が成立した頃から政策の企画・立案のために利用されるようになり、それに伴い調査範囲も広がった。ナポレオン・ボナパルトは「統計は事物の予算である。そして予算なくしては公共の福祉も無い」と語り、1800年にはフランス、1828年にはオーストリアで国の調査機関が設立された。

さらに、パソコンの普及、分析手法の発達によって大学や企業なども統計を利用するようになり、「国のためのデータ」から「国民のためのデータ」へとその性質は変わってきている[1]。

日本の公的統計

この節では特段の断りが無い限り、日本における統計法に基づいた公的統計について記述する。

日本の統計史

律令制における戸籍にその始まりを見ることができる。人口や土地面積等の把握は国家統治の基本であり、日本においても検地や人別改などとして歴代の国家主体・政治主体により実施されてきた。しかし、これらは調査方法が統一されていなかったり、調査・集計の体制が一貫していないなど、統計情報としての正確性に疑義がもたれるものであった。

調査方法を統一し、集計体制を整えたいわゆる近代的統計を日本で初めて実施したのは明治政府である。1871年（明治4年）太政官正院に「政表課」が設置され、近代的な統計制度が開始された。その後統計業務を行う組織は変遷したが、1885年（明治18年）の内閣制度成立とともに内閣統計局が発足し、以後終戦まで政府の統計業務を行うこととなる。

第二次大戦後に統計委員会（現・総務省政策統括官[統計基準担当]）が設置され、国家の統計業務の中心である総理庁統計局（現・総務省統計局および独立行政法人統計センター）と、各省庁が実施する諸統計と間の調整を行うように体系づけるとともに、行政による統計の基本法として「統計法」が制定された（「旧統計法」）。これにより戦後日本における統計制度が確立した。（日本の統計制度に関しては、総務省政策統括官（統計基準担当）のサイト「統計制度」[1]が詳しい。）

統計業務については幾度かの制度・組織の改変を経ながらも、基本法である「統計法」に基づいて実施されてきたが、社会情勢の変化により個人情報保護の重視と統計業務の効率化徹底を目的として2007年（平成19年）に「統計法」の全部改正が行われた（「新統計法」）。これにより、統計情報を“国民全体の共有資産”として位置づけなおし、個人情報等の保護に留意しつつ、行政目的のみならず広く活用するべきこととされた。

統計学（とうけいがく、英: Statistic、独: Statistik（ラテン語から、"statisticum (collegium)"), 本来の意味は: "社会の状態の科学”）とは、統計に関する研究を行う学問である。

統計学は、経験的に得られたバラツキのあるデータから、応用数学の手法を用いて数値上の性質や規則性あるいは不規則性を見いだす。統計的手法は、実験計画、データの要約や解釈を行う上での根拠を提供する学問であり、幅広い分野で応用されている。

英語で統計または統計学を statistics と言うが、語源はラテン語で「状態」を意味する statisticum であり、この言葉がイタリア語で「国家」を意味するようになり、国家の人力、財力等といった国勢データを比較検討する学問を意味するようになった。現在では、医学（疫学、EBM）、薬学、経済学、社会学、心理学、言語学など、自然科学・社会科学・人文科学の実証分析を伴う分野について、必須の学問となっている。また、統計学は哲学の一分科である科学哲学においても重要なひとつのトピックスになっている。これは、統計学が科学的な研究において方法論上の基礎的な部分を構成していながら、確率という一種捉えがたい概念を扱っているためであり、その意味や在り方が帰納の正当性の問題などと絡めて真剣に議論される。

統計的手法

（2011年11月）

実験計画

データ収集の規模や対象、割付方法をコントロールし、より公正で評価可能なデータが収集できるよう検討すること。統計の世界には Garbage in, garbage out という格言がある。これは、「ゴミのようなデータを使っていくら解析しても出てくる結果はゴミばかりだ」という意味であり、データ収集の前にその方法を十分に検討する必要があることを強調したものである。

記述統計

記述統計とは、収集したデータの要約統計量（平均、分散など）を計算して分布を明らかにする事により、データの示す傾向や性質を知ること。

推計統計

データからその元となっている諸性質を確率論的に推測する分野。推計統計学の項に詳述。

尺度水準

データ（あるいは変数、測定）の尺度はふつう次のような種類（水準）に分類される。尺度水準によって、統計に用いるべき要約統計量や統計検定法が異なる。

質的データ、カテゴリデータ
- 名義尺度：単なる番号で順番の意味はない。電話番号、背番号など。
- 順序尺度：順序が意味を持つ番号。階級や階層など。
量的データ、数値データ
- 間隔尺度：順序に加え間隔にも意味がある（単位がある）が、ゼロには絶対的な意味はない。摂氏・華氏温度、知能指数など。
- 比率尺度：ゼロを基準とする絶対的尺度で、間隔だけでなく比率にも意味がある。絶対温度、金額など。

統計学の用語

要約統計量
- 平均、最頻値（モード）、中央値（メジアン）、分散、標準偏差、共分散、相関係数
正規分布
- カール・フリードリヒ・ガウス（誤差論）
  - 誤差
- 標準得点
  - 偏差値
大数の法則、中心極限定理
推計統計学
- 母集団、無作為抽出（ランダムサンプリング）
- 期待値、不偏分散
- 有意
- 尤度関数
多変量解析
傾向推定
数量化理論

歴史

統計学の源流は国家または社会全体における人口あるいは経済に関する調査（東西を問わず古代から行われている）にある。

学問としては、17世紀にはイギリスでウィリアム・ペティの『政治算術』などが著述され、その後の社会統計学に繋がる流れが始まった。また、ゴットフリート・ライプニッツやエドモンド・ハレーによる死亡統計の研究も行われた。これらの影響の基、18世紀にはドイツのジュースミルヒが『神の秩序』（1741年）で人口動態にみられる規則性を明らかにしたが、これには文字通り「神の秩序」を数学的に記述する意図があった。

ドイツでは17世紀からヨーロッパ各国の国状の比較研究が盛んになったが、1749年にアッヘンヴァルがこれにドイツ語で Statistik（「国家学」の意味）の名をつけている。19世紀初頭になるとこれに関して政治算術的なデータの収集と分析が重視されて、Statistikの語は特に「統計学」の意味に用いられ、さらにイギリスやフランスなどでも用いられるようになった。この頃アメリカ、イギリス、フランスなどで国勢調査も行われるようになる。

一方ブレーズ・パスカル、ピエール・ド・フェルマーに始まった確率論の研究がフランスを中心にして進み、19世紀初頭にはピエール＝シモン・ラプラスによって一応の完成を見ていた。また、カール・フリードリヒ・ガウスによる誤差や正規分布についての研究も統計学発展の基礎となった。ラプラスも確率論の社会的な応用を考えたが、この考えを本格的に広めたのが「近代統計学の父」と呼ばれるアドルフ・ケトレーであった。彼は『人間について』（1835年）、『社会物理学』（1869年）などを著し、自由意志によってばらばらに動くように見える人間の行動も社会全体で平均すれば法則に従っている（「平均人」を中心に正規分布に従う）と考えた。ケトレーの仕事を契機として、19世紀半ば以降、社会統計学がドイツを中心に、特に経済学と密接な関係を持って発展する。代表的な人物にはアドルフ・ワグナー、エルンスト・エンゲル（エンゲル係数で有名）、ゲオルク・フォン・マイヤーがいる。またフローレンス・ナイチンゲールも、社会医学に統計学を応用した最初期の人物として知られる。

同じく19世紀半ばにチャールズ・ダーウィンの進化論が発表され、彼の従弟に当たるフランシス・ゴルトンは数量的側面から進化の研究に着手した。これは当時Biometrics*(生物測定学)と呼ばれ、多数の生物（ヒトも含めて）を対象として扱う統計学的側面を含んでいる。ゴルトンは回帰の発見で有名であるが、当初生物学的と思われたこの現象は一般の統計学的対象の解析でも重要であることが明らかとなる。ゴルトンの後継者となった数学者カール・ピアソンはこのような生物統計学をさらに数学的に発展させ（数理統計学）、19世紀終わりから20世紀にかけ記述統計学を大成する^[1]。

20世紀に入ると、ウィリアム・ゴセット、続いてロナルド・フィッシャーが農学の実験計画法研究をきっかけとして数々の統計学的仮説検定法を編み出し、記述統計学から推計統計学の時代に移る。ここでは母集団から抽出された標本を基に、確率論を利用して逆に母集団を推定するという考え方がとられる。続いてイェジ・ネイマン、エゴン・ピアソンらによって現代の推計統計学の理論体系が構築され、これは社会科学、医学、工学、オペレーションズ・リサーチなどの様々な分野へ応用されることとなった。

こうして推計統計学は精緻な数学理論となった反面、応用には必ずしも適していないとの批判が常にあった。

これに呼応して、在来の客観確率を前提に置く統計学に対し主観確率を中心に据えたベイズ統計学が1950年代に提唱された。ベイズの定理に依拠する主観確率の考え方は母集団の前提を必要とせず不完全情報環境下での計算や原因の確率を語るなど、およそ在来統計学とは正反対の立場に立つため、その当時在来統計学派はベイズ統計学派のことを『ベイジアン』と名付けて激しく対立した。しかし主観確率には、新たに取得した情報によって確率を更新する機能が内包され、この点が大きな応用の道を開いた。今や統計学では世界的にベイズ統計学が主流となり、先端的応用分野ではもっぱらベイズ統計学が駆使されている。

計量経済学、統計物理学、バイオテクノロジー、疫学、機械学習、データマイニング、制御理論、インターネットなど、あらゆる分野でベイズ統計学は実学として活用されている。スパムメールフィルタや日本語入力の予測変換など身近な応用も数多い。20世紀末にはマルコフ連鎖モンテカルロ法など理論面で様々な革新的考案もなされ、旧来の統計学では不可能であったような各分野で多くの応用がなされるようになっている。これらベイズ統計学についての展開は、いずれも計算環境の進歩と不可分である。

統計の困難さ

一度信頼できる統計データが取れさえすれば統計学的分析は数学的に行えるが、信頼できる統計データの収集はとても難しい。実際、統計を取る人の主義主張によって統計値が大きく異なる事も多々あり、レーガン政権は当時アメリカにホームレスが30万人しかいないと主張したが、活動家達はその10倍の300万人いると主張した^[2]。

例えば、質問の仕方一つで結果がガラリと変わってしまう。強姦に関するある調査で、女子大生に「男性からアルコールや薬物を飲まされて、望まない性交をした事がありますか」と質問する事で「女子大生の1/4が強姦された事がある」という結論を出したが、批判者達はこの調査で強姦体験者と認定された女子大生達を集めて再調査したところ、その3/4がその体験を強姦だと考えていないことが分かった^[2]。

また、暗数の考慮にも主観がつきまとってしまう。暗数とは「統計に出ない値」のことで、例えば強姦のような犯罪はそれがタブーであるが故に警察に届けないことも多く、したがって統計に表れない。それには統計を正しく読み解くには暗数を考慮する必要があるが、統計値を多く見積もりたい人は意識的・無意識的に暗数を多く見積もってしまう可能性があり、逆に統計値を少なく見積もりたい人は暗数を少なく見積もってしまう可能性がある。

正しい統計データから正しい統計操作を行ってもなお騙すことが可能である。ここ四十数年で少年犯罪は1/4になっているが、「少年犯罪は急激に犯罪が増加している」ことを主張したければ、最近10年分のデータだけを提示すれば、最近10年分では微増しているため、その主張は成立することになる^[3]。グラフの縦軸（=犯罪数の軸）をわざと縦長に書く事で犯罪数が急上昇しているように見せかけることも可能である。

教育

統計学は「実学」に端を発しており、近代社会以降世界に普及した「市場経済社会」を牽引した原動力とも言える学問である。そのため、自然科学・社会科学・人文科学の各分野の垣根を越えて分化かつ拡大を続ける中、基礎において汎用性が高い学問の構造を有している。

日本においては「統計学科」を置く大学がない背景は、先述の通り、それぞれの分野へ分化された形で組み込まれているためである。

国立の統計学研究・教育機関としては、1944年に設立された統計数理研究所があり、AIC、数量化理論、確率微分方程式などの顕著な成果を生み出し、統計学研究を牽引している^[4]。

社会生活の至る所で統計技術の適用が貢献できる場面がある以上、統計学とその適用方法を学習する上では社会の実態に即して頻繁に技法を適用してみることが重要であり、そのように出来るためには何よりまず統計処理を身近で制限無く実施できるような「統計処理環境」の備えが必要である。PC・ソフトウェア・インターネット環境などのIT環境が急速に進化低廉化して普及したことで身近に統計処理環境を持ちうるようになり、なおかつ莫大な統計情報がインターネットを通じて公開されているため、研究・調査・学習の処理材料にも不自由しない。

実際21世紀に入って以降は、それまでの確率論と数理統計学を重点に置いたカリキュラムに加え、データを処理して求める答えに近づく「データ解析」のスキルが教育されるようになっている。

元来コンピュータを使った数値計算に際してはまず、IEEE 754規格にあるように丸め誤差が暗黙のうちに生じることや、有効数字の概念の認識が重要で、子供のころ算数で学んだような計算結果にはならないことがあることを知っておかねばならない。さらに、統計計算では殊に重要な乱数についても、コンピュータ上で用いるのは疑似乱数であることや、良質な疑似乱数生成方式「メルセンヌ・ツイスタ」を計算ソフトウェアや開発用言語の全てが必ず備えているわけではないこと、暗号論的乱数はさらにまた別の乱数概念であること、なども実は大切な基礎知識である。

人が得意とするパターン認識の力を積極的に用いるため、統計データの「グラフ化」が古来常套手段として用いられているが、ITの支援を得ることで大量のデータを様々な形に、しかも瞬時にグラフ化（あるいは『見える化』）することが可能となった。そのためのグラフ作成ソフトも多数存在するが、その他の数値解析ソフトウェアや数式処理システム、そして殊に下記のような統計アプリケーションではグラフ化するための機能が充実している。一方、近年オフィスソフト機能等で極端なグラフ装飾を施すことが横行している。この結果として、例えば3Dグラフなどを安易に用いると遠近感や区間面積などから表示すべき真の数量とは異なった認識を受け手に与える事がある。本来3Dグラフ表示は人の空間認識力を活かし得る優れた表現手法であるが、意味なく勢い付け等で用いるのは本来的な視覚化からは退行するばかりか、意図して受け手の誤認識を誘導する事も可能となる。「グラフは直感的に分かるから全て善である」と一般に認識されていることや、前出「統計の困難さ」にある内容をふまえると、統計の視覚化とその解釈に関するリテラシ教育は初等段階から特に注意を要する。

上記のように、用いる統計処理環境ごとに適用分野・目的・方法論・使用者との相性などは異なる。そういった統計処理環境固有の特性なども含めて、いかなる道具もそうであるように、数多く体験の機会を作るほかに理解の早道は無い。

広く普及した表計算ソフトウェアが統計処理・グラフ表現機能を持っているので、誰でも手軽に統計処理入門体験は出来る。しかしあくまでビジネスソフトであり、科学技術ソフトではないExcelの計算の信頼性については常に批判が絶えない^[5]^[6]^[7]^[8]（Excelに限らず普及している表計算ソフトウェアはどれも信頼に足る統計計算はできないとの報告もある^[9]）。近年では研究・教育機関が公開するオープンソースなフリーソフトの中からきわめて優秀な計算ソフトウェアが育っており、プロプライエタリソフトの問題点顕在化により関心の高まった統計技術資産の持続可能性という観点からも、統計教育にあたってはこれらオープンソースソフトウェアの積極的な活用が推奨される。

統計の研究・教育に適した代表的なフリーソフトウェア

アプリケーション
- R言語 - GNU GPL・フリーウェアの統計用数値解析ソフトウェア。確率分布や統計モデルを簡潔に記述でき、無限大・非数・欠損値定数を持つベクトル処理言語。FDA公認。
- GNU Octave - GNU GPL・フリーウェアの数値解析ソフトウェア。理工学分野でのデファクトスタンダードとも言えるMATLABと互換の命令体系を持つベクトル処理言語。
- Scilab - Scilab License・フリーウェアの数値解析ソフトウェア。MATLAB類似の文法をもったベクトル処理言語。付属するソフトウェアScicosを用いてダイアグラム操作で視覚的にシステムフロー図を描いてシステムダイナミクスシミュレーションが可能。INRIAが開発。
- Ox言語 - 行列計算のために作られたベクトル処理言語。フリーウェア。オックスフォード大学が開発。
- Maxima - 数式処理システム。MITのMacsyma直系のGNU GPL・フリーウェア版。
- Risa/Asir - 数式処理システム。マルチプラットホーム。OpenXMを実装。フリーウェア。富士通が開発。
- OpenOffice.org - GNU LGPL・フリーウェアのオフィスソフト。Microsoft Officeとほぼ互換。
ライブラリ
- GNU Scientific Library
- Apache Commons Math
- SAMMIF
- DLLSA
- ISMLIB
- Incanter(Clojure用ライブラリ)
- NumPy（Python用ライブラリ）
- SciPy（Python用ライブラリ）

統計計算に関連するソフトウェアのカテゴリ

脚注

[ヘルプ]

^ 現在では生物統計学 Biostatistics とも呼ばれる、この単語は現在では生体認証という別の意味で使われている。
^ ^a ^b ジョエル・ベスト　『統計はこうしてウソをつく : だまされないための統計学入門』　林大訳、白揚社、2002年。ISBN 4-8269-0111-9。
^ パオロ・マッツァリーノ　『反社会学講座』　イースト・プレス、2004年。ISBN 4-87257-460-5。
^ 現在は情報・システム研究機構を構成する一機関。
^ Excel使うな Okumura's Blog　三重大学高等教育創造開発センター教授・教育情報システム部門長奥村晴彦のブログ
^ 52, Issue 10, Pages 4567-4878 (15 June 2008)　 Special Section on Microsoft Excel 2007, Edited by B.D. McCullough
^ Excel は，コンピュータ・ソフトウェアの三種の神器のようになっていますが，とんでもないこともあるというお話。群馬大学社会情報学部教授青木繁伸のサイト
^ 間違いだらけのExcel関数ヘルプ「財務・統計関数編」市販解説本で孫引きしている点も警告
^ On the Numerical Accuracy of Spreadsheets : the Journal of Statistical Software Vol.34, Issue4, Apr2010

参考文献

『統計学入門』　東京大学教養学部統計学教室(編)、東京大学出版会、1991年。
J. R. Taylor　『計測における誤差解析入門』　林茂雄,馬場凉(訳)、東京化学同人、2000年。
蓑谷千凰彦　『推定と検定のはなし』　東京図書、1988年。
竹之内脩　『ルベーグ積分』　培風館〈現代数学レクチャーズ〉、1980年。
R. A. フィッシャー　『統計的方法と科学的推論』　渋谷政昭, 竹内啓(訳)、1962年。

外部リンク

統計学

実験計画法

統計母集団 • サンプリング • 層化抽出法 • 反復 • ブロック化

標本推定

帰無仮説 • 対立仮説 • 第一種過誤と第二種過誤 • 統計的検出力 • 効果の大きさ

記述統計学

連続データ

位置	平均（算術、幾何、調和） • 中央値 • 最頻値

分散	範囲 • 標準偏差 • 変動係数 • 百分率

モーメント	分散 • 歪度 • 尖度

カテゴリデータ

頻度 • 分割表

統計的推測

ベイズ推定 • 仮説検定 • 有意性 • Z検定 • スチューデントのt検定 • カイ二乗検定 • F検定 • 有意 • 区間推定 • 最尤度 • 最小距離 • メタアナリシス • 信頼区間

生存時間分析

生存時間関数 • カプラン－マイヤー推定量 • ログランク検定 • 故障率 • 比例ハザードモデル

相関

交絡変数 • ピアソンの積率相関係数 • 順位相関（スピアマンの順位相関係数、ケンドールの順位相関係数）

線型モデル

一般線型モデル • 一般化線型モデル • 分散分析 • 共分散分析

回帰分析

線形回帰 • 非線形回帰 • ロジスティック回帰

統計図表

棒グラフ • バイプロット • ボックスプロット • 管理図 • 森林プロット • ヒストグラム • Q-Q プロット • ランチャート • 散布図 • 幹葉図

歴史

統計学歴史 • 統計学の創始者 • 確率論と統計学の歩み

応用

社会統計学 • 生物統計学 • 統計力学 • 計量経済学

出版物

統計学に関する学術誌一覧 • 重要な出版物

カテゴリ

数学

主要分野	数理論理学 - 集合論 - 圏論 - 代数学（線型 – 抽象） - 数論 - 解析学/微分積分学 - 幾何学 - 位相幾何学 - 力学系 - 組合せ数学 - ゲーム理論 - 情報理論 - 数値解析 - 最適化問題 - 計算理論 - 確率論 - 統計学 - 三角法

トピックス	数学史 - 和算 - 数理哲学 - 美 - 未解決問題 - 算数・数学教育 - 算数 - 教科 - フィールズ賞 - アーベル賞

一覧	数学定数 - 数 - 関数 - 図形 - 数学記号 - 数学者 - カテゴリ - ポータル - （プロジェクト）

統計学の用語

統計の困難さ

教育

脚注

関連項目

参考文献

外部リンク