はじめに
『図解入門よくわかる 最新ベイズ統計の基本と仕組み』というベイズ統計を簡単に紹介した本を読んだので、どういう本なのか紹介したいと思う。
- 松原望 (2010). 『図解入門よくわかる最新ベイズ統計の基本と仕組み ようこそベイジアンの世界へ ソフトな統計実践入門』 東京:秀和システム.
この本は全くの初心者に向けて、ベイズ統計を紹介した本である。ベイズ統計の基本的な考えがどのようなものであるかを広く浅く紹介している。つまり、ベイズ統計では、どのように物事を捉え、さらにどういった応用があるのかについて説明している。詳しく書かれた教科書というわけではない。ただし、編集がきちんとなされていなかったようで、誤植が多い。
特徴
ベイズ統計ではどのように物事を捉えるかを書いている書籍であり、ベイズ統計の雰囲気をつかむ分には有用だと思う。ただし、教科書ではないので、これでベイズ統計の手法が身につくかと言えば身につかないと思う。しっかり身につけたいのならば、他の入門書を読んだ方が良いだろう。この本の著者である松原望は、他にも色んなベイズ統計の入門書を書いている。
この本は、こういった初心者向けの書籍としては珍しく、数式を使うことを避けていない。ただ、数式の読み方が分からなくても、この本を理解するには別に困りはしないと思う。もちろん数式の読み方を知っていた方が、理解はしやすい面はあるが。もしベイズ統計をしっかり身につけたいというのであれば、数式にしっかり取り組む必要があるが、そのような場合はこの本でなく別の本を読むことをおすすめする。
統計に関する事項を紹介する順番は、割合と大胆なものであり、普通の教科書では見られないような順番で紹介を行っている。例えば、普通の統計の教科書では、最頻値・中央値・平均値といったものは比較的早い時期に習うが、この本では、5章に入って初めてちゃんと紹介される(この本は合わせて6章である)。普通の教科書の場合は、積み上げが大事なので順番が大事になってくる。しかし、この本はしっかりとした教科書というわけではないので、その場で理解しやすいように大胆な順序をとっているのであろう。
第5章と第6章はベイズ統計学の応用となっているが、応用の詳しいやり方は書かれていない。どのような応用があり、その応用が大体どのようなものなのかを簡単に記すのみである。もしもこの本を読んで興味を持った応用があったならば、その応用について詳しく書かれている書籍を参照するのが良いだろう。
練習問題
理解を助けるための練習問題が、各節の終わりに付されている。著者自身が、
と書いているように、簡単なものばかりである。実際のところ、本文で説明している内容の一歩手前の知識を問う練習問題が多いようだ。つまり、本文の内容を直接問うたり、本文の応用を問うているのではない。それでも、理解を助けることは助けていると思う。Excelで計算してみようといった練習問題もある。ただし、Excelでの統計処理について詳しく書かれているわけではないので、Excelに慣れていない人だと、練習問題を解くときにつまづくかも知れない。
なお、練習問題の解答は、秀和システムのWebサイト上のサポートページにある。
誤植・編集ミスなど
先に少し触れたが、編集がきちんとなされていなかったようで、誤植が多い。一応、正誤表がサポートページに掲載されているが、この正誤表に載っていない誤植もまだある。また、これは趣味の問題かも知れないが、本文の中の数式の組み方が美しくない。
主な内容
主な内容は以下の通りである。
第1章 ベイズ統計学とは
- ベイズ統計学と古典統計学の違い
- ベイズ確率論は逆確率(結果から原因を考える確率)に基づく。
- 確率分布のパラメータをダイナミックに動かす。
- データが無くてもおよその予想に基づき自由に発想できる。
- ベイズ更新:経験した事実によって、その事実の示す方向に変えていくこと。事前確率が事後確率に更新される。
- ベイズ統計学の4ジャンル
- 原理論(ベイズの定理・事前確率の選定・事後確率の算出)
- 検定・推定・回帰分析のベイズ的取り扱い
- 隣接分野への応用
- コンピュータ・ベイズ統計学(AIなどと関連)
- ベイズ統計学の思想的背景と限界
第2章 確率とベイズの定理
- ベイズについての紹介(§2.1)
- ベイズの定理の紹介(§2.2)
- 確率の基礎(§2.3-2.4)
- 主観確率(§2.5)
- 主観確率の決め方として、以下の5つの手法を挙げる。
- 専門家の意見を取り入れて決定する。
- 専門家集団からアンケートを採り、その結果を確率分布に集約する。
- 数理的な方法:何らかの確率分布(例えば正規分布)を設定する。
- AHP(Analytic Hierarchy Process、階層分析法・階層化意志決定法):整数およびその逆数からなる相反行列の固有値問題を用いる。
- 不十分理由の原理:各結果の確率はみな等しいと見なす、つまり一様分布になる。
- 主観確率の決め方として、以下の5つの手法を挙げる。
- 事前確率と事後確率(§2.6)
- 三囚人問題を用いて事前確率と事後確率を考える。
第3章 ベイズ統計学の基礎
- 確率分布の紹介(§3.1)
- ポアソン分布にベイズの定理を適用した事例(§3.2)
- 自然共役分布(§3.3)
- 確率分布には自然な相手である事前分布が決まっている。
- 例えば、二項分布の自然共役事前分布はベータ分布、ポアソン分布の自然共役事前分布はガンマ分布のようになっている。
- 正規分布の紹介と、正規分布に対するベイズ統計分析(§§3.4-3.5)
- 待ち時間分布(§3.6)
- ベイズ統計学とは別に関係のない話題だが、関連する話題として載っている。
- 幾何分布(初回、離散時間)
- 負の二項分布(複数回、離散時間)
- 指数分布(初回、連続時間)
- ガンマ分布(複数回、連続時間)
- ベイズ統計学とは別に関係のない話題だが、関連する話題として載っている。
第4章 ベイズ統計実践のための基礎ツール
- ベイズ統計学は、事後確率分布が出るだけであり、出てきた事後分布をどう用いるかが腕の見せ所である。
- 成功率のベイズ分析(§4.1)
- 生起件数のベイズ分析(§4.2)
- ベイズ判別方式(§4.3):ベイズの定理を用いた判別分析、フィッシャーのアヤメのデータを用いて、どの種に属するかを判別する事例
- あいまい分布と尤度(§4.4)
- 情報が全くないときは、事前確率を決めるのが難しい。
- ベイズ因子(§4.5)
- ベイズ意志決定理論(§4.6)
- 事後期待損失最小化:事後確率による期待損失が最小になるように決定すれば、それがベイズ的な最適の統計的決定となる。
第5章 ベイズ統計学の応用(1)
- ベイズ検定(§5.1)
- ベイズ検定とフィッシャーの仮説検定の対比。
- 信頼区間(§5.2)
- パラメータ推定(§5.3)
- 最頻値・中央値・平均値という3種類の代表値についての紹介
- ベータ分布で最頻値と平均値がどういう値をとるか。
- 損失の基準
- 絶対損失:中央値の最適意志決定、損失は誤差に比例
- 二次損失:平均値の最適意志決定、損失は誤差の平方に比例
- 単純損失:最頻値の最適意志決定、損失は誤差が小さい場合は0、ある程度より大きい場合は1
- 経験的ベイズ法(§5.4)
- スタインの縮減(shrinkage)推定量:個別の例の推定に全体の相場を加味する。
- 迷惑パラメータ(nuisance parameter) (§5.5)
- 迷惑パラメータとは、1つのパラメータを求めるときに必要となるが、値が良く分からなくて困るもう1つのパラメータである。。
- 例えば、平均の検定では分散の情報が必要なので、分散は迷惑パラメータである。
- 迷惑はベイズ統計学でうまく解決できる。
第6章 ベイズ統計学の応用(2)
- 最尤推定法(§6.1)
- ベイジアン・ネットワーク(§6.2)
- ベイズ更新と逐次確率比検定(§6.3)
- カルマン・フィルタリング(§6.4)
- マルコフ連鎖モンテカルロ法(§6.5)