乗車日記

自転車ときのこ

入門 ベイズ統計 読了

図書館で借りた本です。ベイズ統計に触れたのは昨年の夏休みに読んだ機械学習の本が初めて。そのときはピンときませんでしたが、今回この本を読んでだいぶんイメージが掴めました。

 たとえばコイントスをやるとします。普通のひとは、まず表裏が出る確率は1/2ずつだと思っているはずです。しかし、実際やってみると10回投げて、表が8回出たとします。すると、このコイン、もしかしたらちょっとおかしいのではないかと思い始めます。そんなときに、結果(10回投げて8回表)から原因(表の確率がどうなっているのか)を評価できるのがベイズ統計です。

といっても、10回ぐらいのテストでばっちり表の出る確率8/10といえるわけではなく、どうも表の出る確率は1/2以上の可能性が高いはずだけど、そうでないかも知れないというのが誰もが感じるところです。例えばものすごい回数投げたときに表の出る確率が1/3のコインでも、10回ぐらいしか投げていないなら、たまたま7回表が出てもおかしくありません。

それがベイズ統計では表の出る確率0~1/4ぐらいの可能性が10%、1/4~2/4ぐらいの可能性が20%、2/4~3/4ぐらいの可能性が50%、3/4~1ぐらいの可能性が20%といった具合に、これくらいかなーと言う原因に関する確信の度合いを、色々な場合の可能性の大小の分布という形で表現・評価できるのです。

その確信の分布はテストの回数が増えるほど、どこかに集まっていって、例えば1000回やって700回表であれば、表が出る確率が7/10 ±1/100ぐらいの可能性が90%、その他の確率である可能性が全部集めて10%ぐらいという具合に、だんだん精度が増していくわけです。

(以上の数字は適当に私が作ったもので、正しい計算結果ではありません。)

 

表紙にも書いてあるように、普通に人間がやっている判断のようなものを統計として表現できるわけで、考えようによってはこちらの方がすっきりしているはずなのですが、普通の統計の考え方に染まっているとかえって分かりにくいのが不思議です。確信といったいわば主観的なことを扱っているあたりが、その原因なのだと思います。

そのあたり、波束の収束が観測者と関わってしまうという量子力学観測問題の居心地の悪さと似ている気もします。観測者も含めた量子平行世界と事後選択を考えると、主観の問題点が解消するように、ベイズ統計の確信というのも、結果が出る前は自分がどの世界にいるか分からなかったのに、特定の結果がでることで自分がどの世界にいるのかがだんだん決まってくるというふうに解釈すると、主観というものを持ち出さなくても良くなるのではないかと私は感じています。ベイズ統計の場合は完全に古典論の世界でも適用されるので、ちょっと違うかも知れませんが。

いずれにせよ、こういう新しいことは読んだだけではまたすぐに忘れてしまうので、なんとか普段の生活で使っていって、自分のものにしていきたいものです。

f:id:tasano-kona:20141105212000j:plain