2016年04月15日

その数学が戦略を決める


その数学が戦略を決める


統計学が人間の専門家を打ち負かしたエピソードてんこもり!
章末ごとに、「この章のまとめ」ページがあるので、大変読みやすい(レビューも書きやすい)
回帰分析とランダム化比較試験(あとベイズ統計)を使うだけで世の中の大半のことは専門家よりも良くわかるようになるよ!
という話でした。


文庫版は2010年出版だが、原著は2007年出版らしく、人工知能とか機械学習みたいな話題はほとんど無し。


回帰分析・ランダム化比較試験・ベイズ統計
この3つを使って専門家に勝った例がこんなに沢山あるよ!

という例がこれでもかと紹介されています。

回帰分析の例
生産年の気候からワインの価格(味)を予想する。
amazonの「この本を買った人は」
他社に流出しそうな客を捕まえる
→いくつかの変数から驚くほどいろいろなことを予測できる。

ランダム化比較試験(無作為実験、ABテスト)の例
クリック率の高いウェブサイトを作る(ランダムにどちらかを表示してデータを集める)
政策決定にも使える(厳しい刑罰は犯罪を減らすか?→NO)
→大量のサンプルさえあればランダムにAとBに振り分けることでどちらが良いかを判断できる。

専門家との対決
根拠に基づく医療(専門家よりも、診断ソフトに症状を入れた方が誤診が少ない)
最高裁判事の判決を予想する(専門家よりも、簡単な回帰式の方が正確)
ニューラルネットワーク(機械学習)を使って映画の興行収入を予測する(大スターが出ているかどうかはあまり関係ない)
→人間は大量のデータを重みづけできない。思い込みや印象のバイアスが強い。
専門家の地位は落ち、データ入力するだけの存在になってしまうかも?

統計を上手く使うヒント
・2σ(シグマ)ルールを知ろう!
正規分布の場合、95%の確率で平均からプラスマイナス2標準偏差の中に納まる。
標準偏差というのは、一言でいうと振れ幅。
何かの平均値と標準偏差を考える時には、平均から2σ足したり、2σ引いた値が現実的かどうかを考えることで、簡単に推測が出来る。

例:
男性の身長の分布を考えたい。
平均は大体170だろうと想像がつく。身長の下限や上限を考えると、大体、155〜185くらいに95%の人が収まるだろうと考えられる。
すると1標準偏差は8pとなる。

逆パターン:
偏差値は、平均が50、標準偏差が10の分布である。
あなたの偏差値が70だとしたら、あなたは2σだけ、平均よりも高いことになる。(ちょうど上位2.5%である(下側にも2.5%の外れが居るので))
なので、偏差値は100を超えたり、マイナスになったりする可能性がある。(5σ以上離れれば、当然そうなる)

IQは、平均が100、テストの種類によるが、標準偏差16の分布である。
IQ132なら、あなたは2σだけ、平均よりも高いことになる。
アインシュタインのIQは180とか言ってるけど、これは5標準偏差離れた状態(=偏差値100)
とかいうのが理解できるようになる。



最後のテクニック、ベイズ推定の例
確率を正しく把握することは人間にはかなり難しい。

陽性反応の誤謬
40歳女性の1%は乳がんにかかっています。
乳がん女性の80%は検査で陽性になります。
乳がんでない女性の10%も検査で陽性になります(偽陽性)
40歳のある女性が検査で陽性になりました。この人が本当に乳がんである確率はいくつ?


ほとんどの医者は75%くらいと答えるが、実際は7.5%
80%は検査で陽性 という部分に引きずられてしまうが、
実は40歳女性の1%しか乳がんではないという事前情報が重要な例。

確率を正しく把握することは人間にはかなり難しいが、ベイズ統計の知識があれば正しく理解が出来る。



統計データでいろんなことが分かったよ〜系の本としては、以下の本

オタクの行動経済学者、スポーツの裏側を読み解く


も面白かったし、全体的に似た本。
読みやすくて内容もなんとなくしっくりくるし、こういう統計学啓蒙書みたいな本をどうしても沢山読んでしまう。
本当は読まなくても大体中身が分かるからこれ以上読む必要がないんだけど・・・


posted by ロボたいしょう at 00:40 | Comment(0) | 読書・書評 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント: