「統計学が最強の学問である」を読んだ

統計学が最強の学問である」を読んだ。

統計学が最強の学問である

統計学が最強の学問である

最近統計ブームになってきて、データ解析してますとかビッグデータ扱ってますという話をよく聞くけど、ただデータを集めて数を測定して何か分かった気になった、というようなやり方は全然金の無駄で、ちゃんと目的を設定した上でデータ集めや解析をしないといけないというようなことが書いてあった。

たとえばビジネスなら、目標は利益をあげることだから、以下の問いを立てて分析しないといけない。

  • 何かの要因が変化すれば利益が向上するのか?
  • そうした変化を起こすような行動は実際に可能なのか?
  • 変化を起こす行動が可能だとして、そのコストは利益を上回るのか?

確かにそのとおりだと思った。

必要のない正確さについて

他には、「意思決定に必要のない正確さは、無駄なコストだ」ということも書いてあった。普段、何も考えずに正確さを求めてる気がするので反省したい。

A/Bテストについて

A/Bテストのことも書いてあった。A/Bテストは統計の世界ではランダム化比較実験と呼ばれてきたものらしい。実験対象にランダムにそれぞれの方法を試すことで、比較したい両グループの諸条件がほぼ揃う。たとえば畑を40区画に分けて、肥料A、Bをそれぞれランダムな区画に散布すると、肥料Aをまいた土地が日当たりの悪い区画ばかりあたる確率は100万分の1になる。日当たりの良い区画が同数になる確率は13%、+-1まで許容すると36%、+-2まで許容すると57%になる。これは日当たり以外の水はけや土壌などの他の条件についても同じことが言える。ランダム化比較実験は複雑な要素を持ってる実験対象が相手の時に威力を発揮する。なので人間相手に実験したいときには非常に有効。

また、得られた結果から導かれた結論が、どの程度確かなのかを検証する計算も確立されていて、誤差によってその結果が導かれた可能性が5%以下なら、誤差とは考えにくいとみなすのが一般的らしい。

A/Bテストは最近記事などでよく見かけるけど、それがコンバージョン率7%から9%に上がったとして、そこから単純に優劣が決まるのか、それとも誤差のことを考えなくていいのかがよくわかってなかった。ランダム化の強力さと、誤差のことも考えて比較できるということがわかって、非常に腑に落ちた。機会があればA/Bテストを導入していきたい。

その他

統計の分析手法は一般化線形モデルというカテゴリでくくると共通化できるものが多くて、どういうケースでどの手法を使うかという表が載ってて便利。きっとデータ分析が必要になったら見直すと思う。

統計について何もわかってない状態から読んでみたけど、統計学の概観と、統計学が怪しげな学問じゃなくて、数学の裏づけがある学問だということがわかってよかった。もっと統計について勉強したい。