統計学が流行っているようなので

Pocket

流行に流されやすい自分。書店の本棚に特集が組まれるようなテーマだとついつい気になっちゃいます。今回は統計学の本で一番売れていそうな本、ってことで統計学をかじった事がない素人が読んでみた感想です。

「統計学が最強の学問である」を読んで

統計学が最強かどうかは置いておいて、今後何か判断を行うときには統計学的な思考は必須になると思う。

なぜか。何かを判断する場合、判断材料、つまり根拠(エビデンス)となるデータを見つけることができれば、正しい判断がしやすくなる。しかしこのエビデンスを見つけるのはコツがいるのだ。そこで統計学の出番となる。

例えば、あるデータの集合(母集団)が与えられたとして、その中から、判断に役立ちそうな傾向や特異点を見つけ出したいとする。

見つけることができたとしても、それはたまたまなのかもしれない。そもそも与えられた母集団だけで、判断ができるのか。判断ができる場合、どの程度確からしいのか。

このあたりの情報を付与してくれるのが統計学なのだ。(たぶん)

統計学とセットで語られることが多い、ビックデータとかデータマイニングとテキストマイニングとか結構流行り言葉の勉強にもなるので、 新刊のうち、つまり鮮度が高いに読むとよいかもしれない。

ちなみにデータを分析/解析するに当たって、アプローチが大きく分けて2つあると思われる。

  1. 仮説を立てて、その内容が正しいかどうかを検証する(どのくらい正しいかを導く)
  2. 仮説は立てずにデータから考えられる説を導く(傾向を導く)

1.は人間が勘や経験、思いつきなどを駆使して閃いた案が、データを使うことによりどのくらい正しいかどうかを検証する方法。

2.は、データから何が言えるかを見つける作業。これがIT化の波に乗り、データの塊さえコンピュータに放り込めば、さまざまな傾向(可能性)を提案してくれるようになる日もくるのだろう。

でもさ、データを与えさえすればコンピュータが判断ができるなら、もはや人間の役目はなんだろうと思ってしまう。 別に働かなくてもいいのであれば、コンピュータがすべてを決めてくれるほうがよいとは思うけど、自己満足度は下がっちゃうかも。データを集めるところからコンピュータで自動化されちゃったら、頭さえ使わなくていい時代がくるのだろうか。羨ましくもあり怖くもあり。

ということで確かに統計学は判断には最強に役にたつ学問っぽいけど、算数とか国語とかITとかできないと統計学はあんまり活かせないような気もする。 そもそも役立ち度だと、コミュニケーションが円滑にとれるようになる国語最強とかになったりしないんだろうか。そういった意味では最強ってのはいいすぎである。

あとは本書は結構読みづらい分野の本だと思う。 理解をしないと先に進めないからだ。 ぜひ本書をテキストマイニングしてサマリーを教えて欲しいところだ。

Pocket