2014年11月21日

1億人のための統計解析

本日は西内 啓氏の
1億人のための統計解析
です。
1億人のための統計解析 エクセルを最強の武器にする

本書は統計学が最強の学問であるの著者の実践編として、
興味を持って購入しました。


統計学が最強の学問であるはとても良い本だと思いますが、
若干、理論に偏って、分かりにくい部分もありました。

本書はそれを補完する実践的な本です。
エクセルで解析を行いながら、統計分析の基礎を学べます。


この本で特に良いのは重回帰分析です。

データの加工から、関数の使い方といった
エクセルの基本操作から、統計ツールの使い方、
説明変数の絞り込み方といった少し専門的な知識まで
重回帰分析を行うのに必要最低限の知識を得られます。

理論はともかく、まず試してみたい、という人には
ピッタリの一冊です。


また、回帰分析は統計解析の基本ですから、
統計解析を何から学べばよいかわからない、という人は
この本がとっかかりになってくれるでしょう。


商売などをされていて、すぐに使えるデータがあるけれど、
解析方法がわからない、という方にお勧めの一冊です。
とりあえず、本書に沿った分析をしてみれば、
思わぬ発見があるかもしれません。




なぜ統計解析を行うかといえば、
「事前には想像もしなかったビジネスのヒント」を
データから得るためだ。
だから、オープン・クエスチョンを投げかけ、データから得られる
すべてのものを答えの候補にすべきである。


数学的な関連性が高いからといって、ビジネス面での価値があるのか、
あるいはその解析結果が関係者にとってうれしいものなのか
までは保証してくれない。


統計解析に慣れていない人に報告する場合、
重回帰分析の結果だけ見せてもなかなか理解してもらえないので、
クロス集計や散布図を使って説明するのがよいだろう。


最終的には、クロス集計のようにシンプルな形で
結果を報告するにせよ、重回帰分析は有用な道具となるのだ。


他の説明変数の値から
完全に予測される説明変数が存在してはいけない


目的変数の予測精度が問題になるような分析においては、
予測精度それ自体ではなく、それによってもたらされる
合理化のメリットこそがビジネスに価値を生むのである。


Excell 2010以降に追加できるデータマイニング機能を使うと、
説明変数が15個以内という制限がなくなる。
また、説明変数の選択も自動的に行われるため、
ユーザーが変数選択法を使って重回帰分析を手作業で
繰り返す必要もなくなる。
何が「普通」なのか判断するのが難しければ、とりあえず
すべての説明変数を指定して分析すれば良いのだ。


解析結果から利益につながるアイデアが生まれたら、
小規模な実証実験を試してみよう。
多くの統計学の教科書に書いてある
「相関と因果は混同してはいけない」という話はもっともであるが、
だからといって慎重な議論を繰り返しているだけではなにも始まらない。






engineer_takafumi at 23:11│Comments(0)TrackBack(0)★理系本の書評 | ⇒ 仕事術、思考法・ツール

トラックバックURL

コメントする

名前
URL
 
  絵文字