感覚で分かっておきたい数字:統計学が最強の学問である

公開日: 2017年9月27日水曜日 テクノロジー リサーチ

数年前にこの本が出たとき、電車の中で読んでいる人がたくさんいた記憶があります。(そういう職種が多い路線だったのかもしれませんが)僕も少しではあるけどユーザーリサーチの結果を集計+分析することはありますが、やっても平均値や中央値を出したり、せいぜい標準偏差を出すくらいまで、回帰分析まではしたことはありません。一度オンライン教室の統計学の講義で、一応回帰分析を習って修了証書はもらったのですが、、、まるで頭に入ってません。嫌いではないのかもとは思いつつ、やっぱり苦手意識はあります。



統計学が最強の学問である
西内 啓
ダイヤモンド社 2013.01

そんな僕がなんでこの本を読んだかというと、デジタルマーケティングの話に関わることが少しあって、雑誌の特集を読んでみたところおススメ書籍が紹介されていて、ならばちょっと読んでみようかと思い、重い腰を上げてみました。タイトルは何か高圧的で難しそうな印象がありますが、内容は平易で専門の人でなくてもわかりやすかったです。この本にも回帰分析などが紹介されていますが、計算の仕方とかではなく、あくまで何に有効でどういったことが分かるかということに注力した説明になっています。

全体を通して一番グッときたのは「分析だけでなくいかにシンプルな施策に落とし込めるか」ということでした。例えばコレラの疑いの可能性があったときに打ち出した施策は「水道会社Aの水を使うのを中止する、以上。」というシンプルなものであり、最近では「タバコは肺がんリスクの高める、だから控えること、以上。」という、ごくシンプルなメッセージを打ち出しています。それで実際には死亡患者の減少や健康改善につながっているとう結果が出ています。

統計学は、原因の根本理由や正確性よりも実効性と効果に着目する、実用学の要素が強いところが面白いです。つまり、あるデータが明らかにおかしかったら、その原因をいつまでも議論して追求するよりも、何か変なのは間違いないのだから異常値が出ないようにすぐに施策を打つ、という動きに出ること。実社会やビジネスの中ではとても有効なアプローチだといえます。

こういったことが最近のビッグデータ活用の考え方にもつながってきますが、大事なのはデータを見る力があるかどうかが問われることです。誰もがおかしいと思うデータがいつも出てくるわけではなく、実際には見る人がみることで浮かび上がってくる境界領域や法則性などがあるのだと思います。そこには標準偏差や回帰分析の相関係数の値に対する知識と経験も必要になってきます。例えば値0.4が何を意味するのかが分かってないと、判断もできないので。これはプロダクトデザイナーが何ミリという数字に対して、どのような形状や使い勝手になるかを想像できるスキルと同じような構造です。


デジタルデータがますます重要になってくるこの時代、統計学の知識を備えておくことが有効であるのは間違いないと思うのですが、僕は仕事でつかう機会がほとんどないことと、普段の仕事が真逆に近いものであるため、定着はどうしても難しいのが実情です。せめて数字の妥当性が分かるようになれるといいのですが、道のりは険しそうです。

ただ1つだけ体感的に理解している数字があります。この本でもサンプリング率は一万人増やしても標準誤差は0.1しか変わらないという例を紹介していましたが、僕も数十や数百のユーザーデータをとってたうえで、だいたいこのくらいの値をとれば十分という範囲はわかってきています。定性ユーザー調査では1つの事象に対してミニマム5人を取ればほぼわかる(6人目以降はかなりの確率で同じ反応を目にする)ということが実体験から自信をもっていえます。やっぱり実践で身に着けるのが一番ですね。

  • ?±??G???g???[?d????u?b?N?}?[?N???A