「勘」と「経験」を代替するデータ分析、という触れ込みは未だに目につきます。 しかし、勘と経験は本来データ分析の業務で大きな助けになるものです。対象についての知識や経験がないときに統計学の知識を正しく適用することはできません。
統計学はあくまでツールであり、ツールを正しく活用するためには、それを適用する対象分野の知識が不可欠だからです。
【関連記事】データ分析の実務が本質的に属人的である、その3つの理由
そして、ある程度データ分析の経験のある人なら、これは間違いであるとわかっていることだと思います。
現場の勘と経験がデータ分析を助ける3つの理由
話は変わりますが、これまでの「勘」や「経験」を否定して新しい発想を得る目的で、あえて新人や業務経験の浅い人にデータ分析をさせようとする状況もあります。このような動きは、データ分析が「勘」や「経験」と対立するものだという考えがあって、初めて出てくるものだと考えています。
教育を目的とする場合はある程度正しいと思います。データをいろいろな切り口で集計することで、業務にかかわるいろいろな数値や、データ上どんな項目が見られるのかなど、業務に関連する知識を得ることができます。
また、サイト改善などのオンラインで完結する施策であれば、データからいろいろな提案をして実施することができる可能性も高くなります。普段関わっていない人だからこそ持ちえる新しい着想や視点を得られることはメリットでしょう。
しかしながら、データの背後にある現実の幅が広いほど、データの背景にある現実の知識がない分析は意味を持ちません。会社の時間をかけて分析をさせても、行動に至ることはほとんどないでしょう。 そこで、改めて「勘」と「経験」がなぜデータ分析に必要なのか、大きく3つの理由に分けて考えてみます。
「勘」や「経験」は分析自体を助ける
データ分析の実務が本質的に属人的である、その3つの理由 でも述べましたが、統計学の知識を現実に活かすにはその背景の事象についての深い知識が必要です。これは手法が高度であるほど重要になってきますが、実際にはデータを扱うすべての場合について言えます。
たとえば、何も背景知識がないままデータを扱ったら、集計すらまともに行うことはできません。
・この集計結果の全数に何が含まれていないのか
・集計の各カテゴリに現実の何が含まれるか
・結果は信頼に足るものなのか
など、扱うデータそのものがまず分かっていないからです。得られる示唆はゼロです。
また、分析手法が高度になればなるほど、
・データ間の因果関係
・確率分布の形
・設定するパラメータの範囲 など、
分析に取り掛かる前に、様々な形で現実を抽象化することが必要になってきます。
背景にある現実の抽象化が行えていない場合、これらに対するアプローチは「とりあえず置きで」「教科書通りに」「一般的には」・・・など、分析側すらあまり確信の持てないものになってしまいます。さらには、それにすら気づかず行っている分析も世間にはたくさんあります。
実業務の勘や経験があるほど、これらの分析に係る作業が簡単になります。
「勘」や「経験」は分析結果の評価を助ける
データ分析の結果に基づいて行動するためには、その結果が信頼に足るものであるかを判断し、納得する必要があります。 業務経験や知識が豊富な人であれば、数字を読んだうえで何が信頼できて、何が信頼できないかを判断し、そのうえでどう使っていくかという「見切り」ができます。
また優れた人であれば、アルゴリズムの概要さえつかんでいれば、「こういうモデルの表現であれば、こういう結果が出てくるだろう」というのはすぐわかるものです。
そもそも、データ分析で分かる知見や示唆はいわゆる「当たり前のこと」がほとんどです。しかし、分析を実行する中で、当たり前でないことや、これまで見過ごしてきたことも出てきます。
これはデータの誤りであったり、今まで着目していなかった傾向の違いであったりと様々ですが、分析によって得られるそのような副次的な価値にも、「何が当たり前か」を知っていて初めて気づくことができます。
「勘」や「経験」は分析結果をより有効に活用する
3つ目はデータから実行を組み立てる力です。同じ結果や示唆が与えられたときに、どう行動するかということです。当然ですが、勘や経験があるほうがうまくいくでしょう。
またさらに重要なのは、勘や経験があれば、データ分析に基づいて取った行動の結果を評価できることです。「分析結果が不十分」なのか、あるいは「それに基づく意思決定が不十分」なのか、または「行動が不十分」なのかは、常に見分けづらいものです。
勘や経験があるほど、それに対して十分な対応が得られるでしょう。
0コメント