データ利活用というと、
大げさな話だと思いがちです。
特に最近では、
データ利活用の本も多く出ており、
自分がどの本を選ぶべきか
迷ってしまうでしょう。
また、ネットで調べると、
日本のデータ利活用とは、
という大きな課題の話が多く出てきます。
調べたり学んだりするのが得意な人ほど、
「何から始めればよいか」と
疲れてしまうかもしれません。
そこで、この記事では
気軽にデータ利活用を始める方法として、
データ分析の簡単な例を出してみます。
簡単なデータ分析
以下の手順で進めてください。
1.いま一番関心のある数字を日単位で出してみる
日ごとの売上やサイト訪問数などです。
なければ、Googleトレンド等で
関心のあるキーワードの検索数でも
よいかもしれません。
注意点としては、
なるべく日単位のほうが良いです。
週、月、年でもいいですが、
変化が少ないので、
面白味がないかもしれません。
2.それについて、何が影響しているか想像する
天気や曜日などが例として挙がりますが、
他の要因があれば、それでもかまいません。
3.その中で取れそうなものを1つ選び、データを取る
天気であれば、気象庁のサイトから
気象データを取れます。
曜日であれば、
平日=0、休日=1として
カレンダーを作りましょう。
4.グラフとして並べてみる
折れ線グラフにすると良いでしょう。
5.想像した通りの影響があるかどうか、目視で確認してみる
こうして複数の要因を重ねるだけでも、
いろいろなことがわかります。
・いつ似た動きをしているか
・また、いつ違う動きになるのか
たとえば、
「日曜日はいつも売上が上がるが、
土~月の連休の場合は
日曜日はそれほど上がらない」
「休日が雨だと売上が下がるが、
平日に雨が降っても売上は下がらない」
のようなことです。
この時点で新しい発見はないと思いますが、
感覚値と比べてどうでしょうか?
さらに考察を進めると、
改善につながる以下のような仮説が出てきます。
6.違う動きをしているときは何が原因なのか? を探る
日付などから、
具体的に何があったのかを
確認してみます。
近隣でイベントがあった日には
やはり売上が伸びていたり、
広告を打った日に伸びていたりするでしょう。
また、欠品していたため、
本当は売上が上がる日にもかかわらず、
その日だけ傾向が違う、ということもあります。
その場合は機会損失があったということでしょう。
さらに、
「システム上のデータがそもそも間違っていた」
というのも非常に良くあることです。
このように、 「傾向の違う日」を掘るだけでも
いろいろな気づきが得られます。
これは、高度な分析を行う際の前準備としても
とても重要なことです。
7.平均すると何%くらい違うのか?
原因を探ったら、
次は影響を数値化してみたいと
思うこともあるかもしれません。
簡単にするために、上で分かったことが
以下の2つだけであると想定します。
・(上の5.から)
土日に売上が上がることが分かった
・(上の6.から)
広告を打てば上がることが分かった
ここで広告の影響を数値化したい場合、
・まず、データを平日と休日に分ける
・平日と休日のそれぞれで、
広告があった日となかった日の売上を比べる
これだけでも、
ある程度の広告影響の数値化ができます。
なんと、ここまでで
データ分析の1つのステップが終わりました。
あとは1.に戻って他の要因を試してみると、
また新たな気づきがあるかもしれません。
これをどんどん続けていくと、
そのうち要因が多くなりすぎて
煩雑になってきます。
その時初めて、重回帰分析などの
統計的手法が有効になってきます。
おわりに
いかがでしたでしょうか?
データ利活用とは、 簡単に言えば
ここで行ったような
仮説に対して検証を繰り返していく
プロセスのことです。
これは集計でも可視化でも分析でも同じです。
「データが揃っていなければできない」
「優秀な人材がいなければできない」
「ツールがなければできない」
というものではありません。
大企業や広告代理店の現場などでも、
常に複雑な分析をやっているかといえば
そうでもなく、
2つのデータの単純な関係を見て
判断していることは
意外に多いものです。
データ利活用の方向性とは、
まず最初の一歩を踏み出すところから
生まれてくるものだと思っています。
0コメント