
実務データ分析虎の巻Vol.98~データ分析は「テーマ」に対して?「問題」に対して?
今回は、データ活用に共通して見られる「テーマ」と「問題・目的」の違いについて紹介します。
この違いとは、「データを活用する出発点」の違いと言っても良さそうです。
今回は、データ活用に共通して見られる「テーマ」と「問題・目的」の違いについて紹介します。
この違いとは、「データを活用する出発点」の違いと言っても良さそうです。
スーパーサイエンスハイスクールに指定されている徳島県立富岡西高校にて、「データ活用」の授業を行ってきました。それまで全くデータ分析に関することをやったことがない(=先生方も教えたことが無い)というゼロベースで、「自らテーマを立てて、データを活用した研究を行う」プロジェクトを進めています。
データ活用の基礎的なテクニックの一つが、1つだけでなく、2つの軸での評価です。ここで言う”軸“とは、「尺度」や「評価基準」と言い換えても良いかもしれません。
まだまだ”ビッグデータ“や”データサイエンス“といった言葉は広く意識されているようです。ところが一般実務の中で、これらが活用されて成果が出ているという話は、言葉の広がりのわりには耳にすることがありません。それはビッグデータやデータサイエンスそのものが悪いというよりも、ゴールが違うことが理解されていないからではないか、と思うことがあります。
「データ分析」という言葉からイメージされる内容は人によって大きく異なるなぁと感じることが多いです。その違いによって、最終的に到達できるポイントにも大きく差が出ることが見えてきました。
「データ分析ができている/できていない」とはつまりどういうことなのか?
この説明を講演などするときにこの図を使うことが増えました。
「データ分析で何したい?何ができる?」と問われるとどのようにお答えになりますか?
データ分析の研修に臨む前に多くの人が抱いているイメージが、ズバリ!こちらの図です(この説明のためにイラストレーターに書いてもらいました)。
データ分析で満足いく答えが出せない大きな理由の一つに「正しい問いが設定されていない(正しい問いに答えていない)」ことが挙げられます。
平均というすぐにわかる指標を用いて、2つの都市を”寒い地域“と”そうでない地域“に分けて(分断して)います。
人は、このように明確な違い(このケースでは平均値)にフォーカスを当て、その違いをハイライトすることで、「ほら、この2つ違うでしょ!」と言いたがるというのです。
皆さんには身に覚えはないでしょうか。
研修やセミナーをしていると、たまに聞かれる質問があります。
「自分の言いたいことに合わせて、都合の良いデータを引っ張ってきて、都合の良い結論を作ってしまうってことはないですか?」
これに対する私の答え:「分析者によっては、もちろんあり得ます。」