データサイエンスと実務データ分析活用との本質的な違い


あなたは本当にデータサイエンティストになりたいのか

「データ分析の専門家として、少しでも精度の高い計算結果を大量のデータから導くこと」すなわちデータサイエンスと、一般の実務家が自分の業務でデータやデータ分析を活用して、必要な知見を得ること(問題解決やロジカル、客観的な提案など)とは本質的に違います。

その違いを、米国ハーバード大学院ビジネススクールのData Science for Businessカリキュラムを修了した経験から紐解きたいと思います。

こちらの絵を作成致しました。データサイエンスといってもその範囲は広いのですが、その中でも代表的な機械学習(Machine Learning)を例として考えてみます。

左側が、実務家が自分の業務でデータやデータ分析を活用してその成果の質を上げるイメージです。
まずは自分が何をしたいのか(ここでは例えば、目の前の実務課題の根本要因を見つけたいという目的を、「ダイヤモンドを見つけたい」と置き換えてみましょう)が明確にあります。

その目的(ダイヤモンド)を、手にすくった砂(データ)の中から見つけ出すためには以下のステップを踏みます。

(1)目的の確認(=ダイヤモンドを見つける)

(2)探す対象のデータを定義し集める(=適切な砂を見極めて集める)

(3)探し当てるための方法論や仮説を考える(=砂の中のどこからどうやって探し当てるか考える)

(4)その方法に沿って分析作業をする(=実際に砂の中から探す)

ここで、相対的に重要且つスキルや求められるのは(1)~(3)です。((4)のスキルは不要ということではありません)

一方で、右側が機械学習などを例とするデータサイエンスです。

ここでは、目の前にまず大量の砂や岩があります。そこに何が埋まっているのか、もっというと自分が何を探そうとしているかすら曖昧(決まっていない)です。

でも「きっと何かあるだろうから」その砂や岩を、ものすごい作業効率で見ていく必要があります。

そのまま見ていても良く分からないので、何か洗練されたアルゴリズムで、”カテゴリーに分類”していきます。

どうやってそのカテゴリーを決めるのか、はそのアルゴリズムが「良い」と思ったものに原則お任せです。その意味ではブラックボックスです。

でも何か良くわからないけど機械が「良い」という分類で砂や岩に含まれている成分や素材が整理されました。これを人が人力でやろうとすると効率的にも、人が当てはめられるアルゴリズムという観点からも手に負えません。

洗練された手法で分類はできるのですが、その先には問題があります。「はい、分類できましたよ」は良いのですが「で、これをどうするの?」に繋がらない可能性がある程度高いはずです。なぜなら、「何を目的に何が必要なのか」というゴールがそもそもない中で分析が走るケースが多いからです。

確かにこういった分析(データサイエンス)が、特にアカデミックな世界では必要とされることは十分理解できますし、その威力は確かにあります。そして、純粋に学問的には(私個人としては)面白いです。ただ、Practicalかと問われると、「YES」とは言えないところですね。

ですので、ハーバードという世界最高峰のプログラムでデータサイエンスを学んだ後も、私は迷わず図の左側(実務におけるデータ分析活用)を追求していくのです。


関連記事

  1. 日経情報ストラテジー2月号連載です

  2. 実務データ分析虎の巻Vol.34(データの特徴を“広く”捉える)

  3. データ分析を組織定着させるカギ

  4. SMBC主催『データ分析・統計手法の実務活用ポイント』(3/5)

  5. 今月限りのオンデマンドセミナー東洋経済『実践!データ分析活用講座』

  6. 実務データ分析虎の巻Vol.64(「データ分析で結果が出ない」よくある原因)

PAGE TOP