あなたは本当にデータサイエンティストになりたいのか

「データ分析の専門家として、少しでも精度の高い計算結果を大量のデータから導くこと」すなわちデータサイエンスと、一般の実務家が自分の業務でデータやデータ分析を活用して、必要な知見を得ること(問題解決やロジカル、客観的な提案など)とは本質的に違います。

その違いを、米国ハーバード大学院ビジネススクールのData Science for Businessカリキュラムを修了した経験から紐解きたいと思います。

こちらの絵を作成致しました。データサイエンスといってもその範囲は広いのですが、その中でも代表的な機械学習(Machine Learning)を例として考えてみます。

左側が、実務家が自分の業務でデータやデータ分析を活用してその成果の質を上げるイメージです。
まずは自分が何をしたいのか(ここでは例えば、目の前の実務課題の根本要因を見つけたいという目的を、「ダイヤモンドを見つけたい」と置き換えてみましょう)が明確にあります。

その目的(ダイヤモンド)を、手にすくった砂(データ)の中から見つけ出すためには以下のステップを踏みます。

(1)目的の確認(=ダイヤモンドを見つける)

(2)探す対象のデータを定義し集める(=適切な砂を見極めて集める)

(3)探し当てるための方法論や仮説を考える(=砂の中のどこからどうやって探し当てるか考える)

(4)その方法に沿って分析作業をする(=実際に砂の中から探す)

ここで、相対的に重要且つスキルや求められるのは(1)~(3)です。((4)のスキルは不要ということではありません)

一方で、右側が機械学習などを例とするデータサイエンスです。

ここでは、目の前にまず大量の砂や岩があります。そこに何が埋まっているのか、もっというと自分が何を探そうとしているかすら曖昧(決まっていない)です。

でも「きっと何かあるだろうから」その砂や岩を、ものすごい作業効率で見ていく必要があります。

そのまま見ていても良く分からないので、何か洗練されたアルゴリズムで、”カテゴリーに分類”していきます。

どうやってそのカテゴリーを決めるのか、はそのアルゴリズムが「良い」と思ったものに原則お任せです。その意味ではブラックボックスです。

でも何か良くわからないけど機械が「良い」という分類で砂や岩に含まれている成分や素材が整理されました。これを人が人力でやろうとすると効率的にも、人が当てはめられるアルゴリズムという観点からも手に負えません。

洗練された手法で分類はできるのですが、その先には問題があります。「はい、分類できましたよ」は良いのですが「で、これをどうするの?」に繋がらない可能性がある程度高いはずです。なぜなら、「何を目的に何が必要なのか」というゴールがそもそもない中で分析が走るケースが多いからです。

確かにこういった分析(データサイエンス)が、特にアカデミックな世界では必要とされることは十分理解できますし、その威力は確かにあります。そして、純粋に学問的には(私個人としては)面白いです。ただ、Practicalかと問われると、「YES」とは言えないところですね。

ですので、ハーバードという世界最高峰のプログラムでデータサイエンスを学んだ後も、私は迷わず図の左側(実務におけるデータ分析活用)を追求していくのです。


多くの企業とセミナーを実施して改めて実感する「データ分析を活用するために」必要なこと



 



私のゴールは「データやデータ分析をビジネスの業務で活用し、具体的な成果を出すこと」に尽きます。



その中で、ここ数年で、仕事でデータ分析を活用したい人の理解や意識にも若干の変化(気づき)が現れてきたと感じています。



 



かつては、がむしゃらに統計学の勉強をしたり、高度な分析手法に手を出したりして、成果を求める風潮もありました。具体的には、



 



統計学として:統計検定、標準誤差、重回帰分析、クラスター分析など



高度な分析手法として:R、Python、機械学習、BI (Business Intelligence)など



 



いずれも否定されるものではありません。ただしそれぞれの向かう方向が、



ビジネス実務におけるデータ分析活用



とは異なるという事実に注目すべきです。



特に、実務経験がない専門家は、この事実に気が付いていない人も多いと感じています。



 



統計学を学ぶのは、それをビジネス実務で使うのではなく、学問的に数学的にそれを応用したい(する必要がある)という限られた現場において有効です。ただし、一般の事業会社にてそれが求められる現場は、ほとんど皆無でしょう。1%の分析精度向上や統計理論よりも、優先される事項(時間や意思決定のしやすさ、相手への説得力、プレゼン力など)があるからです。



その中で、いくら「これは統計的に正しいんだ」と言っても、”お前は分かっていない”と言われてしまうのが落ちです。



 





高度な分析手法も、ほぼ同様のことが言えます。分析自体を主業務としている企業は別として、一般の事業会社ではそれを使いこなして成果に結びつけられるところは非常に限られます。また、最新のシステムを導入したものの、宝の持ち腐れとなり、結局そこから離れて行ったというケースも少なくありません。一方で、分析業務を請け負う会社の従業員としては、これらの知識やスキルが必要だと思いますし、それを外部委託しつつ、その結果をビジネスの根幹に使うという企業にとっても必要なスキルかもしれません。ただし、そのような企業は、一般事業会社としては限られる、というのがポイントです。



 



話を元に戻すと、「自業務で自らデータ分析を活かしたい」と考える非専門家が世の中の大多数を占めます。



その大多数の人たちがその目的を達成するために必要なのは、統計学を学ぶことでも、高度な分析手法を導入することでもなく、データ(分析)を扱う考え方やリテラシー、そして最低限の分析手法(スキル)だということに多くの人が気づき始めています。



 



そのため、多くの企業が、実践的なビジネスへの応用をプログラム化している”データサイエンティストではない”私の研修を取り入れて下さっています。結果として年間のレギュラープログラムとなっているところも少なくありません(傾向として大企業が多いです)。



 



これを裏付けるかのように、先日、データ分析専門家のエンジニア向けに書籍を多く出版している出版社の編集長から次のような相談を受けました。



「世の中に”データサイエンス学部”などが少しずつ生まれ、分析技術を学ぶエンジニアもいるのですが、彼らは一様に”この結果がビジネスには生かさるケースがない(少ない)”と悩んでいます。



実は彼らも、分析の世界と実ビジネスの世界に大きな隔たりがあることに気づいているものの、自分たちではそのギャップを埋める術を知らないのです。ある意味彼らがやっていることが”学問”として宙に浮いてしまっているんですよね」



 



学問として、そして先端技術としての統計や高度分析手法は、その目的に沿って、更に発展していくことと思います。そして、その道で世の中に貢献していくことでしょう。



同時に、それが一般企業の実務と直結するという期待や誤解が少しずつ解消し、本質的に何が必要なのかを多くの方が実感(認知)しつつある現状は望ましいことだと思います。



 



AI(人工知能)などの技術によって、考えなくともアルゴリズムを与えればできてしまう仕事は増えていくことでしょう。一方で、人が考えて付加価値を生み出す仕事は最後まで残ります。



「データ分析を活用する」ために、分析作業の部分は機械に任せればよいでしょう。



でも、



 ・何を目的と置くのか



 ・そのためにどんなデータ(指標)を使うのか



 ・出てきた結果をどう解釈して結論とするのか



 ・それを誰にどう伝えるか



といった、機械ではできない、人が大きく携わる部分のスキルが欠けています。



それを補うことができれば、あなたのチームや組織での「データ活用力」は各段に向上すると思います。



 


PAGE TOP