やり方や理論だけでは突破できない、データ分析実務応用の例(相関)
データ分析の手法は、その操作法や読み方、統計的理論を理解しただけでは、そのまますぐに実務の成果に直結しません。
恐らく、数回自分の仕事に応用しようと試したことがある人は誰でも気づくと思います。
「なんだか思ったように答えが出せない」 と。。。
それもそのはず、実際にやろうとすると、かなり泥臭い壁に何度もぶち当たるからです。
ケースによってその中身は多様ですが、相関分析について一例を挙げると次のようなものがあります。
こういった「壁の超え方」は、この相関分析だけに限ったものではありません。発想としては他の分析やデータ処理にも当てはまります。データ分析をがっつりと実務でやっている人は、長年のトライアンドエラーによって、これらの勘所が身についていますが、それを体系化、言語化して伝えるのは容易ではありません。そもそもその全てを表現しようとするのは、
「サッカーのPKでどのように蹴ればゴールできるのか」
の全てのパターンを言語化、表現しようとするのと同じで、現実的ではありません。
「キーパーの立ち位置とその日のコンディションによる」となってしまうからです。
とはいえ、”よくある”ケースというのは存在します。例として、次の2つを紹介致します:
(1)扱うデータの中にたくさんの要素が入っていて特徴がデータに現れにくい(故に、分析結果も明確なものが出にくい)
男女両方のデータ、全国全支店のデータなどを一括りにして分析に掛けると、いろいろな要素がお互いの特徴をかき消してしまい、分析結果が得られにくくなります。
(2)遠い関係のデータを扱う
相関分析とは、2つのデータ間の関係性の強さを調べるものです。TVコマーシャルの頻度と、イベント会場への入場者の関係を調べたとします。確かに、TVコマーシャルは入場者を増やすために打っているのですが、その2つの間には、例えば「認知されること」「ネットで検索されること」などのプロセスが入り、その結果として入場者が増えるのかもしれません。
このように、途中にいくつもの層(プロセスや項目、指標)が入る場合、それだけ両端のデータの関係性にはノイズが入りやすくなります。その結果、クリアな分析結果が出ないのです。
こういったことは、統計学のテキストにもデータ分析の本にも載っていません。ただし、これらをクリアーしないと実務での成果に活用するまでの道のりは長いものとなります。
私は、これを「分析デザイン」の一部だと考えています。
そして、データ分析を活用して、ビジネスや行政などで成果を出すには、分析手法云々よりも、この「分析デザイン」のスキルが8~9割を占めると確信しています(実務家として)。
私の研修やセミナーでは、データ分析のやり方はもちろんですが、この「分析デザイン」に比重をより置いて、”使える”ことを最重視しています。
是非ご体験ください。