実務データ分析虎の巻Vol.65(相関分析がうまくできない原因)


相関分析がうまくできない原因

データとデータの間のつながり(関連性)の強さの度合示す分析が相関分析です。

使った広告宣伝費“と”集客数“のつながりが確認できれば、広告宣伝活動は集客という成果につながっている(=効果がある)ことが分かりますね。

 ところが実践で使おうとすると、この相関関係を見つけることは思ったほど簡単でないことに気づきます。

理由は様々ですが、例えば・・・

 

(1)  使うデータに複数の要素が混在している

「ある製品」ではなく「全製品」の売上データのほうが、ノイズが多いため相関が出にくい傾向があります。

より具体的に絞り込んだデータを使ってみましょう。

 

(2)  2つのデータに距離がある

できるだけ関係性が近いデータのほうが相関が出やすい傾向があります。

広告宣伝費と利益額の相関(この間には集客、売上、コストなど他の要素が介在してノイズとなります)よりも、広告宣伝費と来店者のほうが、両者間のノイズが少ないですね。

 

こういった実践的なコツや目の付け所は、データ分析の本には載っていません。

自ら実践した上での工夫点と言えるでしょうか。

うまく結果がでなくて困る場合には、是非思い出してみてください。


関連記事

  1. なぜ意味のない「グラフや表」が大量生産されるのか-分析前にすべきこと(Biz/Zineオンライン連載#2)

  2. 新刊のタイトル決定!『結局、仮説で決まる。』(日本実業出版社)

  3. 実務データ分析活用スキルアップに必要なコンテンツ

  4. 長岡市「行政のためのデータ活用」講演を行いました

  5. データ分析、データサイエンス、ビッグデータの関係は「家具作り」にあり

  6. 中国語版『日産で学んだ 世界で活躍するためのデータ分析の教科書』が発売!

PAGE TOP