実務データ分析虎の巻Vol.65(相関分析がうまくできない原因)


相関分析がうまくできない原因

データとデータの間のつながり(関連性)の強さの度合示す分析が相関分析です。

使った広告宣伝費“と”集客数“のつながりが確認できれば、広告宣伝活動は集客という成果につながっている(=効果がある)ことが分かりますね。

 ところが実践で使おうとすると、この相関関係を見つけることは思ったほど簡単でないことに気づきます。

理由は様々ですが、例えば・・・

 

(1)  使うデータに複数の要素が混在している

「ある製品」ではなく「全製品」の売上データのほうが、ノイズが多いため相関が出にくい傾向があります。

より具体的に絞り込んだデータを使ってみましょう。

 

(2)  2つのデータに距離がある

できるだけ関係性が近いデータのほうが相関が出やすい傾向があります。

広告宣伝費と利益額の相関(この間には集客、売上、コストなど他の要素が介在してノイズとなります)よりも、広告宣伝費と来店者のほうが、両者間のノイズが少ないですね。

 

こういった実践的なコツや目の付け所は、データ分析の本には載っていません。

自ら実践した上での工夫点と言えるでしょうか。

うまく結果がでなくて困る場合には、是非思い出してみてください。


関連記事

  1. オンライン連載『そもそもデータから答えなんて出てこない』

  2. 9/4 日経BP『課題解決のためのデータ分析入門』セミナーやります!

  3. 横浜国大での「ビジネスデータ分析」授業の一部動画(日本語版)

  4. 海外版の著作にサインさせてもらいました(横国)

  5. クルマ情報誌「Goo10月号」に寄稿しています!

  6. 日経BP主催 2大セミナーのご案内!(9/4と10/1)

PAGE TOP