実務データ分析虎の巻Vol.65(相関分析がうまくできない原因)


相関分析がうまくできない原因

データとデータの間のつながり(関連性)の強さの度合示す分析が相関分析です。

使った広告宣伝費“と”集客数“のつながりが確認できれば、広告宣伝活動は集客という成果につながっている(=効果がある)ことが分かりますね。

 ところが実践で使おうとすると、この相関関係を見つけることは思ったほど簡単でないことに気づきます。

理由は様々ですが、例えば・・・

 

(1)  使うデータに複数の要素が混在している

「ある製品」ではなく「全製品」の売上データのほうが、ノイズが多いため相関が出にくい傾向があります。

より具体的に絞り込んだデータを使ってみましょう。

 

(2)  2つのデータに距離がある

できるだけ関係性が近いデータのほうが相関が出やすい傾向があります。

広告宣伝費と利益額の相関(この間には集客、売上、コストなど他の要素が介在してノイズとなります)よりも、広告宣伝費と来店者のほうが、両者間のノイズが少ないですね。

 

こういった実践的なコツや目の付け所は、データ分析の本には載っていません。

自ら実践した上での工夫点と言えるでしょうか。

うまく結果がでなくて困る場合には、是非思い出してみてください。


関連記事

  1. ITPro連載『データ活用に必須の課題分解術』第5回が掲載されました!

  2. 明日発売『週刊ダイヤモンド3/4号』特集記事書いています。

  3. 新潟県燕市役所での行政課題データ活用プロジェクト発表会

  4. 行政でのデータ活用プロジェクトの紹介(新潟県燕市役所)

  5. 実務データ分析虎の巻Vol.92~「データ分析」にある誤解を図にすると

  6. 【再掲】7/22 日経BP主催 大人気「仮説立案実践講座」実施します!

PAGE TOP