実務データ分析虎の巻Vol.65(相関分析がうまくできない原因)


相関分析がうまくできない原因

データとデータの間のつながり(関連性)の強さの度合示す分析が相関分析です。

使った広告宣伝費“と”集客数“のつながりが確認できれば、広告宣伝活動は集客という成果につながっている(=効果がある)ことが分かりますね。

 ところが実践で使おうとすると、この相関関係を見つけることは思ったほど簡単でないことに気づきます。

理由は様々ですが、例えば・・・

 

(1)  使うデータに複数の要素が混在している

「ある製品」ではなく「全製品」の売上データのほうが、ノイズが多いため相関が出にくい傾向があります。

より具体的に絞り込んだデータを使ってみましょう。

 

(2)  2つのデータに距離がある

できるだけ関係性が近いデータのほうが相関が出やすい傾向があります。

広告宣伝費と利益額の相関(この間には集客、売上、コストなど他の要素が介在してノイズとなります)よりも、広告宣伝費と来店者のほうが、両者間のノイズが少ないですね。

 

こういった実践的なコツや目の付け所は、データ分析の本には載っていません。

自ら実践した上での工夫点と言えるでしょうか。

うまく結果がでなくて困る場合には、是非思い出してみてください。


関連記事

  1. (7/5)日経BP主催『課題解決のためのデータ分析入門』セミナー開催です

  2. 実務データ分析虎の巻Vol.33(考える順番が真逆です)

  3. バラつきの推移から「国内新型コロナ感染拡大」を示す

  4. 東洋経済主催『実践!データ分析活用講座<2日間>』(3/3, 3/11)

  5. (Yahoo! News寄稿)アンケート結果をどう料理するか

  6. 7~8月のデータ分析活用オープンセミナーのご案内

PAGE TOP