相関分析がうまくできない原因
データとデータの間のつながり(関連性)の強さの度合示す分析が相関分析です。
”使った広告宣伝費“と”集客数“のつながりが確認できれば、広告宣伝活動は集客という成果につながっている(=効果がある)ことが分かりますね。
ところが実践で使おうとすると、この相関関係を見つけることは思ったほど簡単でないことに気づきます。
理由は様々ですが、例えば・・・
(1) 使うデータに複数の要素が混在している
「ある製品」ではなく「全製品」の売上データのほうが、ノイズが多いため相関が出にくい傾向があります。
より具体的に絞り込んだデータを使ってみましょう。
(2) 2つのデータに距離がある
できるだけ関係性が近いデータのほうが相関が出やすい傾向があります。
広告宣伝費と利益額の相関(この間には集客、売上、コストなど他の要素が介在してノイズとなります)よりも、広告宣伝費と来店者のほうが、両者間のノイズが少ないですね。
こういった実践的なコツや目の付け所は、データ分析の本には載っていません。
自ら実践した上での工夫点と言えるでしょうか。
うまく結果がでなくて困る場合には、是非思い出してみてください。