実務データ分析虎の巻Vol.65(相関分析がうまくできない原因)


相関分析がうまくできない原因

データとデータの間のつながり(関連性)の強さの度合示す分析が相関分析です。

使った広告宣伝費“と”集客数“のつながりが確認できれば、広告宣伝活動は集客という成果につながっている(=効果がある)ことが分かりますね。

 ところが実践で使おうとすると、この相関関係を見つけることは思ったほど簡単でないことに気づきます。

理由は様々ですが、例えば・・・

 

(1)  使うデータに複数の要素が混在している

「ある製品」ではなく「全製品」の売上データのほうが、ノイズが多いため相関が出にくい傾向があります。

より具体的に絞り込んだデータを使ってみましょう。

 

(2)  2つのデータに距離がある

できるだけ関係性が近いデータのほうが相関が出やすい傾向があります。

広告宣伝費と利益額の相関(この間には集客、売上、コストなど他の要素が介在してノイズとなります)よりも、広告宣伝費と来店者のほうが、両者間のノイズが少ないですね。

 

こういった実践的なコツや目の付け所は、データ分析の本には載っていません。

自ら実践した上での工夫点と言えるでしょうか。

うまく結果がでなくて困る場合には、是非思い出してみてください。


関連記事

  1. 9周年を迎えました!

  2. 全国の地方自治体職員向けに「データ分析活用」研修を実施(@JIAM)

  3. 企業研修アンケートでよく頂く声

  4. 東洋経済での3日間『実践!戦略的データ分析活用講座』の受講者コメント

  5. 翔泳社主催『「データ分析」×「ロジカルシンキング」基礎演習・講座』(8/23)

  6. 『行政&情報システム』で、地方自治体のデータ活用スキル特集記事を書きました!

PAGE TOP