実務データ分析虎の巻Vol.60(相関分析のコツ~“風が吹けば桶屋が儲かる”の相関は厳しい)




 



 



相関分析は、2つのデータの間の関連性の強さを数字で示すものです。



顧客訪問数と売上など、何かしらの活用とその結果の相関を見ることで活動の効果や妥当性を確認できる優れものです。



 



しかし、相関分析において致命的となる、2つの関係の”距離“について言及していないことが多く見られます。



 



つまり、“風が吹く”ことと“桶屋が儲かる”ことには相関がありそうとは言えるものの、この2つの間には、いくつもの中間ステップが介在します。



この距離が大きなノイズになり、“風が吹くこと”により”桶屋が儲かる“ことになっても、それが相関として現れない可能性が出てきます。



 



相関関係を丁寧に確かめるには、2つの距離が近いもの同士を確かめることが大事です。まずは“風が吹く”ことと、すぐ次に影響を受ける“土ぼこりで目が悪い人が増える”こととの相関を見る必要があります。



 



こういう話は、データ分析の本には載っていません。“分析手法”とは別な話だからです。



 



でも実務で応用する場合、これを知らないと致命的な問題になります。



関連記事

  1. ITpro連載『データ活用に必須の課題分解術』第2回

  2. データ分析活用の基本コンセプト(機械がやる仕事 vs 人がやる仕事)

  3. 横浜国大での英語での授業ビデオを作成しました

  4. データ活用に必要なのは「統計」でも「データサイエンス」ではない、という話

  5. 日経XTech新連載『データ分析を阻む厄介な存在』第2回

  6. 【日経BP主催『課題解決のためのデータ分析入門』(9/23)】

PAGE TOP