実務データ分析虎の巻Vol.60(相関分析のコツ~“風が吹けば桶屋が儲かる”の相関は厳しい)




 



 



相関分析は、2つのデータの間の関連性の強さを数字で示すものです。



顧客訪問数と売上など、何かしらの活用とその結果の相関を見ることで活動の効果や妥当性を確認できる優れものです。



 



しかし、相関分析において致命的となる、2つの関係の”距離“について言及していないことが多く見られます。



 



つまり、“風が吹く”ことと“桶屋が儲かる”ことには相関がありそうとは言えるものの、この2つの間には、いくつもの中間ステップが介在します。



この距離が大きなノイズになり、“風が吹くこと”により”桶屋が儲かる“ことになっても、それが相関として現れない可能性が出てきます。



 



相関関係を丁寧に確かめるには、2つの距離が近いもの同士を確かめることが大事です。まずは“風が吹く”ことと、すぐ次に影響を受ける“土ぼこりで目が悪い人が増える”こととの相関を見る必要があります。



 



こういう話は、データ分析の本には載っていません。“分析手法”とは別な話だからです。



 



でも実務で応用する場合、これを知らないと致命的な問題になります。



関連記事

  1. オンライン講座/研修への受講者の声を紹介します

  2. Data&Story's English page is now open! データ&ストーリーの英語ページがオープン

  3. PRESIDENTムックに寄稿掲載『統計学ではわからないデータの使い方』

  4. 3/16 産学官連携シンポジウム「KYOTO AI(きょうと あい) × ビッグデータ」で登壇

  5. 「日経情報ストラテジー」連載最終回はこちら!

  6. 実務データ分析虎の巻Vol.35(統計的精度はどこまで必要か)

PAGE TOP