相関分析は、2つのデータの間の関連性の強さを数字で示すものです。
顧客訪問数と売上など、何かしらの活用とその結果の相関を見ることで活動の効果や妥当性を確認できる優れものです。
しかし、相関分析において致命的となる、2つの関係の”距離“について言及していないことが多く見られます。
つまり、“風が吹く”ことと“桶屋が儲かる”ことには相関がありそうとは言えるものの、この2つの間には、いくつもの中間ステップが介在します。
この距離が大きなノイズになり、“風が吹くこと”により”桶屋が儲かる“ことになっても、それが相関として現れない可能性が出てきます。
相関関係を丁寧に確かめるには、2つの距離が近いもの同士を確かめることが大事です。まずは“風が吹く”ことと、すぐ次に影響を受ける“土ぼこりで目が悪い人が増える”こととの相関を見る必要があります。
こういう話は、データ分析の本には載っていません。“分析手法”とは別な話だからです。
でも実務で応用する場合、これを知らないと致命的な問題になります。