「相関」があっても「因果関係」があるとは限らない
分析結果は出せても、その解釈次第で間違った結論を導いてしまうことがあります。
身近なものには「相関」と「因果関係」の問題があります。
「相関」は2つのデータの動き(増減)が同時に起こることを指します。でも、どちらが原因でどちらが結果として増減が起こるのか、までは分かりません。そのため、相関分析の結果を見て、因果関係を結論とするときには人の解釈が入ってしまうのです。せっかく客観的なデータというものを使ったにもかかわらず、最後の最後で人の解釈(つまり主観や思い込み)が入ってしまいがちです。
現在、新潟県燕市役所で行っている「健康増進をデータ分析で」プロジェクトで扱ったデータの一部です。
例えば、55歳以上を見てみましょう。縦軸は何かしらの運動をしている人の割合です。
すると、運動をしている方が体調が良い(横軸)という傾向が見られます。
でもこの結果をどう解釈すると良いのでしょうか。
普通に考えると「やはり運動は健康に良い」となるでしょうか。この場合、「運動」が原因で「健康」が結果ですね。
ちょっと考えてみてください。その逆は成り立ちませんでしょうか?
55歳以上となると、体が健康でないと「運動でもしようか」という状況や気分にならないと想定したらどうでしょう?
つまり、「体調が良い」が(原因)で、「運動をする」は(結果)ということになります。
それでも同じ結果になるはずです。でもこのデータ(結果)からはそのどちらなのかはわからないのです。(他の調査が必要です)
このように、同じデータ分析結果でも、それをどのように解釈するかは、人の問題が入り込む厄介なものです。
その問題を知っていると、そこに注意が払われます。くれぐれも自信満々に間違った結論をデータと供に提示しないように。