ここでも注意!「相関と因果関係」の問題


「相関」があっても「因果関係」があるとは限らない



 



分析結果は出せても、その解釈次第で間違った結論を導いてしまうことがあります。



身近なものには「相関」と「因果関係」の問題があります。



「相関」は2つのデータの動き(増減)が同時に起こることを指します。でも、どちらが原因でどちらが結果として増減が起こるのか、までは分かりません。そのため、相関分析の結果を見て、因果関係を結論とするときには人の解釈が入ってしまうのです。せっかく客観的なデータというものを使ったにもかかわらず、最後の最後で人の解釈(つまり主観や思い込み)が入ってしまいがちです。



 



現在、新潟県燕市役所で行っている「健康増進をデータ分析で」プロジェクトで扱ったデータの一部です。



例えば、55歳以上を見てみましょう。縦軸は何かしらの運動をしている人の割合です。



すると、運動をしている方が体調が良い(横軸)という傾向が見られます。



でもこの結果をどう解釈すると良いのでしょうか。



普通に考えると「やはり運動は健康に良い」となるでしょうか。この場合、「運動」が原因で「健康」が結果ですね。



 



ちょっと考えてみてください。その逆は成り立ちませんでしょうか?



 



55歳以上となると、体が健康でないと「運動でもしようか」という状況や気分にならないと想定したらどうでしょう?



つまり、「体調が良い」が(原因)で、「運動をする」は(結果)ということになります。



それでも同じ結果になるはずです。でもこのデータ(結果)からはそのどちらなのかはわからないのです。(他の調査が必要です)



 



このように、同じデータ分析結果でも、それをどのように解釈するかは、人の問題が入り込む厄介なものです。



その問題を知っていると、そこに注意が払われます。くれぐれも自信満々に間違った結論をデータと供に提示しないように。



 



関連記事

  1. BizZine連載(「根拠さえ示せばロジックは盤石」は本当か?)

  2. 日経BP主催『課題解決のためのデータ分析入門』(2020/1/31)

  3. 「Excelで学ぶ意思決定論」韓国語版が発売!

  4. ベトナム版『それちょっと、数字で説明してくれる?』本発売!

  5. 新刊『武器としてのデータ活用術』見本が届きました

  6. 3/10『データ活用最前線2017』基調講演に登壇致します!

PAGE TOP