実務データ分析虎の巻Vol.74(「相関のある/なし」だけではありません)
2つのデータの間の直線的(比例)関係の強さを示す分析が相関分析です。相関分析を学ぶとまずは2つのデータ(例えば売上と来店客数など)を散布図上の縦軸、横軸に取り、いかに直線(相関)関係に近いかを確認します。
2つのデータの間の直線的(比例)関係の強さを示す分析が相関分析です。相関分析を学ぶとまずは2つのデータ(例えば売上と来店客数など)を散布図上の縦軸、横軸に取り、いかに直線(相関)関係に近いかを確認します。
当たり前のことを「知っている」、「頭で理解している」ことと、「実践して成果を出せる」ことには大きな開きがあります。後者ができることには非常に高い価値があると感じています。そして、それは多くの人がまだできていません。
これって”結果論” ⇒ “方策”になっていませんか?
地方自治体などを中心に、『自業務で「データ分析」を活かし示唆を得る』ことの難しさと方法を”練習“するプログラムが効果を発揮しています。
仕事での「考える」には大きく2種類あります。ところがこれがあまり意識されていない故に、「考える」人材やスキルが正しく育成されていない現場によく出くわします。
その2つとは、次の2つです。
企業研修の中で時々次のような質問を受けることがあります:
「最初から結論有りきで、恣意的なデータで恣意的な分析をしなければいけないときはどうしたら良いのですか?」
財務省での問題と同じ状況ですね。サラリーマンだった私にもよく分かります。
でもここは「データ分析でこれを解決できる」期待は捨てたほうが良さそうです。
簡易に判別する方法の一つが、ヒストグラムです。縦軸にデータの数、横軸にデータの値(の幅)を取り、データの分布の形を棒グラフで可視化します。
くれぐれも職場のアンケート結果から「コミュニケーション不足」の割合が多いことを取り上げて“データによって要因が特定”などとされないように。
実務やデータ分析の世界には、多くの人の認識に反して、絶対的な正解など存在しないのです。しかも、仮説段階では、自分なりの根拠で、その切り口を自由に想定していいので、理論的にはその段階で「難しい」
という発想は出てこないはずなのです。100%の正解とのギャップを意識始めた途端、「難しい」と感じるようです。
データとデータの間のつながり(関連性)の強さの度合示す分析が相関分析です。”使った広告宣伝費“と”集客数“のつながりが確認できれば、広告宣伝活動は集客という成果につながっている(=効果がある)こと
が分かりますね。