
実務データ分析虎の巻Vol.68(データの違いを山の形で見つける)
簡易に判別する方法の一つが、ヒストグラムです。縦軸にデータの数、横軸にデータの値(の幅)を取り、データの分布の形を棒グラフで可視化します。
簡易に判別する方法の一つが、ヒストグラムです。縦軸にデータの数、横軸にデータの値(の幅)を取り、データの分布の形を棒グラフで可視化します。
くれぐれも職場のアンケート結果から「コミュニケーション不足」の割合が多いことを取り上げて“データによって要因が特定”などとされないように。
実務やデータ分析の世界には、多くの人の認識に反して、絶対的な正解など存在しないのです。しかも、仮説段階では、自分なりの根拠で、その切り口を自由に想定していいので、理論的にはその段階で「難しい」
という発想は出てこないはずなのです。100%の正解とのギャップを意識始めた途端、「難しい」と感じるようです。
データとデータの間のつながり(関連性)の強さの度合示す分析が相関分析です。”使った広告宣伝費“と”集客数“のつながりが確認できれば、広告宣伝活動は集客という成果につながっている(=効果がある)こと
が分かりますね。
「分析しても思ったような結果が得られない」このよくあるお悩みの原因の一つは、分析そのものではなくその前段階にあったりします。
いつも見ているグラフや表など、データを使ったアウトプットや指標はたくさんあると思います。是非再度その一つ一つをご覧頂きたいと思います。
そして、それぞれに対して「それ知ってどうするの?」と自分に問いかけてみてください。
「お客様の満足」は大切なことではありますが、一体それを知ることや 向上させることは何のためか、十分具体的に把握できているでしょうか?
回帰分析の「R-2乗値」について。現実的には、限られたデータだけで勝負せざるを得ず、仮にR-2乗値が低くても(=精度が低くても)それを使って結論を出すか、データを使うことを諦めるかといった二者択一に迫られるケースが少なくありません。
相関分析において致命的となる、2つの関係の”距離“について言及していないことが多く見られます。
「業務でデータ分析する機会がない」という人がいるが、「じゃあ君これを分析してね」が降りて来るのを待っていると一生そんな機会は来ない。自分で機会を作るのです。「業務でデータ分析する機会がない」という人がいるが、「じゃあ君これを分析してね」が降りて来るのを待っていると一生そんな機会は来ない。自分で機会を作るのです。