複数のデータを比較して違いを探すことから、「課題のポイント」を見つけることがデータ分析の第一歩です。
2~3種類のデータであれば単純にそれぞれを比較すればよいのですが、数が増えるとそれも難しくなります。
そのような場合、「全体の標準(普通)」と比べて差が大きいものをあぶり出すことが有効です。全体の標準には”平均“などを使うことが多いでしょう。
先日、亜細亜大で行ったワークショップで、学生の一人が、全球団の平均年間ホームラン数と、その年の優勝チームのホームラン数に違いがあるのか、つまり、ホームランは優勝の重要要素なのかをデータを使って調べようとしました。
この場合、「全球団の平均数」を”普通“と考え、優勝チームの数をそれと比較することで、差異が見つかるかもという仮説を持ったわけです。
結果は「ホームラン数は必ずしも優勝の要因とはならない」ということでした