実務データ分析虎の巻Vol.44 (分析精度へのこだわりはどこまで必要?)


分析精度へのこだわりはどこまで必要?





 



 



分析結果の精度に関するお悩みを耳にすることがあります。



例えば、「(複数の変数を用いる)重回帰分析と、(一つの変数だけを用いる)単回帰分析とでは得られる結果が違う。その結果や精度の違いはどう考えるべきか」といった内容です。



 



もちろん、その他の条件が全て同じであれば、より精度が高い分析のほうが良いに決まっています。



ところが、分析手法がより複雑になるにつれ、分析者の裁量部分が増え、同じデータでも分析者により結果が違うことが生じます。



分析が単調なほど「誰がやっても同じ」結果を得られる傾向があります。



 



このため、先の重回帰分析と単回帰分析の結果の違いが、分析者の裁量部分による違いからなのか、分析精度によるものなのかは厳密に切り分けることができません。分析手法としては高度なものだが分析者の属人的要素に頼る結果で良しとするか、単調であっても再現性の高い結果を良しとするか、の違いとも言い換えられます。



 



また、仮に分析手法をより高度なものにして、過去のデータをより精度高く表現できたとしても、実際に将来起こることと分析結果との”ブレ“幅のほうが、分析手法の違いによる過去のデータの読み方の精度の”ブレ“を大きく上回るのではないかとすら私は考えています。



つまり「過去のデータを読み解くことに本当にそこまで精度にこだわる必要はあるのか」を一度冷静に考えてみるべきかと。



 



私の今のところの結論は、上記2点から、誰でも分かり易く人によるブレが少ない単調(分析精度としては低くとも)なものが実務分析者には良いのでは、という結論です。



関連記事

  1. 【残席僅か】5/8『「データ分析」×「ロジカルシンキング」セミナーby 翔泳社』

  2. Note記事【「問いを立てること」の重要さ】

  3. 地方創生!RESASフォーラム2017の講演動画 公開です

  4. 日経XTech新連載『データ分析を阻む厄介な存在』第2回

  5. イベント収録『「データマネジメントを考える1日」』11/24無料公開

  6. Bizzine連載「課題を特定するためのロジカルデータ分析の秘訣は「データの範囲」と「絞り込み比較」」

PAGE TOP