実務データ分析虎の巻Vol.61(回帰分析の「R-2乗値」について)




 



 



2つのデータ間の関係を数式化する方法に、「回帰分析」と呼ばれるものがあります。そのアウトプットは例えば、



 



 売上額(円)=52.9 × ウェブサイト訪問数(回)+ 357,000



 



のようなものです。



 



数式への元データの当てはまり度合を「R-2乗値」と呼ぶ指標で示します。



 



元のデータが数式から乖離するほど、R-2乗値は小さい値を取ります。



ところが残念ながら、“XX以上なら数式をOKとみなす”という分かりやすい公式目安は存在しません。



 



”ルール“を欲しがる人は、客観的な評価ができないことに不安を覚え、真面目な分析家ほど、この指標を0.01でも高くする努力をします。



 



ただ、これだと実践の場では単に時間を浪費する結果になるかもしれません。



現実的には、限られたデータだけで勝負せざるを得ず、仮にR-2乗値が低くても(=精度が低くても)それを使って結論を出すか、データを使うことを諦めるかといった二者択一に迫られるケースが少なくありません。



 



その場合、分析精度が低いことを受け入れ、それでもデータが示すことを活用するという”柔軟な“対応が求められるのです。



 



分析者が自分の腹を括る瞬間といってもよいでしょう。



関連記事

  1. 1/27 日経BP主催『仮説立案実践講座』 再開催決定!

  2. 【受講者1300名突破】Udemy 『実務直結”データを活かした”戦略的ストーリーメイキング講座』

  3. 7/12 【第13回】「データ分析」×「ロジカルシンキング」基礎演習・講座

  4. 8/26 【第9回】「データ分析」×「ロジカルシンキング」基礎演習・講座~実務課題とデータ分析をつなげる思考法~

  5. 徳島県立富岡西高校で「データを活用したストーリー作り」発表会

  6. 翔泳社主催『実務で成果を出す、5つの「データ活用力」養成講座【オンライン】』(2/7)

PAGE TOP