実務データ分析虎の巻Vol.61(回帰分析の「R-2乗値」について)

 

 

2つのデータ間の関係を数式化する方法に、「回帰分析」と呼ばれるものがあります。そのアウトプットは例えば、

 

 売上額(円)=52.9 × ウェブサイト訪問数(回)+ 357,000

 

のようなものです。

 

数式への元データの当てはまり度合を「R-2乗値」と呼ぶ指標で示します。

 

元のデータが数式から乖離するほど、R-2乗値は小さい値を取ります。

ところが残念ながら、“XX以上なら数式をOKとみなす”という分かりやすい公式目安は存在しません。

 

”ルール“を欲しがる人は、客観的な評価ができないことに不安を覚え、真面目な分析家ほど、この指標を0.01でも高くする努力をします。

 

ただ、これだと実践の場では単に時間を浪費する結果になるかもしれません。

現実的には、限られたデータだけで勝負せざるを得ず、仮にR-2乗値が低くても(=精度が低くても)それを使って結論を出すか、データを使うことを諦めるかといった二者択一に迫られるケースが少なくありません。

 

その場合、分析精度が低いことを受け入れ、それでもデータが示すことを活用するという”柔軟な“対応が求められるのです。

 

分析者が自分の腹を括る瞬間といってもよいでしょう。

関連記事

  1. 実務データ分析虎の巻Vol. 15(動画公開)データから情報を絞り出す…

  2. 実務データ分析虎の巻Vol.10(「全てのデータを使用」でも結論を見誤…

  3. 実務データ分析虎の巻Vol.50 (課題指標と分析データはマッチしてい…

  4. 実務データ分析虎の巻Vol.26(仮説の作り方)

  5. 実務データ分析虎の巻Vol.2(組織の中で分析の納得性を高めるもの)

  6. 実務データ分析虎の巻Vol.23(「アンケート結果を平均で比較する」を…

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

CAPTCHA


PAGE TOP