実務データ分析虎の巻Vol.49 (分析者を悩ます係数の数々)
分析結果の信頼度や精度を評価する係数が、分析手法によって存在します。
例えば、
相関係数、決定係数、R-2乗値、P-値・・・・・
実は名前だけ見ると似ているのがかえって厄介です。
名前を見聞きしたり、何となくその意味を知っている人はいるのですが、これらの理解が中途半端であると、それぞれの意味するところをごちゃまぜに捉えていて、結果として正しくない結論を出してしまっている人に出会います。
「相関係数」 は相関(2つのデータの比例関係)度合を示します。
「決定係数(R-2乗値)」 は回帰分析で得られる式の当てはまり度合を示します。
回帰式の中の”傾き“と意味を混同している人も少なくありませんが、それは解釈が間違っています。
「P-値」 は統計検定の結論を評価するときの指標です。
ここでは更に詳細な説明は割愛しますが、是非これらを使う際には、再度書籍やネットでその意味するところを調べてみて下さい。
特に、名前が似ている他の係数との違いを対比しながら理解すると間違いが減ります。(もちろん、私の研修ではしっかりこれらを押さえます)
日常的に使い続けるものではないので、一度覚えても忘れてしまいがちだと思います。
尚更、使うときの再チェック(再理解)は重要ですね。