2018年07月20日

決定係数とモデル適合度

〇決定係数とは?

決定係数とは、分散説明率とも言い、R²(SSy^/SSy)で表されます。

独立変数が従属変数(の分散)をどれだけよく予測あるいは説明するかを評価する指標で、0~1の範囲で表されます。

ーーーーーーーーー

例えば、R²=0.4のときを考えてみましょう。
(xを独立変数、yを従属変数、eを誤差とおく回帰分析を考える)

x1→y←e

x2⤴

R²=0.4のとき、x1,x2はyを4%しか説明できておらず、yを説明するには他の変数が必要だと考えられます。

このとき、eは96%(100%-4%)です。

ーーーーーーーーー
〇モデル適合度とは?

決定係数とよく混合されるのが、モデルの適合度です。

しかし、決定係数とモデルの適合度は、全く異なる話になります。

先ほどの例だと、決定係数は0.4でモデル適合は100%、という可能性もありえます。

モデル適合度とは、少ない変数でどれだけ多くの情報量を持っているのかという割合

と考えると理解しやすいかと思います。

20の変数で80%のモデル適合を示すより、

3つで70%のモデル適合を示す方が、モデル適合度を表す基準(赤池情報量基準:AIC)は高くなります。

言い換えると、

全ての変数にパスが引かれている状態(飽和モデル)から、どのパスを消しても良いか、をみる指標でもあります。

ーーーーーーーーー
〇モデル適合度の数値の見方

モデル適合度を評価する指標はいくつかあります。

論文では、代表的な指標を複数提示し、そのどの指標もモデル適合度が良い、という風に報告する必要があります。

例えば、
GFIは、0.9を超えることが望ましいとされています。

ーーーーーーーーー
〇まとめ

決定係数とモデル適合度は異なる指標なので、混合しないようにしましょう。

スポンサーリンク


posted by アリシス at 20:18| Comment(0) | 統計学 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
コチラをクリックしてください