ロジスティック回帰分析(その1)
ロジスティック回帰分析とは発生確率を予測する手法。
基本的な考え方は線形回帰分析と同じだが、予測結果が0~1の値を取る。
0%(0.00)~100%(1.00)のような確率で予測を行う場合に有意な手法。
Rではglm()で以下のように実行できる
ans = glm(Y~X1+X2+・・・Xn, data=DATA, family=binomial(link="logit"))
summary(ans)
線形解析分析と同様に解析結果は β0+β1*X1+β2*X2・・・βn*Xnの形になりますが、推測値として0~1の範囲内に収まる確率値を得るために対数をとり、以下の式になります。
log(Y/(1-Y)) = β0+β1*X1+β2*X2・・・βn*Xn
ここでYは目的変数が発生する確率であり1-Yは発生しない確率を意味します。
分解すると
t=β0+β1*X1+β2*X2・・・βn*Xn
log(Y/(1-Y)) = t
Y/(Y-1) = exp(t)
et = exp(t)
Y = et /(1+et)
となります。