ロジスティック回帰分析(その1)

ロジスティック回帰分析とは発生確率を予測する手法。

基本的な考え方は線形回帰分析と同じだが、予測結果が0~1の値を取る。

0%(0.00)~100%(1.00)のような確率で予測を行う場合に有意な手法。

 

Rではglm()で以下のように実行できる

ans = glm(Y~X1+X2+・・・Xn, data=DATA, family=binomial(link="logit"))

summary(ans)

 

線形解析分析と同様に解析結果は β0+β1*X1+β2*X2・・・βn*Xnの形になりますが、推測値として0~1の範囲内に収まる確率値を得るために対数をとり、以下の式になります。

log(Y/(1-Y)) = β0+β1*X1+β2*X2・・・βn*Xn

ここでYは目的変数が発生する確率であり1-Yは発生しない確率を意味します。

分解すると

t=β0+β1*X1+β2*X2・・・βn*Xn

log(Y/(1-Y)) = t

Y/(Y-1) = exp(t)

et = exp(t)

Y = et /(1+et)

となります。