逻辑回归
逻辑回归的引入
考虑预测值 y 不再连续,而是离散值。这时候线性回归不再适用。
对于二分类问题y∈{0,1} ,不妨使得假设函数hθ(x) 预测p(y=1∣x),即x是种类y=1的概率
构造逻辑回归函数:
hθ(x)=g(z)=g(θx)=1+e−θx1
sigmoid 函数:
g(z)=1+e−z1
其导数
g(z)’=g(z)(1−g(z))
则p(y∣x)=hθ(x)y[1−hθ(x)]1−y
我们定义:
if hθ(x)>=0.5,y=1else y=0
进而问题转化为
z>=0=>y=1
z<0=>y=0
代价函数
J(θ)=−m1∑yilnhθ(x)+(1−yi)ln(1−hθ(x))
可由极大似然估计推导得到
L(θ)=∏i=1mp(yi∣xi)
lnL(θ)=∑i=1myilnhθ(x)+(1−yi)ln(1−hθ(x))
极大似然求极大,而损失函数求极小,在似然函数前去负号 + 求个平均就得到了损失函数
对θ 求偏导:
αθαJi=−[hθ(xi)yig(θx)(1−g(θxi))xi+(−1)1−hθ(xi)1−yig(θxi)(1−g(θxi))xi]=−(yi−g(θxi))xi=−(yi−hθ(x))xi
与线性回归的偏导形式一样,具体原因参考CS229指数族部分讲解