【机器学习】ML判定边界

Lani ·
更新时间:2024-09-20
· 930 次阅读

在逻辑回归中,我们预测:

当hθ(x)>=0.5{h_\theta}\left( x \right)>=0.5hθ​(x)>=0.5时,预测 y=1y=1y=1。

当hθ(x)<0.5{h_\theta}\left( x \right)<0.5hθ​(x)<0.5时,预测 y=0y=0y=0 。

根据上面绘制出的 S 形函数图像,我们知道当

z=0z=0z=0 时 g(z)=0.5g(z)=0.5g(z)=0.5

z>0z>0z>0 时 g(z)>0.5g(z)>0.5g(z)>0.5

z<0z<0z<0 时 g(z)<0.5g(z)<0.5g(z)<0.5

又 z=θTxz={\theta^{T}}xz=θTx ,即:
θTx>=0{\theta^{T}}x>=0θTx>=0 时,预测 y=1y=1y=1
θTx<0{\theta^{T}}x<0θTx<0 时,预测 y=0y=0y=0

现在假设我们有一个模型:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-18HIdgr3-1576586853606)(…/images/58d098bbb415f2c3797a63bd870c3b8f.png)]

并且参数θ\thetaθ 是向量[-3 1 1]。 则当−3+x1+x2≥0-3+{x_1}+{x_2} \geq 0−3+x1​+x2​≥0,即x1+x2≥3{x_1}+{x_2} \geq 3x1​+x2​≥3时,模型将预测 y=1y=1y=1。
我们可以绘制直线x1+x2=3{x_1}+{x_2} = 3x1​+x2​=3,这条线便是我们模型的分界线,将预测为1的区域和预测为 0的区域分隔开。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-N8qx0URA-1576586853607)(…/images/f71fb6102e1ceb616314499a027336dc.jpg)]

假使我们的数据呈现这样的分布情况,怎样的模型才能适合呢?

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-m63wlWaY-1576586853608)(…/images/197d605aa74bee1556720ea248bab182.jpg)]

因为需要用曲线才能分隔 y=0y=0y=0 的区域和 y=1y=1y=1 的区域,我们需要二次方特征:hθ(x)=g(θ0+θ1x1+θ2x2+θ3x12+θ4x22){h_\theta}\left( x \right)=g\left( {\theta_0}+{\theta_1}{x_1}+{\theta_{2}}{x_{2}}+{\theta_{3}}x_{1}^{2}+{\theta_{4}}x_{2}^{2} \right)hθ​(x)=g(θ0​+θ1​x1​+θ2​x2​+θ3​x12​+θ4​x22​)是[-1 0 0 1 1],则我们得到的判定边界恰好是圆点在原点且半径为1的圆形。

我们可以用非常复杂的模型来适应非常复杂形状的判定边界。


作者:DrogoZhang



边界 学习 机器学习

需要 登录 后方可回复, 如果你还没有账号请 注册新账号