课程里讲的模糊不清,笔者的理解就是模型的复杂程度,参数多的,复杂度高,训练时间长,参数少的,复杂度地,训练时间短,复杂度和误差的关系如图。
训练集的大小会影响拟合结果,一般来说,训练集小,过拟合容易发生。泛化误差不会碎训练集增大而增大,所以我们通常希望训练集大一些,特别是模型复杂度较高时。
1.5 解决方案 1.5.1 权重衰减权重衰减等价于L2L_2L2范数正则化。正则化通过为模型损失函数添加惩罚项使训练出的模型参数值小,是应对过拟合的常用手段。
1.5.2 L2L_2L2范数正则化L2L_2L2范数正则化在模型损失函数基础上添加L2L_2L2范数惩罚项,从而得到训练所需要的最小化的函数。L2L_2L2范数惩罚项指的是模型权重参数每个元素的平方和与一个正的常数的乘积。以现行回归中的线性回归损失函数为例
其中