deeplearning_class3:过拟合、欠拟合、梯度消失、梯度爆炸

Mathea ·

更新时间:2024-09-21

· 810 次阅读

1 过拟合、欠拟合及解决方案 1.1 训练误差和泛化误差 训练误差：指模型在训练数据集上表现出的误差泛化误差：值模型在任意一个测试数据样本上表现出的误差的期望，并通过测试数据集上的误差来近似 1.2 过拟合和欠拟合 欠拟合：模型无法得到较低的训练误差过拟合：模型的训练误差远小于他在测试数据集上的误差 1.3 模型复杂度

课程里讲的模糊不清，笔者的理解就是模型的复杂程度，参数多的，复杂度高，训练时间长，参数少的，复杂度地，训练时间短，复杂度和误差的关系如图。
在这里插入图片描述

1.4训练集大小的影响

训练集的大小会影响拟合结果，一般来说，训练集小，过拟合容易发生。泛化误差不会碎训练集增大而增大，所以我们通常希望训练集大一些，特别是模型复杂度较高时。

1.5 解决方案 1.5.1 权重衰减

权重衰减等价于L2L_2L2范数正则化。正则化通过为模型损失函数添加惩罚项使训练出的模型参数值小，是应对过拟合的常用手段。

1.5.2 L2L_2L2范数正则化

L2L_2L2范数正则化在模型损失函数基础上添加L2L_2L2范数惩罚项，从而得到训练所需要的最小化的函数。L2L_2L2范数惩罚项指的是模型权重参数每个元素的平方和与一个正的常数的乘积。以现行回归中的线性回归损失函数为例
在这里插入图片描述
其中

过拟合欠拟合梯度 class

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

HTML块级标签汇总（小篇）

Leona 2021-07-17

862

golang如何实现mapreduce单进程版本详解

Paula 2020-01-08

500

浅谈CSS浮动的特性

Iola 2020-02-21

664

详解git无法pull仓库refusing to merge unrelated histories

Saadiya 2020-06-22

656

解决JDBC的class.forName()问题

Dulcea 2022-11-04

1582

C#基础教程之类class与结构struct的区别

Florence 2022-11-05

47

Vue 运行高德地图官方样例,设置class无效的解决

Elita 2022-11-05

793

vue如何动态设置class、动态设置style

Qoqa 2022-11-05

1305

JS中关于Class类的静态属性和静态方法

Aggie 2022-11-06

615

ES6 class类实现继承实例详解

Blossom 2022-11-06

578

vue-class-setup 编写 class 风格组合式API

Velika 2022-11-06

1721

Vue装饰器中的vue-property-decorator 和 vux-class使用详解

Honey 2022-11-06

1092

图文详解梯度下降算法的原理及Python实现

Karli 2022-11-06

410

Python中class内置方法__init__与__new__作用与区别解析

Tia 2022-11-09

1759

基于Class.forName()用法及说明

Olivia 2022-11-25

1925

JS优雅的使用function实现一个class

Serafina 2022-12-15

1237

JavagetResource()如何获取class文件目录位置

Olivia 2022-12-29

1110

C#纯技术之Class写入Json

Malina 2023-01-27

425

python中class(object)的含义是什么以及用法

Olivia 2023-02-04

511

OpenCV学习之图像梯度算子详解

Isoke 2023-02-16

474

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座