深度学习（三）————过拟合、欠拟合及其解决方案；梯度消失、梯度爆炸；循环神经网络进阶

Jewel ·

更新时间:2024-11-14

· 682 次阅读

过拟合、欠拟合及其解决方案

训练误差和泛化误差

过拟合和欠拟合的概念

模型复杂度和误差之间的关系

解决过拟合的方案

梯度消失及梯度爆炸

循环神经网络进阶

GRU

LSTM

深度神经网络

过拟合、欠拟合及其解决方案 训练误差和泛化误差
在解释上述现象之前，我们需要区分训练误差（training error）和泛化误差（generalization error）。通俗来讲，前者指模型在训练数据集上表现出的误差，后者指模型在任意一个测试数据样本上表现出的误差的期望，并常常通过测试数据集上的误差来近似。计算训练误差和泛化误差可以使用之前介绍过的损失函数，例如线性回归用到的平方损失函数和softmax回归用到的交叉熵损失函数。

机器学习模型应关注降低泛化误差。
过拟合和欠拟合的概念 一类是模型无法得到较低的训练误差，我们将这一现象称作欠拟合（underfitting）；另一类是模型的训练误差远小于它在测试数据集上的误差，我们称该现象为过拟合（overfitting）。在实践中，我们要尽可能同时应对欠拟合和过拟合。虽然有很多因素可能导致这两种拟合问题，在这里我们重点讨论两个因素：模型复杂度和训练数据集大小 模型复杂度和误差之间的关系
解决过拟合的方案
权重衰减（又称L2范式正则化）

权重衰减等价于 L2 范数正则化（regularization）。正则化通过为模型损失函数添加惩罚项使学出的模型参数值较小，是应对过拟合的常用手段。

丢弃法
梯度消失及梯度爆炸
里面有详细说明https://blog.csdn.net/u011734144/article/details/80165007

几种解决方法

1、对于RNN，可以通过梯度截断，避免梯度爆炸

　　2、可以通过添加正则项，避免梯度爆炸

　　3、使用LSTM等自循环和门控制机制，避免梯度消失，参考：https://www.cnblogs.com/pinking/p/9362966.html

　　4、优化激活函数，譬如将sigmold改为relu，避免梯度消失
循环神经网络进阶 GRU
LSTM

深度神经网络

作者：渣渣菜

过拟合欠拟合循环神经网络循环学习梯度深度学习神经网络解决方案

1024 个赞

编辑举报

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

Linux 安装

Tricia 2020-10-13

661

HTML 5.1学习之新增的14项特性与应用示例

Ummi 2020-11-28

936

.NET实现工资管理系统

Genet 2020-03-17

878

golang如何实现mapreduce单进程版本详解

Paula 2020-01-08

500

Shell中去除字符串前后空格的方法

Iris 2021-08-03

567

HBASE 常用shell命令,增删改查方法

Heidi 2020-03-04

525

linux禁止普通用户切换至root用户的实例讲解

Connie 2020-01-15

762

浅谈CSS浮动的特性

Iola 2020-02-21

664

详解git无法pull仓库refusing to merge unrelated histories

Saadiya 2020-06-22

656

Redis数据结构之跳跃表使用学习

Ophelia 2023-07-20

644

Redis数据结构之listpack和quicklist使用学习

Natalia 2023-07-20

1968

mysql双游标嵌套循环方式

Ida 2023-07-20

1450

mysql存储过程多层游标循环嵌套的写法分享

Irma 2023-07-20

1557

Python ModuleNotFoundError: No module named ‘xxx‘可能的解决方案大全

Gabriela 2023-07-20

641

Python顺序结果、选择结构和循环结构详解

Samira 2023-07-20

1624

大语言模型的开发利器langchainan安装使用快速入门学习

Irma 2023-07-20

829

Python使用嵌套循环实现图像处理算法

Valora 2023-07-20

1314

vue数组中不满足条件跳出循环问题

Xandy 2023-07-20

1089

vue3 Error:Unknown variable dynamic import: ../views/的解决方案

Xenia 2023-07-20

1653

uni-app的iPhonex底部安全区域解决方案

Jacuqeline 2023-07-20

101

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。
软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座