动手学习深度学习|过拟合、欠拟合及其解决方案

Bliss ·

更新时间:2024-09-21

· 929 次阅读

一过拟合与欠拟合及其解决方案 过拟合、欠拟合的概念权重衰减丢弃法 1 训练误差与泛化误差

训练误差：在训练集上的数据误差；

泛化误差：在其他任意数据集上的误差的期望，常用测试集误差来近似

模型选择：通常用验证集来进行模型选择

K折交叉验证：将数据集分成相等的K个子数据集来进行K次训练和验证，每次将其中1个当作验证集进行验证模型，另外K-1个数据集进行训练，最后K次后取训练误差的均值和验证误差的均值

2 过拟合和欠拟合

过拟合：训练集的误差远小于测试集的误差

欠拟合：模型无法得到较小的训练误差

其主要讨论模型复杂度和数据及大小，常用多项式拟合实验来观察比较训练误差和泛化误差

3 过拟合解决方法

权重衰减：等价于 $math?formula=L2$ 转存失败重新上传取消 $math?formula=L2$ 正在上传…重新上传取消 $math?formula=L2$ 转存失败重新上传取消 $L2$ 范数正则化，即损失函数添加惩罚项使得学得的模型参数值较小， $math?formula=L2$ 转存失败重新上传取消 $math?formula=L2$ 正在上传…重新上传取消 $math?formula=L2$ 转存失败重新上传取消 $L2$ 范数惩罚项指的是模型权重参数每个元素的平方和与一个正的常数的乘积

丢弃法：当对隐藏层使用丢弃法时，该层的隐藏单元将有一定概率被丢弃掉（被清零），丢弃法不改变其输入的期望值

二梯度消失和梯度爆炸

当神经网络的层数较多时，模型的数值稳定性容易变差，当多层感知机的层数较大时，较大层数的输出会出现消失或爆炸

环境因素：协变量偏移，标签偏移，概念偏移

Kaggle 房价预测实战

三循环神经网络进阶

RNN存在的问题：梯度较容易出现衰减或爆炸（BPTT）

解决方法：

门控循环神经⽹络：捕捉时间序列中时间步距离较⼤的依赖关系

1 GRU

• 重置门有助于捕捉时间序列⾥短期的依赖关系；

• 更新门有助于捕捉时间序列⾥长期的依赖关系。

2 LSTM 长短期记忆long short-term memory

遗忘门:控制上一时间步的记忆细胞

输入门:控制当前时间步的输入

输出门:控制从记忆细胞到隐藏状态

记忆细胞：⼀种特殊的隐藏状态的信息的流动

3 深度循环神经网络

添加num_layers=2

gru_layer=nn.LSTM(input_size=vocab_size,hidden_size=num_hiddens,num_layers=2)

4 双向循环神经网络

添加 bidirectional=True

gru_layer=nn.GRU(input_size=vocab_size,hidden_size=num_hiddens,bidirectional=True)

作者：zhangChao_Yanqiu

动手学过拟合欠拟合学习深度学习解决方案

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

Linux 安装

Tricia 2020-10-13

661

.NET实现工资管理系统

Genet 2020-03-17

878

Shell中去除字符串前后空格的方法

Iris 2021-08-03

567

浅谈CSS浮动的特性

Iola 2020-02-21

664

详解git无法pull仓库refusing to merge unrelated histories

Saadiya 2020-06-22

656

PHP的简单跳转提示的实现详解

Floria 2021-01-03

687

C++函数模板学习示例教程指南

Pandora 2023-07-07

25

go语言定义零值可用的类型学习教程

Tallulah 2023-07-17

216

SQLServer通过端口1433连接到主机localhost的TCP/IP连接失败常见问题的解决方案

Damara 2023-07-20

544

windows上的mysql服务突然消失提示10061Unkonwnerror问题及解决方案

Kirima 2023-07-20

1650

Redis集群Lettuce主从切换问题解决方案

Abbie 2023-07-20

1406

Redis数据结构之intset整数集合使用学习

Janna 2023-07-20

1721

Redis数据结构之跳跃表使用学习

Ophelia 2023-07-20

644

Redis数据结构之listpack和quicklist使用学习

Natalia 2023-07-20

1968

Python ModuleNotFoundError: No module named ‘xxx‘可能的解决方案大全

Gabriela 2023-07-20

641

大语言模型的开发利器langchainan安装使用快速入门学习

Irma 2023-07-20

829

vue3 Error:Unknown variable dynamic import: ../views/的解决方案

Xenia 2023-07-20

1653

uni-app的iPhonex底部安全区域解决方案

Jacuqeline 2023-07-20

101

C++前缀树字典树的学习与模拟实现代码示例

Kirima 2023-07-20

1789

Linux signal()函数的使用学习

Fawn 2023-07-21

785

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座