《动手学深度学习：过拟合、欠拟合及其解决方案；梯度消失、梯度爆炸；循环神经网络进阶》

Autumn ·

更新时间:2024-11-11

· 905 次阅读

过拟合、欠拟合及其解决方案

过拟合、欠拟合的概念
权重衰减
丢弃法

简洁实现

def fit_and_plot_pytorch(wd):
    # 对权重参数衰减。权重名称一般是以weight结尾
    net = nn.Linear(num_inputs, 1)
    nn.init.normal_(net.weight, mean=0, std=1)
    nn.init.normal_(net.bias, mean=0, std=1)
    optimizer_w = torch.optim.SGD(params=[net.weight], lr=lr, weight_decay=wd) # 对权重参数衰减
    optimizer_b = torch.optim.SGD(params=[net.bias], lr=lr)  # 不对偏差参数衰减
    train_ls, test_ls = [], []
    for _ in range(num_epochs):
        for X, y in train_iter:
            l = loss(net(X), y).mean()
            optimizer_w.zero_grad()
            optimizer_b.zero_grad()
            l.backward()
            # 对两个optimizer实例分别调用step函数，从而分别更新权重和偏差
            optimizer_w.step()
            optimizer_b.step()
        train_ls.append(loss(net(train_features), train_labels).mean().item())
        test_ls.append(loss(net(test_features), test_labels).mean().item())
    d2l.semilogy(range(1, num_epochs + 1), train_ls, 'epochs', 'loss',
                 range(1, num_epochs + 1), test_ls, ['train', 'test'])
    print('L2 norm of w:', net.weight.data.norm().item())

作者：zxj_45373271

动手学过拟合欠拟合循环神经网络循环学习梯度深度学习神经网络解决方案

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

Linux 安装

Tricia 2020-10-13

661

HTML 5.1学习之新增的14项特性与应用示例

Ummi 2020-11-28

936

.NET实现工资管理系统

Genet 2020-03-17

878

golang如何实现mapreduce单进程版本详解

Paula 2020-01-08

500

Shell中去除字符串前后空格的方法

Iris 2021-08-03

567

HBASE 常用shell命令,增删改查方法

Heidi 2020-03-04

525

linux禁止普通用户切换至root用户的实例讲解

Connie 2020-01-15

762

浅谈CSS浮动的特性

Iola 2020-02-21

664

详解git无法pull仓库refusing to merge unrelated histories

Saadiya 2020-06-22

656

PHP的简单跳转提示的实现详解

Floria 2021-01-03

687

Redis数据结构之跳跃表使用学习

Ophelia 2023-07-20

644

Redis数据结构之listpack和quicklist使用学习

Natalia 2023-07-20

1968

mysql双游标嵌套循环方式

Ida 2023-07-20

1450

mysql存储过程多层游标循环嵌套的写法分享

Irma 2023-07-20

1557

Python ModuleNotFoundError: No module named ‘xxx‘可能的解决方案大全

Gabriela 2023-07-20

641

Python顺序结果、选择结构和循环结构详解

Samira 2023-07-20

1624

大语言模型的开发利器langchainan安装使用快速入门学习

Irma 2023-07-20

829

Python使用嵌套循环实现图像处理算法

Valora 2023-07-20

1314

vue数组中不满足条件跳出循环问题

Xandy 2023-07-20

1089

vue3 Error:Unknown variable dynamic import: ../views/的解决方案

Xenia 2023-07-20

1653

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座