Pytorch中的modle.train,model.eval,withtorch.no_grad解读

Dulcea ·

更新时间:2024-11-10

· 1192 次阅读

modle.train,model.eval,with torch.no_grad解读

model.eval()与torch.no_grad()的作用

model.eval()

torch.no_grad()

异同

总结

modle.train,model.eval,with torch.no_grad解读

1. 最近在学习pytorch过程中遇到了几个问题

不理解为什么在训练和测试函数中model.eval()，和model.train()的区别，经查阅后做如下整理

一般情况下，我们训练过程如下：

拿到数据后进行训练，在训练过程中，使用

model.train()：告诉我们的网络，这个阶段是用来训练的，可以更新参数。

训练完成后进行预测，在预测过程中，使用

model.eval()：告诉我们的网络，这个阶段是用来测试的，于是模型的参数在该阶段不进行更新。

2. 但是为什么在eval()阶段会使用with torch.no_grad()？

查阅相关资料：传送门

with torch.no_grad - disables tracking of gradients in autograd.
model.eval() changes the forward() behaviour of the module it is called upon
eg, it disables dropout and has batch norm use the entire population statistics

总结一下就是说，在eval阶段了，即使不更新，但是在模型中所使用的dropout或者batch norm也就失效了，直接都会进行预测，而使用no_grad则设置让梯度Autograd设置为False(因为在训练中我们默认是True)，这样保证了反向过程为纯粹的测试，而不变参数。

另外，参考文档说这样避免每一个参数都要设置，解放了GPU底层的时间开销，在测试阶段统一梯度设置为False

model.eval()与torch.no_grad()的作用 model.eval()

经常在模型推理代码的前面，都会添加model.eval(), 主要有3个作用：

1.不进行dropout

2.不更新batchnorm的mean 和var 参数

3.不进行梯度反向传播，但梯度仍然会计算

torch.no_grad()

torch.no_grad的一般使用方法是，在代码块外面用with torch.no_grad()给包起来。如下面这样：

with torch.no_grad():
    # your code

它的主要作用有2个：

1.不进行梯度的计算(当然也就没办法反向传播了)，节约显存和算力

2.dropout和batchnorn还是会正常更新

异同

从上面的介绍中可以非常明确的看出，它们的相同点是一般都用在推理阶段，但它们的作用是完全不同的，也没有重叠。可以一起使用。

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持软件开发网。

model pytorch eval

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

HTML5 Canvas中绘制矩形实例

Kenda 2021-03-28

576

利用kernel提供的接口打印进程号(pid)

Cynthia 2020-09-01

568

VMware给虚拟机安装linux系统

Oceana 2021-06-02

595

Pytorch中的model.train() 和 model.eval() 原理与用法解析

Gitana 2023-04-14

1817

分布式训练training-operator和pytorch-distributed RANK变量不统一解决

Pandora 2023-04-14

1631

基于Pytorch实现分类器的示例详解

Viveka 2023-04-18

1798

详解利用Pytorch实现ResNet网络

Tia 2023-04-20

1496

PyTorch定义Tensor及索引和切片(最新推荐)

Kara 2023-04-22

750

Vue.js按键修饰符及v-model修饰符示例详解

Gitana 2023-05-04

1419

python windows安装cuda+cudnn+pytorch教程

Fawn 2023-05-12

646

Vue自定义组件中v-model的使用方法示例

Hasana 2023-05-12

1025

pytorch版本PSEnet训练并部署方式

Adelaide 2023-05-13

471

PyTorch模型转换为ONNX格式实现过程详解

Tani 2023-05-27

556

利用Pytorch实现ResNet网络构建及模型训练

Tanisha 2023-05-27

1264

Pytorch实现ResNet网络之ResidualBlock残差块

Kande 2023-05-27

1208

PyTorch常用函数torch.cat()中dim参数使用说明

Tricia 2023-05-27

372

Pytorch基础教程之torchserve模型部署解析

Xylona 2023-07-20

1007

PyTorch模型创建与nn.Module构建

Radinka 2023-07-20

293

PyTorch模型容器与AlexNet构建示例详解

Dorothy 2023-07-20

1029

解决vue3中from表单嵌套el-table时填充el-input,v-model不唯一问题

Bianca 2023-07-20

1910

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座