Pytorch实现将模型的所有参数的梯度清0

Gitana ·

更新时间:2024-11-13

· 788 次阅读

有两种方式直接把模型的参数梯度设成0：

model.zero_grad()
optimizer.zero_grad()#当optimizer=optim.Optimizer(model.parameters())时，两者等效

如果想要把某一Variable的梯度置为0，只需用以下语句：

Variable.grad.data.zero_()

补充知识：PyTorch中在反向传播前为什么要手动将梯度清零？optimizer.zero_grad()的意义

optimizer.zero_grad()意思是把梯度置零，也就是把loss关于weight的导数变成0.

在学习pytorch的时候注意到，对于每个batch大都执行了这样的操作：

optimizer.zero_grad()             ## 梯度清零
preds = model(inputs)             ## inference
loss = criterion(preds, targets) ## 求解loss
loss.backward()                   ## 反向传播求解梯度
optimizer.step()                  ## 更新权重参数

1、由于pytorch的动态计算图，当我们使用loss.backward()和opimizer.step()进行梯度下降更新参数的时候，梯度并不会自动清零。并且这两个操作是独立操作。

2、backward()：反向传播求解梯度。

3、step()：更新权重参数。

基于以上几点，正好说明了pytorch的一个特点是每一步都是独立功能的操作，因此也就有需要梯度清零的说法，如若不显示的进 optimizer.zero_grad()这一步操作，backward()的时候就会累加梯度。

以上这篇Pytorch实现将模型的所有参数的梯度清0就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持软件开发网。

您可能感兴趣的文章:对pytorch中的梯度更新方法详解pytorch的梯度计算以及backward方法详解画pytorch模型图,以及参数计算的方法pytorch获取模型某一层参数名及参数值方式Pytorch中实现只导入部分模型参数的方式

pytorch 参数模型梯度

1024 个赞