Pytorch中torch.nn的损失函数

Cytheria ·

更新时间:2024-11-13

· 584 次阅读

前言

一、torch.nn.BCELoss(weight=None, size_average=True)

二、nn.BCEWithLogitsLoss(weight=None, size_average=True)

三、torch.nn.MultiLabelSoftMarginLoss(weight=None, size_average=True)

四、总结

前言
最近使用Pytorch做多标签分类任务，遇到了一些损失函数的问题，因为经常会忘记（好记性不如烂笔头囧rz），都是现学现用，所以自己写了一些代码探究一下，并在此记录，如果以后还遇到其他损失函数，继续在此补充。

如果有兴趣，我建议大家阅读Pytorch的官方中文文档的loss function部分，讲得比较清晰。

注：官方文档中特别强调了计算出来的结果默认已经对mini-batch取了平均。
一、torch.nn.BCELoss(weight=None, size_average=True)
注：以下公式都是针对一个element(即mini-batch=1)的情形，如果mini-batch=m，最后的输出结果默认会对m个loss取平均的。

（关于weight和size_average两个参数我就不介绍了，介绍起来显得太啰嗦，只需要注意如果使用weight参数，那么weight的shape需要和类别数保持一致）

$\small loss(y,target)=-\frac{1}{C}\sum_i(target[i] *log(y[i])+(1-target[i]) *log(1-y[i]))$

这个地方需要强调的两点：

1、此处的i是指第i个类别，C表示总共有C个类别。

2、 0<=y[i]<=1（官方写的0<=target[i]<=1应该是写错了！）

下面是我实现的代码：
# 自己写的BCELoss函数 def BCE(y, target): loss = -(target*torch.log(y) + (1-target)*torch.log(1-y)) # 官方文档中特别强调了:计算出来的结果默认对mini-batch取平均 return loss.mean() if __name__ == '__main__': # mini-batch = 2 , data shape is [2, 4] y = torch.FloatTensor([[0.5, 0.9, 0.1, 0.3], [0.1, 0.2, 0.3, 0.9]]) target = torch.FloatTensor([[0, 1, 0, 0], [0, 0, 1, 1]]) # 官方的BCELoss() criterion = nn.BCELoss() loss = criterion(y, target) # 自己的BCELoss() loss2 = BCE(y, target) print("官方实现的BCELoss:", loss) print("自己实现的BCELoss:", loss2) 可以看到输出结果和官方是一样的输出结果: 官方实现的BCELoss: tensor(0.3623) 自己实现的BCELoss: tensor(0.3623) 二、nn.BCEWithLogitsLoss(weight=None, size_average=True) 官方文档中没有看到这个函数，不过还是讲一下。就是相当于先使用函数处理y，然后再使用BCELoss()函数进行处理。以下是我实现的代码: # sigmoid函数 def Sigmoid(x): return 1 / (1 + torch.exp(-x)) # 自己写的BCELoss函数 def BCE(y, target): loss = -(target*torch.log(y) + (1-target)*torch.log(1-y)) # 官方文档中特别强调了:计算出来的结果已经对mini-batch取了平均 return loss.mean() # 自己写的BCEWithLogitsLoss函数 def BCELogit(y, target): # 首先使用sigmoid函数处理y y = Sigmoid(y) # 然后再使用BCELoss() loss = BCE(y, target) return loss f __name__ == '__main__': # mini-batch = 2 , data shape is [2, 4] y = torch.FloatTensor([[0.5, 0.9, 0.1, 0.3], [0.1, 0.2, 0.3, 0.9]]) # 这是一个多标签分类，可以看到每行中可以有多个1 target = torch.FloatTensor([[0, 1, 0, 1], [0, 0, 1, 1]]) criterion = nn.BCEWithLogitsLoss() loss = criterion(y, target) loss2 = BCELogit(y, target) print("官方实现的BCEWithLogitsLoss:", loss) print("自己实现的BCEWithLogitsLoss:", loss2) 可以看到输出结果和官方是一样的输出结果: 官方实现的BCEWithLogitsLoss: tensor(0.6315) 自己实现的BCEWithLogitsLoss: tensor(0.6315) 注：因为对y使用了sigmoid函数，所以0<=y[i]<=1这个条件就不需要了。个人认为，BCEWithLogitsLoss就是比BCELoss多了一个Sigmoid函数处理。三、torch.nn.MultiLabelSoftMarginLoss(weight=None, size_average=True) 这不就是和BCEWithLogitsLoss的公式一模一样咩，无非就是把Sigmoid函数展开了（小朋友你是否有很多问号？？？）于是我写代码验证了一下 if __name__ == '__main__': # mini-batch = 2 , data shape is [2, 4] y = torch.FloatTensor([[0.5, 0.9, 0.1, 0.3], [0.1, 0.2, 0.3, 0.9]]) # 这是一个多标签分类，可以看到一行中可以有多个1 target = torch.FloatTensor([[0, 1, 0, 1], [0, 0, 1, 1]]) criterion = nn.BCEWithLogitsLoss() criterion2 = nn.MultiLabelSoftMarginLoss() loss = criterion(y, target) loss2 = criterion2(y, target) print("官方实现的BCEWithLogitsLoss:", loss) print("官方实现的MultiLabelSoftMarginLoss:", loss2) 可以看到官方实现的BCEWithLogitsLoss和MultiLabelSoftMarginLoss输出是一样的输出结果: 官方实现的BCEWithLogitsLoss: tensor(0.6315) 官方实现的MultiLabelSoftMarginLoss: tensor(0.6315) 四、总结总结一下： 1、BCELoss加上一个Sigmoid函数操作就得到BCEWithLogitsLoss。 2、MultiLabelSoftMarginLoss和BCEWithLogitsLoss从公式上来看是一样的。我也是最近才看了一下nn.torch的损失函数的内容，如果我写得有错误，还请评论区拍砖、斧正！参考：https://blog.csdn.net/qq_39507748/article/details/105356845 Pytorch的官方中文文档作者：秋名山翻车的 pytorch 损失函数损失函数

1024 个赞编辑举报

需要登录后方可回复, 如果你还没有账号请注册新账号相关文章 Go 语言的指针的学习笔记 Cady 2020-01-13 703 .NET Core 2.0迁移小技巧之MemoryCache问题修复解决的方法 Nita 2021-07-06 975 使用ASP.NET MVC引擎开发插件系统 Tama 2021-06-19 701 利用kernel提供的接口打印进程号(pid) Cynthia 2020-09-01 568 Pythonendswith()函数的具体使用 Thirza 2023-07-20 600 Pythonisalnum()函数的具体使用 Rhoda 2023-07-20 1821 Pytorch基础教程之torchserve模型部署解析 Xylona 2023-07-20 1007 python写入csv时writerow()和writerows()函数简单示例 Tesia 2023-07-20 883 python中的torch常用tensor处理函数示例详解 Ursula 2023-07-20 1925 PyTorch模型创建与nn.Module构建 Radinka 2023-07-20 293 PyTorch模型容器与AlexNet构建示例详解 Dorothy 2023-07-20 1029 C++友元函数和友元类的使用与区别 Edana 2023-07-20 347 C++面试八股文之什么是构造函数 Dabria 2023-07-20 1894 C语言中fopen()函数的使用方法示例详解 Paula 2023-07-20 828 C++中vector与remove()函数详解 Peony 2023-07-20 1792 C语言实现日期和时间处理的常用函数总结 Rayna 2023-07-20 96 Linux signal()函数的使用学习 Fawn 2023-07-21 785 Go语言应用闭包之返回函数 Tia 2023-07-21 4 Go defer 去掉闭包函数及用法分析 Victoria 2023-07-21 1434 C++中String类的常用接口函数总结 Olathe 2023-07-21 525

我要提问致谢帮助他人，成就自己。人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。 1024问感谢每一位朋友的帮助和支持。软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座