tensorflow中常用交叉熵损失函数(cross_entropy)的比较总结与代码示例

Cindy ·

更新时间:2024-09-20

· 862 次阅读

本文将对以下几种tensorflow中常用的交叉熵损失函数进行比较： tf.losses.sigmoid_cross_entropy tf.nn.sigmoid_cross_entropy_with_logits tf.losses.softmax_cross_entropy tf.nn.softmax_cross_entropy_with_logits_v2 tf.losses.sparse_softmax_cross_entropy 1. tf.losses.sigmoid_cross_entropy


import tensorflow as tf
batch_size = 4
num_classes = 2
'''
tf.losses.sigmoid_cross_entropy适用于二分类问题，是对logits先进行sigmoid再求交叉熵
args:
    logits:不经过sigmoid处理的神经网络输出，是分类器对每个类别打的分数，shape:[batch_size, num_classes]
    labels:真实标签值，shape:[batch_size, num_classes]
'''
logits = tf.constant([[9., 2.],
                      [1, 7.],
                      [5., 4.],
                      [2., 8.]])
labels = tf.constant([0, 1, 0, 1])
one_hot_labels = tf.one_hot(labels, depth=num_classes, dtype=tf.int32)
loss = tf.losses.sigmoid_cross_entropy(multi_class_labels=one_hot_labels, logits=logits)
sess = tf.InteractiveSession()
print(loss.eval())

打印的结果为：loss:1.1991692
2. tf.nn.sigmoid_cross_entropy_with_logits

import tensorflow as tf
batch_size = 4
num_classes = 2
'''
tf.nn.sigmoid_cross_entropy_with_logits与tf.losses.sigmoid_cross_entropy的功能类似，主要差别如下:
    1. 前者要求logits和labels不仅要有相同的shape，还要有相同的type
    2. 前者的输出为一个list，后者的输出为一个具体的数值
args:
    logits:不经过sigmoid处理的神经网络输出，是分类器对每个类别打的分数，shape:[batch_size, num_classes]
    labels:真实标签值，shape:[batch_size,num_classes]
'''
logits = tf.constant([[9., 2.],
                      [1., 7.],
                      [5., 4.],
                      [2., 8.]])
# logits = tf.cast(logits, tf.float32)
labels = tf.constant([0, 1, 0, 1], dtype=tf.int32)
labels = tf.one_hot(labels, depth=num_classes, dtype=tf.float32)
loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(labels=labels, logits=logits))
sess = tf.InteractiveSession()
print(loss.eval())
打印的结果为：loss:1.1991692，与方法1的结果相同
3.tf.losses.softmax_cross_entropy

import tensorflow as tf
batch_size = 4
num_classes = 3
'''
tf.losses.softmax_cross_entropy适用于多分类问题，是对logits先进行softmax再求交叉熵
args:
    logits:不经过softmax处理的神经网络输出，是分类器对每个类别打的分数，shape:[batch_size, num_classes]
    labels:真实标签值，shape:[batch_size, num_classes]
'''
logits = tf.constant([[9., 2., 4.],
                      [1., 7., 3.],
                      [5., 4., 8.],
                      [2., 8., 9.]])
labels = tf.constant([1, 0, 2, 1])
one_hot_labels = tf.one_hot(labels, depth=num_classes, dtype=tf.int32)
loss = tf.losses.softmax_cross_entropy(onehot_labels=one_hot_labels, logits=logits)
sess = tf.InteractiveSession()
print(loss.eval())

打印结果为：loss:3.6020036
4.tf.nn.softmax_cross_entropy_with_logits_v2

import tensorflow as tf
batch_size = 4
num_classes = 3
'''
tf.nn.softmax_cross_entropy_with_logits_v2的功能与tf.losses.softmax_cross_entropy类似，两者的差别如下：
    1. 前者的输出为一个list，后者的输出为一个具体的值
args:
    logits:不经过softmax处理的神经网络输出，是分类器对每个类别打的分数，shape:[batch_size, num_classes]
    labels:真实标签值，shape:[batch_size, num_classes]
'''
logits = tf.constant([[9., 2., 4.],
                      [1., 7., 3.],
                      [5., 4., 8.],
                      [2., 8., 9.]])
labels = tf.constant([1, 0, 2, 1])
one_hot_labels = tf.one_hot(labels, depth=num_classes, dtype=tf.int32)
loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(labels=one_hot_labels, logits=logits))
sess = tf.InteractiveSession()
print(loss.eval())

打印的结果为：loss:3.6020036，与方法3的结果相同
5.tf.losses.sparse_softmax_cross_entropy

import tensorflow as tf
batch_size = 4
num_classes = 3
'''
tf.losses.sparse_softmax_cross_entropy的功能与tf.losses.softmax_cross_entropy类似，两者的差别如下：
    1. 前者的参数labels不需要ont_hot编码
args:
    logits:不经过softmax处理的神经网络输出，是分类器对每个类别打的分数，shape:[batch_size, num_classes]
    labels:真实标签值，shape:[batch_size,]
'''
logits = tf.constant([[9., 2., 4.],
                      [1., 7., 3.],
                      [5., 4., 8.],
                      [2., 8., 9.]])
labels = tf.constant([1, 0, 2, 1])
loss = tf.losses.sparse_softmax_cross_entropy(labels=labels, logits=logits)
sess = tf.InteractiveSession()
print(loss.eval())

打印的结果为：loss:3.6020036，与方法3和方法4的结果相同
总结如下:
sigmoid交叉熵损失函数适用于二分类问题，softmax交叉熵损失函数适用于多分类问题。
	nn库中的损失函数方法输出为一个list，losses库中的损失函数方法输出为一个值，前者需要再进行reduce_mean。
	sparse_softmax_cross_entropy与softmax_cross_entropy的区别是前者的labels参数不需要one_hot编码。
                    
                                        潜行隐耀
                                                                                            
                    原创文章 5获赞 0访问量 158
                                            关注
                                                                私信
    
                展开阅读全文


作者：潜行隐耀
                    
 
                

                            CROSS
                            示例
                            损失
                            函数
                            交叉熵
                            交叉
                            损失函数
                            tensorflow


           
    
    

            
                
                    
                
            
            
                
    
        
            需要 登录 后方可回复, 如果你还没有账号请 注册新账号
        
    
                
            
                
                    
                        相关文章

    
        
    
    
        
            探索PowerShell(一) 初识 PowerShell
        
        
            Maleah
            2021-05-23
        
    
    
        828
    


    
        
            Go 语言的指针的学习笔记
        
        
            Cady
            2020-01-13
        
    
    
        703
    


    
        
    
    
        
            html+css+javascript实现跟随鼠标移动显示选中效果
        
        
            Xanthe
            2021-05-04
        
    
    
        502
    


    
        
    
    
        
            利用HTML+CSS实现跟踪鼠标移动功能
        
        
            Jillian
            2021-03-29
        
    
    
        635
    


    
        
    
    
        
            .NET Core 2.0迁移小技巧之MemoryCache问题修复解决的方法
        
        
            Nita
            2021-07-06
        
    
    
        975
    


    
        
    
    
        
            使用ASP.NET MVC引擎开发插件系统
        
        
            Tama
            2021-06-19
        
    
    
        701
    


    
        
            ubuntu修改terminal终端的主机名的实现方法
        
        
            Kita
            2021-05-26
        
    
    
        748
    


    
        
            mvc上传到美橙云虚拟机系列问题的解决方法
        
        
            Willow
            2020-09-23
        
    
    
        991
    


    
        
            C#语言async await之迭代器工作原理示例解析
        
        
            Jacinthe
            2023-07-22
        
    
    
        549
    


    
        
            C#语言async await工作原理示例解析
        
        
            Winona
            2023-07-22
        
    
    
        1206
    


    
        
            C#实现从PPT中提取文本的示例代码
        
        
            Ophelia
            2023-07-22
        
    
    
        1546
    


    
        
            C#实现文件压缩与解压功能的示例代码
        
        
            Agnes
            2023-07-22
        
    
    
        214
    


    
        
            C# 中的智能枚举之如何在枚举中增加行为(示例代码)
        
        
            Aurora
            2023-07-22
        
    
    
        1219
    


    
        
            基于WPF实现面包屑控件的示例代码
        
        
            Glory
            2023-07-22
        
    
    
        780
    


    
        
            docker存储目录迁移示例教程
        
        
            Pelagia
            2023-07-22
        
    
    
        1183
    


    
        
            使用docker compose部署emqx集群的示例
        
        
            Ianthe
            2023-07-22
        
    
    
        1083
    


    
        
            nginx location指令(匹配顺序匹配冲突)实战示例详解
        
        
            Nafisa
            2023-07-22
        
    
    
        1688
    


    
        
    
    
        
            Python实战使用XPath采集数据示例解析
        
        
            Diane
            2023-07-24
        
    
    
        1433
    


    
        
            C++ 类模板与成员函数模板示例解析
        
        
            Nora
            2023-07-28
        
    
    
        276
    


    
        
            nginx限制ip访问频率的实现示例
        
        
            Rhea
            2023-08-08
        
    
    
        1403


        
    
        
            我要提问
        
    
    
        
        
    
        致谢
        
            帮助他人，成就自己。
            人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。
            1024问感谢每一位朋友的帮助和支持。
            软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。
        
    
    
        
            
    育儿网
    微养生
    全球行
    美食街
    育儿
    菜谱大全
    海南旅游
    女性
    养狗百科
    星座