【TensorRT】TensorRT的INT8校准原理

Sabah ·

更新时间:2024-11-14

· 948 次阅读

INT8校准就是原来用32bit（float32）表示的tensor现在用8bit来表示，并且要求精度不能下降太多。

将FP32转换为 INT8的操作需要针对每一层的输入tensor和网络学习到的参数进行。

但是不同网络结构的不同layer的激活值分布很不一样，因此合理的量化方式。应该适用于不同的激活值分布，并且减小信息损失。

使用相对熵（也叫KL散度）来衡量不同的INT8分布与原来的FP3F2分布之间的差异程度。

确定每一层的|T|值的过程称为校准。方法是从验证集选取一个子集作为校准集，校准集应该具有代表性，多样性，最好是验证集的一个子集，不应该只是分类类别的一小部分。激活值分布就是从校准集中得到的。比如NVIDIA官方介绍ImageNet数据集，校准集有500张图片就够了。

有了校准集之后：

1. 在校准集上进行FP32推理；

2. 遍历网络的每一层：

2.1 收集该层的激活值，做直方图，并分成若干bins（官方介绍使用2048个bins）；

2.2 |T|的值肯定在第128-2047 bins之间，遍历不同的|T|值，这里可以取每个bin的中值，最后选取使得KL散度最小时的|T|值。

3. 最后每一层都得到一个|T|值，据此创建CalibrationTable。

官方伪代码：


Input: FP32 histogram H with 2048 bins: bin[ 0 ], …, bin[ 2047 ] 
For i in range( 128 , 2048 ): 
	reference_distribution_P = [ bin[ 0 ] , ..., bin[ i-1 ] ] 
	outliers_count = sum( bin[ i ] , bin[ i+1 ] , … , bin[ 2047 ] ) 
	reference_distribution_P[ i-1 ] += outliers_count 
	P /= sum(P) // 归一化
	candidate_distribution_Q = quantize [ bin[ 0 ], …, bin[ i-1 ] ] into 128 levels
	expand candidate_distribution_Q to ‘ i ’ bins 
	Q /= sum(Q) 
	divergence[ i ] = KL_divergence( reference_distribution_P, candidate_distribution_Q)
End For
Find index ‘m’ for which divergence[ m ] is minimal
threshold = ( m + 0.5 ) * ( width of a bin )
 
下面是我使用TensorRT生成CalibrationTable输出的一些log。





作者：heiheiya
                    
 
                

                            tensorrt
                            INT8
                            int
                            校准


           
    
    

            
                
                    
                
            
            
                
    
        
            需要 登录 后方可回复, 如果你还没有账号请 注册新账号
        
    
                
            
                
                    
                        相关文章

    
        
    
    
        
            System.Web中不存在类型或命名空间名称script 找不到System.Web.Extensions.dll引用
        
        
            Paloma
            2021-05-12
        
    
    
        614
    


    
        
            .NET微信公众号客服接口
        
        
            Claire
            2020-12-31
        
    
    
        810
    


    
        
            asp.net登录验证码实现方法
        
        
            Liana
            2020-10-09
        
    
    
        997
    


    
        
            php实现的表单验证类完整示例
        
        
            Oriel
            2020-10-27
        
    
    
        717
    


    
        
            QT中QByteArray与char、int、float之间的互相转化
        
        
            Nysa
            2022-07-15
        
    
    
        1969
    


    
        
            Python如何将list中的string转换为int
        
        
            Jayne
            2022-07-15
        
    
    
        1688
    


    
        
    
    
        
            pandas时间序列之如何将int转换成datetime格式
        
        
            Elina
            2022-07-16
        
    
    
        1478
    


    
        
            浅谈mysql中int(1)和int(10)的区别
        
        
            Wenda
            2022-07-17
        
    
    
        973
    


    
        
    
    
        
            Python中Timedelta转换为Int或Float方式
        
        
            Olivia
            2022-07-18
        
    
    
        327
    


    
        
    
    
        
            C++中string使用+号与int拼接方式
        
        
            Valora
            2022-07-20
        
    
    
        1774
    


    
        
    
    
        
            详细深入聊一聊Mysql中的int(1)和int(11)
        
        
            Laila
            2022-08-08
        
    
    
        1184
    


    
        
    
    
        
            Java如何将字符串String转换为整型Int
        
        
            Hasana
            2022-08-10
        
    
    
        1712
    


    
        
            pythonnumpy.ndarray中如何将数据转为int型
        
        
            Mathilda
            2022-10-14
        
    
    
        1878
    


    
        
            Python内建类型int源码学习
        
        
            Willow
            2022-10-14
        
    
    
        361
    


    
        
            MySQL中int (10) 和 int (11) 的区别
        
        
            Madge
            2022-10-23
        
    
    
        623
    


    
        
            C++string与int的相互转换(使用C++11)
        
        
            Isis
            2022-10-24
        
    
    
        1538
    


    
        
            C# BitArray（点矩阵）转换成int和string的方法实现
        
        
            Zandra
            2022-10-24
        
    
    
        277
    


    
        
            Python中的int函数使用
        
        
            Tricia
            2022-11-05
        
    
    
        1953
    


    
        
    
    
        
            Flutter枚举值enum和int互相转化总结
        
        
            Tallulah
            2023-02-18
        
    
    
        476
    


    
        
            MySQL中int(10)和int(11)的区别详解
        
        
            Jacinthe
            2023-03-02
        
    
    
        317


        
    
        
            我要提问
        
    
    
        
        
    
        致谢
        
            帮助他人，成就自己。
            人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。
            1024问感谢每一位朋友的帮助和支持。
            软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。
        
    
    
        
            
    育儿网
    微养生
    全球行
    美食街
    育儿
    菜谱大全
    海南旅游
    女性
    养狗百科
    星座