【TensorRT】使用C++ API直接创建tensorRT 模型

Linnea ·

更新时间:2024-11-14

· 612 次阅读

使用TensorRT C++ API创建的模型只有前向推理能力，没有反向传播能力。也就是说不能用于训练，模型的权值参数要人为给定。但可以针对设定网络模型（自己使用API创建网络模型）或给定模型（使用NvCaffeParser或NvUffPaser导入其他深度学习框架训练好的模型）做一系列优化，以加快推理速度（inference）。

使用C++ API函数部署网络主要分为四个步骤：

创建网络；为网络添加输入；添加各种各样的层；设定网络输出。

这里只列出一些关键代码，详细的代码可以参考TensorRT官方的例子。

一、创建网络

首先创建一个TensorRT的network，这个network目前没有什么实质的内容。


nvinfer1::IBuilder* = nvinfer1::createInferBuilder(gLogger.getTRTLogger());
INetworkDefinition* network = builder->createNetwork();

二、为网络添加输入
所有的网络都必须明确输入是哪个blob，TensorRT才能知道数据的入口。

data = network->addInput(INPUT_BLOB_NAME, dt, DimsCHW{ 1, INPUT_H, INPUT_W});
其中，INPUT_BLOB_NAME 是为输入 blob起的名字。
dt是指数据类型，我使用的TensorRT版本是6.0.1.5，关于数据类型的定义位于include/NvInferRuntimeCommon.h文件内。

enum class DataType : int
{
    kFLOAT = 0, //!< FP32 format.
    kHALF = 1,  //!< FP16 format.
    kINT8 = 2,  //!< quantized INT8 format.
    kINT32 = 3  //!< INT32 format.
};
DimsCHW{ 1, INPUT_H, INPUT_W}，其中batch为1（省略），channel 为1，输入height 和width分别为 INPUT_H, INPUT_W的blob。
三、为网络添加层
可以添加不包含训练参数的层，比如Relu层，Pooling层等，和包含训练参数的层，比如卷积层，全连接层等。
3.1 添加不包含训练参数的层
比如这里添加一个对输入数据做归一化的scale层。

const float scaleParam = 0.0125f;
const Weights power{DataType::kFLOAT, nullptr, 0};
const Weights shift{DataType::kFLOAT, nullptr, 0};
const Weights scale{DataType::kFLOAT, &scaleParam, 1};
IScaleLayer* scale_1 = network->addScale(*data, ScaleMode::kUNIFORM, shift, scale, power);
3.2 添加包含训练参数的层
一般来说包含训练参数的层的参数是从已经训练好的模型文件中得来的，所以要先加载模型文件。
比如这里添加一个卷积层。

std::map weightMap = loadWeights(locateFile("mnistapi.wts"));
IConvolutionLayer* conv1 = network->addConvolution(*scale_1->getOutput(0), 20, DimsHW{5, 5}, weightMap["conv1filter"], weightMap["conv1bias"]);
conv1->setStride(DimsHW{1, 1});
其中*scale_1->getOutput(0)是获取上一层 scale层的输出。
20代表的是卷积核的个数。
DimsHW{5, 5}是卷积核大小5x5。
weightMap["conv1filter"], weightMap["conv1bias"]是从加载的模型文件得到的权值系数矩阵。
四、设定网络输出
网络必须指定哪一个blob是输出的。

auto prob = network->addSoftMax(*ip2->getOutput(0)); 
prob->getOutput(0)->setName(OUTPUT_BLOB_NAME); 
network->markOutput(*prob->getOutput(0));
这里最后为网络添加了一个softmax层，并将其命名为OUTPUT_BLOB_NAME，最后将这个层指定为输出层。


作者：heiheiya
                    
 
                

                            c+
                            tensorrt
                            模型
                            C++
                            api


           
    
    

            
                
                    
                
            
            
                
    
        
            需要 登录 后方可回复, 如果你还没有账号请 注册新账号
        
    
                
            
                
                    
                        相关文章

    
        
            Font Awesome 方向图标
        
        
            Winona
            2021-01-14
        
    
    
        661
    


    
        
            XSL-FO 区域
        
        
            Uma
            2020-10-21
        
    
    
        610
    


    
        
            Go语言中结构体方法副本传参与指针传参的区别介绍
        
        
            Rebecca
            2021-05-19
        
    
    
        817
    


    
        
            php实现的表单验证类完整示例
        
        
            Oriel
            2020-10-27
        
    
    
        717
    


    
        
            python3爬虫之入门基础和正则表达式
        
        
            Dreama
            2020-06-22
        
    
    
        633
    


    
        
            C++ std::chrono库使用示例(实现C++ 获取日期,时间戳,计时等功能)
        
        
            Faith
            2023-07-21
        
    
    
        367
    


    
        
            C++面经之什么是RAII面试问题解析
        
        
            Laila
            2023-07-21
        
    
    
        548
    


    
        
            C++使用expected实现优雅的错误处理
        
        
            Tia
            2023-07-21
        
    
    
        1849
    


    
        
            c与c++之间的相互调用及函数区别示例详解
        
        
            Chipo
            2023-07-21
        
    
    
        513
    


    
        
            一文带你了解Docker网络模型
        
        
            Amber
            2023-07-22
        
    
    
        1442
    


    
        
            C++存储持续性生命周期原理解析
        
        
            Rhea
            2023-07-28
        
    
    
        1265
    


    
        
            C++存储链接性原理详解
        
        
            Kathy
            2023-07-28
        
    
    
        743
    


    
        
            C++ 类模板与成员函数模板示例解析
        
        
            Nora
            2023-07-28
        
    
    
        276
    


    
        
            C++开发protobuf动态解析工具
        
        
            Pandora
            2023-07-28
        
    
    
        1666
    


    
        
            利用C++开发一个protobuf动态解析工具
        
        
            Tani
            2023-07-28
        
    
    
        1384
    


    
        
    
    
        
            使用Python对接OpenAi API实现智能QQ机器人的方法
        
        
            Miette
            2023-08-28
        
    
    
        1874


        
    
        
            我要提问
        
    
    
        
        
    
        致谢
        
            帮助他人，成就自己。
            人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。
            1024问感谢每一位朋友的帮助和支持。
            软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。
        
    
    
        
            
    育儿网
    微养生
    全球行
    美食街
    育儿
    菜谱大全
    海南旅游
    女性
    养狗百科
    星座