caffe ssd 优化

Phyllis ·
更新时间:2024-11-14
· 863 次阅读

一、数据预处理加速(提升 4~6 倍) 优化原因: 原版 caffe ssd 数据预处理速度很慢(尤其是遇到 depthwise conv 的时候) 数据预处理的速度远远跟不上前向和反向计算的速度,导致训练速度很慢 优化方法: 数据预处理对多幅图片的处理改为多线程 数据预处理过程中,不需要将图片格式在 datumcv::Mat 之间来回转换导致不必要的时间浪费 参考代码 https://github.com/maidabu/caffe-ssd-optimized 替换 caffe ssd 源代码中的相应层 二、多卡加速:NVIDIA NCCL 优化原因: 使用多卡加载预训练模型进行训练的时候报错,没有安装 nccl 优化方法: 安装 ncclgit clone https://github.com/NVIDIA/nccl.git cd nccl sudo make install -j16 三、重新编译 cudnn_conv 使其支持 cudnn7 优化原因: depthwise_conv 训练耗时严重,并且占用太多内存,cudnn7+中对其做了优化,支持 Group 卷积 优化方法: 参考代码 https://github.com/chuanqi305/MobileNetv2-SSDLite/tree/master/src 替换 caffe ssd 源代码中的相应层#include "caffe/layers/cudnn_conv_layer.hpp" #if CUDNN_MAJOR >= 7 #define USE_CUDNN_GROUP_INTERNAL #endif
作者:man_world



caffe 优化

需要 登录 后方可回复, 如果你还没有账号请 注册新账号