介绍:
相较于简单暴力的提高深度网络性能方法:加深网络模型,增加数据集。作者提出结合深度模型和传统机器视觉思想来提高效能。(准确率+效率,特别适合用于移动端或是嵌入式,计算能力有限,为解决这一问题,可从减少参数入手)
base:赫布理论、多尺度、稀疏结构、network in network(下一篇阅读)
相关工作:
1、池化有益于准确率的提升
2、多滤波器模拟多尺度的学习
3、network in network ,提高网络的表现能力,增加深度却不增加计算复杂度,也可以增加宽度,使用33、55的滤波器
4、r-cnn的两个子阶段:低阶特征产生候选框,cnn进行分类(更高的目标边界框召回使用多盒预测,并融合了更好的边界框候选区域分类方法)
解决思路:
用大型深度稀疏网络结构拟合数据分布
卷积利用了空间域上的稀疏性,对上一层块采用密集连接的集合
11的filter降维处理,使得在每个inception module内部单元数量不受限制
层数越高,33、5*5的filter数量越来越多
googleNet:
22权重层,平均池化层取代全连接层
为避免反向传播过程中梯度的不稳定,在inception(4a)(4b)上j使用辅助分类器,推断时不需要辅助分类器
训练测试googleNet:
1、由于输入图像batch、采样方式的不同,得到并集成7个模型来推断。
2、裁剪方式:每张图像对应4个尺度,取左中右块,上下左右中裁剪出224*224的图像