ResNet18的基本原理及tensorflow2.0实现

Dianthe ·

更新时间:2024-09-20

· 911 次阅读

注：阅读本博客之前，你需要先掌握：全连接神经网络，卷积神经网络的基本原理。

背景介绍

随着LeNet-5，AlexNet，VGG等神经网络结构的出现，卷积神经网络逐渐从单纯的只拥有卷积操作和下采样的神经网络发展为具有max pooling、dropout以及非线性函数的神经网络。在网络结构变得不断复杂的同时，人们发现，神经网络的效率并没有预期得到提升，反而容易出现梯度消失等情况，因而导致loss难以减少等现象。

对于出现梯度消失的原因，大家可以参考这篇：
https://blog.csdn.net/jasonleesjtu/article/details/89185185

ResNet通过在两个卷积层之间添加短路（shortcut）的方式，有效地解决了在神经网络层数不断增加的情况下难以训练的问题。

网络结构 1、Basic Block

在这里插入图片描述
上图所示就是一个Basic Block。其中，weight layer可看成是卷积层，F(x)是x通过两个卷积层之后所学习到的。该结构的特点，就是在两个卷积层外面添加了一条shortcut，使得x经过两个卷积层之后可以以x+F(x)的形式输出。

那么，为什么这种结构可以有效地解决因网络层数增加而导致的模型难以训练的问题呢？我们以解决梯度消失为例：
yly_lyl=h(xlx_lxl)+F(xlx_lxl,wlw_lwl)
xl+1x_{l+1}xl+1=f(yly_lyl)
其中：xlx_lxl和xl+1x_{l+1}xl+1分别是这个Basic Block的输入与输出项；h(xlx_lxl)=xlx_lxl，即identity，ResNet的核心；F(xlx_lxl,wlw_lwl)是x通过两个卷积层之后所学习到的，也称为残差(residual)；f表示relu函数。

如果两个卷积层之间还有其他卷积层或者一般层，则可以如下表示：
xLx_LxL=xlx_lxl+∑i=1L−1F(xi,wi)\sum_{i=1}^{L-1} F(x_i,w_i)∑i=1L−1F(xi,wi)

dlossdxl\left. \frac{dloss}{dx_l} \right.dxldloss=dlossdxL\left. \frac{dloss}{dx_L} \right.dxLdloss*dxLdxl\left. \frac{dx_L}{dx_l} \right.dxldxL=dlossdxL\left. \frac{dloss}{dx_L} \right.dxLdloss(1+d∑i=1L−1F(xi,wi)dxl\left. \frac{d{\sum_{i=1}^{L-1} F(x_i,w_i)}}{dx_l} \right.dxld∑i=1L−1F(xi,wi))

其中，1表示shortcut可以无条件地继承梯度，当d∑i=1L−1F(xi,wi)dxl\left. \frac{d{\sum_{i=1}^{L-1} F(x_i,w_i)}}{dx_l} \right.dxld∑i=1L−1F(xi,wi)接近0的时候，模型仍可保持网络层数较少时的梯度，因此Basic Block可以有效解决因网络层数增加而导致的模型难以训练的问题。

ResNet的一大特点，就是：当feature map的大小减少一半时，feature map的数量增加一倍。

在h(xlx_lxl)+F(xlx_lxl,wlw_lwl)的时候，很多人可能会想到维度不同的问题：以xlx_lxl的维度为[b,32,32,3]为例，如果经过了stride=2的卷积层，维度（大小）会减少为[b,16,16,c]，这时在与identity相加之前，一般会先用1*1的卷积核（kernel）对xlx_lxl进行同步长卷积处理，这样就完成了当feature map的大小减少一半时，feature map的数量增加一倍的目的；当然也可以0来填充增加出来的维度。

2、ResBlock

ResBlock由多个Basic Block连接而成。

3、ResNet18

在这里插入图片描述
ResNet18包含开始的一个卷积层，4个ResBlock（每个ResBlock包含2个Basic Block，每个Basic Block包含两个卷积层），和最后的一个全连接层，即：1+4*4+1=18。

网络搭建

导入相关的包

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers, Sequential

定义Basic Block

#定义Basic Block
class BasicBlock(layers.Layer):
  def __init__(self, filter_num, stride=1):
        super(BasicBlock, self).__init__()
        #第一小块
        self.conv1 = layers.Conv2D(filter_num, (3, 3), strides=stride, padding='same')
        self.bn1 = layers.BatchNormalization()
        self.relu = layers.Activation('relu')
        #第二小块
        self.conv2 = layers.Conv2D(filter_num, (3, 3), strides=1, padding='same')
        self.bn2 = layers.BatchNormalization()
        if stride != 1:
            self.downsample =Sequential()
            self.downsample.add(layers.Conv2D(filter_num, (1, 1), strides=stride))
        else:
            self.downsample = lambda x:x
  def call(self, inputs, training=None):
        identity = self.downsample(inputs)
        out = self.conv1(inputs)
        out = self.bn1(out,training=training)
        out = self.relu(out)
        out = self.conv2(out)
        out = self.bn2(out,training=training)
        out = layers.add([out, identity])
        out = tf.nn.relu(out)
        return out

代码解释：
1、第一小块和第二小块分别是下图的两个weight layer。在这里插入图片描述
2、判断stride是否为1，若stride=1，说明卷积前后维度相同，可以直接相加；stride！=1，则进行同stride卷积操作，再进行相加。

定义ResNet

#定义ResNet
class ResNet(keras.Model):
    def build_resblock(self, filter_num, blocks, stride=1):
        res_blocks = Sequential()
        res_blocks.add(BasicBlock(filter_num, stride))
        for _ in range(1, blocks):
            res_blocks.add(BasicBlock(filter_num, stride=1))
        return res_blocks
    def __init__(self, layer_dims, num_classes=10):#mnist有10类
        super(ResNet, self).__init__()
        self.stem = Sequential([layers.Conv2D(64, (3, 3), strides=(1, 1)),
                                layers.BatchNormalization(),
                                layers.Activation('relu'),
                                layers.MaxPool2D(pool_size=(2, 2), strides=(1, 1), padding='same')
                                ])
        self.layer1 = self.build_resblock(64,  layer_dims[0])
        self.layer2 = self.build_resblock(128, layer_dims[1], stride=2)
        self.layer3 = self.build_resblock(256, layer_dims[2], stride=2)
        self.layer4 = self.build_resblock(512, layer_dims[3], stride=2)
        self.avgpool = layers.GlobalAveragePooling2D()
        self.fc = layers.Dense(num_classes)
    def call(self, inputs, training=None):
        x = self.stem(inputs,training=training)
        x = self.layer1(x,training=training)
        x = self.layer2(x,training=training)
        x = self.layer3(x,training=training)
        x = self.layer4(x,training=training)
        x = self.avgpool(x)
        x = self.fc(x)
        return x

代码解释：
1、build_resblock根据给定的blocks值，构建ResBlock。
2、GlobalAveragePooling2D()可以在不确定输出维度的情况下，把[b,512,h,w]变成[b,512]，值为每一个channel上所有h，w像素的均值。

定义ResNet18。

def ResNet18():
    return ResNet([2, 2, 2, 2])

由于定义ResNet的代码较长，我们可以把它保存，然后当作包使用，例如：保存为resnet.py，在需要时
from resnet import ResNet18
model=ResNet18()，即可。

参考文献

1.https://www.jianshu.com/p/ec0967460d08

作者：A Peaceful Tree

tensorflow resnet

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

Powershell获取图片名字、文件夹及拍摄时间的例子

Naomi 2020-03-25

702

探索PowerShell(一) 初识 PowerShell

Maleah 2021-05-23

828

TensorFlow中关于tf.app.flags命令行参数解析模块

Fern 2022-11-09

1394

Tensorflow高性能数据优化增强工具Pipeline使用详解

Bliss 2022-11-09

利用OpenCV+Tensorflow实现的手势识别

Dulcea 2022-11-12

987

Tensorflow2.1MNIST图像分类实现思路分析

Malina 2022-11-20

1598

Tensorflow2.1实现文本中情感分类实现解析

Rose 2022-11-20

1182

Tensorflow2.1完成对MPG回归预测详解

Querida 2022-11-20

696

Tensorflow2.4从头训练Word Embedding实现文本分类

Serafina 2023-01-06

1212

Tensorflow2.4搭建单层和多层Bi-LSTM模型

Kathy 2023-01-06

深度学习Tensorflow 2.4 完成迁移学习和模型微调

Tani 2023-01-06

1085

Python基于TensorFlow接口实现深度学习神经网络回归

Lark 2023-02-18

364

tensorflow1.x和tensorflow2.x中的tensor转换为字符串的实现

Olivia 2023-02-25

1309

tensorflow基于Anaconda环境搭建的方法步骤

Oria 2023-02-28

278

Anaconda中安装Tensorflow的过程

Psyche 2023-03-31

506

详解利用Pytorch实现ResNet网络

Tia 2023-04-20

1496

使用Python、TensorFlow和Keras来进行垃圾分类的操作方法

Laila 2023-05-12

349

tensorflow之如何使用GPU而不是CPU问题

Ida 2023-05-13

644

Tensorflow训练模型默认占满所有GPU的解决方案

Bella 2023-05-13

714

利用Pytorch实现ResNet网络构建及模型训练

Tanisha 2023-05-27

1264

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座