人工智能学习PyTorch教程之层和块

Zahara ·

更新时间:2024-11-14

· 110 次阅读

对于多层感知机而言，整个模型做的事情就是接收输入生成输出。但是并不是所有的多层神经网络都一样，所以为了实现复杂的神经网络就需要神经网络块，块可以描述单个层、由多个层组成的组件或整个模型本身。使用块进行抽象的一个好处是可以将一些块组合成更大的组件。

从编程的角度来看，块由类（class）表示。它的任何子类都必须定义一个将其输入转换为输出的正向传播函数，并且必须存储任何必需的参数。注意，有些块不需要任何参数。最后，为了计算梯度，块必须具有反向传播函数。幸运的是，在定义我们自己的块时，由于autograd 中引入）提供了一些后端实现，我们只需要考虑正向传播函数和必需的参数。

这一部分我们就要自定义自己的层和块。

先用实现一个简单的多层感知机：


import torch
from torch import nn
from torch.nn import functional as F
net = nn.Sequential(nn.Linear(20, 256), nn.ReLU(), nn.Linear(256, 10))
X = torch.rand(2, 20)
net(X)

这个多层感知机包含一个具有256个单元和ReLU激活函数的全连接的隐藏层，然后是一个具有10个隐藏单元且不带激活函数的全连接的输出层。

通过实例化nn.Sequential来构建我们的模型，层的执行顺序就是传入参数的顺序。

nn.Sequential定义了一种特殊的Module，即在PyTorch中表示一个块的类。它维护了一个由Module组成的有序列表（Linear类是Module的子类）。

正向传播（forward）函数：将列表中的每个块连接在一起，将每个块的输出作为下一个块的输入。

通过net(X)调用我们的模型来获得模型的输出。是net.__call__(X)的简写。（这一句先不管他有什么，继续往下看。）

我们也可以自己手写一个多层感知机：


class MLP(nn.Module):
    def __init__(self):
        # 调用`MLP`的父类的构造函数来执行必要的初始化。
        # 这样，在类实例化时也可以指定其他函数参数，例如模型参数`params`（稍后将介绍）
        super().__init__()
        self.hidden = nn.Linear(20, 256)  # 隐藏层
        self.out = nn.Linear(256, 10)  # 输出层
    # 定义模型的正向传播，即如何根据输入`X`返回所需的模型输出
    def forward(self, X):
        # 注意，这里我们使用ReLU的函数版本，其在nn.functional模块中定义。
        return self.out(F.relu(self.hidden(X)))
net = MLP()
net(X)

通过super().__init__()调用父类的__init__函数，省去了重复编写适用于大多数块的模版代码的痛苦。

实例化两个全连接层，分别为self.hidden和self.out。

除非我们实现一个新的运算符，否则我们不用担心反向传播函数或参数初始化，系统将自动生成这些。

前边说调用net() 就相当于调用net.__call__(X)，因为我们在自己的MLP中写了forward，但是我们没有调用，只使用net() 他就自动执行forward了。就是因为会自动调用.__call__函数使forward执行。

说完后两条说第一条：

有序是怎么实现的，构建构一个简化的MySequential：


class MySequential(nn.Module):
    def __init__(self, *args):
        super().__init__()
        for block in args:
            # 这里，`block`是`Module`子类的一个实例。我们把它保存在'Module'类的成员变量
            # `_modules` 中。`block`的类型是OrderedDict。
            self._modules[block] = block
    def forward(self, X):
        # OrderedDict保证了按照成员添加的顺序遍历它们
        for block in self._modules.values():
            X = block(X)
        return X

MySequential类提供了与默认Sequential类相同的功能。


net = MySequential(nn.Linear(20, 256), nn.ReLU(), nn.Linear(256, 10))
net(X)

用MySequential类实现的多层感知机和Sequential类实现的一样。

注意这里只是写出了其执行顺序，是简化版的Sequential类！

到此这篇关于人工智能学习PyTorch教程之层和块的文章就介绍到这了,更多相关PyTorch 层和块内容请搜索软件开发网以前的文章或继续浏览下面的相关文章希望大家以后多多支持软件开发网！

程之 pytorch 人工智能

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

关于canvas绘制模糊问题的解决方法

Belle 2020-02-15

671

利用kernel提供的接口打印进程号(pid)

Cynthia 2020-09-01

568

正则表达式小脚本(对输入内容进行处理)

Octavia 2021-08-05

844

图文详解如何利用PyTorch实现图像识别

Yelena 2023-04-06

918

Pytorch中的model.train() 和 model.eval() 原理与用法解析

Gitana 2023-04-14

1817

分布式训练training-operator和pytorch-distributed RANK变量不统一解决

Pandora 2023-04-14

1631

基于Pytorch实现分类器的示例详解

Viveka 2023-04-18

1798

详解利用Pytorch实现ResNet网络

Tia 2023-04-20

1496

PyTorch定义Tensor及索引和切片(最新推荐)

Kara 2023-04-22

750

python windows安装cuda+cudnn+pytorch教程

Fawn 2023-05-12

646

C++初阶教程之缺省参数与函数重载

Hester 2023-05-12

1789

Go并发编程之死锁与活锁的案例分析

Crystal 2023-05-13

848

pytorch版本PSEnet训练并部署方式

Adelaide 2023-05-13

471

PyTorch模型转换为ONNX格式实现过程详解

Tani 2023-05-27

556

利用Pytorch实现ResNet网络构建及模型训练

Tanisha 2023-05-27

1264

Pytorch实现ResNet网络之ResidualBlock残差块

Kande 2023-05-27

1208

PyTorch常用函数torch.cat()中dim参数使用说明

Tricia 2023-05-27

372

mysql数据库存储过程之游标(光标cursor)详解

Cytheria 2023-07-20

142

C#控件编程之文本框(TextBox)的使用

Phaedra 2023-07-20

1922

Pytorch基础教程之torchserve模型部署解析

Xylona 2023-07-20

1007

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座