【李宏毅机器学习笔记】7、反向传播（Backpropagation）

Florida ·

更新时间:2024-09-21

· 965 次阅读

【李宏毅机器学习笔记】1、回归问题（Regression）

【李宏毅机器学习笔记】2、error产生自哪里？

【李宏毅机器学习笔记】3、gradient descent

【李宏毅机器学习笔记】4、Classification

【李宏毅机器学习笔记】5、Logistic Regression

【李宏毅机器学习笔记】6、简短介绍Deep Learning

【李宏毅机器学习笔记】7、反向传播（Backpropagation）

【李宏毅机器学习笔记】8、Tips for Training DNN

【李宏毅机器学习笔记】9、Convolutional Neural Network（CNN）

------------------------------------------------------------------------------------------------------

【李宏毅深度强化学习】视频地址：https://www.bilibili.com/video/av10590361?p=13

课件地址：http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML17_2.html

-------------------------------------------------------------------------------------------------------

使用反向传播（Backpropagation）原因

经过前面几篇笔记的介绍，知道可以用gradient descent来更新参数，使Loss Function最小化。

但是面对Neural Network可能上百万的参数，做gradient descent会很困难。所以需要引入反向传播（Backpropagation）使gradient descent 做得更有效率一点。

链式法则（Chain Rule）

反向传播（Backpropagation）就用到链式法则（Chain Rule）的知识，没有涉及其他高深的知识。

反向传播（Backpropagation）

。接下来就主要讲怎么解这个偏微分。

为方便讲解，取网络中的红色三角形标识的区域进一步讲解。

以图中的部分网络为例，根据链式法则可以知道，偏微分。

计算的过程叫做Forward pass，因为这一项是从网络由前往后计算得出的（等下就知道为什么是由前往后）。

计算的过程叫做Backward pass，因为这一项是从网络由后往前计算得出的（等下就知道为什么是由后往前）。

Forward pass

Forward pass就是计算。以图中的例子，其实可以知道，这个偏微分的结果是可以口算的。

它都会等于weight前面的输入 x1，x2 。

举个更具体的例子，如图，每一个都会等于前面weight的输入值。

Backward pass

就不像前面Forward pass那么简单，因为 z 后面还要经过很多过程才能得到 C 。

但是不管那么多，先把写成。

由于 z 通过sigmoid函数得到 a，所以代表 sigmoid函数的微分。

然后还剩下这一项怎么算呢？

使用链式法则可以写成如图所示。

由于现在不知道网络后面又有怎样的过程，所以有两项是我们现在还不知道的。

这两项的计算方法等下再讲，现在先假设我们知道这两项的值，这样就能算出的值，如下

这个就是的结果。

把Backward pass的过程用另一种方式展现出来，如图所示，更能体现Backward pass由后往前的特点。

其中是一个常数，因为在Forward pass的过程就已经算出 z ，所以在z算出来的情况下，再经过sigmoid函数也仍然是一个固定的值。

所以在Backward pass由后往前的过程中，在三角形那里，做的运算并不是通过一个非线性函数，而是直接乘上一个常数。

刚才为了简便，先假设了，这两项未知的值是已知，然后就能算出。

下面来具体讲下如何计算那两项的结果。

第一种情况：后面接的就已经是Output Layers

那很直接，，的计算结果就如图所示。

第二种情况：后面不是Output Layers，还有很多层

其实原理和前面例子的计算一样。

z对C的微分，取决于 z 后一层 的 z'对C的微分 和 z''对C的微分。

所以，如果 z' 和 z'' 后面还有很多层，那就一直往后推下去。直到最后一层，这时计算方法就如刚才的第一种情况那样可以直接算出来。然后再反推回来，知道最后一层就可以求倒数第二层，知道倒数第二层又可以求倒数第三层……

按刚才的方法来看，感觉挺复杂的。为了算第一层要算后面的每一层直到output layer，再反推回第一层。

所以为了使计算更有效率，就把刚才的顺序颠倒过来，直接从output layer开始算起，这样就发现每一层都能直接秒算。

以上图为例子，本来为了算出，需要先算出和，……直到最后一层。

但现在从output layer开始算，只要算出，，就能秒算出前面的，立刻变得有效率了。

总结

由前往后，做Forward Pass，算出

。由后往前，做Backward Pass，算出

。两者相乘就是最后的结果

。
作者：qqqeeevvv

学习笔记学习反向传播机器学习

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

Kotlin Android 环境搭建

Quirita 2021-04-07

999

深入理解Linux shell中21的含义(全网最全，看完就懂)

Lecea 2021-04-30

959

Shell中去除字符串前后空格的方法

Iris 2021-08-03

567

css控制边界与边框示例(内边距、外边距使用方法)

Halima 2021-06-19

620

关于MongoDB数据库学习路线指南

Kande 2023-05-13

295

SQL注入之sqlmap入门学习

Ula 2023-05-13

1477

Docker AIGC等大模型深度学习环境搭建步骤最新详细版

Jacinda 2023-05-13

1807

一文带你学习一下C++中的构造函数

Winona 2023-05-13

520

C++中set的用法学习

Fawn 2023-05-13

226

Three.js概述和基础知识学习

Echo 2023-05-13

1103

Vue自定义指令学习及应用详解

Maha 2023-05-13

1234

写给小白学习的地理信息的表示法GeoJSON

Kande 2023-05-15

702

从错误中学习改正Go语言五个坏习惯提高编程技巧

Viridis 2023-05-17

1281

Java NIO下ByteBuffer的常用方法学习

Maleah 2023-05-17

473

MySQL基础学习之字符集的应用

Nafisa 2023-05-17

1150

C++函数模板学习示例教程指南

Pandora 2023-07-07

go语言定义零值可用的类型学习教程

Tallulah 2023-07-17

216

Redis数据结构之intset整数集合使用学习

Janna 2023-07-20

1721

Redis数据结构之跳跃表使用学习

Ophelia 2023-07-20

644

Redis数据结构之listpack和quicklist使用学习

Natalia 2023-07-20

1968

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座