【李宏毅机器学习笔记】6、简单介绍深度学习（Deep Learning）

Pandora ·

更新时间:2024-11-13

· 609 次阅读

【李宏毅机器学习笔记】1、回归问题（Regression）

【李宏毅机器学习笔记】2、error产生自哪里？

【李宏毅机器学习笔记】3、gradient descent

【李宏毅机器学习笔记】4、Classification

【李宏毅机器学习笔记】5、Logistic Regression

【李宏毅机器学习笔记】6、简短介绍Deep Learning

【李宏毅机器学习笔记】7、反向传播（Backpropagation）

【李宏毅机器学习笔记】8、Tips for Training DNN

【李宏毅机器学习笔记】9、Convolutional Neural Network（CNN）

------------------------------------------------------------------------------------------------------

【李宏毅深度强化学习】视频地址：https://www.bilibili.com/video/av10590361?p=13

课件地址：http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML17_2.html

-------------------------------------------------------------------------------------------------------

开局介绍了点深度学习的历史和现状，总之就是一句话，很火！

之前的课程说机器学习分为三个步骤，深度学习也一样。

Step1：定义一个神经网络模型

以上篇笔记的例子，很多个Logistic Regression串起来，就形成一个神经网络（Neural Network）。

神经元的不同的连接方式就会形成很多不同的网络。

网络的参数

如图，共有6个神经元。每个神经元都有一个weight和bias。weight和bias是通过training找出来的。

以图中为例子，输入1和-1，经过1*1+（-1）*（-2）+ 1=4，再经过 sigmoid function就得到0.98。

当weight和bias都知道的话，整个network就是一个普通function，输入[1，-1]，输出[0.62，0.83] ；输入[0，0]，输出[0.51，0.85]

weight和bias的数值有无穷个，每一组参数代表一个function，所以network就是一个function set（model）。

和刚才的例子类似，所有神经元排成一层一层的样子。

输入的地方就是Input Layer，输出的地方就是Output Layer。中间就统称Hidden Layers。

Deep就是指有很多层Hidden Layers。

注意：这些深层网络并不是单纯的叠出来的，像ResidualNet，中间是还有用快捷链路这样的特殊组件。

Matrix Operation

Neural Network的运算可以看成是矩阵运算。如上图所示。

可以看到，每一层都可以用这样的方式来计算。

所以，整个网络做的就只是一连串嵌套的 wx+b 的矩阵运算。

把整个网络做成矩阵运算的好处就是：可以调用GPU并行计算来加速运算。

Output Layer

中间Hidden Layers可以看做是一个feature extractor。它做的事情，就类似于上篇笔记讲到的feature engineering做的事情（feature transformation等等），将原本没办法分类的feature转换成能被分类的feature。

所以Output Layer以这些转换后的feature作为输入，经过Softmax函数，就实现 Multi-class Classifier。

手写数字识别的例子

输入图片分辨率为16*16，总共256维。假设有字迹的格子数值为1，否则为0 。

输入256维，输出为10维。10维代表识别为每一个数字的几率。

这个例子中，知道输入为256维（图片分辨率16*16），输出为10维。

中间Hidden Layers多少层，每一层多少个神经元，这些都没有一个合理的根据去确定，就只能根据你的经验和直觉去设定。

（也有自动设定网络架构的方法，比如evolutionary neural networks，这个有兴趣自己找资料了解下）

Step 2：评价一个函数的好坏

估测出的

Loss Function就是所有的 Cross Entropy 的和。训练的目的就是找出一组weight和bias，能使Loss Function的值最小化。

更新参数的方法用gradient descent。

step 3：找出最好的函数

就是对L求偏微分，然后乘上learning rate，作为更新量。不断重复这个过程。（gradient descent更具体的内容可以看第一篇笔记）

作者：qqqeeevvv

学习笔记学习深度学习 deep 机器学习

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

Kotlin Android 环境搭建

Quirita 2021-04-07

999

HTML清除浮动的其中两种方式

Alanni 2020-11-09

750

.NET实现工资管理系统

Genet 2020-03-17

878

Shell中去除字符串前后空格的方法

Iris 2021-08-03

567

css控制边界与边框示例(内边距、外边距使用方法)

Halima 2021-06-19

620

SQL注入之sqlmap入门学习

Ula 2023-05-13

1477

Docker AIGC等大模型深度学习环境搭建步骤最新详细版

Jacinda 2023-05-13

1807

一文带你学习一下C++中的构造函数

Winona 2023-05-13

520

C++中set的用法学习

Fawn 2023-05-13

226

Three.js概述和基础知识学习

Echo 2023-05-13

1103

Vue自定义指令学习及应用详解

Maha 2023-05-13

1234

写给小白学习的地理信息的表示法GeoJSON

Kande 2023-05-15

702

从错误中学习改正Go语言五个坏习惯提高编程技巧

Viridis 2023-05-17

1281

Java NIO下ByteBuffer的常用方法学习

Maleah 2023-05-17

473

MySQL基础学习之字符集的应用

Nafisa 2023-05-17

1150

C++函数模板学习示例教程指南

Pandora 2023-07-07

go语言定义零值可用的类型学习教程

Tallulah 2023-07-17

216

Redis数据结构之intset整数集合使用学习

Janna 2023-07-20

1721

Redis数据结构之跳跃表使用学习

Ophelia 2023-07-20

644

Redis数据结构之listpack和quicklist使用学习

Natalia 2023-07-20

1968

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座