动手学深度学习之机器翻译和数据集

Cindy ·

更新时间:2024-11-13

· 848 次阅读

参考伯禹学习平台《动手学深度学习》课程内容内容撰写的学习笔记
原文链接：https://www.boyuai.com/elites/course/cZu18YmweLv10OeV/video/MZn2AdNyGzumTprVPwV3y
感谢伯禹平台，Datawhale，和鲸，AWS给我们提供的免费学习机会！！
总的学习感受：伯禹的课程做的很好，课程非常系统，每个较高级别的课程都会有需要掌握的前续基础知识的介绍，因此很适合本人这种基础较差的同学学习，建议基础较差的同学可以关注伯禹的其他课程：
数学基础：https://www.boyuai.com/elites/course/D91JM0bv72Zop1D3
机器学习基础：https://www.boyuai.com/elites/course/5ICEBwpbHVwwnK3C

机器翻译和数据集

机器翻译（MT）：将一段文本从一种语言自动翻译为另一种语言，用神经网络解决这个问题通常称为神经机器翻译（NMT）。
主要特征：输出是单词序列而不是单个单词。输出序列的长度可能与源序列的长度不同。

数据预处理

将数据集清洗、转化为神经网络的输入minbatch
字符在计算机里是以编码的形式存在，我们通常所用的空格是 \x20 ，是在标准ASCII可见字符 0x20~0x7e 范围内。
而 \xa0 属于 latin1 （ISO/IEC_8859-1）中的扩展字符集字符，代表不间断空白符nbsp(non-breaking space)，超出gbk编码范围，是需要去除的特殊字符。再数据预处理的过程中，我们首先需要对数据进行清洗。

分词

字符串—单词组成的列表

建立词典

单词组成的列表—单词id组成的列表

载入数据集

每次都要把句子的每个词补到相同长度。
数据生成器的好处是每次只会生成一组。

Encoder-Decoder

encoder：输入到隐藏状态
decoder：隐藏状态到输出

Image Name

Sequence to Sequence模型 模型：

训练
Image Name
预测

Image Name

具体结构：

Image Name

Encoder Decoder 损失函数 Beam Search

简单greedy search：

Image Name

维特比算法：选择整体分数最高的句子（搜索空间太大）
集束搜索：

Image Name

作者：water19111213

动手学机器翻译数据集数据学习深度学习

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

.NET实现工资管理系统

Genet 2020-03-17

878

Shell中去除字符串前后空格的方法

Iris 2021-08-03

567

详解css栅格系统在项目中的灵活运用

Ursula 2020-04-01

908

CSS清除浮动方法大全(小结)

Quirita 2020-01-27

903

深入浅析CSS 选择器分组

Coral 2021-01-26

954

PHP的简单跳转提示的实现详解

Floria 2021-01-03

687

sessionStorage多Tab标签页数据共享问题分析

Gella 2023-07-20

18

C++前缀树字典树的学习与模拟实现代码示例

Kirima 2023-07-20

1789

数据结构之带头结点的单链表

Grizelda 2023-07-20

1827

C++各种输出数据类型详解

Janna 2023-07-20

623

Linux signal()函数的使用学习

Fawn 2023-07-21

785

Golang基于Vault实现敏感数据加解密

Ophelia 2023-07-21

1848

用Python进行数据清洗以及值处理

Crystal 2023-07-21

283

Python常用的数据清洗方法详解

Laila 2023-07-21

1301

Python multiprocessing.value实现多进程数据共享的示例

Aine 2023-07-21

1131

深入探究python中Pandas库处理缺失数据和数据聚合

Bliss 2023-07-21

191

Python中Pandas库的数据处理与分析

Lillian 2023-07-21

155

pandas删除重复数据简单方法

Tertia 2023-07-21

311

详解C#如何将枚举以下拉数据源的形式返回给前端

Olive 2023-07-21

797

Flutter中跨组件数据传递的方法总结

Angie 2023-07-21

906

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座