NLP dream 系列总结 1 词的向量化

Chynna ·

更新时间:2024-11-14

· 955 次阅读

词袋模型

就是类似有个集合中有很多个词，根据来的句子中的分词结果进行描述结果，然后生成一个向量，其实每个词出现了几次就是几，
1 其中词袋的维度和最终的句子向量的维度是一样的
2不能体现词前后位置

NNLM

词向量：是利用一定维度向量来表示某个词袋中所有词
神经概率语言模型
有某句话，然后根据前面一些词可以预测得到下个词是什么，其中通过softmax进行概率计算。
在这里插入图片描述神经网路语言模型就是根据贝叶斯概率公式计算某句话产生的概率
先分词然后随机初始化所有词的向量，然后根据预料对上述神经网络进行训练输出连接一个softmax得到下个词的概率。
设置损失函数，然后对神经网络的参数以及随机初始化的向量一起进行优化，可以得到优化后的参数，这样不仅得到了一个优化后的模型，还得到一个优化后的向量C（词向量）
在这里插入图片描述

word2vec

word2vec cbow 前后得中间词小数据
skim-garam 中间得前后大数据

在这里插入图片描述

word2vec 后面接
hierarchical softmax 和negative sampling 都可以word2vec后面的优化过程

参考：https://www.cnblogs.com/peghoty/p/3857839.html

作者：丁叔叔

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

详解flex和position兼容采坑笔记

Efia 2021-01-18

828

一文读懂NLP之HMM模型代码python实现与演示

Tawnie 2021-01-22

734

【NLP】之结巴分词

Ailis 2021-07-19

622

问答摘要与推理(nlp)之数据预处理

May 2020-03-29

920

[NLP入门]基于 Dense 层的电影评论分类

Daisy 2020-07-20

909

Python机器学习NLP自然语言处理基本操作之京东评论分类

May 2021-12-16

1229

Python机器学习NLP自然语言处理基本操作之Seq2seq的用法

Kande 2021-12-16

1500

Python机器学习NLP自然语言处理基本操作电影影评分析

Iola 2021-12-16

616

Python机器学习NLP自然语言处理基本操作家暴归类

Fawziya 2021-12-16

965

Python机器学习NLP自然语言处理基本操作词向量模型

Alexandra 2021-12-16

273

Python机器学习NLP自然语言处理基本操作词袋模型

Tama 2021-12-16

795

Python机器学习NLP自然语言处理基本操作关键词

Calandra 2021-12-16

1758

Python机器学习NLP自然语言处理Word2vec电影影评建模

Ula 2021-12-16

1292

Python机器学习NLP自然语言处理基本操作精确分词

Haidee 2021-12-16

57

Python机器学习NLP自然语言处理基本操作新闻分类

Cybill 2021-12-16

363

使用torchtext导入NLP数据集的操作

Kitty 2021-12-16

265

Python机器学习NLP自然语言处理基本操作之命名实例提取

Shanon 2022-01-14

780

nlp计数法应用于PTB数据集示例详解

Jacinda 2022-07-15

1186

nlp自然语言处理基于SVD的降维优化学习

Xandy 2022-10-23

1262

nlp自然语言处理学习CBOW模型类实现示例解析

Isis 2022-10-23

600

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座