3.2 机器学习 - NLP和情感分析

Isabella ·

更新时间:2024-11-10

· 905 次阅读

案例1：利用贝叶斯方法的多项式模型分析新闻数据

数据#1

!wget http://qwone.com/~jason/20Newsgroups/20news-bydate.tar.gz
!ls
!tar -xzf 20news-bydate.tar.gz
!ls
!ls 20news-bydate-test
!ls 20news-bydate-train
!ls 20news-bydate-test/rec.autos
!cat 20news-bydate-test/rec.autos/103744

数据#2

!git clone https://github.com/qiwsir/DataSet.git
!ls DataSet
!ls DataSet/20newsbydate
!ls DataSet/movie_data

案例2：情感分析：分析影评数据

NLTK

NLTK是构建Python程序以使用人类语言数据的领先平台。
它为50多种语料库和词汇资源（如WordNet）提供了易于使用的界面，以及用于分类，标记化，词干，标记，解析和语义推理的文本处理库套件。

import nltk
nltk.download('punkt')
sentence = "The Quick brown fox, Jumps over the lazy little dog. Hello World."
word_tokenize(sentence)

在这里插入图片描述
sentence.split()

sentence.split(’,’)

案例3：分析nltk中的影评数据

from nltk.corpus import movie_reviews
nltk.download('movie_reviews')

影评类别

movie_reviews.categories()

在这里插入图片描述
显示存储影评的文档

movie_reviews.fileids()[:5]

在这里插入图片描述
对所有文档中的词汇进行统计

all_words = movie_reviews.words() # 得到所有词汇
freq_dist = nltk.FreqDist(all_words) # 对单词计数
freq_dist.most_common(20) #

在这里插入图片描述

!ls /root/nltk_data/corpora/movie_reviews
!tree /root/nltk_data/corpora/movie_reviews/neg

在这里插入图片描述

作者：喝醉酒的小白

情感情感分析学习 nlp 机器学习

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

Kotlin Android 环境搭建

Quirita 2021-04-07

999

详解flex和position兼容采坑笔记

Efia 2021-01-18

828

Shell中去除字符串前后空格的方法

Iris 2021-08-03

567

php和js实现根据子网掩码和ip计算子网功能示例

Rayna 2020-10-26

541

jQuery利用cookie 实现本地收藏功能(不重复无需多次命名)

Dorothy 2020-03-12

847

Docker AIGC等大模型深度学习环境搭建步骤最新详细版

Jacinda 2023-05-13

1807

一文带你学习一下C++中的构造函数

Winona 2023-05-13

520

C++中set的用法学习

Fawn 2023-05-13

226

Three.js概述和基础知识学习

Echo 2023-05-13

1103

Vue自定义指令学习及应用详解

Maha 2023-05-13

1234

写给小白学习的地理信息的表示法GeoJSON

Kande 2023-05-15

702

从错误中学习改正Go语言五个坏习惯提高编程技巧

Viridis 2023-05-17

1281

Java NIO下ByteBuffer的常用方法学习

Maleah 2023-05-17

473

MySQL基础学习之字符集的应用

Nafisa 2023-05-17

1150

自然语言处理NLPTextRNN实现情感分类

Rhea 2023-07-01

777

循环神经网络TextRNN实现情感短文本分类任务

Kathy 2023-07-01

364

C++函数模板学习示例教程指南

Pandora 2023-07-07

go语言定义零值可用的类型学习教程

Tallulah 2023-07-17

216

Redis数据结构之intset整数集合使用学习

Janna 2023-07-20

1721

Redis数据结构之跳跃表使用学习

Ophelia 2023-07-20

644

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座