Node.js 利用cheerio制作简单的网页爬虫示例

Faye ·

更新时间:2024-11-15

· 549 次阅读

本文介绍了Node.js 利用cheerio制作简单的网页爬虫示例，分享给大家，具有如下：

1. 目标

完成对网站的标题信息获取将获取到的信息输出在一个新文件工具: cheerio，使用npm下载npm install cheerio cheerio的API使用方法和jQuery的使用方法基本一致如果熟练使用jQuery，那么cheerio将会很快上手

2. 代码部分

介绍: 获取segment fault页面的列表标题，将获取到的标题列表编号，最终输出到pageTitle.txt文件里


const https = require('https');
const fs = require('fs');
const cheerio = require('cheerio');
const url = 'https://segmentfault.com/';
https.get(url, (res) => {
  let html = '';
  res.on('data', (data) => {
    html += data;
  });
  res.on('end', () => {
    getPageTitle(html);
  });
}).on('error', () => {
  console.log('获取网页信息错误');
});
function getPageTitle(html) {
  const $ = cheerio.load(html);
  let chapters = $('.news__item-title');
  let data = [];
  let index = 0;
  let fileName = 'pageTitle.txt';
  for (let i = 0; i < chapters.length; i++) {
    let chapterTitle = $(chapters[i]).find('a').text().trim();
    index++;
    data.push(`\n${index}, ${chapterTitle}`);
  }
  fs.writeFile(fileName, data, 'utf8', (err) => {
    if (err) {
      console.log('fs文件系统创建新文件失败', err);
    }
    console.log(`已成功将获取到的标题放入新文件${fileName}文件中`)
  })
}

爬虫 node.js 示例 cheerio node js

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

Foundation 提醒框

Sally 2021-01-16

813

JavaScript 字符串

Shanon 2021-02-22

641

.Net集合排序的一种高级玩法实例教程

Rowena 2020-04-05

912

ubuntu修改terminal终端的主机名的实现方法

Kita 2021-05-26

748

Mac中体验ASP.NET 5 beta2的K gen代码生成

Echo 2020-10-05

870

important的妙用解决firefox和ie的css兼容问题

Flower 2020-11-13

940

C++ std::chrono库使用示例(实现C++ 获取日期,时间戳,计时等功能)

Faith 2023-07-21

367

c与c++之间的相互调用及函数区别示例详解

Chipo 2023-07-21

513

C#语言async await之迭代器工作原理示例解析

Jacinthe 2023-07-22

549

C#语言async await工作原理示例解析

Winona 2023-07-22

1206

C#实现从PPT中提取文本的示例代码

Ophelia 2023-07-22

1546

C#实现文件压缩与解压功能的示例代码

Agnes 2023-07-22

214

C# 中的智能枚举之如何在枚举中增加行为(示例代码)

Aurora 2023-07-22

1219

基于WPF实现面包屑控件的示例代码

Glory 2023-07-22

780

docker存储目录迁移示例教程

Pelagia 2023-07-22

1183

使用docker compose部署emqx集群的示例

Ianthe 2023-07-22

1083

nginx location指令(匹配顺序匹配冲突)实战示例详解

Nafisa 2023-07-22

1688

Python实战使用XPath采集数据示例解析

Diane 2023-07-24

1433

C++ 类模板与成员函数模板示例解析

Nora 2023-07-28

276

nginx限制ip访问频率的实现示例

Rhea 2023-08-08

1403

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座