Python每日一练(18)-抓取小说目录和全文

Oprah ·
更新时间:2024-11-14
· 503 次阅读

本文要实现的案例是通过 requests 库抓取 斗破小说网 上指定的小说的目录和每一节的完整内容(只保留纯文本内容)。当抓取包含目录和小说内容的页面后,会通过正则表达式分析 HTML 代码,并提取出目录标题,对应的 url 以及文本形式的小说内容。现在进入斗破小说网,选择一篇小说,本文选择了 斗破苍穹 目录页面如下图所示:
原创文章 39获赞 701访问量 3万+ 关注 私信 展开阅读全文
作者:Amo Xiang



Python 小说

需要 登录 后方可回复, 如果你还没有账号请 注册新账号