scrapy crawlspider难题,翻页链接是JS实现的，无法在rules中定义获取，如何实现翻页？？？

Stephenie ·

更新时间:2024-09-20

· 982 次阅读

问题：翻页链接是JS实现的，无法在rules中定义获取，通过网页分析需要爬取的页面翻页规律“index_数字.html”,度了很多，均未找到理想的答案，尤其是如何结束？？？

救急思路：只能通过修改start_urls 重载parse_start_url来预先生成urls的所有请求，再传给rules

37    #重载该方法实现JS翻页无法获取翻页链接的问题 ，通过修改start_urls发出请求实现翻页
38    def parse_start_url(self, response): 
39        for index in range(10):
40            url = 'http://www.xxx.com/yaowen/index_'+str(index+1)+'.html'
41            yield scrapy.Request(url)

求大神给出更好的办法！！！

作者：driverxb

js实现 scrapy rules js

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

Foundation 提醒框

Sally 2021-01-16

813

HTML5本地存储之Web Storage详解

Maren 2020-09-29

738

ASP.NET Core针对一个使用HttpClient对象的类编写单元测试详解

Ula 2020-10-06

928

数据库 MySQL中文乱码解决办法总结

Pascall 2020-09-25

539

js项目中前端如何实现无感刷新token

Winola 2023-07-20

1938

JS算法题解搜索插入位置方法示例

Winona 2023-07-20

605

js中net::ERR_FILE_NOT_FOUND报错的解决

Vera 2023-07-20

347

js中find、findIndex、indexOf的用法和区别

Iola 2023-07-20

1102

js控制台报错UncaughtTypeError:Cannotreadpropertiesofundefined(reading‘appendChild‘)的解决

Kara 2023-07-20

382

js中的柯里化与反柯里化的基础概念和用法

Viridis 2023-07-20

1851

JS算法题解旋转数组方法示例

Dara 2023-07-20

1477

js类型判断内部实现原理示例详解

Tertia 2023-07-20

999

JS中varlet声明范围区别详解

Zada 2023-07-20

576

JS实现数组内值累加常见的3个方法

Rhea 2023-07-20

176

JS实现深拷贝的4种方式介绍

Lani 2023-07-20

366

JS将字符串中指定字符全局替换的方法

Hazel 2023-07-20

347

vue 导入js中的两种方法(示例详解)

Sue 2023-07-20

1879

JS中数组合并的几种常见方法

Antonia 2023-07-20

756

js控制滚动条滚动的两种简单方法

Zahirah 2023-07-20

518

JS中6个对象数组去重的方法

Rae 2023-07-20

1383

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座