Python3爬虫技术文档（三）——动态页面数据获取

Dulcea ·

更新时间:2024-11-14

· 946 次阅读

上文说到，我们可以通过分析Ajax访问服务器的方式来获取Ajax数据。Ajax也算动态渲染页面的一种。所以，动态页面也是可以爬取滴。

文章目录Selenium安装SeleniumSelenium基本使用方法声明浏览器对象访问页面查找节点节点交互获取节点信息 Selenium

Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7, 8, 9, 10, 11），Mozilla Firefox，Safari，Google Chrome，Opera等。这个工具的主要功能包括：测试与浏览器的兼容性——测试你的应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能和用户需求。支持自动录制动作和自动生成 .Net、Java、Perl等不同语言的测试脚本。简而言之，Selenium可以模拟用户操作浏览器，所以它也可以提取动态页面。

安装Selenium

cmd下输入：

pip install selenium

同时下载浏览器对应版本的驱动。
Chrome：点击下载
Firefox：点击下载
IE：点击下载
下载后解压到python安装目录的scripts下。

Selenium基本使用方法 声明浏览器对象

Selenium支持许多的浏览器，我们首先需要让系统知道你使用的是什么浏览器，我们可以用以下方式初始化：

from selenium import webdriver
browser = webdriver.Chrome()
browser = webdriver.Firefox()
browser = webdriver.Edge()
browser = webdriver.PhantomJS()
browser = webdriver.Sarari()

之后我们就可以使用调用browser对象，执行各种动作来模拟浏览器操作

访问页面

我们用get()方法来请求网页，只需要传入URL即可。这里我们访问百度页面，并打印出源代码：

from selenium import webdriver
browser = webdriver.Chrome()
browser.get(‘https://www.baidu.com’)
print(browser.page_source)
browser.close()

查找节点 单个节点
网页构成是一个个超文本标记语言构成的，这些就是网页的节点，我们想获取某个信息就需要知道这个信息所在的地方在哪里。那么这里要通过查看网页的源代码。

原创文章 3获赞 3访问量 378 关注私信展开阅读全文
作者：小昱同学

爬虫数据动态 Python3 技术文档 Python

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

HTML 字符集

Kamiisa 2020-04-27

703

HTML ISO-8859-1 参考手册

Ianthe 2020-11-25

713

Foundation Joyride

Jenna 2020-10-09

762

详解css栅格系统在项目中的灵活运用

Ursula 2020-04-01

908

Windows服务器中PHP如何安装redis扩展

Qamar 2021-08-07

929

important的妙用解决firefox和ie的css兼容问题

Flower 2020-11-13

940

Python采集二手车数据的超详细讲解

Pandora 2023-07-24

294

Python进阶之利用+和*进行列表拼接

Tani 2023-07-24

656

Python进阶之列表推导与生成器表达式详解

Tanisha 2023-07-24

1394

Python实战使用XPath采集数据示例解析

Diane 2023-07-24

1433

Android客户端与服务端数据加密传输方案详解

Diane 2023-07-28

768

Docker使用数据容器的具体示例

Nissa 2023-08-08

1163

Python 对象拷贝及深浅拷贝区别的详细教程示例

Miette 2023-08-09

488

使用Python对接OpenAi API实现智能QQ机器人的方法

Miette 2023-08-28

1874

python进阶学习实时目标跟踪示例详解

Serafina 2023-08-28

1732

Python人工智能语音合成实现案例详解

Rhea 2023-08-28

744

python Tkinter实例详解

Malinda 2023-08-28

1999

Python人工智能构建简单聊天机器人示例详解

Kathy 2023-08-28

1370

Python ttkbootstrap的介绍与使用教程

Nora 2023-08-28

1592

python中os模块和sys模块的使用详解

Pandora 2023-08-28

600

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座