网络爬虫（一）前言

Ingrid ·

更新时间:2024-11-13

· 504 次阅读

一、前言 1.1 网络爬虫简介

“网络爬虫”又称“网络蜘蛛”。是一种在互联网上自动采集数据的自动化程序，爬虫的规模可大可小，大到百度，谷歌搜索，小到自动下载图片等。
采集数据，所采集的数据是结构化的，批量提取，提高效率的。例如，我们希望在某电商平台上获取某产品相关信息，其中包含信息可能存在产品名称、产品价格、参评参数、广告、评论内容等，我们只想要其中的用户好评信息，其他的都不要，以表格形式保存，表格就是结构化以后的结果，如果该数据量较小的话我们可以手动复制粘贴，但当有 1000，100000 或更庞大的数据量时，显然复制粘贴效率就太低了还不能保证正确率，使用爬虫提取，正确率都，效率都得意保证，下次再有类似的网页，改一改就可以用。
爬虫的本质是网络请求(request)，请求访问一个网页获得响应后(response)，提取其中的数据。

1.2 Pycharm下载

我们使用 pycharm 来进行爬虫的编写，所以需要下载个 pycharm，下载地址：
https://www.jetbrains.com/pycharm/

1.3 新建项目

首先要新建个空项目文件夹，用来保存我们写的爬虫文件，后依次点击左上角 File -> New Project。
1：把路径设置成刚刚建的空文件夹
2：选择现有环境，指的是你电脑下载的 python 环境
3：你的电脑下载的 python 的环境的路径
4：创建
即可以开始编写程序

作者：hyhooo

爬虫网络爬虫

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

ASP.NET全栈开发教程之在MVC中使用服务端验证的方法

Vanessa 2020-06-06

578

important的妙用解决firefox和ie的css兼容问题

Flower 2020-11-13

940

Python解决爬虫程序卡死问题

Bliss 2022-10-14

127

通过淘宝数据爬虫学习python scrapy requests与response对象

Xanthe 2022-10-16

1429

Pycharm使用爬虫时遇到etree红线问题及解决

Vidonia 2022-10-17

702

python网络爬虫实现个性化音乐播放器示例解析

Faye 2022-10-23

1230

详解如何使用Python网络爬虫获取招聘信息

Roselani 2022-10-23

1253

详解如何用Python写个听小说的爬虫

Beth 2022-10-23

347

Python用requests模块实现动态网页爬虫

Tricia 2022-10-23

1277

Python使用爬虫爬取贵阳房价的方法详解

Fiorenza 2022-10-23

612

爬虫逆向抖音新版signature分析案例

Hazel 2022-10-23

1443

python异步爬虫之多线程

Nancy 2022-10-23

231

基于Python3制作一个带GUI界面的小说爬虫工具

Bonita 2022-10-23

1611

一篇文章带你了解Python之Selenium自动化爬虫

Liana 2022-10-23

1206

Python-Selenium自动化爬虫

Jenna 2022-10-23

1696

c#实现爬虫程序

Tia 2022-10-24

86

详解C#如何利用爬虫技术实现快捷租房

Bambi 2022-11-07

1010

Python用yieldfrom实现异步协程爬虫的实践

Tia 2023-01-19

1481

爬虫训练前端基础Bootstrap5排版表格图像

Rhea 2023-02-26

6

Python网络爬虫之获取网络数据

Tricia 2023-04-30

686

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座