Java、Python哪家强？十万条应聘数据告诉你（含源代码）——网络爬虫第三天

Canace ·

更新时间:2024-11-13

· 807 次阅读

Java、Python哪家强？十万条应聘数据告诉你（含源代码）——网络爬虫第三天一、课程介绍1、确定前途无忧招聘网网址2、自动翻页2、页面分析，正则表达式的编写3、将爬取的信息存入数据库二、获取完整源代码

如果大家没有看之前的requests课程，必须去看一下，不然看不懂今天的课程的！

点我查看requests课程：网络爬虫——实战项目2（爬取某社区所有论文，含代码）

一、课程介绍

今天我做的项目是利用requests模块爬取前途无忧平台的职位信息到数据库

今天的目标是：
一、获取前途无忧所有有关python、java职位名称
二、获取前途无忧所有有关python、java工作地点
三、获取前途无忧所有有关python、java资信待遇
四、将获取到的数据存入到数据库中
五、最终结果
（1.）6w+java岗位：
电气/python工程师

ABB（中国）有限公司上海 02-17

Python开发工程师

“前程无忧”51job.com（上海）上海 02-17

Python开发工程师

普华永道信息技术（上海）有限公司... 上海-浦东新区 17-30万/年 02-17

我们分析一下上面的职位有：电气/python工程师、Python开发工程师、Python开发工程师、Python开发工程师有三个Python开发工程师，我们可以先观察一下他们的特点：（找到他们唯一的特性）
在title里（不唯一），往上看，<a target="_blank"（不唯一），还要网上找，大家一定要耐心
到最后，我们就会发现一下规律:终于区分开职位和其他了：（剩下的两个交给大家来找，很简单的）

job_name_s = 'style="display:none" />.*?.*?
这两个是工作地点和工作新资的正则表达式（大家可以参考）：下面看不懂请翻到文章开头！
job_name_s = 'style="display:none" />.*?.*?(.*?)'
job_add = re.compile(job_add_s,re.S).findall(data)[1:]
job_money_s = '(.*?)'
job_money = re.compile(job_money_s,re.S).findall(data)[1:]

3、将爬取的信息存入数据库
直接上源代码：需要下载第三方库函数，没有的需要下载
	#经过观察，每页有50个数据，也就是说每个正则表达式数组长度为50，每次将一个插入数据库中
    for j in range(0,50):
        sql = "insert into java_job(job_name,job_add,job_money) values('" + job_name[j] + " ',' " + job_add[j] + " ',' " + job_money[j] + "')"
        conn.query(sql)
        conn.commit()

二、获取完整源代码
代码代写(实验报告、论文、小程序制作)服务请加微信：ppz2759

关注下方公众号，回复“爬虫133”即可获取源代码



作者：程序员小哲
                    
 
                

                            应聘
                            JAVA
                            数据
                            爬虫
                            网络爬虫
                            源代码
                            Python


           
    
    

            
                
                    
                
            
            
                
    
        
            需要 登录 后方可回复, 如果你还没有账号请 注册新账号
        
    
                
            
                
                    
                        相关文章

    
        
            HTML 字符集
        
        
            Kamiisa
            2020-04-27
        
    
    
        703
    


    
        
    
    
        
            ECharts 教程
        
        
            Autumn
            2021-01-19
        
    
    
        552
    


    
        
    
    
        
            ASP.NET全栈开发教程之在MVC中使用服务端验证的方法
        
        
            Vanessa
            2020-06-06
        
    
    
        578
    


    
        
    
    
        
            详解css栅格系统在项目中的灵活运用
        
        
            Ursula
            2020-04-01
        
    
    
        908
    


    
        
            CSS中单位px与em的区别(推荐)
        
        
            Miki
            2020-07-14
        
    
    
        552
    


    
        
            important的妙用解决firefox和ie的css兼容问题
        
        
            Flower
            2020-11-13
        
    
    
        940
    


    
        
            用ASP实现写IIS日志的代码
        
        
            Chynna
            2020-01-03
        
    
    
        747
    


    
        
    
    
        
            Python进阶之列表推导与生成器表达式详解
        
        
            Tanisha
            2023-07-24
        
    
    
        1394
    


    
        
    
    
        
            Python实战使用XPath采集数据示例解析
        
        
            Diane
            2023-07-24
        
    
    
        1433
    


    
        
    
    
        
            Java阻塞队列BlockingQueue基础与使用
        
        
            Miette
            2023-07-28
        
    
    
        438
    


    
        
    
    
        
            java如何完成输出语句实例详解
        
        
            Tanisha
            2023-07-28
        
    
    
        1303
    


    
        
    
    
        
            Android客户端与服务端数据加密传输方案详解
        
        
            Diane
            2023-07-28
        
    
    
        768
    


    
        
            Docker使用数据容器的具体示例
        
        
            Nissa
            2023-08-08
        
    
    
        1163
    


    
        
            Python 对象拷贝及深浅拷贝区别的详细教程示例
        
        
            Miette
            2023-08-09
        
    
    
        488
    


    
        
    
    
        
            使用Python对接OpenAi API实现智能QQ机器人的方法
        
        
            Miette
            2023-08-28
        
    
    
        1874
    


    
        
    
    
        
            python进阶学习实时目标跟踪示例详解
        
        
            Serafina
            2023-08-28
        
    
    
        1732
    


    
        
    
    
        
            Python人工智能语音合成实现案例详解
        
        
            Rhea
            2023-08-28
        
    
    
        744
    


    
        
    
    
        
            python Tkinter实例详解
        
        
            Malinda
            2023-08-28
        
    
    
        1999
    


    
        
            Python人工智能构建简单聊天机器人示例详解
        
        
            Kathy
            2023-08-28
        
    
    
        1370
    


    
        
    
    
        
            Python ttkbootstrap的介绍与使用教程
        
        
            Nora
            2023-08-28
        
    
    
        1592


        
    
        
            我要提问
        
    
    
        
        
    
        致谢
        
            帮助他人，成就自己。
            人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。
            1024问感谢每一位朋友的帮助和支持。
            软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。
        
    
    
        
            
    育儿网
    微养生
    全球行
    美食街
    育儿
    菜谱大全
    海南旅游
    女性
    养狗百科
    星座