Python编程-使用爬虫程序爬取肺炎疫情数据-1 爬取给定国家的历史疫情信息

Alice ·

更新时间:2024-09-21

· 632 次阅读

首先，我们进入目标页面：腾讯网

如下图所示，按F12进入开发者选项，接着点击【网络】（如下箭头所示），然后刷新页面。

刷新页面之后，我们就可以看到下面多了很多内容，这是浏览器接收到服务器返回的信息。

点击选中的任意一行，我们可以看到：

（上面截图使用浏览器：火狐浏览器）

（上面截图使用浏览器：谷歌浏览器）

通过上图，我们可以看到服务器返回的部分国家的历史疫情信息，客户端请求方法为POST。

现在，我们开始准备爬取数据，如下图所示，复制url：


意大利：
https://api.inews.qq.com/newsqa/v1/query/pubished/daily/list?country=%E6%84%8F%E5%A4%A7%E5%88%A9&
伊朗：
https://api.inews.qq.com/newsqa/v1/query/pubished/daily/list?country=%E4%BC%8A%E6%9C%97&
西班牙：
https://api.inews.qq.com/newsqa/v1/query/pubished/daily/list?country=%E8%A5%BF%E7%8F%AD%E7%89%99&
其中，URL链接后面的country=之后是国家名（编码方式问题，不宜阅读）
由此，我们可以得到想要的URL接口：

https://api.inews.qq.com/newsqa/v1/query/pubished/daily/list?country=国家名
下面是全部代码，爬取结果保存至excel文件中：

'''
爬取给定国家的疫情历史信息
'''
import requests
import xlwt
import datetime
import json
import sys
def getURLContent(url):
    headers = {
        'user-agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Mobile Safari/537.36'
    }
    response = requests.post(url, headers=headers)
    return response.status_code, response
def getCountryEpidemiSituationInfo(workbook, country_list):
    for index, country_i in enumerate(country_list):
        # 创建一个worksheet
        worksheet = workbook.add_sheet(country_i)
        print("开始爬取 %s 的疫情数据... ... " % country_i)
        url = 'https://api.inews.qq.com/newsqa/v1/query/pubished/daily/list?country=%s' % country_i
        status_code, data = getURLContent(url)
        if status_code != 200:
            print("%s数据爬取失败,状态码%d" % (country_i, status_code))
            sys.exit()
        data = data.json()["data"]
        if data == None:
            print("%s数据爬取数据为空" % country_i)
            break
        worksheet.col(0).width = 128 * 20  # 设置excel中第A列的宽度（方便日期数据展示）
        current_row_index = 0  # 记录当前所写入数据的行号
        # 将列标题写入excel
        for i, str_col in enumerate(['date', 'confirm_add', 'confirm', 'heal', 'dead', 'suspect']):
            worksheet.write(current_row_index, i, str_col)  # 参数对应 行, 列, 值
        current_row_index += 1
        # 往excel中写入日期格式
        style = xlwt.XFStyle()
        style.num_format_str = 'YYYY/MM/DD'
        # 将抓取到的疫情数据写入excel
        for data_i in data:
            worksheet.write(current_row_index, 0, datetime.datetime.strptime('2020.' + data_i['date'], "%Y.%m.%d"), style)
            worksheet.write(current_row_index, 1, data_i['confirm_add'])
            worksheet.write(current_row_index, 2, data_i['confirm'])
            worksheet.write(current_row_index, 3, data_i['heal'])
            worksheet.write(current_row_index, 4, data_i['dead'])
            worksheet.write(current_row_index, 5, data_i['suspect'])
            current_row_index += 1
if __name__ == "__main__":
    # 创建一个workbook 设置编码
    workbook = xlwt.Workbook(encoding='utf-8')
    # 添加要爬取疫情数据的国家
    country = ["美国", "加拿大", "意大利", "英国", "法国", "丹麦", "韩国", "日本本土", "德国"]
    getCountryEpidemiSituationInfo(workbook, country)
    # 保存
    workbook.save('./data/疫情历史数据.xls') #这里不要使用.xlsx格式保存，否则无法打开！！！原因与库xlwt有关，如需要保存为.xlsx格式，需要使用其他第三方库操作

结果：



作者：桐小哥
                    
 
                

                            爬虫
                            肺炎
                            疫情
                            程序
                            数据
                            Python


           
    
    

            
                
                    
                
            
            
                
    
        
            需要 登录 后方可回复, 如果你还没有账号请 注册新账号
        
    
                
            
                
                    
                        相关文章

    
        
            HTML 字符集
        
        
            Kamiisa
            2020-04-27
        
    
    
        703
    


    
        
    
    
        
            详解css栅格系统在项目中的灵活运用
        
        
            Ursula
            2020-04-01
        
    
    
        908
    


    
        
            linux下忘记mysql密码的几种找回方法（推荐）
        
        
            Acacia
            2021-06-08
        
    
    
        654
    


    
        
            详解CSS3的图层阴影和文字阴影效果使用
        
        
            Orianna
            2020-11-04
        
    
    
        527
    


    
        
            几个CSS3的flex弹性盒模型布局的简单例子演示
        
        
            Hope
            2021-07-09
        
    
    
        791
    


    
        
            important的妙用解决firefox和ie的css兼容问题
        
        
            Flower
            2020-11-13
        
    
    
        940
    


    
        
    
    
        
            Python采集二手车数据的超详细讲解
        
        
            Pandora
            2023-07-24
        
    
    
        294
    


    
        
            Python进阶之利用+和*进行列表拼接
        
        
            Tani
            2023-07-24
        
    
    
        656
    


    
        
    
    
        
            Python进阶之列表推导与生成器表达式详解
        
        
            Tanisha
            2023-07-24
        
    
    
        1394
    


    
        
    
    
        
            Python实战使用XPath采集数据示例解析
        
        
            Diane
            2023-07-24
        
    
    
        1433
    


    
        
    
    
        
            Android客户端与服务端数据加密传输方案详解
        
        
            Diane
            2023-07-28
        
    
    
        768
    


    
        
            Docker使用数据容器的具体示例
        
        
            Nissa
            2023-08-08
        
    
    
        1163
    


    
        
            Python 对象拷贝及深浅拷贝区别的详细教程示例
        
        
            Miette
            2023-08-09
        
    
    
        488
    


    
        
    
    
        
            使用Python对接OpenAi API实现智能QQ机器人的方法
        
        
            Miette
            2023-08-28
        
    
    
        1874
    


    
        
    
    
        
            python进阶学习实时目标跟踪示例详解
        
        
            Serafina
            2023-08-28
        
    
    
        1732
    


    
        
    
    
        
            Python人工智能语音合成实现案例详解
        
        
            Rhea
            2023-08-28
        
    
    
        744
    


    
        
    
    
        
            python Tkinter实例详解
        
        
            Malinda
            2023-08-28
        
    
    
        1999
    


    
        
            Python人工智能构建简单聊天机器人示例详解
        
        
            Kathy
            2023-08-28
        
    
    
        1370
    


    
        
    
    
        
            Python ttkbootstrap的介绍与使用教程
        
        
            Nora
            2023-08-28
        
    
    
        1592
    


    
        
    
    
        
            python中os模块和sys模块的使用详解
        
        
            Pandora
            2023-08-28
        
    
    
        600


        
    
        
            我要提问
        
    
    
        
        
    
        致谢
        
            帮助他人，成就自己。
            人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。
            1024问感谢每一位朋友的帮助和支持。
            软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。
        
    
    
        
            
    育儿网
    微养生
    全球行
    美食街
    育儿
    菜谱大全
    海南旅游
    女性
    养狗百科
    星座