Python爬取新浪足球数据（以中超为例）

Agatha ·

更新时间:2024-09-21

· 696 次阅读

最近在整理上学期学位课中用到的一些知识点，其中看到了一个很省代码量的操作，记录一下。上学期多元统计，留了一个课程论文是用相关统计方法来分析数据，像我这种叫天天不应叫地地不灵要啥啥没有“三无蓝孩“，硬着头皮学了爬虫，后来，就有了今天的故事。

入坑一时爽，一直入坑一直爽啊

当然，说是要结合自己的专业，我，一个学GIS的，有些数据怕是要保密的，而且公开我也不会用啊

在这里插入图片描述

但是我爱看球啊，从中超英超德甲西甲，平时闲着没事也爱看看数据啥的，哪个球员又牛逼了，哪个队进欧冠了啥的，然后我就用这些数据做了个聚类（怕是多元统计里最简单的一个了，也感谢老师的浓浓师生情，让我复习了一天的多元统计过了）在这里插入图片描述

回到正题，其实获取数据是主要的工作量，不想让中间商赚差价就只能自己动手丰衣足食了。

首先，打开网址，http://match.sports.sina.com.cn/football/csl/opta_rank.php?item=order&year=2019&lid=8&type=2&dpc=1

在这里插入图片描述

我起初的思路很钢铁直，就是用XPath获取，结合源码写了如下获取方式

def parse_page(text):
    tree = etree.HTML(text)
    # print(tree)
    ranking = []
    club_name = []
    try_goal = []    
    for i in range(2, 18):
        # 球队排名
        ranking_item = tree.xpath(
            '//tr[' + format(i) + ']/td[1]/text()')[0].strip()
        # 球队名称
        club_name_item = tree.xpath(
            '//tr['+format(i)+']/td/a/text()')[0].strip()
        # 射门数
        try_goal_item = tree.xpath(
            '//tr['+format(i)+']/td[3]/text()')[0].strip()
        ranking.append(ranking_item)
        club_name.append(club_name_item)
        try_goal.append(try_goal_item)
    return zip(ranking, club_name, try_goal)

这样倒是也可以获取数据了，可是，对于Python这种语言这也未免太多代码了吧。。。

再看一眼网页源码，

table，emmm，用pandas啊

然后就用pandas库来实现

da = pandas.read_html(response.content)[0]

写个循环将不同年份的各种类型数据爬下来。。

在这里插入图片描述
哎，今年的中超啥时候能开呢

作者：小蒋小蒋荡起双桨

足球数据数据新浪足球中超 Python

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

HTML 字符集

Kamiisa 2020-04-27

703

阻止移动设备(手机、pad)浏览器双击放大网页的方法

Olive 2021-07-24

851

html5 Canvas画图教程(6)—canvas里画曲线之arcTo方法

Xylona 2021-05-17

967

html5 Canvas画图教程(4)—未闭合的路径及渐变色的填充方法

Tanisha 2021-07-07

913

详解css栅格系统在项目中的灵活运用

Ursula 2020-04-01

908

asp中日期时间函数介绍

Hazel 2021-06-29

656

Python采集二手车数据的超详细讲解

Pandora 2023-07-24

294

Python进阶之利用+和*进行列表拼接

Tani 2023-07-24

656

Python进阶之列表推导与生成器表达式详解

Tanisha 2023-07-24

1394

Python实战使用XPath采集数据示例解析

Diane 2023-07-24

1433

Android客户端与服务端数据加密传输方案详解

Diane 2023-07-28

768

Docker使用数据容器的具体示例

Nissa 2023-08-08

1163

Python 对象拷贝及深浅拷贝区别的详细教程示例

Miette 2023-08-09

488

使用Python对接OpenAi API实现智能QQ机器人的方法

Miette 2023-08-28

1874

python进阶学习实时目标跟踪示例详解

Serafina 2023-08-28

1732

Python人工智能语音合成实现案例详解

Rhea 2023-08-28

744

python Tkinter实例详解

Malinda 2023-08-28

1999

Python人工智能构建简单聊天机器人示例详解

Kathy 2023-08-28

1370

Python ttkbootstrap的介绍与使用教程

Nora 2023-08-28

1592

python中os模块和sys模块的使用详解

Pandora 2023-08-28

600

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座