第一个爬虫——斗鱼分类下的人气排行

Akili ·

更新时间:2024-09-21

· 728 次阅读


from urllib import request
from io import BytesIO
import gzip
import re
class Spider():
	def __init__(self):
		self.url='https://www.douyu.com/g_LOL'
		self.root_pattern='([\s\S]*?)'
		self.number_pattern='([\s\S]*?)'
		self.name_pattern='([\s\S]*?)'
	def __fetch_content(self):
		headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36'}
		page1=request.Request(self.url,headers=headers)
		r=request.urlopen(page1)#加入浏览器信息
		htmls=r.read()#获取字节码
		buff=BytesIO(htmls)
		f=gzip.GzipFile(fileobj=buff)
		htmls=f.read().decode('utf-8')#数据被压缩过，我们要对数据进行处理。
		return htmls
	def __analysis(self,htmls):
		root_htmls=re.findall(self.root_pattern,htmls)
		anchors=[]
		for origin_html in root_htmls:
			new_html=origin_html.replace('','')
			anchors.append(new_html)
		print(anchors)
	def go(self):
		htmls=self.__fetch_content()
		self.__analysis(htmls)
spider=Spider()
spider.go()

以前觉得爬虫很难，完成了一个小目标之后，觉得有点小放松。
但内心却似乎感觉很朦胧。
只是冰山一角而已。


作者：小云同学
                    
 
                

                            斗鱼
                            爬虫
                            分类


           
    
    

            
                
                    
                
            
            
                
    
        
            需要 登录 后方可回复, 如果你还没有账号请 注册新账号
        
    
                
            
                
                    
                        相关文章

    
        
    
    
        
            Asp.Net使用服务器控件Image/ImageButton显示本地图片的方法
        
        
            Mathilda
            2020-07-07
        
    
    
        845
    


    
        
            important的妙用解决firefox和ie的css兼容问题
        
        
            Flower
            2020-11-13
        
    
    
        940
    


    
        
            ASP脚本的执行顺序详细说明
        
        
            Fern
            2020-08-06
        
    
    
        901
    


    
        
    
    
        
            Python用yieldfrom实现异步协程爬虫的实践
        
        
            Tia
            2023-01-19
        
    
    
        1481
    


    
        
            Python函数参数分类使用与新特性详细分析讲解
        
        
            Rose
            2023-01-23
        
    
    
        1055
    


    
        
    
    
        
            SVM算法的理解及其Python实现多分类和二分类问题
        
        
            Rose
            2023-02-02
        
    
    
        1748
    


    
        
            Python利用CNN实现对时序数据进行分类
        
        
            Kara
            2023-02-26
        
    
    
        1371
    


    
        
            爬虫训练前端基础Bootstrap5排版表格图像
        
        
            Rhea
            2023-02-26
        
    
    
        6
    


    
        
    
    
        
            一文详解CNN解决Flowers图像分类任务
        
        
            Gitana
            2023-03-11
        
    
    
        147
    


    
        
            基于Python编写一个简单的垃圾邮件分类器
        
        
            Kande
            2023-04-14
        
    
    
        781
    


    
        
    
    
        
            Python基于Tkinter实现的垃圾分类答题软件代码
        
        
            Tricia
            2023-04-14
        
    
    
        1018
    


    
        
    
    
        
            基于Pytorch实现分类器的示例详解
        
        
            Viveka
            2023-04-18
        
    
    
        1798
    


    
        
            Python网络爬虫之获取网络数据
        
        
            Tricia
            2023-04-30
        
    
    
        686
    


    
        
            Shell命令解释器分类示例详解
        
        
            Tricia
            2023-05-12
        
    
    
        1732
    


    
        
            Golang多线程爬虫高效抓取大量数据的利器
        
        
            Tallulah
            2023-05-12
        
    
    
        322
    


    
        
            一问弄懂Shell变量四大分类
        
        
            Iria
            2023-05-12
        
    
    
        849
    


    
        
            python脚本之如何按照清晰度对图片进行分类
        
        
            Laila
            2023-05-12
        
    
    
        1632
    


    
        
            使用Python、TensorFlow和Keras来进行垃圾分类的操作方法
        
        
            Laila
            2023-05-12
        
    
    
        349
    


    
        
            使用Python实现简单的爬虫框架
        
        
            Tulla
            2023-05-12
        
    
    
        715
    


    
        
            微信小程序实现商品分类页过程结束
        
        
            Antonia
            2023-05-16
        
    
    
        487


        
    
        
            我要提问
        
    
    
        
        
    
        致谢
        
            帮助他人，成就自己。
            人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。
            1024问感谢每一位朋友的帮助和支持。
            软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。
        
    
    
        
            
    育儿网
    微养生
    全球行
    美食街
    育儿
    菜谱大全
    海南旅游
    女性
    养狗百科
    星座