爬取豆瓣电影新片榜

Ophira ·

更新时间:2024-09-20

· 971 次阅读

python爬虫 — 豆瓣电影新片榜

豆瓣电影新片榜

import requests
import csv
import pandas as pd
from bs4 import BeautifulSoup
from selenium import webdriver
from urllib3.exceptions import RequestError
def get_one_page(url):
    try:
        headers = {
           "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36 Edg/80.0.361.66"
        }
        response = requests.get(url, headers=headers)
        if response.status_code == 200:
            return response.text
        return None
    except RequestError:
        return None
def parse_one_page(html):
    soup = BeautifulSoup(html, "html.parser")
    messages = soup.find_all("tr",class_="item")
    top10 = []
    for message in messages:
        top10.append(message.a['title'])
    return top10
def write_to_file(content):
    index = [1,2,3,4,5,6,7,8,9,10]
    #用pandas保存csv文件
    test = pd.DataFrame({"index":index,'top10':content})
    test.to_csv(r'Douban_top10_movie.csv',sep=',',encoding='utf-8-sig',index=False)
    #用csv保存csv文件
    """with open("Douban_top10_movie.csv", "w",newline='',encoding='utf-8-sig') as csvfile:
        writer = csv.writer(csvfile)
        writer.writerow(["index", "top10"])
        writer.writerows([index,content])"""
if __name__ =='__main__':
    html = get_one_page('https://movie.douban.com/chart')
    content = parse_one_page(html)
    write_to_file(content)

爬取结果：
在这里插入图片描述

作者：UPC. 故里

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

利用HTML5 Canvas制作一个简单的打飞机游戏

Diane 2020-03-17

525

Vuex,iView UI面包屑导航使用扩展详解

Jacinthe 2021-03-14

541

机器深度学习二分类电影的情感问题

Octavia 2021-12-16

1528

python 爬取豆瓣网页的示例

Paula 2021-12-16

125

python爬取豆瓣评论制作词云代码

Vanna 2022-01-14

385

基于Python实现电影售票系统

Willow 2022-01-14

601

Python爬虫实现热门电影信息采集

Chloe 2022-01-14

1320

鸿蒙系统微电影创作功能怎么使用?鸿蒙微电影创作使用方法

Hadara 2022-02-23

182

在豆瓣上找电影时如何将喜欢的电影下载

Veronica 2022-03-07

400

电脑看电影的时候鼠标不动自动重启怎么办？

Iria 2022-03-08

839

python 爬取豆瓣电影短评并利用wordcloud生成词云图

Serwa 2022-06-07

1256

JavaSE实现电影院系统

Pandora 2022-08-12

1056

C语言实现电影管理系统

Antonia 2022-08-12

429

Python获取时光网电影数据的实例代码

Maleah 2022-09-04

83

Python实现抓取腾讯视频所有电影的示例代码

Katherine 2022-10-19

1738

JS实现电影票选座的项目示例

Glenna 2022-10-19

614

Python爬虫实现抓取电影网站信息并入库

Pandora 2022-10-23

451

用Python爬取2022春节档电影信息

Zahara 2022-10-23

1623

python selenium实现登录豆瓣示例详解

Welcome 2022-10-23

1752

详解基于Transformer实现电影评论星级分类任务

Tani 2023-07-01

1069

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座