pyquery报错：UnicodeDecodeError: 'gbk' codec can't decode byte

Peggy ·

更新时间:2024-09-20

· 758 次阅读

今天想使用pyquery库读取本地HTML文件时报错：UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xa1 in position 164: illegal multibyte sequence。翻译一下就是UnicodeDecodeError: 'gbk’编解码器无法解码位置164中的字节0xa1:非法多字节序列。
分析原因： 这个HTML文件是utf-8格式的文件，存储是二进制数据，使用pyquery读取时是采用gbk进行解码！读到了非gbk编码形式的二进制数据，于是就报错了！
排错过程： 我通过查看pyquery源码，企图搜索是否存在能传解码格式的参数，发现并没有！于是只能百度一下了，发现大多数方案都是将中文去掉（emmm，他们这样等于没说）。终于找到了另一种方法，就是将html文本先读出来，使用pyquery的另一种初始化方式进行读取。但是，这种还是治标不治本，我觉得最好是能够修改解码方式，希望有懂的大神教教我！
附上修改方案：

from pyquery import PyQuery as pq
def method1():
    with open("demo.html", "r", encoding="utf-8")as f:
        content = f.read()
    print(type(content))        # str类型
    result = pq(content)
    print(result('title'))
if __name__ == '__main__':
    # doc = pq(filename='demo.html')        # 报错
    method1()

有错误的地方敬请指出！觉得写得可以的话麻烦给个赞！欢迎大家评论区或者私信交流！

作者：1/4糖柠檬茶

byte pyquery gbk

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

Node.js 创建第一个应用

Jamina 2021-07-05

631

golang实现对docker容器心跳监控功能

Ailis 2020-05-28

864

VS2013的Browser Link引起的问题

Fern 2021-02-04

896

.net6环境下使用RestSharp请求GBK编码网页乱码的解决方案

Laila 2022-01-14

1547

如何在Go中将[]byte转换为io.Reader

Lillian 2022-01-14

336

Linux安装GBK/GB2312程序显示乱码的五种解决方法

Aggie 2022-01-24

912

Ubuntu Eclipse MyEclipse 添加GBK支持不乱码

Gaia 2022-02-09

1061

网络中bit、Byte、bps、Bps、pps、Gbps的详细说明及换算方法

Sabah 2022-02-28

1895

C#操作Byte数组和十六进制进行互转

Kande 2022-05-03

1154

关于vue二进制转图片显示问题后端返回的是byte[]数组

Malina 2022-06-05

1741

Python如何读取16进制byte数据

Kate 2022-07-15

1561

C#使用文件流FileStream和内存流MemoryStream操作底层字节数组byte[]

Tina 2022-07-15

1200

C#使用System.Buffer以字节数组Byte[]操作基元类型数据

Serena 2022-07-15

383

C#中的小数和百分数计算与byte数组操作

Viridis 2022-07-15

458

Python有关UnicodeUTF-8GBK编码问题详解

Irma 2022-08-18

1624

javaObject转byte与byte转Object方式

Peggy 2022-08-19

1392

Golang中字符串(string)与字节数组([]byte)一行代码互转实例

Noella 2022-09-18

305

教你使用.NET快速比较两个byte数组是否相等

Leona 2022-10-02

1003

Python如何存储和读取ASCII码形式的byte数据

Nora 2022-10-14

1975

python3里gbk编码的问题解决

Fawn 2022-11-06

964

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座