Pandas之read_csv()读取文件跳过报错行的解决

Lilac ·

更新时间:2024-11-10

· 607 次阅读

读取文件时遇到和列数不对应的行，此时会报错。若报错行可以忽略，则添加以下参数:

样式：

pandas.read_csv(***,error_bad_lines=False)

pandas.read_csv(filePath) 方法来读取csv文件时，可能会出现这种错误：

ParserError：Error tokenizing data.C error:Expected 2 fields in line 407,saw 3.

是指在csv文件的第407行数据，期待2个字段，但在第407行实际发现了3个字段。

原因：header只有两个字段名，但数据的第407行却出现了3个字段（可能是该行数据包含了逗号，或者确实有三个部分），导致pandas不知道该如何处理。

解决办法：把第407行多出的字段删除，或者通过在read_csv方法中设置error_bad_lines=False来忽略这种错误：

改为

pandas.read_csv(filePath,error_bad_lines=False)

来忽略掉其中出现错乱(例如，由于逗号导致多出一列)的行。

KeyError错误：

报这种错是由于使用了DataFrame中没有的字段，例如id字段，原因可能是：

.csv文件的header部分没加逗号分割，此时可使用df.columns.values来查看df到底有哪些字段：

print(df.columns.values)

.在操作DataFrame的过程中丢掉了id字段的header，却没发现该字段已丢失。

例如：

df=df[df['id']!='null']#取得id字段不为null的行
df=df['id']#赋值后df为Series，表示df在id列的值，而不再是一个DataFrame,于是丢掉了id的头，此时若再使用df['id']将报错。

取列的值，与取列的区别：

df=df['id']#取id列的值，赋值后df为Series类型，可用print(type(df))来查看其类型
df=df[['id']]#只取df的id列作为一个新的DataFrame，赋值后df仍然是一个DataFrame
df=df[['id','age']]#取df的id和age列作为一个新的DataFrame，赋值后df仍然是一个DataFrame

过滤行

df=df[df['id']!='null']#过滤掉id字段取值为'null'的行

注意，此处的'null'是一个字符串，若df中某行id字段的值不是字符串型，或者为空，将报TypeError：invalid type comparison错，因为只有相同类型的值才能进行比较。

解决办法：如果不能保证id列都是string类型，则需要去掉该过滤条件。

补充知识：pandas 使用read_csv读取文件时产生错误：EOF inside string starting at line

解决方法：使用参数 quoting

df = pd.read_csv(csvfile, header = None, delimiter="\t", quoting=csv.QUOTE_NONE, encoding='utf-8')

以上这篇Pandas之read_csv()读取文件跳过报错行的解决就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持软件开发网。

您可能感兴趣的文章:解决pandas read_csv 读取中文列标题文件报错的问题解决pandas使用read_csv()读取文件遇到的问题pandas读取csv文件提示不存在的解决方法及原因分析

csv read pandas

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

Python3 函数

Serena 2021-07-07

954

Lua 字符串

Florence 2021-02-12

582

ASP Session 对象

Wilma 2020-04-12

617

深入解析pandas数据聚合和重组

Miette 2023-04-22

1543

Pandas数据操作及数据分析常用技术介绍

Olivia 2023-04-30

724

Pandas在数据分析和机器学习中的应用及优势

Dulcea 2023-04-30

678

python中pandas库的iloc函数用法解析

Ula 2023-05-12

1151

C#CSV文件读写的实现

Crystal 2023-05-12

593

Pandas实现自定义Excel格式并导出多个sheet表

Jacuqeline 2023-05-12

268

Pandas日期处理之生成工作日与节假日

Karli 2023-05-12

1341

C#实现CSV文件读写的示例详解

Kirima 2023-05-13

778

pandas库中 DataFrame的用法小结

Oria 2023-05-17

1640

Python+pandas数据分析实践总结

Bertha 2023-07-20

1461

python写入csv时writerow()和writerows()函数简单示例

Tesia 2023-07-20

883

python利用pandas和csv包向一个csv文件写入或追加数据

Heather 2023-07-20

653

关于pandas中的.update()方法解析

Aggie 2023-07-20

578

基于C语言的开源csv解析库MiniCSV的使用示例

Qamar 2023-07-20

1493

使用C++实现Excel文件与CSV之间的相互转换

Rose 2023-07-20

1804

深入探究python中Pandas库处理缺失数据和数据聚合

Bliss 2023-07-21

191

Python中Pandas库的数据处理与分析

Lillian 2023-07-21

155

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座