pandas读取csv格式数据时header参数设置方法

Stella ·

更新时间:2024-09-20

· 199 次阅读

目录

写在前面

参考文档

read_csv的header参数

header参数测试

思考

写在前面

使用pandas中read_csv读取csv数据时，对于有表头的数据，将header设置为空(None)，会报错：pandas_libs\parsers.pyx in pandas._libs.parsers.raise_parser_error() ParserError: Error tokenizing data. C error: Expected 4 fields in line 2, saw 5 。

查看pandas官方文档发现，read_csv读取时会自动识别表头，数据有表头时不能设置header为空（默认读取第一行，即header=0)；数据无表头时，若不设置header，第一行数据会被视为表头，应传入names参数设置表头名称或设置header=None。

参考文档

这是pandas的read_csv的官方文档: python - pandas.read_csv

read_csv的header参数

使用pandas的read_csv读取数据时，header参数表头名称设置(即各列数据对应名称)，下面是文档中对header参数的说明：

其中指出，表头可根据数据格式推断各列名称：默认情况下，

若未传入names参数，则根据输入文件的第一行推断是否有表头；

若传入names参数，则names传入的参数作为表头（原数据有表头则会替换原有表头）。

下面是对read_csv的header参数测试

header参数测试

测试数据两个csv(用逗号隔开)格式的文件，这里是用Excel打开，分别是带有表头和不带表头的数据：

默认header 下面是header默认情况下，对有表头的数据识别第一行作为header（即header=0）[ 数据没有给出index名称，这里设置 index_col=False，不设置默认第一列为index（而表头仍是4列，最后一列数据为NaN）， index_col参数与 header类似可自动识别。

设置header=None 对有表头的数据设置 header=None则会报错：

对无表头的数据，则需设置 header=None，否则第一行数据被作为表头：

思考

pandas是如何识别或区分数据和表头名称的？

对于index_col来说，若数据都是相同类型，比如数值型，则表示无index，输出默认index为0,1,2,…；若数据第一列为字符，其他列为数值，则会将第一列视为index；若设置index_col=False, 则表示无index（默认将0, 1, 2,…作为数据的index)

对header，当第一行为字符，则第一行默认为表头；当第一行与其他数据类型相同时，也会把第一行当作表头，所以无表头时应设置header=None

header传入list参数(元素代表取对应行号)怎么用？

read_csv的参数skip_blank_lines=True会忽略注释行和空行，其中注释行是用什么符号注释的？（试了一下，行首用’#'注释的不对)

到此这篇关于pandas读取csv格式数据时header参数设置方法的文章就介绍到这了,更多相关pandas header参数内容请搜索软件开发网以前的文章或继续浏览下面的相关文章希望大家以后多多支持软件开发网！

方法数据 pandas csv header

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

Go 错误处理

Daisy 2020-03-18

730

Lua 字符串

Florence 2021-02-12

582

ASP Session 对象

Wilma 2020-04-12

617

详解css栅格系统在项目中的灵活运用

Ursula 2020-04-01

908

Laravel 中使用简单的方法跟踪用户是否在线(推荐)

Serwa 2020-03-20

874

Docker镜像之不同服务器间迁移方法大全

Dorothy 2023-07-22

1993

docker容器使用内存大小限制方法

Dulcea 2023-07-22

493

在Linux中列出Systemd下所有正在运行的服务的方法指南

Zandra 2023-07-22

507

一文详解Python中多进程和进程池的使用方法

Serafina 2023-07-24

338

Pandas中DataFrame的常用用法分享

Malinda 2023-07-24

382

python简单几步实现时间日期处理到数据文件的读写

Nora 2023-07-24

926

Python采集二手车数据的超详细讲解

Pandora 2023-07-24

294

Python实战使用XPath采集数据示例解析

Diane 2023-07-24

1433

Android客户端与服务端数据加密传输方案详解

Diane 2023-07-28

768

VMware克隆虚拟机并重新设置IP和主机名的实现方法

Kathy 2023-08-08

194

使用nginx.exe时闪退的原因和解决方法

Olivia 2023-08-08

694

Docker使用数据容器的具体示例

Nissa 2023-08-08

1163

阿里云服务IIS搭建Web网站外网无法访问的解决方法

Elina 2023-08-08

897

ssh报错nokeyalg的解决方法(关于低版本连接高版本ssh)

Jacinthe 2023-08-08

339

在没有Docker缓存的情况下构建镜像的方法分享

Viridis 2023-08-08

1779

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座