Pandas使用stack和pivot实现数据透视的方法

Kirima ·

更新时间:2024-09-20

· 545 次阅读

前言

一、经过统计得到多维度指标数据

二、使用unstack实现数据的二维透视

三、使用pivot简化透视

四、stack、unstack、pivot的语法

1.stack

2.unstack

3.pivot

总结

前言

笔者最近正在学习Pandas数据分析，将自己的学习笔记做成一套系列文章。本节主要记录Pandas中使用stack和pivot实现数据透视。

一、经过统计得到多维度指标数据

非常场景的统计场景，指定多个维度，计算聚合后的指标
实例：统计得到“电影评分数据集”，每个月份的每个分数被评分多少次:(月份、分数1-5、次数)


import pandas as pd
import numpy as np
%matplotlib inline
df=pd.read_csv(
        "./datas/ml-1m/ratings.dat",
    sep="::",
    engine='python',
    names='UserID::MovieID::Rating::Timestamp'.split("::"),
    header=None
)
df.head()
#将时间戳转换为具体的时间
df['padate']=pd.to_datetime(df["Timestamp"],unit='s')
df.head()
df.dtypes
#实现数据统计 
# 对于这样格式的数据，我想查看按月份，不同评分的次数趋势，是没有办法进行实现的，需要将数据转换为每个评分是一列才可以实现。
df_group=df.groupby([df["padate"].dt.month,"Rating"])["UserID"].agg(pv=np.sum) 
df_group.head(20)

二、使用unstack实现数据的二维透视

目的：想要画图对比按照月份的不同评分的数量趋势


df_stack=df_group.unstack()
df_stack
df_stack.plot()
#unstack和stack是互逆的操作
df_stack.stack().head(20)

三、使用pivot简化透视

pivot方法相当于对df使用set_index创建分层索引，然后调用unstack


df_group.head(20)
df_reset=df_group.reset_index()
df_reset.head()
df_pivot=df_reset.pivot("padate","Rating","pv")
df_pivot.head()
df_pivot.plot()

四、stack、unstack、pivot的语法 1.stack

stack:DataFrame.stack(level=-1,dropna=True),将column变成index，类似把横放的书籍变成竖放
level=-1代表多层索引的最内层，可以通过==0,1,2指定多层索引的对应层

2.unstack

unstack:DataFrame.unstack(level=-1,fill_value=None)，将index变成column，类似把竖放的书变成横放

3.pivot

pivot:DataFrame.pivot(index=None,columns=None,values=None)，指定index,columns,values实现二维透视

总结

到此这篇关于Pandas使用stack和pivot实现数据透视的方法的文章就介绍到这了,更多相关Pandas stack和pivot数据透视内容请搜索软件开发网以前的文章或继续浏览下面的相关文章希望大家以后多多支持软件开发网！

stack 数据透视方法数据 pandas

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

ASP Session 对象

Wilma 2020-04-12

617

详解css栅格系统在项目中的灵活运用

Ursula 2020-04-01

908

Laravel 中使用简单的方法跟踪用户是否在线(推荐)

Serwa 2020-03-20

874

七、HTTP应答状态

Pythia 2021-05-01

644

Docker 配置网络使用bridge网络的方法

Ivie 2020-01-05

552

Docker镜像之不同服务器间迁移方法大全

Dorothy 2023-07-22

1993

docker容器使用内存大小限制方法

Dulcea 2023-07-22

493

在Linux中列出Systemd下所有正在运行的服务的方法指南

Zandra 2023-07-22

507

一文详解Python中多进程和进程池的使用方法

Serafina 2023-07-24

338

Pandas中DataFrame的常用用法分享

Malinda 2023-07-24

382

python简单几步实现时间日期处理到数据文件的读写

Nora 2023-07-24

926

Python采集二手车数据的超详细讲解

Pandora 2023-07-24

294

Python实战使用XPath采集数据示例解析

Diane 2023-07-24

1433

Android客户端与服务端数据加密传输方案详解

Diane 2023-07-28

768

VMware克隆虚拟机并重新设置IP和主机名的实现方法

Kathy 2023-08-08

194

使用nginx.exe时闪退的原因和解决方法

Olivia 2023-08-08

694

Docker使用数据容器的具体示例

Nissa 2023-08-08

1163

阿里云服务IIS搭建Web网站外网无法访问的解决方法

Elina 2023-08-08

897

ssh报错nokeyalg的解决方法(关于低版本连接高版本ssh)

Jacinthe 2023-08-08

339

在没有Docker缓存的情况下构建镜像的方法分享

Viridis 2023-08-08

1779

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座