pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例

Jcinta ·

更新时间:2024-11-13

· 850 次阅读

代码如下，步骤流程在代码注释中可见：


# -*- coding: utf-8 -*-
import pandas as pd
from pyspark.sql import SparkSession
from pyspark.sql import SQLContext
from pyspark import SparkContext
#初始化数据
#初始化pandas DataFrame
df = pd.DataFrame([[1, 2, 3], [4, 5, 6]], index=['row1', 'row2'], columns=['c1', 'c2', 'c3'])
#打印数据
print df
#初始化spark DataFrame
sc = SparkContext()
if __name__ == "__main__":
 spark = SparkSession\
  .builder\
  .appName("testDataFrame")\
  .getOrCreate()
sentenceData = spark.createDataFrame([
 (0.0, "I like Spark"),
 (1.0, "Pandas is useful"),
 (2.0, "They are coded by Python ")
], ["label", "sentence"])
#显示数据
sentenceData.select("label").show()
#spark.DataFrame 转换成 pandas.DataFrame
sqlContest = SQLContext(sc)
spark_df = sqlContest.createDataFrame(df)
#显示数据
spark_df.select("c1").show()
# pandas.DataFrame 转换成 spark.DataFrame
pandas_df = sentenceData.toPandas()
#打印数据
print pandas_df

程序结果：

以上这篇pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持软件开发网。

您可能感兴趣的文章:Pandas中把dataframe转成array的方法详解将Pandas中的DataFrame类型转换成Numpy中array类型的三种方法pandas 实现字典转换成DataFrame的方法pandas DataFrame数据转为list的方法Pandas实现dataframe和np.array的相互转换

SQL pyspark dataframe pandas

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

ASP Session 对象

Wilma 2020-04-12

617

PowerShell: Try...Catch...Finally 实现方法

Roxana 2020-10-15

740

golang双链表的实现代码示例

Aurora 2020-09-15

522

利用CSS3实现折角效果实例源码

Psyche 2020-08-11

632

SQL中case when用法及使用案例详解

Petunia 2023-07-20

1330

sql中的IF条件语句的用法详解

Hellens 2023-07-20

1065

使用SQL语句将相同名的多行字段内容拼接(方法详解)

Belle 2023-07-20

1546

SQL查询中出现笛卡尔积现象的解决方法

Nyako 2023-07-20

1884

SQL DNSlog注入实战

Dagny 2023-07-20

239

SQL Server2012附加数据库5120错误(拒绝访问)的解决方法

Clementine 2023-07-20

248

oracle中sql%rowcount的作用详解

Isleta 2023-07-20

497

SQL Server2022安装提示安装程序在运行作业UpdateResult时失败解决方法

Madeleine 2023-07-20

1841

SQL查询服务器下所有数据库及数据库的全部表

Isis 2023-07-20

1752

Navicat中如何导入数据库SQL脚本并执行

Ula 2023-07-20

1782

Python+pandas数据分析实践总结

Bertha 2023-07-20

1461

python利用pandas和csv包向一个csv文件写入或追加数据

Heather 2023-07-20

653

关于pandas中的.update()方法解析

Aggie 2023-07-20

578

深入探究python中Pandas库处理缺失数据和数据聚合

Bliss 2023-07-21

191

Python中Pandas库的数据处理与分析

Lillian 2023-07-21

155

pandas删除重复数据简单方法

Tertia 2023-07-21

311

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座