MAC下Anaconda+Pyspark安装配置详细步骤

Laurie ·

更新时间:2024-11-10

· 606 次阅读

在MAC的Anaconda上使用pyspark,主要包括以下步骤：

在MAC下安装Spark,并配置环境变量。

在Anaconda中安装引用pyspark。

1. MAC下安装Spark

到Apark Spark官网上下载Spark文件，无论是windows系统，还是MAC系统，亦或者Linux系统，都可以下载这个文件(独立于系统)。

将下载的文件进行解压(可以使用命令行进行解压，也可以使用解压软件)。解压之后的文件如下：

配置环境变量。打开MAC命令行窗口，输入如下命令：


sudo vi ~/.bash_profile #bash_profile是当前用户的环境变量文件

打开bash_profile文件，并在该文件中增加以下两行命令：


export SPARK_HOME="/Users/sherry/documents/spark/spark-3.1.2-bin-hadoop2.7" #spark文件的完整解压目录
export PATH=${PATH}:${SPARK_HOME}/bin

如下图

保存并退出之后，运行以下命令：


source ~/.bash_profile #让修改的bash_profile生效
echo $PATH #查看环境变量，可以看到新增的路径名

一般MAC上使用的是zsh的shell工具，需要修改zshrc文件来使环境变量永久生效(若不修改该文件，在命令行中输入spark- shell或者pyspark时可能会提示zsh:command not found:pyspark 或 zsh:command not found spark-shell )。输入以下命令：


vi ~/.zshrc

修改该文件，添加如下命令：


if [ -f ~/.bash_profile ]; then
        source ~/.bash_profile
fi

保存并退出即可。下面来验证spark是否正确安装，具体如下：
(1)命令行中输入spark-shell

(2)命令行中输入pyspark

至此，spark已经安装成功。

2.在Anaconda中引用pyspark

想要在Anacond中使用pyspark, 只需将spark解压文件中python文件夹下的pyspark复制到Anaconda下的site-packages文件中。下面来验证一下是否能在spyder中使用pyspark, 使用如下代码：


from pyspark import SparkContext, SparkConf
if __name__ == "__main__":
    spark_conf = SparkConf()\
        .setAppName('Python_Spark_WordCount')\
        .setMaster('local[2]') 
    #使用spark最原始的API进行数据分析
    sc = SparkContext(conf=spark_conf)
    sc.setLogLevel('WARN')
    print (sc)
   # ------创建RDD，需要分析的数据 --------------------------------------
    def local_rdd(spark_context):
        datas = ['hadoop spark','hadoop hive spark','hadoop hive spark',\
                 'hadoop python spark','hadoop python spark',]
        return spark_context.parallelize(datas)
    rdd = local_rdd(sc)
    print (rdd.count())
    print (rdd.first())
    sc.stop()

运行发现提示如下错误：

从提示信息可以知道，找不到SPARK_HOME。可以在上述主函数中增加如下代码：


import os
#添加spark安装目录
os.environ['SPARK_HOME'] ='/Users/sherry/documents/spark/spark-3.1.2-bin-hadoop2.7'

重新运行即可得到如下结果：

5

hadoop spark

到此这篇关于MAC+Anaconda+Pyspark安装配置教程的文章就介绍到这了,更多相关Anaconda Pyspark安装配置内容请搜索软件开发网以前的文章或继续浏览下面的相关文章希望大家以后多多支持软件开发网！

pyspark anaconda mac

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

Ruby 模块（Module）

Gelsey 2020-12-09

712

PowerShell默认参数$PSDefaultParameterValues结合Out-File输出到日志文件

Paloma 2020-02-13

556

golang双链表的实现代码示例

Aurora 2020-09-15

522

Pycharm配置Anaconda环境的详细图文教程

Querida 2023-02-08

660

在anaconda中配置graphviz包的详细过程

Rose 2023-02-10

489

Mac上Python使用ffmpeg完美解决方案(避坑必看!)

Querida 2023-02-10

1896

Mac上安装Mysql的详细步骤及配置

Viridis 2023-02-10

237

pycharm使用anaconda全过程

Vanna 2023-02-26

906

Anaconda和Pycharm的安装配置教程分享

Ursula 2023-02-26

831

tensorflow基于Anaconda环境搭建的方法步骤

Oria 2023-02-28

278

解决anaconda安装pytorch报错找不到包的问题

Rhea 2023-03-13

408

docker如何在mac-m1芯片部署并启用tomcat

Kande 2023-03-23

900

Anaconda超详细保姆级安装配置教程

Malina 2023-03-23

1641

Anaconda中安装Tensorflow的过程

Psyche 2023-03-31

506

anaconda如何创建和删除环境

Ula 2023-04-14

1105

最新anaconda安装配置教程

Malina 2023-04-14

499

Anaconda安装以及修改环境默认位置图文教程

Dulcea 2023-04-20

1291

win10系统下如何彻底卸载anaconda3

Rhea 2023-04-22

1016

Docker之苹果Mac安装Docker的两种方式小结

Madge 2023-05-13

1564

Mac安装Python3.10和配置环境的详细教程

Olivia 2023-05-13

1489

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座