pyspark的windows7环境搭建

Gamila ·
更新时间:2024-11-13
· 629 次阅读

安装步骤

注意:本篇的所有资源可通过百度网盘提供,减少寻找和下载时间

链接:https://pan.baidu.com/s/1v53Vt5NZEPZigCXE6rjDGQ 
提取码:64pi 


1.安装java

这里选择version 1.8.,配置环境变量JAVA_HOME,PATH,CLASSPATH

参考链接:Java JDK8下载地址,Java安装及环境配置

注意java的版本不能太高,否则后面java安装会报错。

2.安装scala,配置环境变量

(1).从 Scala官网下载目录下载 Scala 二进制包,本教程将下载 2.11.8版本

下载后,双击 msi 文件,一步步安装即可,安装过程使用默认的安装目录即可。

(2).右击【我的电脑】--【属性】--【高级系统设置】--【环境变量】

设置 SCALA_HOME 变量:单击新建,变量名输入:SCALA_HOME,变量值输入:C:\scala,即 Scala 的安装目录

注意安装目录名称不能有空格。
设置 Path 变量:找到Path,单击编辑。变量值添加如下的路径: %SCALA_HOME%\bin;%SCALA_HOME%\jre\bin;

注意:后面的分号 ; 不要漏掉。
设置 Classpath 变量:找到ClassPath,单击编辑。变量值添加:.;%SCALA_HOME%\bin;%SCALA_HOME%\lib\dt.jar;%SCALA_HOME%\lib\tools.jar.;

(3).检查软件是否安装成功

cmd中输入 scala,看到如下结果,说明安装成功。

(3).通过Anaconda navigator的Environments安装py4j库

这里默认已经安装好了Anaconda

pyspark依赖于py4j,导入之前必须确保已安装py4j库

(4).添加系统环境变量
新建系统变量,变量名输入:PYTHONPATH,变量值输入:%SPARK_HOME%\python\lib\py4j;%SPARK_HOME%\python\lib\pyspark

7.检查软件是否安装成功

cmd中输入 pyspark,看到如下结果,说明安装成功。


作者:风一样的男人_



环境搭建 环境 pyspark windows

需要 登录 后方可回复, 如果你还没有账号请 注册新账号