Spark的安装（Standalone模式，高可用模式，基于Yarn模式）

Jessica ·

更新时间:2024-11-10

· 615 次阅读

spark的Standalone模式安装

一、安装流程

1、将spark-2.2.0-bin-hadoop2.7.tgz 上传到 /usr/local/spark/ 下，然后解压

2、进入到conf中修改名字改为 .sh 结尾的

3、编辑 spark-env.sh

4、修改slaves 的名字并且编辑他

5、发送到其他两台虚拟机上

6、修改ect/proflie下面的配置环境

7、到spark的sbin目录下修改启动命令

8、启动之后的jps数目

二、检测是否安装成功

1、进谷歌浏览器看看（端口号是8080 和tomcat端口号是一样的，注意后期一块启动的冲突问题）

2、按装完之后执行Spark程序进行迭代计算Spark上的PI示例

三、进入spark的shell界面操作算子

Spark高可用（先启动zookeeper再启动spark）

一、安装流程

二、高可用安装注意事项

1、先把Standalone模式注释掉

2、在后面添加配置注意其中的间隔

3. 在node1节点上修改slaves配置文件内容指定worker节点

4.把配置好的spark 拷贝到其他节点

5.在node1上执行sbin/start-all.sh脚本，然后在node2上执行sbin/start-master.sh启动第二个Master。

三、spark高可用启动

四、高可用模式提交任务：

Spark基于yarn调度的模式 Spark on yarn

一、Yarn集群模式安装流程：

1、需要的配置项三台都需要配

2、配置好hadoop环境变量

3.在hadoop的yarn-site中添加如下配置三台都需要配

二、通过往spark集群上运行jar包，测试安装效果，看是否安装成功

2.1、spark-shell --master yarn-client 进yarn spark shell界面的

2.2、测试基于yarn模式能否在集群上计算π

2.3、基于yarn的两种模式（client模式和cluster模式）

三、进入shell界面操作算子

spark的Standalone模式安装 一、安装流程 1、将spark-2.2.0-bin-hadoop2.7.tgz 上传到 /usr/local/spark/ 下，然后解压 -C 是用大写C解压到指定目录 2、进入到conf中修改名字改为 .sh 结尾的 3、编辑 spark-env.sh export JAVA_HOME=/home/xss/java/jdk #指定spark老大Master的IP export SPARK_MASTER_HOST=node132 #指定spark老大Master的端口 export SPARK_MASTER_PORT=7077 #woker 使用1g和1个核心进行任务处理 export SPARK_WORKER_CORES=1 export SPARK_WORKER_MEMORY=1g 4、修改slaves 的名字并且编辑他 5、发送到其他两台虚拟机上 scp -r ./spark-2.2.0 node133:/usr/local/spark scp -r ./spark-2.2.0 node134:/usr/local/spark 6、修改ect/proflie下面的配置环境 export SPARK_HOME=/usr/local/spark/spark-2.2.0 export PATH=.:$SPARK_HOME/sbin:$HBASE_HOME/bin:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$ZOOKEEPER_HOME/bin:$PATH 7、到spark的sbin目录下修改启动命令 /usr/local/spark/spark-2.2.0/sbin 修改启动命令（因为它之前的启动命令和hadoop的启动命令冲突了，所以要改它） mv ./start-all.sh start-spark.sh mv ./stop-all.sh stop-spark.sh 8、启动之后的jps数目 node32： node133/node34： 二、检测是否安装成功 1、进谷歌浏览器看看（端口号是8080 和tomcat端口号是一样的，注意后期一块启动的冲突问题） node132:8080 2、按装完之后执行Spark程序进行迭代计算Spark上的PI示例 bin/spark-submit \ --class org.apache.spark.examples.SparkPi \ --master spark://node132:7077 \ --executor-memory 1G \ --total-executor-cores 2 \ examples/jars/spark-examples_2.11-2.2.0.jar \ 100 三、进入spark的shell界面操作算子 spark/bin 目录下 ./spark-shell 回车
Spark高可用（先启动zookeeper再启动spark） 来源网址： file:///F:/vm/老師錄屏/stage4/spark/高可用spark提交任务.docx 作者： ℡XSs

高可用模式安装高可用 spark yarn

1024 个赞

编辑举报

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

SQL 快速参考

Galatea 2020-07-01

695

Redis 有序集合(sorted set)

Petra 2020-05-22

602

ionic 表单和输入框

Githa 2021-05-25

926

PHP session实现购物车功能

Irisa 2020-12-24

937

shell脚本中case条件控制语句的一个bug分析

Akili 2021-03-24

596

Windows Server 2019 MySQL数据库的安装与配置理论+远程连接篇

Olinda 2023-05-15

1507

Windows Server 2019 Web服务器之IIS的安装与基本配置

Viridis 2023-05-15

1197

spark中使用groupByKey进行分组排序的示例代码

Tricia 2023-05-23

1807

fs-extra实现yarn create tlist创建示例详解

Diane 2023-07-02

1801

windows下MySQL免安装版配置教程mysql-5.6.51-winx64.zip版本(最新安装教程)

Tanisha 2023-07-04

459

Windows 环境搭建 PostgreSQL 逻辑复制高可用架构数据库服务

Tia 2023-07-17

1417

Oracle数据库安装教程并实现公网远程连接(内网穿透)

Dianthe 2023-07-20

221

SQL Server2022安装提示安装程序在运行作业UpdateResult时失败解决方法

Madeleine 2023-07-20

1841

MongoDB的安装方法图文详细

Tina 2023-07-20

146

Mysql8.0压缩包安装方法(详细教程一步步安装)

Jacinda 2023-07-20

484

MySQL自动安装脚本代码实例分享

Thalia 2023-07-20

1470

Spark删除redis千万级别set集合数据实现分析

Tia 2023-07-20

1955

Redis分布式缓存的安装

Winona 2023-07-20

1325

Python虚拟环境安装及操作命令详解

Kamiisa 2023-07-20

106

如何解决jupyternotebook无法导入自己安装的包

Erin 2023-07-21

1749

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。
软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座

© 2021 1024问 MIT 京ICP备11031391号-29