Spark的Yarn模式

Heidi ·

更新时间:2024-11-10

· 722 次阅读

Spark基础理论： https://blog.csdn.net/weixin_45102492/article/details/104318250

Spark安装及Local模式：https://blog.csdn.net/weixin_45102492/article/details/104318738
Spark的Standalone模式： https://blog.csdn.net/weixin_45102492/article/details/104319485

Yarn模式

Spark客户端直接连接Yarn，不需要额外构建Spark集群。有yarn-client和yarn-cluster（集群模式，工作中常用）两种模式，主要区别在于：Driver程序的运行节点。
yarn-client：Driver程序运行在客户端，适应于交互、调试，希望立即看到app的输出
yarn-cluster：Driver程序运行在由RM（ResourceManager）启动的AP（APPMaster）适用于生产环境。

修改yarn-site.xml文件

添加以下内容


    yarn.nodemanager.pmem-check-enabled
    false

    yarn.nodemanager.vmem-check-enabled
    false

修改spark-env.sh文件

添加下面配置

YARN_CONF_DIR=/opt/module/Hadoop/hadoop-2.7.7/etc/hadoop

执行官方PI案例

[root@node01 spark-3.0.0-preview2-bin-hadoop2.7]# bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master yarn \
--deploy-mode client \
./examples/jars/spark-examples_2.12-3.0.0-preview2.jar \
100

执行spark-shell

[root@node01 spark-3.0.0-preview2-bin-hadoop2.7]# bin/spark-shell --master yarn
20/02/14 11:27:21 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
Setting default log level to "WARN".
To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).
20/02/14 11:27:28 WARN util.Utils: Service 'SparkUI' could not bind on port 4040. Attempting port 4041.
20/02/14 11:27:30 WARN yarn.Client: Neither spark.yarn.jars nor spark.yarn.archive is set, falling back to uploading libraries under SPARK_HOME.
Spark context Web UI available at http://node01:4041
Spark context available as 'sc' (master = yarn, app id = application_1581648909274_0003).
Spark session available as 'spark'.
Welcome to
      ____              __
     / __/__  ___ _____/ /__
    _\ \/ _ \/ _ `/ __/  '_/
   /___/ .__/\_,_/_/ /_/\_\   version 3.0.0-preview2
      /_/
Using Scala version 2.12.10 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_212)
Type in expressions to have them evaluated.
Type :help for more information.
scala>

日志查看
Spark做计算Yarn做资源调度，中间的日志看不到，可以做以下修改，修改配置文件spark-defaulys.conf
添加以下内容

#把spark的运行日志传到hadoop中 用web访问8088端口方便查看日志
spark.yarn.historyServer.address=node01:18080
spark.history.ui.port=18080

重启spark历史服务

[root@node01 spark-3.0.0-preview2-bin-hadoop2.7]# sbin/stop-history-server.sh
[root@node01 spark-3.0.0-preview2-bin-hadoop2.7]# sbin/start-history-server.sh

Yarn运行模式图解
在这里插入图片描述

IDEA打包程序到集群
在idea的pom文件中添加


    org.apache.maven.plugins
    maven-assembly-plugin
    3.0.0
                WordCount
            jar-with-dependencies
            make-assembly
            package
                single

然后利用maven的package打包
在打包前要注意输入路径要修改为file:///opt/module/Spark/spark-3.0.0-preview2-bin-hadoop2.7/input否则会在yarn下找路径
把WordCount-jar-with-dependencies.jar上传到集群（我在spark下创建了一个job来存放jar包）

提交任务

bin/spark-submit /
--class com.zut.bigdata.spark.WordCount /
./job/WordCount-jar-with-dependencies.jar

作者：hykDatabases

spark yarn

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

SQL 快速参考

Galatea 2020-07-01

695

Redis 有序集合(sorted set)

Petra 2020-05-22

602

Docker-Compose搭建Spark集群的实现方法

Elina 2022-05-29

1952

使用pnpm包管理器替代npm及yarn的命令示例

Antonia 2022-06-14

1324

node.js包管理工具Yarn使用简介

Jelena 2022-07-03

206

Yarn与Lerna管理monorepo使用详解

Iria 2022-07-07

1991

pnpm对npm及yarn降维打击详解

Fern 2022-08-03

364

yarn的安装及使用详解

Levana 2022-08-23

107

浅谈vue-cli5关于yarn的一个小坑

Irisa 2022-10-14

1070

一文带你了解前端包管理工具npm、yarn和pnpm

Nafisa 2022-10-14

554

Spark临时表tempView的注册/使用/注销/注意事项(推荐)

Bambi 2022-10-19

707

教你如何让spark sql写mysql的时候支持update操作

Janna 2022-10-23

880

Spark GraphX 分布式图处理框架图算法详解

Roselani 2022-10-24

253

Spark中的数据读取保存和累加器实例详解

Riva 2022-11-05

1525

如何使用npm安装yarn详解

Hana 2022-11-06

Spark处理trick总结分析

Malina 2022-12-13

235

Spark 集群执行任务失败的故障处理方法

Damara 2023-02-24

615

Spark SQL小文件问题处理

Elina 2023-04-08

1100

spark大数据任务提交参数的优化记录分析

Anna 2023-05-13

776

spark中使用groupByKey进行分组排序的示例代码

Tricia 2023-05-23

1807

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座