Spark快速大数据分析——第四章键值对操作——Pair RDD的行动操作

Serena ·
更新时间:2024-09-21
· 829 次阅读

Pair RDD的行动操作 val conf = new SparkConf().setMaster("local").setAppName("PairRDD") val sc = new SparkContext(conf) 1、对每个键对应的元素分别计数 // 1、对每个键对应的元素分别计数 val lines = sc.parallelize(List((1,2 ),(3, 4),(3, 6))) private val countByKey: collection.Map[Int, Long] = lines.countByKey() countByKey.foreach(println) // (1,1) // (3,2) 2、将结果以映射表的形式返回,以便查询 // 2、将结果以映射表的形式返回,以便查询 private val Collection: collection.Map[Int, Int] = lines.collectAsMap() Collection.foreach(println) 3、返回给定键对应的所有值 // 3、返回给定键对应的所有值 private val lookup: Seq[Int] = lines.lookup(3) lookup.foreach(println)
作者:软件手



大数据分析 数据 rdd 数据分析 spark 键值 大数据

需要 登录 后方可回复, 如果你还没有账号请 注册新账号