val conf = new SparkConf().setMaster("local").setAppName("PairRDD")
val sc = new SparkContext(conf)
1、对每个键对应的元素分别计数
// 1、对每个键对应的元素分别计数
val lines = sc.parallelize(List((1,2 ),(3, 4),(3, 6)))
private val countByKey: collection.Map[Int, Long] = lines.countByKey()
countByKey.foreach(println)
// (1,1)
// (3,2)
2、将结果以映射表的形式返回,以便查询
// 2、将结果以映射表的形式返回,以便查询
private val Collection: collection.Map[Int, Int] = lines.collectAsMap()
Collection.foreach(println)
3、返回给定键对应的所有值
// 3、返回给定键对应的所有值
private val lookup: Seq[Int] = lines.lookup(3)
lookup.foreach(println)