Java Spark算子：distinct

Isoke ·

更新时间:2024-11-13

· 854 次阅读

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import java.util.Arrays;
import java.util.List;
/**
 * distinct（）算子
 * 去除RDD的重复元素。
 *
 */
public class DistinctDemo {
    public static void main(String[] args) {
        SparkConf conf = new SparkConf().setMaster("local").setAppName("spark");
        JavaSparkContext sc  = new JavaSparkContext(conf);
        List list = Arrays.asList("a","b","c","a","b","c","d");
        JavaRDD javaRDD = sc.parallelize(list);
        //distinct算子：去重
        JavaRDD reduce = javaRDD.distinct();
        System.err.println(reduce.collect());
    }
}

作者：默默倾听全世界

JAVA spark distinct

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

Bootstrap 教程

Glenna 2020-09-10

946

Redis 有序集合(sorted set)

Petra 2020-05-22

602

CSS中单位px与em的区别(推荐)

Miki 2020-07-14

552

Java+element实现excel的导入和导出

Malinda 2023-07-07

654

Java实现合并多个升序链表

Kathy 2023-07-07

984

一文详解Java对象的序列化和反序列化

Nora 2023-07-07

700

详解Java构建树结构的公共方法

Tani 2023-07-07

1498

Java访问者模式实现优雅的对象结构处理

Nora 2023-07-12

415

Java状态设计模式实现对象状态转换的优雅方式

Pandora 2023-07-12

895

Java实现自定义语言和表达式解析的解释器模式

Tani 2023-07-12

1302

Java享元设计模式优化对象创建提高性能和效率

Tanisha 2023-07-12

1798

Java桥梁设计模式优雅地将抽象与实现分离

Kande 2023-07-12

1132

Java如何判断字符串中是否包含某个字符

Rhea 2023-07-18

1094

前端ajax请求+后端java实现的下载zip压缩包功能示例

Malinda 2023-07-20

1062

使用linux java shell启动脚本

Antonia 2023-07-20

60

Spark删除redis千万级别set集合数据实现分析

Tia 2023-07-20

1955

关于Java中RabbitMQ的高级特性

Gretel 2023-07-20

430

Java基础技术之反射详解

Xylona 2023-07-21

1208

Android创建文件时出现java.io.IOException: Operation not permitted异常的解决方法

Tia 2023-07-21

531

Linux系统java进程CPU占用过高的问题及排查

Rose 2023-07-22

1813

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座