Java Spark算子：sample

Tricia ·

更新时间:2024-09-21

· 548 次阅读

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import java.util.Arrays;
import java.util.List;
/**
 * sample(withReplacement,fraction,seed) 算子
 * 对RDD中的数据进行随机采样，会有误差。
 * 第一个参数：boolean类型，表示产生的样本是否可以重复：false不重复，也就是不放回的取；true可以重复，也就是放回的取。
 * 第二个参数：代表取样的比例。
 * 第三个参数：代表一个随机数种子，就是抽样算法的初始值。
 *
 */
public class SampleDemo {
    public static void main(String[] args) {
        SparkConf conf = new SparkConf().setMaster("local").setAppName("spark");
        JavaSparkContext sc = new JavaSparkContext(conf);
        List list = Arrays.asList("ziang","tianyu","zikun","changjun","wenlong","zhangpeng","zelang");
        JavaRDD javaRDD = sc.parallelize(list);
        //sample算子：放回的取样
        JavaRDD javaRDD1 = javaRDD.sample(true,1);
        //sample算子：不放回的取样
        JavaRDD javaRDD2 = javaRDD.sample(false,1);
        System.err.println(javaRDD1.collect());
        System.err.println(javaRDD2.collect());
    }
}

作者：默默倾听全世界

sample JAVA spark

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

Redis 有序集合(sorted set)

Petra 2020-05-22

602

CSS中单位px与em的区别(推荐)

Miki 2020-07-14

552

Ubuntu/Debian 自有软件包构建私有源详解

Tertia 2020-06-23

819

Java+element实现excel的导入和导出

Malinda 2023-07-07

654

Java实现合并多个升序链表

Kathy 2023-07-07

984

一文详解Java对象的序列化和反序列化

Nora 2023-07-07

700

详解Java构建树结构的公共方法

Tani 2023-07-07

1498

Java访问者模式实现优雅的对象结构处理

Nora 2023-07-12

415

Java状态设计模式实现对象状态转换的优雅方式

Pandora 2023-07-12

895

Java实现自定义语言和表达式解析的解释器模式

Tani 2023-07-12

1302

Java享元设计模式优化对象创建提高性能和效率

Tanisha 2023-07-12

1798

Java桥梁设计模式优雅地将抽象与实现分离

Kande 2023-07-12

1132

Java如何判断字符串中是否包含某个字符

Rhea 2023-07-18

1094

前端ajax请求+后端java实现的下载zip压缩包功能示例

Malinda 2023-07-20

1062

使用linux java shell启动脚本

Antonia 2023-07-20

60

Spark删除redis千万级别set集合数据实现分析

Tia 2023-07-20

1955

关于Java中RabbitMQ的高级特性

Gretel 2023-07-20

430

Java基础技术之反射详解

Xylona 2023-07-21

1208

Android创建文件时出现java.io.IOException: Operation not permitted异常的解决方法

Tia 2023-07-21

531

Linux系统java进程CPU占用过高的问题及排查

Rose 2023-07-22

1813

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座