import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import java.util.Arrays;
import java.util.List;
/**
* sample(withReplacement,fraction,seed) 算子
* 对RDD中的数据进行随机采样,会有误差。
* 第一个参数:boolean类型,表示产生的样本是否可以重复:false不重复,也就是不放回的取;t
- 1
- 2
前往页