没有合适的资源？快使用搜索试试~ 我知道了~

文库首页课程资源JavaHadoop课程实验和报告——K-Means算法并行实现

Hadoop课程实验和报告——K-Means算法并行实现

共13个文件

java：5个

class：5个

classpath：1个

K-Means算法

5星 · 超过95%的资源需积分: 20 152 下载量 100 浏览量 2015-06-30 11:17:05 上传评论 7 收藏 210KB RAR 举报

温馨提示

Hadoop课程实验和报告——K-Means算法并行实现

资源推荐

资源详情

资源评论

收起资源包目录

Project-KMeans.rar （13个子文件）

Project-KMeans

bin

KMeans.class 2KB

KMeansReducer.class 3KB

KMeansCombiner.class 3KB

KMeansDirver.class 1KB

KMeansMap.class 5KB

K-Means算法并行实现.docx 220KB

src

KMeansCombiner.java 957B

KMeansMap.java 2KB

KMeans.java 2KB

KMeansReducer.java 1KB

KMeansDirver.java 515B

.project 425B

.classpath 18KB

共 13 条

实验八 K-Means 算法并行实现

一、算法原理

K-Means 算法通过指定 k 的值然后随机挑选出 k 个点，通过迭代计算，将所有的数据划分为

k 部分，每一个部分都有各自的中心点。

二、程序设计

K-Means 算法的并行化主要是通过数据的并行化扫描读取来进行的，同时假定 k 个点足够

小并能够放置在缓存中进行共享。在 map 的起始阶段通过读取缓存文件获取 k 个中心点的

信息，然后对于 map 读取的每一个记录通过计算比较来判定距离最近的中心点，然后输出

<中心点 ID，当前所有点个数，当前所有点的中心点>，在 map 阶段，当前所有点个数为

1，而当前所有点的中心点为当前记录点的信息。在 reduce 阶段，对于同一个中心点 ID 的

所有的点信息重新进行计算获取最后的中心点，然后输出，作为下一轮迭代的输入。

三、程序实现

Job 配置函数

Mapper 实现

评论收藏

内容反馈

资源评论

资源反馈

评论星级较低，若资源使用遇到问题可联系上传者，3个工作日内问题未解决可申请退款~

u013165052

2018-06-03

还不错我觉得
语言不通

2018-11-19

看起来还不错
qq_36339794

2018-06-10

感觉还不错

随风之影

粉丝: 8
资源: 7

上传资源快速赚钱

我的内容管理展开

我的资源快来上传第一个资源

我的收益

登录查看自己的收益

我的积分登录查看自己的积分

我的C币登录后查看C币余额

我的收藏

我的下载

下载帮助

前往需求广场，查看用户热搜

Hadoop课程实验和报告——K-Means算法并行实现

基于Hadoop的Kmeans算法实现

hadoop k-means实现

云环境下K-means算法的并行化

机器学习Kmeans实验报告

基于云环境K-means聚类的并行算法 (2015年)

hadoop大数据课程设计

Kmeans.docx K均值聚类算法实验报告

k-means实验.zip

Hadoop课程实验和报告——Apriori算法并行实现

hadoop k-means算法实现（可直接命令行运行）

论文研究-基于Hadoop的K-Means聚类算法优化与实现 .pdf

hadoop-kmeans:使用 Hadoop 实现 K-Means 算法

MPI-Clustering:K-Means算法的顺序和并行实现，数据集为数据点，DNA链为输入，K为质心

K-Means-Clustering:使用Hadoop和hbase的迭代映射简化实现k-means聚类算法

KMeans_Hadoop:使用映射减少框架的K-Means算法实现

实验报告——Kmeans聚类方法.docx

Hadoop课程实验和报告——Hadoop安装实验报告

hadoop课程设计

基于Hadoop的聚类算法并行化分析及应用研究_陈爱平

软件工程课程设计报告Hadoop配置

Hadoop课程设计，基于Hadoop的好友推荐，在VM虚拟机上搭建CentOS环境（伪分布式）

hadoop 分布式云计算 课程设计报告

基于Hadoop的数据仓库Hive学习指南.doc

课程设计题目

基于Hadoop的海量数据分析系统设计

实验题目：基于Hadoop的并行贝叶斯分类算法的设计与实现

基于Hadoop下MapReduce框架实现的的并行C4.5算法.zip

基于Hadoop平台的Apriori算法的并行化研究与实现论文.docx

基于Hadoop平台的Apriori算法的并行化研究与实现.docx

parallel_fpgrowth:巴西利亚大学并行编程课程的最终项目。 FPGrowth 算法的并行实现 (http

最新资源

hadoop 分布式云计算课程设计报告