没有合适的资源?快使用搜索试试~
我知道了~
文库首页
课程资源
专业指导
k_means聚类算法的MapReduce并行化实现
k_means聚类算法的MapReduce并行化实现
kmeans
mapreduce
4星
· 超过85%的资源
需积分: 50
72 下载量
163 浏览量
2014-10-15
11:00:28
上传
评论
2
收藏
258KB
PDF
举报
温馨提示
立即下载
利用k_means聚类算法的MapReduce并行化实现,为学习hadoop的同学提供参考
资源推荐
资源评论
用MapReduce实现KMeans算法
浏览:62
用MapReduce实现KMeans算法,数据的读写都是在HDFS上进行的,在伪分布下运行没有问题。文档中有具体说明。
kmeans算法并行化
浏览:53
本代码是全局kmeans算法在异构架构下的实现,使用cuda c语言编写。(声明,改代码是一位大牛所写,希望对你有用)
聚类实现MapReduce技术
浏览:92
本文将将K均值聚类算法应用在MapReduce的并行算法实现上,具有借鉴意义。
一种基于MapReduce高效K-means并行算法
浏览:22
针对K-means算法对初值选取的依赖,收敛速度慢,聚类精度低,以及对海量数据的处理存在内存瓶颈的问题,提出一种基于MapReduce的高效K-means并行算法.该算法在MapReduce框架基础上,结合K选择排序算法进行并行采样,提高采样效率;采用基于样本预处理策略获取初始中心点;使用权值替换策略对迭代中心进行更新;此外,通过调整Hadoop集群,对算法的运行效率作出进一步提升.实验结果表明,
基于MapReduce的Kmeans实现
浏览:81
5星 · 资源好评率100%
这是我基于MapReduce实现的Kmeans算法,用Java语言,在一个完全分布式系统运行良好
kmeans-pyspark:Spark中分布式K-means聚类的Python实现
浏览:144
本地开发和运营 依存关系 确保您已将Python 2.7和pip一起安装。 然后运行: pip install -r requirements.txt 正在运行的工作 使用中央作业运行程序模块src/index.py运行所有作业。 您完全不需要编辑此文件。 python src/index.py <job> <k> <file1> <file2> 参数: <job> src/spark_jo
hadoop并行化和非并行化的kmeans算法.zip
浏览:92
包含两种平台上运行的kmeans算法:一种是在Hadoop系统上的并行化kmeans算法,支持读文件,执行聚类算法,输出质心文件,将每个数据的聚类信息输出到控制台上;另一种是串行的聚类算法,支持读文件数据,执行kmeans算法,将每个数据的聚类信息输出到文件中。代码注释清晰。
Hadoop课程实验和报告——K-Means算法并行实现
浏览:177
5星 · 资源好评率100%
Hadoop课程实验和报告——K-Means算法并行实现
分布式MVC-Kmeans算法设计与实现.pdf
浏览:121
#资源达人分享计划#
云环境下K-means算法的并行化
浏览:86
随着大数据时代的到来,传统的聚类算法很难高效地处理海量数据,而云计算平台凭借负载均衡、网络存储、虚拟化等技术,有效地突破了耗时耗能的瓶颈,为海量数据的处理提供了良好的解决方案。主要研究了Hadoop平台下的MapReduce编程模型及传统K-means算法,提出了一种基于MapReduce的并行化K-means算法的设计方案,包括Map函数和Reduce函数的设计。通过实验,验证了并行化K-mea
论文研究-基于MapReduce的ACO-K-means并行聚类算法.pdf
浏览:184
针对K-means算法处理海量数据存在严重的内存不足,提出利用MapReduce并行化K-means,但是普通的K均值存在收敛速度慢、易陷入局部最优和对初始聚类中心的选取等局限性,因此选择了经ACO改进过的ACO-K-means聚类算法。实验结果表明,经MapReduce并行化的ACO-K-means,不仅具有良好的加速比和扩展性,其收敛性以及聚类精度均得到了改善。
聚类分析的并行化实现技术研究
浏览:159
文中基于使传统聚类算法能够满足当前大数据分析的对计算效率的需求,采用将传统聚类算法分布式化的方法提高传统聚类算法效率。结合近年来广泛使用的MapReduce分布式处理模型,对K-means、PAM、CLARA 3种算法进行了分布式化实验,并从数据规模和节点数量两个方面考察、讨论了一些影响并行算法性能的因素。实验分析表明,该方法能够有效地将聚类方法并行化,并可以应用在分布式系统当中。
基于云环境K-means聚类的并行算法 (2015年)
浏览:155
K-means聚类算法只能保证算法收敛到局部最优,从而导致聚类结果对初始点的选择非常依赖,同时在面对海量数据时容易因运算次数增多而使聚类过程耗时增加。针对上述问题及结合海量数据的特性,本文提出了一种基于云环境的并行聚类算法,该算法利用Canopy聚类算法思想并结合二分查找思想对K-means算法进行优化,同时采用“极限点”原则使之避免了聚类过程中的局部最优,然后利用顺序组合式MapReduce编程
基于MapReduce的气象数据并行PK-means算法 (2012年)
浏览:5
随着气象信息化程度日益提高,气象数据呈指数级增长。由于数据量的过快增长,K-means算法很难满足实际应用需求,根据气象数据的特征,提出一种基于MapReduce的并行聚类算法PK-means,其中Map函数计算数据对象到中心点的距离,并重新标记新的聚类类别,Reduce函数根据中间结果计算新的聚类中心,然后迭代计算,中间迭代只计算中心点到所属类的所有点的距离,实验结果显示该算法具有很强的计算能力
Hadoop mapreduce 实现KMeans
浏览:54
4星 · 用户满意度95%
Hadoop mapreduce 实现KMeans,可用
mapreduce-kmeans:使用MapReduce的朴素K均值聚类
浏览:48
mapreduce-kmeans 代码。 请注意,这只是一个示例,而不是可用于生产的代码。 如果您要进行正式生产和正常工作的群集,请使用Mahout,Hama或Spark。 建造 您将需要Java 8来构建该库。 您可以简单地使用以下命令进行构建: mvn clean软件包安装 创建的jar包含可调试代码+源+ javadocs。 要生成蚀文件,请使用: mvn eclipse:ecl
基于Hadoop的Kmeans算法实现
浏览:142
基于Hadoop的Kmeans算法实现:Kmeans算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标。即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。
分布式K-means聚类算法研究与实现.pdf
浏览:64
#资源达人分享计划#
KMean算法在MapReduce上的并行化.rar
浏览:158
4星 · 用户满意度95%
KMean算法在MapReduce上的并行化.rar KMean算法在MapReduce上的并行化.rar KMean算法在MapReduce上的并行化.rar KMean算法在MapReduce上的并行化.rar KMean算法在MapReduce上的并行化.rar
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
fafa菜
2019-05-26
是一篇论文
自由正义神
2015-03-19
具有一定的参看价值
AntonioV
粉丝: 1
资源:
5
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
java实现获取今日天气源码
精品协同供应链集成解决方案V70.rar
最新租号平台系统源码,可选择单独租用或与他人合租.rar
win-soem-win10及win11系统QT-SOEM-1个电机转圈圈-位置模式(PP模式)-添加代码注释-CSDN.rar
备胎书屋2024-04-12.torrent
基于 HTTP 请求的快速数据驱动 pytest 接口自动化测试框架
汐鹤Key码查询+网站授权系统源码.rar
程序设计实践 邮件客户端的实现
PHP项目管理系统网站源码 方便程序员设计开发项目进度跟进.rar
Nteam官网程序全解版 移除后门授权.rar
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功