没有合适的资源?快使用搜索试试~ 我知道了~
基于Hadoop的FP-Growth关联规则并行改进算法
所需积分/C币: 50 浏览量·157 PDF 503KB 2018-06-29 16:46:39 上传
身份认证 购VIP最低享 7 折!

大数据环境下,传统的串行FP-Growth算法在处理海量数据时,占用内存过大、频繁项多,适用于大数据情况的PFP(parallel FP-Growth)算法存在数据量增大无法处理的缺陷。针对这些问题,提出了基于Hadoop的负载均衡数据分割FP-Growth并行算法。在Hadoop平台下,使用负载均衡和数据分割相结合的方式对原始事务数据集分片实现并行化。实验证明,基于Hadoop的负载均衡数据分割FP-Growth并行算法在处理数据量和效率上有所提高。
资源推荐
资源评论














资源评论

qq_28339273
- 粉丝: 9
- 资源: 204

上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
已下载
下载帮助

看过该资源的人还看了
论文研究-基于Hadoop的FP-Growth关联规则并行改进算法.pdf
一种基于Hadoop的并行关联规则算法
数据挖掘之关联规则挖掘FP-Growth算法
论文研究-基于FP-tree和约束概念格的关联规则挖掘算法及应用研究.pdf
基于Hadoop平台的K-means聚类算法并行化改进研究.pdf
论文研究-基于Spark的FP_Growth算法的并行与优化.pdf
基于Hadoop平台Canopy-Kmeans聚类算法优化改进研究.pdf
hadoop k-means算法实现(可直接命令行运行)
论文研究-基于Spark的FP-Growth伴随车辆发现与应用.pdf
FP-growth发现频繁项集python实现(含数据集)
安全验证
文档复制为VIP权益,开通VIP直接复制
