没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
第 32 卷 第 1 期 电 子 科 技 大 学 学 报 Vol.32 No.1
2003 年 2 月 Journal of UEST of China Feb. 2003
分布式数据挖掘计算过程
——DDCP算法研究
方英武
*1,2
张广鹏
1
吴德伟
2
黄玉美
1
赵修斌
2
王 轶
2
(1. 西安理工大学机械与精密仪器工程学院 西安 710048; 2. 空军工程大学电讯工程学院 西安 710077)
【摘要】提出了一种关联规则挖掘大项集生成的并行和分布式处理的计算框架的算法,该算法以大规模事务
数据库为基础,将数据有效地分片后作分布或者并行处理,通过节点之间的通信降低了节点间传输的数据量。通
过算法实例验证了算法的正确性和可行性,可以在分布式或者并行环境里实现高效的数据挖掘。
关 键 词 数据挖掘; 关联规则; 大项集; 数据库
中图分类号 TP311.5 文献标识码 A
Research on Distributive Datamining Calculating Process
——DDCP Algorithm
Fang Yingwu
1,2
Zhang Guangpeng
1
Wu Dewei
2
Huang Yumei
1
Zhao Xiubing
2
Wang Yi
2
(1. College of Mechanical and Precision Tool Engineering, Xi’an Univ. of Technology Xi’an 710048;
2. The Telecommunication Engineering Institure, Air Force Engineering Univ. Xi’an 710077)
Abstract This article proposed a algorithm of the calculate architecture used for the association
rule and this algorithm based on the data partition, fully uses the merits and specialties, at the same time
uses controller to assign transactions randomly to resolve the data skew in the database. The algorithm is
used for the example and shows the correctness and feasibility.It can be used for distribute database and
most applicable for distribute calculation.
Key words datamining; association rule; large itemset; database
目前数据挖掘的算法很多
[1]
,但这些算法都是针对特定的问题和应用领域,在有些方面是高效的,但都
存在或多或少的缺陷。主要问题在于每一种方法都是对具体的计算方法的研究,在改善以往算法时却牺牲
了一些以往算法的优点。大规模数据库的关联规则挖掘算法的效率瓶颈是大项集的生成过程,这个过程相
当耗时,故所有的算法都针对这一点进行了研究和分析,提出了各种不同技术的算法,其目的是尽量减少
数据库的扫描次数。本文通过深入分析以往算法的优缺点
[2]
,提出了一种关联规则挖掘大项集生成的并行和
分布式处理的计算框架的算法—分布式数据挖掘计算过程(Distributive Datamining Calculating Process,DDCP)
算法。旨在能够提供一个灵活的和可扩展的计算平台,利用现在相对廉价的单机进行网络计算,充分挖掘
网络计算的优势。
1 分布式计算框架
1.1 问题描述
关联规则挖掘问题是在分析零售业事务数据库时提出的,现在的发展已经超出了原来的应用范围,其
2002年7月10日收稿
* 男 30岁 博士研究生 主要从事计算力学与自动控制方面的研究
资源评论
weixin_38621441
- 粉丝: 7
- 资源: 934
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- (源码)基于Spring Boot和Vue的高性能售票系统.zip
- (源码)基于Windows API的USB设备通信系统.zip
- (源码)基于Spring Boot框架的进销存管理系统.zip
- (源码)基于Java和JavaFX的学生管理系统.zip
- (源码)基于C语言和Easyx库的内存分配模拟系统.zip
- (源码)基于WPF和EdgeTTS的桌宠插件系统.zip
- (源码)基于PonyText的文本排版与预处理系统.zip
- joi_240913_8.8.0_73327_share-2EM46K.apk
- Library-rl78g15-fpb-1.2.1.zip
- llvm-17.0.1.202406-rl78-elf.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功