没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有意义的关联。随着大量数据不停的收集和存储,从数据库中挖掘关联规则显得越来越有必要性,关联规则挖掘的Apriori算法是数据库挖掘的最经典算法并得到广泛应用,在介绍关联规则挖掘和Apriori算法的基础上,发现Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。综述了Apriori算法的主要优化方法,并指出了Apriori算法在实际中的应用领域,提出了未来Apriori算法的研究方向和应用发展趋势。
资源推荐
资源详情
资源评论
第 24卷第 1期
2011年 2月
四川理工学院学报(自然科学版)
JournalofSichuanUniversityofScience&Engineering(NaturalScienceEdition)
Vol24 No1
Feb2011
收稿日期:20100721
基金项目:四川省科技厅支撑计划项目(2008FZ0109);四川省教育厅科技项目(2007ZL048)
作者简介:赵洪英(1980),女,河南驻马店人,硕士生,主要从事智能信息处理方面的研究。
文章编号:16731549(2011)01006605
关联规则挖掘的 Apriori算法综述
赵洪英
1
,蔡乐才
2
,李先杰
1
(1.四川理工学院电子与信息工程学院,四川 自贡 643000;2.四川理工学院计算机学院,四川 自贡 643000)
摘 要:关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有意义的关
联。随着大量数据不停的收集和存储,从数据库中挖掘关联规则显得越来越有必要性,关联规则挖掘的
Apriori算法是数据库挖掘的最经典算法并得到广泛应用,在介绍关联规则挖掘和 Apriori算法的基础上,
发现 Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。综述了 Apriori算法的主要优
化方法,并指出了 Apriori算法在实际中的应用领域,提出了未来 Apriori算法的研究方向和应用发展趋
势。
关键词:数据挖掘;关联规则;Apriori算法;综述
中图分类号:TP3914 文献标识码:A
引 言
现在,数据挖掘作为从数据中获取信息的有效方
法,越来越受到人们的重视。关联规则挖掘首先是用来
发现购物篮数据事务中各项之间的有趣联系。从那以
后,关联规则就成为数据挖掘的重要研究方向,它是要
找出隐藏在数据间的相互关系。定义为,设 I={I
1
,I
2
,
…I
m
}是 m个不同项的项集,X
∈
I,Y
∈
I,并且 X和 Y
是不相交的项集,即 X
∩
Y=
Φ
。关联规则的属性可以
用以下三个参数描述:一是支持度,(support)定义为全
体事务集
T中有 s%的事务同时支持事务集 X和 Y,则
称 s%为关联规则 X
→
Y的支持度。支持度表示规则的
频繁程度,用 S(X
→
Y)表示。其中,最小支持度用 Min
sup表示。二是置信度(confidence),定义为全体事务集
T中支持事务集 X的事务中,有 c%的事务同时也支持
事务集
Y,c%为关联规则 X
→
Y的置信度。置信度表示
规则的强度,用 C(X
→
Y)表示。其中,最小置信度用
Minconf表示。三是频繁项集,定义为支持度不小于最
小支持度(minsup)的事务集,称为频繁项集。
关联规则的挖掘问题就是在事务数据库 D中找出
具有用户给定的满足一定条件的最小支持度
Minsup和
最小置信度 Minconf的关联规则。关联规则的挖掘一般
分为以下两个步骤:
(1)找出存在于事务数据库中的所有频繁项集。
(2)用频繁项集生成关联规则,即对于每个频繁项
集
X,若 Y
∈
X,Y
≠Φ
,且 c(Y
→
(X-Y))
≥
Minconf,构
成关联规则 Y
→
(X-Y)。
本文分析了 Apriori算法,指出其存在的几个缺陷,提
出了针对缺陷的主要改进优化的方法,列举了
Apriori算
法的几个应用领域,展望了 Apriori算法的未来研究方向。
1 Apriori算法
11 算法概述
Apriori算法是第一个关联规则挖掘算法,也是最经
典的算法。它利用逐层搜索的迭代方法找出数据库中
项集的关系,以形成规则,其过程由连接(类矩阵运算)
与剪枝(去掉那些没必要的中间结果)组成。该算法中
项集(Itemset)的概念即为项的集合。包含 K个项的集
合为 k项集。项集出现的频率是包含项集的事务数,称
为项集的频率。如果某项集满足最小支持度,则称它为
资源评论
weixin_38638647
- 粉丝: 7
- 资源: 993
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- (源码)基于Arduino的盲人碰撞预警系统.zip
- 自己学习java安全的一些总结,主要是安全审计相关.zip
- (源码)基于C++的多线程外部数据排序与归并系统.zip
- 编译的 FFmpeg 二进制 Android Java 库.zip
- 纯 Java git 解决方案.zip
- (源码)基于Spring Boot和Vue的后台管理系统.zip
- 用于将 Power BI 嵌入到您的应用中的 JavaScript 库 查看文档网站和 Wiki 了解更多信息 .zip
- (源码)基于Arduino、Python和Web技术的太阳能监控数据管理系统.zip
- (源码)基于Arduino的CAN总线传感器与执行器通信系统.zip
- (源码)基于C++的智能电力系统通信协议实现.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功