基于Apriori算法的多维关联规则挖掘研究

所需积分/C币:29 2014-09-09 11:32:21 286KB PDF

基于Apriori算法的多维关联规则挖掘研究,从单维扩展到多维,可以给到一个思路上的启发
1736 科学技术与工程 9卷 生频繁项集;第三部由频繁项集生成关联规则。其 中第二不是关联规则挖掘的核心内容,关联规则挖 For each cand idate E =( i}∈C 掘算法的总体性能由它决定。 F k维立方体中方格 中的 传统的 a priori算法是用在单维、单层、布尔关 coun t值 联规则中,它采用一种称作逐层搜索的迭代方法,k Support= frequency / btalcount 项集用于搜索(k+1)项集。首先,找出频繁1项 If support>min_aup)then//I是一个频繁项日集 集的集合。该集合记作L。L1用于找频繁2项集 L=L∪{I}; 的集合L而L2用于找L,如此下去,直到不能找 到频繁k项集。找每个Lk(频繁k项集的集合)需 Retum Lk 要一次数据库扫描。找频繁项集的过程有两步组 Fuction gen_candidate(kLk-1)/胲该函数由频繁(k-1)项集 成:连接和剪枝。 L-1生成候选k项集 改进后的算法也有连接和剪枝步组成,但不同 的是 I) a prp ri算法扫描的是交易数据表,而本算 For each item∈ 法扫描的是数据立方体; 2)本算法的剪枝步由两部分构成:一是根据 For each item∈Ik 维间关联规则的特点,即同一维内不同的层不能同 If(I和L前k-2个项相同,第k-1个项来自不 时出现在一个谓词集中来剪枝;二是采用 A priori算 同的维) 法的剪枝来进行二次剪枝。 then 23改进后算法的伪代码 基于以上描述,并在前任的基础上,改进后的 c=1el;/连接操作 伪代码如下 ifc中包含同维内不同的层,then删除c else 输入:一个n维的数据立方体Cube[d1,…,dnl最小支持度 ifc有非频繁的(k-1)项集,then删除 insp else c= cu c 输出:n维间的频繁项目集L (2)C,a=(d维中所有互不相同的的取值};/附每一维 d生成候选1项集 tum C1=UC1d;;/冾并Cpb产生所有维候选1项集的集 (3)生成频繁1项集集合:L1= gen_ t(LC1) 3结束语 (4) );k++) 生成候选k项集的集合:Ck=gen_ candidate(k 多维关联规则挖掘是当前关联规则挖掘中的 热点,其基于多维数据立方体的原理,适合于目前 生成频繁k项集的集合:L4=8 gen frequent(kC):大多数关系数据库。本文在经典单维布尔型算法 LE IUL Aprior算法的基础上,提出了一种适合多维关联规 Iui蝕m(kC)胲函数由候选k项集集合C产则挖掘的算法,任务相关数据存放在数据立方体 生频繁k项集集合I 中。利用同维内层与层之间互斥和 A priori算法本 1992012 China academic journal electronic publisl身的校对候选集进行了一次剪枝很太程度 7期 绳英英,等:基于 A priori算法的多维关联规则挖掘研究 1737 上减小了候选集的个数,在一定程度上提高了算法4李锦泽,叶晓俊.关联规则挖掘算法研究现状计算机技术与应 效率( A prior算法的瓶颈之一是生成的频繁项集数 用进展,2007 5刘君强.海量数据挖掘技术研究.杭州:浙江大学博士学位论 目过大)。 文,2003 参考文献 6黄勇,刘峰.关系数据库中多维关联规则挖掘的一种新算 法.计算机应用与软件,20078360-61 I Agraw alr m ielinsk i T, Sw an iA. M ining association nules betw een7李明,郑波.基于数据立方体分块的多维关联规则挖掘.计 sets of iem s n large datab ase: In P roc 1993 A CM-S GMOD Int Con f 算机与现代化,2007;(3):67-6896 M anagem ent of Data(SMOD 93),Washington, DC, M ay 1993; 8高学东,王文贤,吴森.基于数据立方体的多维关联规则的挖 207—216 掘方法.计算机工程,2003153(8):74-76 2 H an jia ei K amber.数据挖掘概念与技术.北京:机械工业岀版9方旺盛,郑剑,绍利平.基于多维关联规则的算法研究与系统 社,2007 实现计算机与数字工程,200432(4):25 3王翠茹,王少华.关联规则经典算法的一种改进.中国通信学会 第五届学术年会论文集,2008 Research Multi-dim ensional association Rule mining Based on apriori a lgorithm SHENG Y ng-ying YAN RenWy WANG Jiam in LI J School of cam puter Scien ce& Engineering J iangsu U n ive Is ity of Scien ce and Technobgy, Zhen jang 212003 P. R Ch in a [Abstract] A ssociation nu les m n ng is very im po rtant in the app licat in of data m in ing C lass ic a priori algorithm one of he most influent ial assoc iation nu les n m in ing boo lean frequent item sets algorithms but is no t su itab le for m in ing multid im ensional data m odel wh ich rise in recent years A"second cut method is proposed w hich is on he bas is of the a priori a borithm. The algo rithm app lies to multtd m ensional m n ng associat in rules and to same ex tent im proved the efficiency of he a boritm [Key words] data m ining mu ltidim ens ion al association ru les data cube a pr iri arithm etic 勘误表 卷 2008 栏 行 55 右 图5 正 见右图4见右图5 图4 图5 o1994-2012ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net

...展开详情
img
xiaolaodi218

关注 私信 TA的资源

上传资源赚积分,得勋章
相关内容推荐