论文研究-基于FP-tree和约束概念格的关联规则挖掘算法及应用研究.pdf

所需积分/C币:10 2019-07-22 20:36:51 659KB .PDF

现有的基于频繁模式树FP-tree和概念格的规则挖掘算法在构造概念格时存在重复遍历FP-tree问题,在挖掘后件约束的规则时算法构造的概念格包含冗余结点。针对这两个问题,提出了通过遍历FP-tree生成候选概念格节点的策略,并根据候选概念格节点进一步构造规则约束条件下无冗余概念格。通过实际项目中大气腐蚀数据进行算法的应用,结果表明该算法比现有算法具有更高的挖掘效率且腐蚀规则结果对材料腐蚀现状研究具有重要指导价值。
第4期 付冬梅,等:基于 FP-tree和约東概念格的关联规则挖掘算法及应月斫究 1015· 的规则结果。根据 DFTFH算法,深度优先遍历 FP-trce产生候大气腐蚀数据集中的材料腐蚀率属性作为关联规则的固定后 选概念格节点,并最终通过候选节点生成的约束概念格结构如件,挖掘各地环境与材料腐蚀率的相关腐蚀规则。 图2所小。 具休应用的大气腐蚀数据为1、24、8、16年在全国七个腐 表1样本数据库 蚀实验站点碳钢材枓的采样数据,部分原始数据集如表3所示。 事务TD 项目列表 事务TID 项目列表 表3A3钢材料大气环境腐蚀数据 1 ABCD ABDE 腐蚀率/平均温平均 含SO 实验 IBCDE 度/℃ 时间 量 含量 站点 3 6 BCE 33.491.9 2558 0.0390.209北京 表2频繁项目外表H 16.8 41810.0140.264武汉 1.181 青岛 频繁1项集 B A E 0.0)9 广州 支持度 5 17.9 江津 计数 28.7 0.018 琼海 4.2 020 0.128 0.06 万宁 1D|414(3,11K31E 对于金属材料的腐蚀性类型分类,国际标准化组织颁布了 ISO9223-9226标准,其中I092233.大气腐蚀性分类方法 412m计D 中根据腐蚀速率及标准金属实验测定的分类方法,规定了标准 324 试样腐蚀速率的测定,并将大气腐蚀性分为五类: C1:很低;C2:低;C3:中;C4高;C5很高 图1频繁模式树(FP-tree) 图2基于约束条件D构造的 按照腐蚀性等级标准进行腐蚀速率的离散化聚类,并将其 约束概念格 图2中的实线框节点及其之间的连接所组成的概念格结构他数据属性进行相关区间化聚类预处理等到预处理数据,将预 为本文算法枃造的约朿概悆格,虚线框表示的格节点为约東条处理数据分别用 DFCLAΔ和 DFTFH算法进行腐蚀规则挖掘。 件D下无意义的相关冗余节点,此类冗余节点在本文算法构造本实验中设置支持度5%,置信度70%,得到材料在各地的腐 的约束概念格中不存在,但在 DFCLA算法构造的概念格中有规则结果如表4所示 表4A3钢在各圯腐蚀规则 在。可以看出,此样本数据库下,本文算法删除的无意义冗余节 点占全部节点的1/3,在实际的数据应用中,木文算法所删除的 编号 规则形式 规则置信度/% 青岛→腐蚀等级C4 冗余节点所占全部节点的百分比和对比图将在第3章中介绍。 江津→腐蚀等级C4 84.61 本文算法在上述约束概念格的形成过程中,深度优先遍历FP 广州→腐蚀等级C3andC 100 tre生成所有候选概念格节点组合,分枝处的节点组合计数以 武汉→腐蚀等级C3andC4 93.62 万宁→腐蚀等级C3 相关节点中的最小计数为准,各个分枝共用的卞枝千节点组合 234567 北京→腐蚀等级C3 只计算一次。如 FP-tree分枝BD4E产生的节点组合为(4,B 琼海→腐蚀等级C2anlC 100 D),〈3,{B,A},(1,{B,E}),(3,D,A}〉,〈1,{D,E}〉,〈1 实验表明, DFCLA和 DETFH算法能够控握出相关的大气 A,E}),〈3,B,D,A}),(1,B,D,E}),(1,D,A,E}),〈1,环境腐蚀关联规则结果。然而 DFCLA算法屮的慨念格结构屮 B,D,A,E}>,分枝 BDACE和BDE共用一条主枝干BD4E,包含环境因素白身之间组成的冗余节点, DFTFH算法的约束 因此只生成该主校十1B,D,A,E的节点组合一次,在打指概念格结构中则过滤掉了相关的冗余节点。在本例中,表5和 BACE时不再重复生成。最终打描完全部分枝后将相同节点图3表明,算法剔除冗余节点比率在10%左右,若数据量增 组合进行合并,其支持度计数累加,形成全部节点组合,然后判大,剔除冗余节点的比率会进一步增加,因此DFT算法史为 断每个节点组合是否包含约枣条件D。如果包含约束条件D,简洁。算法时间的比较结果如图4所示。 则保留此节点和该节点删除约束项后剩余元素对应的父节点, 表5 DFCLA和 DFTFH算法概念格节点比较 如节点组合(〈3,B,D,A}〉包含约束条件D,因此保留(3,{B, 支持度 D,A})本身和其删除D后对应的父节点<4,B,4},而节点 比较项 10% 20% 组合〈3,B,C}由丁既不包含约束条件D,又非任意包含约東 DFCLA节点数 1320 191 130 DETFH节点数 条件D的节点的父节点,因此被删除。按照上述略删除几剔除冗余节点百分比%949914-319.9169 余节点并完成保留节点的概念格链接,最终生成如图2所示的 实线框节点组成的约束概念格。通过约束概念格父子节点扫140 l800r 4-D=CLA算法 描容易得出相应的约束关联规则,例如通过父节点(5,B})和1200 A-DFTLA 000 其子节点(4,B,D能够得到B→D的置信度为80%。 600 3算法应用与比较 00C 200 将厶算法实际应用于国家自然科学基金项目和国家中长 期科学和技术发展规划纲要的研究领域中的冇关材料腐蚀数 支持度/% 据分析的相关研究中,利用实际材料大气环境腐蚀数据进行规图3算法概念格节点数的比较结果区4算法时间的比较结果 则挖捱,分析大气环境因素对于材料腐蚀行为的影响。本文将 (下转第1019页) 第4期 秦录芳,等:复杂系统故障诊断的新型滤波方法研究 1019 [4 DOUCET A, GORDON N J Sequential Monte Carol methods in prac- tice[M]. New York: Springer-Verlag, 2001: 247-272 [5. DENG Xiao-long, XIE' Jian-ying, NI Hong-wei. Improved particle fil er for target tracking[ J]. Chinese Journal of Aeronautics, 2005 18(2):166-170 [6』杜正聪,詹斌,李可.混合退火粒子漶波器[J].物理学报,2006 55(3):999-1004. 图4状态1的状态信计均方误差图5状态2的状态估计均力误差「7朱忘字,杨官校基于 Stiefel流形的粒于滤波器研究「J.物理学 报,2010,59(12):8316-8321 4结束语 L8」程建.基于粒子滤波与层级形状描述的红外目标跟踪J」.系统 程与电子技术,2011,33(6):1217-1236 针对复杂系统故障诊断问题,文提出了一种噪声相关情9张海洋,李谢华,江英,基于假设捡验的白适应粒子滤波红外目 况下的丰线性滤波方法,概括起来讲,主要有以下三个特点 标跟踪[J].计算机工程,2012,38(11):153-159 a)建立了噪声相关情况下的系统状态模型,并给出相关噪声10]IP, KADIRKAMANATHAN V. Fault detection and isolation in 联合概率密度的分解形式;b)推导了量测噪声与系统噪声的 nonlinear stochastic systems-a combined adaptive Monte Carlo filtering nd likelihood ratio approach[ J]. International Journal of Control 联合分布函数的具体表达式;)详细推导了噪声统计特性和 2004,77(12):1101-1114 乐统状态的联合估计表达式。理论分析和实验结果表明,本文「11 DJURIC P M, ZHANG Ze-jie, BUGALLO M F. Target tracking by a 算法为复杂系统的故障诊断问题提供了个新的思路。但是 new class of cost-reference particle filters[C]//Proc of IEEE Aero- 本文仅限于单一传感信息的单一改障诊断问题,妇何实现多故 space Conference. 2008: 1-9 障的联合诊断问题是下一步的研究方向。 [12]胡振涛,泉,杨峰,等.基于CFPF的残差似然比检验故障诊蚜 算法[J].系统工程与电子技术,2009,31(12):3022-3025 参考文就 L13 CAPPE O, GODSILL S J, MOULINES E. An overview of existing [Ⅰ]」以为,萧徳云.基于进化粧子滤波器的泥合系统故障诊断[J ethods and recent advances in sequential Monte Carlo[J.Pro 控制与决策,2004,19(6):612-615. ceedings of the IEEE, 2007, 95(5):895)-924 [2] KADIRKAMANATHAN V,ⅡP.Aseqμ uential Monte Carlo filtering[I4]刘金山,张囯权。正态一逆 Wishart先验信息下多源线性模型的 approach lo fault detection and isolation in nonlinear systems[C// 后验似然比检验[J],应用概率统计,2005,21(11):351-358 Proc of IEEE Conference on Decision and Control. 2000: 4341-4346. [ 15] WEI Qi, XIONG Zhang, LI Chao, et al. A robust approach for multi [3 KATSUJI U, TOSHIHARU H. Evolution strategies based particle fil le vehicles tracking using layered particle filter[ J]. International ters for fault detection[ Cl// Proe of IEEE Symposium on Computa Journal of Electronics and Communications, 2011. 65(7): 609 tional intelligence in image and signal processing. 2007. 58-65 (上接第1015页)进一步比较不同支持度阈值下,两和算法的执 York: ACM Press. 1993. 207-216 行时间如表6所示。 [2 HAN Jia-wei, PEI Jian, YIN Yi-wen, et aL. Mining frequent patterns 表6 DFCLA和 DFTFH算法执行时间比较 without candidate generation C//Proc of the ACM SIGMOD Inter national Conference on Management of Data. New York: ACM Press 比较项 支持度 2000:1-12 5% 15%20% DCLA时间/ms 156l 1330 1015 [3 WILLE R. Restructuring lattice theory: an approach based on hierar DFTFH时间/ms l170 10)6 chies of concepts [M//RIVAL I. Ordered Sets. Boston: Reidel 算法效率提高自分北/%4.9 16.7 17.6 15.8 1982:445-470. 结果表明,在不同的支持度下, DFTFH比 DFCLA算法的 「4]王志海,胡可云,胡学钢,等,概念袼上规则提取的一般和渐进式 算法「J.计算机学报,1999,22(1):66-70. 执行效率均有提高。因为 DFTFH算法只扫搐FP-tre一次,且[5〗谢忞鹛,刘宗田概念格与关联规则发现[J]·计算机研究与发 过滤掉了不满足约束条件的冗余节点,在进行约束关联规则挖 辰,2000,37(12):1415-1421 掘的过程中,DTFH相对于 DFCLA算法节省了重复遍历FP-[61胡可云,陆玉昌,石纯-,基于概念格的分类和关联规则的集成 tree的时间和冗余节点的概念格构造时间。 挖掘方法[J].软伫学报,2000,11(11):1478-1484 [7 GODIN R. Incremental concept formation algorithm based on galois 4结束语 concept) lattices [J]. Computational Intelligence, 1995, 11 本文提出了种基于FPre和约東概念格的规则挖掘算[81陈湘,吴跃。基于约简概念格的关联规则提取改进算法[门.计 法,解决了现有基于FP-tre和概念格的规则挖掘算法中算法 算机应用研究,2011,28(4):1293-1295 效率依赖于 FP-tree频繁项目列表的问题,避免了现有算法在9」梁吉业,王悛红.基于概念格的规则产生集挖掘算法L冂」.计算 挖掘约束关联规则时概念格上产生冗余节点的不足。通过实 机研究与发展,200441(8):1339-1344 际项目中大气腐蚀数据集进行算法实验,结果表明,提出的算10」张继福,张素兰,蒋义剪.约来概念格的代致性质及其知识表示 法效率优于现有算法,并且能够通过不存在冗余节点的约束概 的完备性[冂]。模式识别与人工智能,2010,23(3):289-299 念格提取出用户感兴趣的全部约束关联规则。 [1I1]王慧,京.FPre上频繁慨念格的无冗余关联规则提取[J 计算机工程与应用,2012,48(15):12-15 参考文献 [12] HaN Jia-wei, KAMBER M.数据挖掘概念与技术[M].范明,孟小 [1 ACRAWAL R, IMIELINSKI T, SWAMI A, ct aL. Mining associatio 峰,译.2版。北京:机械工业出版社,2011 ween sets of items in large databases[C]// Proc of ACM [13] IS0 9223, Corrosion of metals and alloys corrosivity of atmosphere SIGMOD International Conference on Management of Data. New classification S. Geneva: ISO, 1992

...展开详情
img

关注 私信 TA的资源

上传资源赚积分,得勋章
    最新推荐