论文研究-一种基于粗糙集神经网络的分类算法.pdf

所需积分/C币:9 2019-07-22 19:16:58 422KB .PDF

当输入维数高时神经网络结构复杂、体系庞大,导致其收敛速度慢。为克服这个缺点,提出了基于决策规则的神经网络,利用粗糙集理论从数据样本中获取最简的决策规则,按决策规则语义构建一种不完全连接的神经网络。根据决策语义规则,计算并初始化网络的参数,减少网络训练的迭代次数、提高网络的收敛速度;同时利用蚁群算法对网络输入的连续属性的最优离散化值进行寻优,从而获得最优的网络结构。最后通过实验结果将本文方法与传统神经网络方法和支持向量机分类方法进行了比较,结果说明了该神经网络具有收敛速度较快、分类效率较高的优点。
840· 计算机应用研究 l≤d≤ (5)2.3路径选择过程 a)初始化。初始化集合L,中的每个元素r(1≤r≤P)的信 对于所有的o,有∑=1。经过转换后,网络的输出为息素λ(),然后所有蚂蚁从蚁穴出发开始搜索。所有路径 ,m2,…,o]T。输出层中各节点的输出值为某样本属于的信息素浓度为0 相应类别的概率,通过比较它们的大小来对该样本进行分类。选择其第,个元素 b)路径选择。对于集合l,第g只蚂蚁根据以下概率随机 神经网络采用基于梯度下降的BP学习算法。 prob(A(2))=A,()/2A2(l) 基于蚁群算法的连续属性模糊离散化 依次在所有集合屮选择一个元素,同时该路径的信息素浓 影响网络收敛速庋的根本原因之一在于网络的输入维数度增加。由式(8)可知,信息素浓度越高,选择该路径的可能 高、网络节点数大,导致网络的体系庞大。上述网络结构中不性越大。 可确知的层节点数为模糊离散层和输岀清晰层,它由连续属性 c)信息素的挥发。当所有蚂蚁在每步中完成选择后,从 的离散化程度决定。从粗糙集的理论分析,属性离散的区间过所有集合的每个元素的信息量中减大E,E表示信息素的 小,容易得到不一致的决策表,属性简化难度也增大;离散化区挥发 间过大,容易遗漏掉重要的属性。从神经网络的角度分析,离 d)返回蚁穴。当从食物源返回叹穴期间,根据式(9)调节 散化区间过大,使得网络的节点数多、体系庞大,导致网络的学相应于每个所选元素的信息素λ,(L),经历了m个时间单位 习数据的过拟合,泛化能力差、离散化区间过小,又难以学习样后,信息索浓度为 木数据。因此,寻找最优的网络结构,也就是输入输出属性的 入,(l)(t+m)=p(l)(t)+△入,( 最优离散化值,是保证网络优良性能、实现快速收敛的关键。 △A,(Ln)=∑△A"(Ln) 数据离散化有很多方法,如等距离划分、等频率划分、适应 离散法等,这些方法需要人为地规定划分的维数,并且离散效 其中,p(0≤p≤1)表示信息素的持久性,△A(L)为信息素调 果难以确定。聚类分析方法按照样品相似稈度将样品逐一归整函数。 类,不需要有关样品的先验信息,但难以找到相似程度的衡量 e)若满足终止条件准则,结束;否则,转步骤b)。 标准。也有学者提出了用遗传算法离散化方法,这种方法 4终止条件 不容易实现,且迭代次数多,离散化时数据收敛慢”。本文提 当所有蚂蚁全部收敛到一条路径上,或者当迭代的次数达 出蚁群算法来实现连续属性离散化,以神经网终的输出湨差作到预定值时,路径选择过程结束。 为离散化优劣的衡量标准,保证数据能进行快速准确的最小离3实验结果 散化。 2.1基于蚁群优化训练的神经网络建模 为验证本文提出神经网络快速收敛的有效性及实用性,选 设输入连续属性数共有n个,每个连续属性离散化数为月了两种样本对象数据:网上下殺的疾病诊断数据 01;某 N(2≤N≤8,1≤i≤n)。取N,的所有可能组合组成集合l。 企业用于催化裂化装置的轻柴油凝点估计数据D2。表1为原 共有M,个元素;2中每个元素对应一种神经网络,代表蚂蚁的 始测试数据集信息。 表1原始数据集信息 种路径;蚂蚁数日为s,代表训练样本数。所有蚂蚁从L中 数据集 样本数 属性数目 类别数目 选择一个元素,并调节其信息素,到达食物源后沿原路返回蚁 D 600 穴,再一次调节信息素浓度,不断选代,直到找到最优解 60C 2.2信息素调整函数 D1和D2分别用500个样进行建模训练,100个样本进 蚁群算汏的核心是信息素浓度的调整。信息素的浓度代行模型测试。本文所选例子输人属性为迕续型数据,输出属性 表路径的优良,越浓说明此路径越近,神经网络适用性能越好。都为离散性数据。原始测试数据经过上述蚁群算法数据离散 用△入(L)来表示第g只蚂蚁在集合L的第r个元素上留下化后属性的最优离散化值分别为[3545871,[256487 的信息素。定义如下 3],即D和D2的输入属性变量的区间分割分别为3、5、4、5、 Q/若第g只蚂蚁在本次循环中 87和2、5、64、87、3。经过粗精集删除冗余规则、兀余属性 △A(2)= 选择了1的第r个儿素 (6)等预处理后按基丁概率最优准则的决策生成方法得到最简决 策表,其相关信息如表2所示。 其中:Q是常数,用于调节信息素的挥发速度;e是以蚂选择 表2预处理后数据集信息 的第r个元素代表的神经网络结构各训练样本的最大输出误 数据集 属性数目 最简决策规则数 类别数目 差,定义为 7) 在分析RDRN性能时,采用以下三种指标,并将结果与传 其中:s是样本数量,O和z是神经网络的m维实际输出矢量统神经网络RMLN6和支持向量机分类算法RSSM2进行 和m维期望输出矢量。因此误差越小,神经网络性能越好,相了对比,对比结果如表3所示。 应信息素增加越多。用信息素调整函数调整蚂蚁经过路径的 a)训练时间由样本原始数据得到分类器的训练总时间。 信息素浓度,可以选择出误差最小的神经网络结构。 (下转第850页) 850 计算机应用研究 第28卷 元组队列 b)设计判断函数,计算得到问题的解时函数的值; 3结束语 )对三元组队列进行变换调整,得到问题的解; 根据路的 Smarandachely全染色的特点,设计了三元组编 d)对解进行解码,得到染色结果。 码方式、队列生成规则和队列变换规则。根据判断函数的值对 算法进行控制,通过对队列进行变换调整,使得判断函数的值 2实验结果及分析 逐渐向最大值靠拢,从而加快算法的收敛,提高算法的效率。 以(G)=8的路的 Smarandache全染色为例来进行实参考文献 [1] BURRIS A C, SCHELP R H. Vertex-distinguishing proper edge colo- 验。8种颜色最多可以完成47个点的路的 Smarandachely全染 ring[ J]. Journal of Graph Theory, 1997, 26(2): 73-82 色。以下为部分路的染色结果 [21 BALISTER P N, GYORI E, LEHEL J, et al. Adjacent vertex distin P(47):82312413421523534251416236346241 guishing edge-colorings[ J1. SIAM Journal Discrete Mathematics 2007,21(1):237-250 1645362561[7237347241745372517564637261 1 3 ZHANG Zhong-fu, LIU Lin-zhong, WANG Jiao -fang. Adjacent strong 384758763846853854B38 edge coloring of graphs J. Applied Mathematics Letters, 2002 P(42):823124134215231534254102361346241 15(5):623-626 64536256172371347241745372517564713627164 「4张忠辅,程辉,姚冰,等.图的邻,点强可区別的全染色「J,中国科 学A轩:數学,2007.37(9):1073-1082. 865385438 [5]孔令峰,苏文龙,罗海鹏,等.图P。,(n)的邻强边染色[冂].计算 P(38):82③312438432152353425416236134624 机应用研究,2008,25(6):1885-1686 1 5617237134724174537251756473627618 [6]BONDY J A, MURTY U S R. Graph theory with application [M] P(33):8231241341125231534254162361346241 New york. MacMillan press ltd. 1976 645362516757253754①72473732718 [7] JENSEN T R, TOFT B. Graph coloring problems[ M]. New York Wiley-Inter Science Publication, 1995 P(29):⑧23124①3412523534254716236346 [8 BOLLOB B. Modern graph theory M]. New York: Springer-\ 4645362561472473732718 对于n个点的路,在最坏的情况下需要对三元组队列进行9 HANG Zhong和u, CHEN XIan-gen, I Jing-wen,ea, On adj 9×(n-2)次交换步骤中∞)操作,所以算法在最坏的情况下 cent vertex-distinguishing total coloring of graphs[ J]. Science in China scrics A,2005,48(3):289-299 的时间复杂度为9×(n-2),在多项式时间内可以得到问题101 ZHANG Zhong-fu, QIU Peng- xiang, xU Bao-gen,eta!. Vetex-diy 的解,且时间复杂度较好。并且路图的结构不受路的长度的影 tinguishing total coloring of graphs[ J]. ARS Combinatoria, 2008 响,所以该算法可以解决任意长度的路图的 Smarandachely全(1张忠铺,图的 SMarandache全染色[R].兰州;兰州交通大学 染色问题。 2009 (上接第840页) 参考文献 b)样本平均识别率SRR=∑(N/Nm)×100%。其中,[1] LI Meng-xin, wU Cheng-dong, JIN Feng. A vision-based inspection N是被正确分类到第i类中的样本数,m是样本的分类类别总 system using fuzzy rough neural network method C//Proc of the 5th International Conference on Machine Learning and Cybernetics 数,N是第i类中的实际样本数。 2006:1- 2 LI Jin-ying. ZHAO Yu-zhi, LI Jin-chao. Power grid safety evaluati c)分类平均正确率CRR=∑(N/Nm)×100%。其中 based on rough set neural network [C]//Proc of the International conference on N是被正确分类到第i类中的样本数,m是样本的分类类别总 Risk Management Engineering Management. 2008 245-249 数,N是被划分到第i类中的样本数。 [3 PAWLAK Z. Rough sets and intelligent data analysis[ J. Informa 表3RDRN与RMLN、RS-SMO的性能指标比较 tion Sciences. 2002, 147(1): 1-12 [4]何明,李博,马兆丰,等,粗糙集理论框架下的神经閃络建榎研究 方法数据集SRR/%CRR/% 送代次数训 l练时间 及应用[J」.控制与决策,2005.20(7):782-785 I5 PAL S K, MITRA S, MITRA P. Rough-fuzzy MLP: modular evolu 98.0 RDRN tion, rule generation and evaluation J. IEEE Trans on Know 189 605 ledge and Data Engineering, 2003, 15(1): 14-25 97.8 812 RMLN [6]张贏,李琛.基于粗糙集理论的神经网络研究及应用[冂].控制与 97.3 决策,2007,22(4):462-464. 97.4 96.2 833 RS-SMO [7]王亚英,邵惠鹤.基于粗集理论的规则知识获取技术[J].上海交 96.9 95.9 863 通大学学报,2000,34(5):688-690 [8]韩中华,马斌,许可,等.基于谱系聚类的粗糙集数据挖掘预处理 4结束语 方法[J].计算机工程与应用,2008,44(2):194-196 [9]罗健旭,郎患鹤.一种基于爼集的模糊神经刈络[J].上海交通大 学学报 11):1 个文提出了一种基于粗糙集规则的不完全连接神经网络101D0BG0M, MANIEZZO V, COLORN1A.Am1ssm; timizatio 结构,并用蚁群算法对神经网络进行优化。实验结果表明,该 by a colony cooperating agents[J]. IEEE Trans on Systems 网络具有良好的工作性能,在保持较高识别率的同时,网络能[11 ASUNCION A, NEWMAN D. The UcI machine learning repository 较快地收敛。但如何根据语义规则,获取更简单的网络结构和 Leb/Ol.(2007).http://archive.icsuciedu/mi/machine-learN 更精确的网络初值仍是一个值得探索的问题,需要更深人的[12]邓九英,杜启亮,宗源,等。基于猁集与支持向量机的分类算 研究。 法[J],南理工大学学报,2008,36(5):123-127

...展开详情
试读 4P 论文研究-一种基于粗糙集神经网络的分类算法.pdf
img

关注 私信 TA的资源

上传资源赚积分,得勋章
    最新推荐
    论文研究-一种基于粗糙集神经网络的分类算法.pdf 9积分/C币 立即下载
    1/4
    论文研究-一种基于粗糙集神经网络的分类算法.pdf第1页
    论文研究-一种基于粗糙集神经网络的分类算法.pdf第2页

    试读已结束,剩余2页未读...

    9积分/C币 立即下载 >