论文研究-基于粗糙集融合支持向量机的水质预警模型.pdf

所需积分/C币:10 2019-09-20 19:19:55 1.11MB .PDF
收藏 收藏
举报

论文研究-基于粗糙集融合支持向量机的水质预警模型.pdf,  为解决因水质预警耦合因素多, 预警模式复杂以及信息不完整所引起的水质预警精度低问题, 提出了粗糙集融合支持向量机(RS-SVM)的水质预警模型. 首先采用粗糙集对14个初始预警指标进行属性约简, 去除冗余或干扰特征, 得到基于5个核心预警指标的数据集, 以此数据集对支持向量机进行训练优化, 构建RS-SVM水质预警模型. 运用该模
第6期 刘双印,等:基于粗糙集融合支持向量机的水质预警模型 1619 c(D),则称E为C的一个约简,记作Red(C).C中必要属生构成的集合组成C的核,记作Core(C)约 简和核存在的关系为:Core(C)=∩Rea(C),对于任一个信息系统,通常包含多个约简,若E是独立的,则E 是保持论域U分类能力的最小集合 由粗糙集理论约简信息表的条件属性,具体步骤如下 Step1对连续性属性离散化处理. step2由数据的分布均衡性进行属性值约简,删除信息表中的重复实例 Step3删除信息表中的冗余属性,求取独立特征的最小子集,获得约简后的最小条件属性集 通过上述粗糙集属性约简步骤可以求出信息表的所有约简结果 12支持向量机分类算法 支持向量机(SVM)是以统计学理论为基础,构建最优超平面为目标的一种新型机器学习方法山.其基 本思想是对于给定的样本集T={(x,y)1∈Rn,v∈{-1,+1}=1:;通过满足 Mercer条件的非线性核函 数叭()将π;映射到高维特征空间中,并构建一个能尽叮能多的将训练样本集中两类数据点正确分廾,且使 分类间隔2/|d‖最大的最优分类超平面定义分类函数为 u·p(x)+b=0 其中,()表示内积,为R→R的一个非线性映射,ω为权重b为偏置量.根据结构风险最小化原则、SVM 为求解参数u和b,建立如下的目标函数及约束条件 min ∑ st.{:x+b}≥1-<,sz≥0(=1,2,…,m) 式中:C为恁罚因子,G;为非负松弛变量.根据KTT条件,引入 Lagrange乘子,其分类问题可转换为如(5) 式的对偶问题 maX ∑a1-∑∑a(x;m)影 1j=1 aiyi= 对二次规划对偶问题式(⑤)求解,可得到原分类问题(4)的最优解a*={a1a2,…,an},进而计算得 b=-∑=121(x;:m)+y,得到相应最优分类函数为 y=f(s)=sign)a2yik(i,J)+b 式中K(x1,x)=0(x;)(x)为核函数,p为支持向量的个数由于高斯径向基函数K(x,x)=exp(-|x1-xl|2/o2) 需设置的参数少,计算复杂度低、性能好等特点(21,故本文采用该函数作为SVM分类模型的核函数 13基于粗糙集融合支持向量机的水质预警模型 运用粗糙集融合支持向量机构建河蟹养殖水质预誉模型的基本思想:将粗糙集作为支持向量分类机的 前置预处理系统,对水质样本数据进行预处理,剔除决策表中冗余属性和冲突属性,从而简化支持向量机分 类模型结构,缩短模型训练时间,提高模型分类性能、然后再利用最小条件属性的训练集对支持向量机分类 器进行优化训练,将获得最优的SVM分类器构建水质预警模型.其水质预警模型架构图如图1所示 数据离「最小条件 训练 预警 水 水质 水质训1散化与属性 是否终ySWM分 RS属 相应训 SVM分 循环 类器预结果 质预警「气练样本 指标 性约简 样本集 类器 警识别输出 据 体系 库构建 水质测 数据离散化与 最小条件属性集及 试样本 RS属性约简 相应测试样本集 图1基于RS-SⅤM的水质预警模型架构图 1620 系统工程理论与实践 第35卷 水质预警模型构建具体步骤如 )构建预警指标体系:从水质数据库中提取描述预警特征的参数,构建水质预警指标体系,再随机抽取 部分样本作为水质训练集; 2)数据离散化及决策表的建立:在保障原始分类能力的前提下,运用适宜的离散化方法对连续的水质特 征进行离散化,用离散化后的条件属性和决策属性建立决策表; 3属性简约:以保持条件属性和决策属性之间原有依赖关系不变为前提采用粗糙集理论消除决策表中 冗余属性或冲突属性,获得最小条件属性集; 4)数据归一化:归一化处理最小条件属性集样本,得到SVM分类器训练样本集. 5)训练并优化SVM分类器:SVM分类器及核函数参数初始化,将训练样本集输入到SⅥM分类器中并 运用二次规划法进行优化训练,当达到总循环次数,或连续几次支持向量数不变,则SⅤM分类器训练结束; 6)预警识别:按照步骤2),3)和4)的数据处理方法对水质测试样本进行属性简约和归一化预处理,然 后输入到优化后的SⅥM预警模型中进行预警识别,获得水质预警结果 2实证分析 2.1集约化河蟹养殖水质预警指标体系构建 因自然或人为原因影响集约化河蟹养殖正常生长的水质囚索很多,如降雨量、太阳辐射、水位、水温、库 容量、空气湿度、气温、气压、风速、风向等水文指标,p值、溶解氧DO、电导率、浊度、叶绿素、硫化氢、 氨氮、亚硝酸盐、化学耗氧量、总氮、总磷和生物耗氧量等理化指标.这些指标的相互影响较大,其重要程度 难以严格界定.鉴于此,本文遵循客观性、多角度、可行性、有效性、科学性、定性与定量相结合的原则,参 考《地表水环境质量标准》2、《渔业水质标准》2、《无公害食品海水养殖用水水质》24等关于养殖用水 标准和现有硏究成果,结合监测点的实际情况以及在冮苏宜兴、广东湛江螃蟹养殖场走访养殖专家的调登问 卷,构建了河蟹养殖主要水质预瞀指标体系,其水质预警指标体系结构如图2所示.根据专家建议和适宜于 河蟹生长水质指标的上下限范围,对水质预警警度划分为四级:无警、轻警、中警、重警,如表1所示 集约化河蟹养殖水质预警指标体系 水文指标 理化指标 透|电氧 雨阳气速压温温解|值明4叶氨 降太空风气气水溶 度率/原/∥ 绿 量辐湿 氧 射度 图2集约化河蟹养殖水质预警指标体系 表1警度划分 警度划分描述 无瞢最适宜于河蟹生存的环境,无膂情. 轻警河蟹能够生存,但是有些指标已经接近或达到适宜于河蟹生 存指标的上下限并持续一定时间,需要引起关注 中警河蟹能够生存,但是有些指标巳经接近或达到胁迫河蟹生存 者标的上下限,若持续·定时问,可能会引起河蟹的死亡,应 引起高度重视,可初步采取一些水质调控措施 重警河蟹基本能生存,但水质指标超过河蟹的生存极限,应立即采 取有效的水质调控措施,否则会造成大批河蟹的死亡 22数据获取与数据源 以中国农业大学-宜兴水产养殖物联网应用示范基地河蟹养殖某池塘为试验区.采用基于WSN的集约 第6期 刘双印,等:基于粗糙集融合支持向量机的水质预警模型 1621 化水产养殖在线监控系统获取河蟹养殖生态环境数据,该系统主要由数据感知层、传输层、基于智能信息处 理的业务逻辑层和应用层构成,分別实现数据釆集、数据传输、业务逻辑计算和应用服务等功能,其系统拓 扑架构图如图3所示 现场监泱中心 降雨量传感器 江用平台 基于云服务的远柱 监控屮心 气压传感器 网关 反速风向传感器 太阳辐射传感器 服务 气象监测节点 气温和湿度传感器 数据采集节点 传感器 ,■溶解氧传感器 独度传感器 电脑管理 水质监测节点 电导率传感器 图3系统拓扑结构图 采用上述水产养殖在线监控系统毎30分钟对河蟹养殖池塘生态环境数据采样一次,将获取的数据作为 训练和测试预警模型的数据源,其中每个样本包括溶解氧、水温、pH值、电导率、氧化还原电位、氨氮、叶 绿素、浊度、气温、气压、降雨量、空气湿度、风速、太阳辐射等14项指标.采样周期为2011年8月26至 8月31日,共计288个样本,从中随机抽取169个样本作为训练集剩余的119个样本作为测试集.其监测 的生态环境部分原始数据如表2所示 表2养殖生态环境原始数据 时间DOpH浊度电导率氧化还原叶绿素氨氮降雨量太阳辐空气湿风速气压气温水温警度 (mg/L)(ntu)(ms/m)电位(mv)(m/s)(mg/)(w/m2)射(lux)度(%rh)(m/s)(kpa)(°C)(°C) 0:005.827.2530.70.493 461 10.65.04 0.0097.461.52101.57232322.83轻警 0:3057272331.20.49146311.150400.0097.370.72101.5823232283轻警 8303887.1639.80.52443916.95,110277996.503.041012926.4527.78中警 9:004.l67.1749.40.514 4.37 5.110.0450.3596.623.58101.3426.3027.76中警 23:007828.1932.50.519 356 13.25.2 00090.102.51101.1826.4028.77元警 23:307.598.2330.514 357 1295.22 0.0091.841.34101.0826.182866无警 23属性约简与数据预处理 由于14个水质预警指标中部分指标之间存在共线性、冗余或干扰的属性,影响着预警模型的分类精度 为此,在保持知识系统分类能力不变的条件下,采用基于粗糙集理论的属性约简算法,删除其冗余不相关或 不重要的属性,挖掘出水质状况较敏感的预警指标、通过粗糙集理论对河蟹养殖生态环境数据集进行属性约 简,提取其中一组统计属性值由溶解氧、pH值、水温、氦氮、浊度等5项指标组成的属性集作为最小条件属 性集.这5项指标也基本符合河蟹养殖过程中对其正常生长有重要影响的预警指标. 为消除预警指标的量纲和数据级差异对预警模型性能的影响,对于预警各指标中越小越优和越大越优的 1622 系统工程理论与实践 第35卷 指标分别釆用式(7)和(8)归一化方法将其统一到某个变换范围内,其归一化表达式如下: Ci max - ik t nir 2 nax 式中,xk和mk分别为第讠个指标的第k个指标值及其归一化后的值,mm和 aimax分别为第讠个指标值 的最小值和最大值 24算法实现及性能分析 因基于径向基核函数的SVM分类器性能由参数(C,o,e)决定,C、σ和ε参数取值不同就会得到分类 性能各异的SVM分类器.为此,本文采用可避免过学习或欠学习缺陷的k折交叉验证法用来选择较优的 (C,σ,)参数组合.运用 libsvm-mat-3.12工具箱与 MATLAB7.13语言编程.算法初始化为:0≤C≤200, 0.1≤σ≤10.最大循环Time=1000.通过1.3节粗糙集融合支持向量机的水质预警算法中的2)~6)的计算 步骤,获得SVM最佳参数组合,C=115.0、02=3.492、c=0.0026,将参数代入 RS-SVM分类模型中进行 河蟹养殖水质预.测试集实际值与基于 RS-SVM模型分类结果对比如图4所示 RS-SVM 60 120 图4测试集实际分类与基于RS-SVM的分类对比图 为检验RS-sVM预警模型的性能,选择BP神经网络和标准SM进行对比分析.将没有经过粗糙集 属性约简的14个指标的水质数据作为BP神经网络和标准SVM的数据集,其中BP神经网络结构采用 14-5-1,最大允许误差为ε=104,激励函数为 sigmoid函数;经过试凑法确定标准SVM模型惩罚误差 C=19.0、02=3.492、8=0.0347.三个预警模型对同一测试集判定情况如表3所示 表3_BP神经络、标准SⅴM与RS-SⅴM分类模型对测试集的判定情况 BP神经网络 标准SⅤM RS-SVM模型 实际正确判定运行实际正确判定运行实际正确判定运行 组别个数判定正确时间个数判定正确时间个数判定正确时间 率%t/s 个数率% 率%t/s 无警 92.501:3780 90.O0 95.000.96 轻瞥12 8 66.7 12 11 91.67 中警23 18 78.26 19 82.60 23 22 95.65 重警4 14 100 4 100 4 4 100 由图4和表3可知.RS-SVM水质预瞢模型精度都在91%之上,对于不同的警度级别,误判样本个数也 都小于等于4个,且其预警过程运行时间t较BP神经网络和标准SVM模型的运行时间分別下降了0.41s 和0.18s,本文提出的预警模型分类精度明显优于其他两个模型,这是因属性约简中去除了原始数据的冗余属 性,减少了噪声干扰,约简后的最小条件属性集更貝有代表性,有效提高了分类的精度和计算效率.以没有经 过粗糙集预处理,含14个特征属性的水质数据为基础,标准SVM预警精度次之,这可能与水质预警指标过 多,指标之间存在冲突或冗余,SVM网络结构复杂等原因有关,从而影响了SVM模型分类精度和计算效率; 而BP神经网络分类精度最差,这可能与小样本、高维数以及水质预警指标之间的耦合影响,致使BP神经 网络分类精度较低,运行时间较长.综上所述,粗糙集融合支持向量机的水质预瞢算法,通过粗糙集对水质数 第6期 刘双印,等:基于粗糙集融合支持向量机的水质预警模型 1623 据进行属性约简,删除冗余属性,能简化SVM分类器网络结构,降低支持向量机的计算复杂度,提高水质预 警的精度,该RS-SVM水质预警模型基本上能够满足集约化河蟹养殖水质预警的实际需要 3结论与展望 1)针对原始预警耦合因素多,信息不完整、数据样本少以及传统水质预警方法精度低等缺陷,本文釆用 粗糙集作为水质数据前置降维预处理系统对预警指标进行属性约简,构建了基于RS-SVM的河蟹养殖水质 预警模型,并对中国农业大学-宜兴水产养殖物联网应用示范基地河蟹养殖某池塘水质进行预警.研究表明, 该水质预啓模型对于不同的警度级别其分类精度都在91%之上,误判样本个数也都小于等于4个,预警效 果较好.可直接应用于河蟹养殖水质预警管理中 2)把粗糙集作为预警模型的前置降维预处理系统,可有效去除了原始数据的冗余或干扰属性,减少了噪 声源影响,约简后的最小条件属性集更具有代表性.以最小条件属性集的水质数据对支持向量机训练优化,有 效提高了SⅥM模型的分类精度 3)河蟹养殖水质预警指标之间存在互相耦合、作用机理复杂、大时滞和非线性等复杂状况,RS-SVM的 水质预警模型在精度和误判样本的个数方面都远远优于BP神经网络,略好于标准SVM模型,还具有计算 速度快、分类精度高的优势 4)通过水质预警可及时掌握河蟹养殖池塘水质状况及其变化趋势,为河蟹健康养殖水质调控管理提供 科学依据 5)作为一种新型的机器学习方法,支持向量分类机的分类精度和性能依赖于其参数的率定,在未来研究 中进一步探索有效的多目标优化技术对SVM分类机参数组合进行优化选择,以提高支持向量分类机的性能 参考文献 1 Koyuncugil A $, Ozgulbas N. Financial early warning system model and data mining application for risk detec tion[J]. Expert Systems with Applications, 2012, 39(6):6238 6253 2]玊禾军,邓飞其基于模糊最小二乘支持向量机的区域粮食安全性预警分析[.农业工程学报,2011,27(5):190-194 Wang Hejun, Deng Feiqi. Analysis on region grain security warning based on fuzzy least squares support vector machines[J]. Transactions of the Chinese Society of Agricultural Engineering, 2011, 27(5):190 194 3]宋戈,连臣.黑龙江省耕地资源安全预警分析及预警系统的构建门J].农业工程学报,2012,28(6):247-252 Song ge, Lian Chen. Analysis and system construction of safety early warning for cu It ivated land resources in Heilongjiang provinceJ. Transactions of the Chinese Society of Agricultural Engineering, 2012, 28(6):217-252 4 Lopez V F, Medina S L, de Paz J F. Taranis: Neural networks and intelligent agents in the early warning against foods J. Expert Systems with A pplications, 2012, 39(11):1003 1-10037 5 Yao Z H, Fei M R, Qu B D. Evolving neural networks for forecasting and early warning red tide and blue- green alga disaster[J. Dynanics of Continuous Discrete and Impulsive Systensseries A-Matheinatical Analysis 200613):241-247 l6]陈弘扬,任华堂,徐世英,等淮南市水厂取水口水质指标预瞥研究[.北京大学学报(自然科学版),2012,48(3):469 474. Chen Hongyang, Ren Huatang, Xu Shiying et al. Water quality early warning research of HuainanJ. Acta Scientiarum Naturalium Universitatis Pekinensis, 2012, 48 3 :469-474 7]凌同华,廖艳程,张胜岩体爆破震动损伤评估的多元判别分析模型小J.中南大学学报(自然科学版),2010,41(1):322 Ling Tonghua, Liao Yancheng, Zhang Sheng. Safety criterion method of rock blasting vibration damnification based on multivariant discriminant analysis modelJ. Journal of Central South University(Science and Technol Ogy),2010,41(1):322-327 岗」杨迎心,冯志勇,饶囯政,等.基于模糊综合评价构建物流运输预警模型小计算机应用,2011、31(10):2844-2848 Yang Yingxin, Feng Zhiyong Rao Guozheng, et al. Early-warning model of logistics transport based on fuzzy comprehensive evaluation]. Journal of Computer Applications, 2011, 31(10):2844-2848 9张立车,刘菊红,刘丹.上市公司财务危机预警的 Logistic回归分析小.南昌大学学报(理科版),2007,31(3):242-245 Zhang lijun, Liu Juhong, Liu Dan. Financial crisis early warning of the listed company based on logistic regression analysis in China[J]. Journal of Nanchang University(Natural Science). 2007, 31(3): 242-245 10王伟,沈振中,李桃凡.遗传算法与自适应粒子群算法耦合的大坝安全预警评价模型刂.岩土工程学报,2009,31(8) 12421247. Wang Wei, Shen Zhenzhong, Li Taofanl. Safety early warning evaluation Inodel for dans based on coupled Inethod 1624 系统工程理论与实践 第35卷 of genctic algorithm and adapting particlc swarm optimization algorithm J. Chincse Journal of Gcotcchnical Engineering,2009,31(8):1242-1247 11 Vapnik V N. Statistical learning theory IM. New York: John Wiley Sons, 1998 12 Ahn J J, Oh K J, Kim T Y, et al. Usefulness of support vector machine to develop an early warning system for financial crisisJ. Expert Systems with Applications, 2011, 38 (4) : 2966-2973 [13 Wan C F, Mita A. Early warning of hazard for pipelines by acoustic recognition using principal component analysis and one-class support vector machines J. Smart Structures and Systems, 2010, 6(4): 405-421 14 Walczak B, Massart D L Rough sets theoryJ. Chemometrics and Intelligent Laboratory Systems, 1999, 47(1) 15 Zhang X Y, Zhou J Z, Guo J Vibrant fault diagnosis for hydroelect ric generator units with a new combination of rough sets and support vector machine J. Expert Systems with Applications, 2012, 39(3 2621-2628 16 Li T S. Applying wavelets transform, rough set theory and support vector machine for copper clad la aminate defects classification[J. Expert Systems with Applications, 2009, 36(3):5822-5829 17 Pawlak Z. Rough set[J International Journal of Computer and Information Sciences, 1982, 11: 341-356 18 Pawlak Z. Rough set approach to knowledge-based decision supportJ. European Journal of Operational Re- search,1997,99(1):48-57. !张清华,王国胤,肖雨.粗糙集的近似集J软件学报,2012,23(7):1745-1759 Zhang Qinghua, Wang Guoyin, Xiao Yu. Approximation scts of rough scts]. Journal of Software. 2012, 23(7) 1745-1759. 20]干国胤. Rough集理论与知识获取[M].西安:西安交通大学出版社,2001 Wang Guoyin. Rough set theory and knowledge discovery [M. Xi'an: Xi'an Jiaotong University Press, 2001 21 Sahak R. Mansor W. Lee Y K, et al. Choice for a support vector machine kernel function for recognizing asphyxia from infantries[Cl// Industrial Electronics Applications, Kuala Lumpur: ISIEA, 2009: 675-678 22GB3838-2002.地表水环境质量标准S.2004 GB3838-2002. Environment quality standard for surface waterS. 2004 23]GB11607-89.渔业水质标准S].1989 GBI1607-89. Water quality st andard for fisheries. 1989 24]NY50522001.无公害食品海水养殖用水水质S].2001 NY 5052-2001. The pollution-free food- Water quality of mariculture S. 2001

...展开详情
试读 8P 论文研究-基于粗糙集融合支持向量机的水质预警模型.pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
    抢沙发
    一个资源只可评论一次,评论内容不能少于5个字
    img
    • 至尊王者

      成功上传501个资源即可获取

    关注 私信 TA的资源

    上传资源赚积分,得勋章
    最新推荐
    论文研究-基于粗糙集融合支持向量机的水质预警模型.pdf 10积分/C币 立即下载
    1/8
    论文研究-基于粗糙集融合支持向量机的水质预警模型.pdf第1页
    论文研究-基于粗糙集融合支持向量机的水质预警模型.pdf第2页
    论文研究-基于粗糙集融合支持向量机的水质预警模型.pdf第3页

    试读已结束,剩余5页未读...

    10积分/C币 立即下载 >