没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
试读
5页
针对决策粗糙集属性约简在引入代价后分类精度不高的问题,对其中代价敏感与分类精度的平衡进行了研究。将分类总代价和近似分类质量作为属性约简过程中的约束条件,结合模拟退火方法,提出了一种基于代价敏感和近似分类质量的决策粗糙集属性约简(ARACOQ)算法。利用UCI数据集对算法进行了模拟实验,实验结果验证了ARACOQ算法的有效性,该算法能够在可承受代价范围内找到一个分类精度最高的属性约简集。
资源推荐
资源详情
资源评论
收稿日期:20171018;修回日期:20171201 基金项目:国家自然科学基金资助项目(61363027);广西重点研发计划资助项目(桂科
AB16380260)
作者简介:陈婉清(1993),女,广西南宁人,硕士,主要研究方向为决策粗糙集、数据挖掘、机器学习;秦亮曦(1963),男(通信作者),广西灵川
人,教授,博士,主要研究方向为数据挖掘、决策粗糙集、深度学习等(qin_lx@126.com).
基于代价敏感和近似分类质量的
决策粗糙集属性约简研究
陈婉清,秦亮曦
(广西大学 计算机与电子信息学院,南宁 530004)
摘 要:针对决策粗糙集属性约简在引入代价后分类精度不高的问题,对其中代价敏感与分类精度的平衡进行
了研究。将分类总代价和近似分类质量作为属性约简过程中的约束条件,结合模拟退火方法,提出了一种基于
代价敏感和近似分类质量的决策粗糙集属性约简(ARACOQ)算法。利用 UCI数据集对算法进行了模拟实验,实
验结果验证了 ARACOQ算法的有效性,该算法能够在可承受代价范围内找到一个分类精度最高的属性约简集。
关键词:决策粗糙集;属性约简;代价敏感;近似分类质量;分类精度
中图分类号:TP181 文献标志码:A 文章编号:10013695(2019)04014102204
doi
:10.19734/j.issn.10013695.2017.10.0973
StudyonDTRSattributereductionconstrainedby
costsensitiveandclassificationquality
ChenWanqing,QinLiangxi
(SchoolofComputer,Electronics&Information,GuangxiUniversity,Nanning530004,China)
Abstract:Aimingatthelowprecisionproblem whilethecostwasintroducedintoattributereductionofdecisiontheoretic
roughset,thispaperstudiedthebalancebetweenthetotalcostandtheprecisioninclassification.Itusedthetotalcostofthe
classificationandtheapproximateclassificationqualityastheconstrainedcriteriaintheattributereductionprocedure,com
binedwithsimulatedannealingmethod,andproposedaDTRSattributereductionalgorithmconstrainedbycostsensitiveand
classificationquality(hereinafterreferredasARACOQ).ItcarriedoutthesimulationexperimentsbyusingUCIdataset.The
resultsverifytheeffectivenessoftheARACOQalgorithm,whichcanfindanattributereductionsetwiththehighestclassifica
tionprecisionwithintheaffordablecostrange.
Keywords:decisiontheoreticroughset;attributereduction;costsensitive;classificationquality;precision
0 引言
粗糙集模型是由 Pawlak
[1]
于 1982年提出的一种计算工
具
[2]
,主要用于分析和处理不精确性和模糊性的数据。经典
粗糙集理论是基于严格的代数包含关系建立的,但是在实际应
用中往往难以满足精确的代数包含,因此导致经典粗糙集在处
理实际分类问题时缺乏容错能力。基于此,Yao
[3]
将贝叶斯风
险相关理论与粗糙集相结合,提出了具有容错能力的决策粗糙
集模型。
随着决策粗糙集研究的逐步深入,其属性约简问题得到了
学者的广泛关注。属性约简的目的是在保证信息系统某些关
键特征值不变的情况下,将冗余的属性删减。决策粗糙集中决
策语义的引入,导致其属性约简不再具有单调性。因此,
Yao
等人
[4]
首先提出了决策粗糙集的属性约简问题,并提出了一
种基于属性
α
正域重要度的属性约简方法;贾修一等人
[5]
将
决策风险最小化作为最优化目标,提出了一种基于决策风险最
小化的属性约简方法;Bi等人
[6]
从代数理论和信息论两个方
面提出了基于最小决策代价的属性约简方法;Zhang等人
[7]
在
决策粗糙集模型下提出了不完备系统的最小代价属性约简方
法;Song等人
[8]
将决策粗糙集与模糊集相结合,提出了两种属
性约简方法,即全局约简和局部约简。全局约简能保持所有决
策类的代价不变或减少,而局部约简则能保持单个决策类的代
价不变或减少。
通常情况下,不同的测试属性集会带来不一样的分类结
果。在一定的范围内,测试属性集中属性个数越多,错误分类
的结果越少,则误分类代价越小,分类精度越高
[9]
。然而在日
常生活中,数据的获取需要花费一定的经济或时间成本,即测
试代价
[10]
。例如,在医疗诊断中,各种医疗检测都需要花费一
定的费用
[11]
。随着测试属性个数的增多,在误分类代价减少
的同时,也会使测试代价增加。因此,在实际问题中,需将测试
代价和误分类代价同时考虑,并找到兼顾两者的一个平衡点。
基于此,Min等人在粗糙集属性约简问题中,率先引入测试代
价作为约束条件。李 华 雄 等 人
[9]
将代价敏感引入决策粗糙
集,提出了代价敏感的决策风险最小化属性约简方法。刘等
人
[12]
采用模拟退火算法并结合传统决策粗糙集正域约简算
法,搜索测试代价总和最小的正域约简属性集,取得了较好的
结果。
在以上研究中,一些方法没有考虑代价,得到的是满足某
些条件(如基于属性
α
正域重要度的属性约简
[4]
)的属性子
集;而一些方法考虑了代价,包括误分类代价、测试代价或包含
两者的总代价,得到的是具有最小代价的属性子集,但此类属
性集的分类精度往往不高。在实际问题中,分类精度应该是首
第 36卷第 4期
2019年 4月
计 算 机 应 用 研 究
ApplicationResearchofComputers
Vol36No4
Apr.2019
资源评论
weixin_39841882
- 粉丝: 443
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功