没有合适的资源?快使用搜索试试~ 我知道了~
粗糙集理论与应用研究综述_王国胤1
需积分: 0 0 下载量 192 浏览量
2022-08-03
19:06:43
上传
评论
收藏 688KB PDF 举报
温馨提示
试读
18页
本文第 2 节介绍粗糙集理论基础;第 3 节介绍粗糙集模型研究, 将从构造化方法和公理化方法 、面向集合的观点和面向算子的观点来阐述 ;第 4 节将探讨粗糙集理
资源详情
资源评论
资源推荐
第 32 卷第 7 期
2009 年 7 月
计 算机 学报
CH IN ESE JOU RNA L OF COM P UT E RS
Vo l32 N o 7
July 2009
收稿日期 20090329 本课题得到国家自然科学基金60573068 60773113重庆市自然科 学基金2008BA 2017重 庆市杰出青年科 学
基金2008BA 2041和重庆市教委科研基金K J080510资助 王国胤 男 1970 年生 博士 教授 中 国计算机学会 理事 主要 研究领域 包
括粗糙集 粒计算 神经网络 机器学习 数据挖掘 知识技术等 Emailwanggy cqu pt edu cn 姚一豫 男 1962 年生 博士 教授 主 要
研究领域包括 Rou gh 集 粒计算 信息检索 W eb 智能 认知信息学和数据挖掘等 于 洪 女 1972 年生 博士 副教 授 主要研究方向 包
括粗糙集 智能信息处理等 Email yu hong cqupt edu cn
粗糙集理论与应用研究综述
王国胤
1
姚一豫
2
于 洪
1 2
1
重庆邮电大学计算机科学与技术研究所 重庆 400065
2
加拿大里贾纳大学计算机科学系 里贾纳 加拿大 S 4S 0A 2
摘要在阐释粗糙集理论基本体系结构的基础上 从多个 角度探 讨粗糙集 模型的 研究思 路 分析粗糙集理论与
模糊集证据理论粒计算 形式概念分析 知识空间等其它理论之间的联系 介绍国内外关 于粗糙集 理论研究的 主
要方向和发展状况 讨论当前粗糙集理论研究的 热点研究领域以及将来需要重点研究的主要问题
关键词粗糙集模糊集粒计算形式概念分析知识空间智能信息处理
中图法分类号 T P 18 DOI 号 10 3724S P J 10162009 01229
A Survey on Rough Set Theory and Applications
WAN G GuoYin
1
YAO YiYu
2
YU H ong
1 2
1
Inst itute o f Comp ut er S cience and Technolog y Chong qing Un iver sity of Posts and Telecommunications Chongqin g 400065
2
Depar tment o f Com pu ter S ci ence Universi ty o f Regi na Regi na S askat chew an Canada S 4S 0 A2
Abstract T his paper presents a framew o rk for a systematic st udy of the ro ug h set theory Vari
o us view s and interpretations o f t he theory and different approaches t o study the theory are dis
cussed The relationships betw een the roug h set s and o ther theories such as fuzzy set s evidence
theory granular co mputing fo rmal co ncept analysis know ledge spaces etc are ex amined
The paper also review s recent theoretic studies and applications of rough set s and point s out fu
ture research directions
Keywords rough sets fuzzy sets g ranular co mputing f ormal concept analy sis kno w ledge
spaces intelligent i nformat ion processing
1 引 言
智能信息处理是当前信息科学理论和应用研究
中的一个热点领域由于计算机科学与技术的发展
特别是计算机网络的发展 每日每时为人们提供了
大量的信息信息量的不断增长对信息分析工具的
要求也越来越高 人们希望自动地从数据中获取其
潜在的知识特别是近 20 年间 知识发现规 则提
取 数据挖掘 机器学习受到人工智能学界的广泛
重视 知识发现的各种不同方法应运而生
粗糙集Roug h Se t 也称 Roug h 集 粗集理论
是 Paw lak 教授于1982 年提出的一种能够定量分析
处理不精确 不一致不完整信息与知 识的数学工
具
1
粗糙集理论最初的原型来源于比较简单的信
息模型 它的基本思想是通过关系数据库分类归纳
形成概念和规则 通过等价关系的分类以及分类对
于目标的近似实现知识发现
由于粗糙集理 论思想新颖 方法独特 粗糙集
理论已成为一种重要的智能信息处理技术
24
该
理论已经在机 器学习与知识发现 数据挖掘决策
支持与分析等方面得到广泛应用目前 有 3 个有关
粗糙集的系列国际会议 即 RSCT C RSFDG rC 和
RSKT 中国学者在这方面也取得了很大的成果 从
2001 年开始每年召开中国粗糙集与软计算学术会
议RSF DGRC2003 IEEE G rC2005 RSKT2006
IF KT2008 RSKT 2008 IEEE G rC2008 等一系列国
际学术会议在中国召开
粗糙集理论与应用的核心基础是从近似空间导
出的一对近似算子 即上近似算子和下近似算子又
称上 下近似集经典 Paw lak 模型中的不分 明关
系是一种等价关系 要求很高 限制了粗糙集模型的
应用 因此 如何推广定义近似算子成为了粗糙集理
论研究的一个重点
目前 常见的关于推广粗糙集理论的研究方法
有两种 即构造化方法和公理化方法构造化方法是
以论域上的二元关系 划分覆盖邻域系统布尔子
代数等作为基本要素 进而定义粗糙近似算子 从而
导出粗糙集代数系统公理化方法的基本要素是一
对满足某些公理的一元集合算子 近似算子的某些
公理能保证有一些特殊类型的二元关系的存在 反
过来 由二元关系通过构造性方法导出的近似算子
一定满足某些公理
事实上 有两种形式来描述粗糙集 一个是从集
合的观点来进行 一个 是从算子的观点来进行 那
么从不同观点采用不同的研究方法就得到粗糙集
的各种扩展模型 扩展模型的研究以及基于其上的
应用研究已经成为新的研究热点
粗糙集理论与其它处理不确定和不精确问题理
论的最显著的区别是它无需提供问题所需处理的数
据集合之外的任何先验信息 所以对问题的不确定
性的描述或处理可以说是比较客观的 由于这个理
论未能包含处理不精确或不确定原始数据的机制
所以这个理论与概率论 模糊数学和证据理论等其
它处理不确定或不精确问题的 理论有很强的互补
性因此 研究粗糙集理论和其它理论的关系也是粗
糙集理论研究的重点之一
基于粗糙集理论的应用研究主要集中在属性约
简规则获取基于粗糙集的计算智能算法研究等方
面由于属性约简是一个 NPH ard 问题 许多学者
进行了系统的研究 基于粗糙集的约简理论发展为
数据挖掘提供了许多有效的新方法 比如 针对不同
的信息系统协调的和不协调的完备的和不完备
的结合信息论 概念格 群体智能算法技术等都有
了相应的研究成果
基于粗糙集理论的应用也涌现在各行各业 许
多学者将粗糙集理论应用到了工业控制
58
医学卫
生及生物科学
911
交通运输
1214
农业科学
1516
环境科学与环境保护管理
17
安全科学
18
社会科
学
1 9
航空 航天和军事等领域
2021
粗糙集理论发展二十余年来 无论在理论研究
还是应用研究上都取得了很多成果从认知科学的
角度讲 我们如果要学习一个新的学科 就必须建立
它的系统体系结构 同时学习思维及计算方法 这样
我们就能从已知的结果推到未知的结果 本文将在
总结已有的这些研究成果的基础上 帮助读者建立
起一个这样的系统体系结构 同时指出进一步的研
究方向 我们将这个理论目前的研究状况介绍给信
息科学工作者 希望进一步推动并促进我国在这一
领域的研究工作
本文第 2 节介绍粗糙集理论基础第 3 节介绍
粗糙集模型研究 将从构造化方法和公理化方法 面
向集合的观点和面向算子的观点来阐述 第 4 节将
探讨粗糙集理论和证据理论 模糊集形式概念分
析 知识空间等的关系 第 5 节是基于粗糙集的研究
以及应用最后是总结和展望
2 粗糙集理论基础
本节在回顾粗糙集基础概念的基础上 说明常
见的两种研究粗糙集的方法 构造化方法和公理化
方法并且 从集合观点和算子观点来解释粗糙集
2 1 概念可定义集
为了对知识进行描述 首先需要知道什么是概
念 从经典的角度来看 每个概念都包含其内涵和外
延 为了给出概念内涵和外延的具体描述 我们考虑
一个简单的知识表达系统 即信息表 信息表就是一
组对象的集合 对象通过一组属性来描述 表 1 就是
一个信息表的例子
表 1 信息表实例
个体编号 头疼 肌肉疼 体温 流感
x
1
是 是 正常 否
x
2
是 是 高 是
x
3
是 是 很高 是
x
4
否 是 正常 否
x
5
否 否 高 否
x
6
否 是 很高 是
1230 计算机学报 2009 年
信息表 M 可以形式化地表达为 四元组 M
U At Va a At Ia a At表 1 中 U
x1 x2 x6是有限非空对象的集合 也称为论域
A t 头疼 肌肉疼 体温 流感是有限非空的属性
集合Va 表示属性a A t 的属性值的范围 即属性 a
的值域 Ia U V a 是一个信息函数 如果A At 则
I Ax表示U 中对象 x 在属性 A 上的属性值
为了形式化地定义概念的内涵 可以采用决策
逻辑语言
22
来分析信息表 我们定义和讨论的决策
逻辑语言 由原子公式组成 公式是一种属性 数
据对 用命题联词 与 或 非等通过标准的方法构
成复合公式公式是用来描述论域中对象的工具 可
以用来描述论域中具有某些性质的对象的子集 例
如在原子公式中 有序对头疼 是解释为在属
性a 头疼上值为v 是的所有对象的描述
当 为信息表 M 中的一个公式时 集合m
x U x M 称为 M 中公式 的含义 含义m
的自变量是语言的公式 其值是信息表中对象集合
的子集 m就是那些具有公式 的性质的对象的
全体 换句话说 公式 可以描述对象子集 m
这样 就建立起了公式 和论域 U 的子集之间的
关系
利用决策逻辑语言 可以给出概念的形式描
述信息表 M 中的概念就是 m 其中
概念 m 的内涵是 表示 M 中对对象子集
m的描述 概念 m的外延是m 其含义
是满足公式 的所有对象的全体
在粗糙集理论的很多应用中 经常考虑的只是
一个属性子集 A At 即在决策逻辑语言中只考虑
A 中的属性我们用符号 A表 示由属性子集 A
定义的语言将前面讨论中出现的 用 A来代替
相应的结论也都成立
考虑属性子集 A At 及其相应 的语言 A
可定义集的形式化定义
23
如下
定义 1 在信息表 M 中 如果称子集 X U
是可被属性子集 A At 定义的 当且仅当在语 言
A中存在一个公式 使得 X m否则 X 称
为不可定义的
值得注意的是 这里谈到的可定义 是指在属性
子集 A 上是可定义的
例如 表 1 中 我们考虑属性子集 A 头疼 肌
肉疼子集 X 1 x1 x 2 x3 U 公式 1 头疼
是 肌肉疼 是那么在语言 A中 显然有
X 1 m1 子集x1 x 2 x3 是可定义集 而且 子
集 X2 x 4 x6 X 3 x5 也是可 定义集 满足的
公式分别是 2 头疼否肌肉疼 是3 头
疼 否 肌肉疼 否
根据定义 1 可定义集的全体表示为
De fU Am A
如果概念的外延能用逻辑公式简洁地表达 那
它就是一个可定义的概念从这个角度讲 概念的外
延就是可定义集
类似地 由语言 A定义的概念集合表示为
D e f ConU A m A
很明显 如果两个对象 x i x j 是等价的 那么他
们在语言 A中由相同的公式描述 或者说他们在
A 上的各个属性值相同 刚才得到的可定义集就是
属性集合 A 上的等价关系 EA在论域U 上产生的
划分 记为UEA x EAx U x EA是由
关系 EA确定的等价类 同一个等价类中的对象
是不可分辨的 所以 有时我们也称等价关系为不可
分辨 关 系 上例 中 UE A x1 x2 x3
x4 x6 x5
等价类 x EA的并显然是可 定义集比 如 考
虑子集 X x
1
x
2
x
3
x
4
x
6
它是等价类的并 描
述这个子集的公式为 1 2
2 2 近似空间
语言 A的所有可定义集正好构造成一个
代数U EA 即
De fU AU EA
序对apr U EA称为一个 P aw lak 近似空
间 简称近似空间 所以 也可以将语言 A的所有
可定义集记为 D ef U ADe fapr
通过 UE A 可 以 构 造一 个 代 数 即
UEA 它包含空集 和等价关系 EA构成
的等价类及其并 并且在交 并和补运 算上是封闭
的 那么 Paw lak 近似空间也唯一确定了一个拓扑
空间U UEA
2 3 上下近似
针对不可定义集 显然不可能构造一个公式来
精确描述 只能通过上下界逼近的方式来刻画 这就
是粗糙集理论中的上下近似算子
定义 2 设 EA是信息表 M 上的等价关系
X U 上下近似算子 apr
EA
apr
EA
下文我们采
用缩写形式apr apr定义为
aprXY Y UEA Y X
Y Y De fU AX Y
12317 期 王国胤等粗糙集理论与应用研究综述
aprX Y Y UEAY X
YY De fU AY X
上近似 aprX是包含 X 的最小可定义集 下
近似aprX是包含在 X 中的最大可定义集
根据定义 2 可定义集显然有相同的上下近似
刚才我们在可定义的基础上构造了一对近似算子
也就是说 只有当对象不可定义时 才会用上下近似
的方法来描述
考虑子集 X U 论域空间将被分成 3 个区域
1集合 X 的正域
POSXaprX
2集合 X 的负域
N EGXPOS XU aprX
3集合 X 的边界域
B NDXaprXaprX
如果 B N DX是空集 则称集 合 X 关于关系
EA是清晰的crisp反之 如果 B NDX不是空
集则称集合 X 为关于关系 EA粗糙的ro ugh
2 4 粗糙集
Paw lak
1 22
定义由等 价关 系 确 定 的 等 价 类
x EA的集合就组成了 P1粗糙集集合P1Roug h
Set P RS1显然 P1粗糙集集合是子集集合 即
PR S1 x EAX 2
U
借助上下近似的描述 也可以给出和 P RS1 等价
的关于粗糙集的另外一种定义 称为 P2粗糙集集
合即 PRS 2 X 1 X 2 aprXaprX
PRS 1 和 PR S2 通称为 Paw lak 粗糙集
有很多形式来描述粗糙集 比如 Iw inski
24
在
布尔代数 2
U
的子代数上来描述粗糙集 他定义粗糙
集为一对可定义集Yao
25
在论域 U 的子集空间 2
U
上描述粗糙集 定义粗糙集为一个闭区间集合 从代
数学意义上讲 Iw inski粗糙集代数和区间代数是等
价的 Iw inski粗糙集代数系统可以看作为一个上下
界是可定义集的区间代数系统
同时 Paw lak Skow ron Wong 和 Yao
2627
等
也提出用论域 U 的元素 x 来描述粗糙集一种简单
有效解释粗糙集的方法就是应用 3 个成员隶属度
函数来描述 即粗糙隶属度函数
X
x强隶属度函
数 apr Xx和弱隶属度函数 ap rXx
关于 粗糙 隶 属 度 函 数 的 定 义 有 多 种 形
式
2829
比如 文献 28 采用三值逻辑 0 1 定义
的粗糙隶属度函数建立起了粗 糙集和模糊集的关
系用模糊集合来描述 Iw inski粗糙集集合 并给出
了它们之间的关系换句话说 采用此种隶属度函数
来描述粗糙集 建立起了粗糙集和模糊集的关系
基于文献 28 的隶属度函数 许多学者研究并
提出了各种概率模型模糊集意义下的 截集经典
Paw lak 粗糙集 可变精度粗糙集VPRS决策粗糙
集理论等
以上对粗糙集的解释都是从集合的观点进行
的 还存在另外一种观点 即从算子的观点来解释粗
糙集在面向算子的观点中 上下近似被看作是论域
幂集空间 2
U
上的一对一元算子L 和 H 也就是说
粗糙集理论中研究的系统2
U
L H是标
准集合系统2
U
附加了两个近似算子的
扩展文献 30 对各种算子的定义及其相互关系作
了探讨
2 5 理论研究方法
经典粗糙集理论的基本思想是基于等价关系的
粒化与近似的数据分析方法 粗糙集理论与应用的
核心基础是从近似空间导出的一对近似算子 即上
近似算子和下近似算子又称上 下近似集目前
主要有两种研究方法来定义近似算子构造化方法
和公理化方法
21 节中我们采用 构造化方法回 顾了经典的
Paw lak 粗糙集模型 构造化方法的主要思路就是通
过直接使用二元关系的概念来定义粗糙集的近似算
子 从而导出 粗糙集代数系统2
U
apr
apr构造化方 法所研究的问题往往来源 于实际
所建立的模型有很强的应用价值 其主要缺点是不
易深刻体现近似算子的公理代数性质所以 也有
许多学者从公理化的角度来研究粗糙集
公理化方法也称为代数方法 有 时也称为算
子方法 这种方法不像构造化方法 中是以二元 关
系为基本要素的 它的基本要素是 一对满足某 些
公理的一元近似算子 L H 2
U
2
U
即粗糙代数系
统2
U
L H中近似算子 L 和 H 是事先
给定的 然后再去找二元关系使得由该二元关系及
其生成的近似空间按构造化方法导出的近似算子恰
好就是给定的由公理化方法定义的集合算子 近似
算子的某些特殊公理能保证有一些特殊类型的二元
关系存在 使这些关系能够通过构造方法产生给定
的算子 反之 由二元关系通过构造方法导出的近似
算子一定满足某些公理 使这些公理通过代数方法
产生给定的二元关系
用公理 化 方 法 研 究 粗 糙 集 最 早 的 是 Lin 和
Liu
31
由于 Lin 和 Liu 给出的公理组不独立 文献
32 对其进行了改进 Yao 与 T hiele 从不同的角度
1232 计算机学报 2009 年
剩余17页未读,继续阅读
李诗旸
- 粉丝: 26
- 资源: 329
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0