在粗糙集理论中,优势关系是一种重要的概念,其定义了一个非对称关系,用于描述对象间的偏好或优势。粗糙集理论旨在处理不精确、不完全和不相容的知识,是数据挖掘、机器学习与模式识别等领域应用的重要数学工具。基于优势关系的粗糙集(DRSA)是由Greco等人提出,它扩展了传统粗糙集方法,以适应包含偏好信息的现实数据。
粗糙集理论中属性约简是一个核心概念,它旨在从数据集中去除冗余属性,保留影响分类决策的关键属性。属性约简的求解往往从核的计算开始,因为核包含了数据集的核心属性,这些属性对于分类决策是不可或缺的。在优势关系下,传统的区分矩阵由于其对称性,并不适用于求解优势关系下的决策表核和属性约简。
文献[3]提出的类区分矩阵概念,是针对一致决策表的求核方法,但其定义未考虑不一致数据的存在,因此不适用于所有决策表。而文献[4-5]虽然给出了优势区分矩阵的定义和求核方法,但是该方法在生成矩阵元素时会增加计算复杂度。文献[6-7]则提出了一种新的优势区分矩阵及其求核方法,在一定程度上减少了计算复杂度,但仍存在一些错误。
本论文的研究目标是指出文献[6-7]中求核方法的错误,并提出一个改进的优势区分矩阵定义及其求核方法。通过改进,新的方法不仅能够正确处理不一致数据,还能够有效降低空间和时间复杂度,优于现有的算法。改进的优势区分矩阵和求核方法,首先定义了信息系统,即一个非空有限集合U称为论域,A表示属性集合,它通常被分为条件属性集合C和决策属性集合D。属性值集合V与属性A相关,而信息函数f:U×A→V负责指定U中每个对象x的属性值。
在定义信息系统后,研究人员引入了偏序关系的概念,用以建立属性值域上的准则。所有属性都是准则时,该信息系统被称为序信息系统。如果只有部分属性建立了偏序关系,则称为含序的信息系统。论文中还定义了优势关系,即在属性值域上建立了偏序关系“≥a”,用来描述对象x和y之间的优势关系,例如“x≥ay”表示x至少和y在准则a上是一样好的,或者说x优于y。
根据定义,对于任意属性集PÍA,可以定义x≥Py(或x≤Py),这表示x在属性集P上至少和y一样好,或者x优于(劣于)y。通过这些定义,研究人员可以计算出优势关系下的决策表的核,即最核心的属性集合。
提出的新方法在保证正确处理不一致数据的同时,通过减少不必要的计算步骤,显著降低了求解优势区分矩阵和核的复杂度。这有助于在实际应用中更高效地进行知识发现和决策支持。
总结来看,本论文通过对现有优势区分矩阵及求核方法的分析,发现并指出其错误,并提出了一个新的改进方法。该方法不仅能够正确处理不一致数据,而且显著提高了计算效率,有助于粗糙集理论在实际问题中得到更好的应用。