数据挖掘中基于多关系决策树算法的研究
摘 要:本文对多关系数据挖掘的分类算法——多关系决策树算
法进行了深入的研究。在此基础上,提出了在用户指导下完成分类
任务的背景属性传递技术,并将该技术应用到改进的多关系决策树
中。
关键词:数据挖掘 多关系 决策树 算法
1.引言
传统的数据挖掘中存在很多挖掘技术,但随着数据挖掘技术处理
对象范围的扩展,经典的学习方法存在一定的局限性:命题逻辑的
描述能力弱,这包括对数据的描述和对发现知识的描述两个方面。
知识的获取并不都是单纯地只从原始数据中获得。由于这些背景知
识通常采用更具表达力的一阶逻辑来描述,因此,现有的命题数据
挖掘技术不便利用有关挖掘任务的背景知识。最后,当前的数据挖
掘算法多采用了单表假设,但是在实际应用中,数据以多关系的形
式组织。从而引入例如多关系决策树算法。多关系数据挖掘是近年
来快速发展的重要的数据挖掘领域,传统的数据挖掘方法只能完成
单一关系中的模式发现,多关系数据挖掘能够从复杂结构化数据中
发现涉及多个关系的复杂模式。
2.多关系决策树算法
2.1 关系数据库
关系数据库包括表的集合 d={x1,x2,…,
xn}及表之间的联系的集合。这些联系可以看作是一个表中的记