引言
• 数据是知识的源泉。但是,拥有大量的数据与拥有许多有用的知识完全是两回事。过去几年中,从数据库中
发现知识这一领域开展的很快。宽广的市场和研讨利益促使这一领域的飞速开展。计算机技术和数据搜集
技术的提高使人们可以从更加广泛的范围和几年前不可想象的速度搜集和存储信息。搜集数据是为了得到
信息,然而大量的数据本身并不意味信息。虽然现代的数据库技术使我们很容易存储大量的数据流,但如今
还没有一种成熟的技术协助我们分析、了解并使数据以可了解的信息表示出来。在过去,我们常用的知识
获取方法是由知识工程师把专家阅历知识经过分析、挑选、比较、综合、再提取出知识和规那么。然而,
由于知识工程师所拥有知识的有局限性,所以对于获得知识的可信度就应该打个
• 折扣。目前,传统的知识获取技术面对巨型数据仓库无能为力,数据发掘技术就应运而生。
• 数据的迅速添加与数据分析方法的滞后之间的矛盾越来越突出,人们希望在对已有的大量数据分析的根
底上进展科学研讨、商业决策或者企业管理,但是目前所拥有的数据分析工具很难对数据进展深层次的处
置,使得人们只能望“数〞兴叹。数据发掘正是为理处理传统分析方法的缺乏,并针对大规模数据的分析处置
而出现的。数据发掘经过在大量数据的根底上对各种学习算法的训练,得到数据对象间的关系方式,这些方
式反映了数据的内在特性,是对数据包含信息的更高层次的笼统[1]。目前,在需求处置大数据量的科研领域
中,数据发掘遭到越来越多的关注,同时,在实践问题中,大量胜利运用数据发掘的实例阐明了数据发掘对科
学研讨具有很大的促进作用。数据发掘可以协助人们对大规模数据进展高效的分析处置,以节约时间,将更
多的精神投入到更高层的研讨中,从而提高科研任务的效率。