交通系统综合平台中数据挖掘技术原理和在智能交
通中的应用
摘要:数据挖掘作为在综合信息平台的海量数据中有效而可靠地提取有决策价值
的先进技术,已日益受到重视。本文首先介绍了数据挖掘的定义接着介绍了常用
的数据挖掘方法,然后分析了数据挖掘的过程,最后提出了数据挖掘技术在综合
信息平台中的典型应用及基于数据挖掘技术的交通信息集成模型。
关键词:智能交通系统;综合信息平台;数据挖掘;应用
0.引言
智能交通系统综合平台是为实现各 ITS 子系统间的数据共享、实现深层次的
信息融合和知识发现而提供的综合平台。该平台能够接受、存储和处理多源、异
构数据,具有数据融合、数据挖掘的功能,并能够为各种应用子系统和公众提供
完善的信息服务。
目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法
发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势,缺乏
挖掘数据背后隐藏的知识的手段,导致了“数据爆炸但知识贫乏”的现象。如何
在综合信息平台中有效地进行数据挖掘成为智能交通系统发展的一个重要问题。
1. 数据挖掘的定义
数据挖掘,英文是 Data Mining。关于它的一种比较公认的定义是:从大型数
据库的数据中提取人们感兴趣的知识,这些知识是隐含的、事先未知的潜在有用
信 息 , 提 取 的 知 识 表 示 为 概 念 (Concepts ) 、 规 则 ( Rules ) 、 规 律
(Regularities )、模式(Patterns)等形式。
式。这种定义把数据挖掘的对象定义为数据库。
将数据挖掘工具与传统的数据分析工具进行比较,传统的数据分析工具是对
过去情况的验证,而数据挖掘技术则是基于发现型的、预测型的,运用模式匹配
等各种算法对数据之间的关系进行挖掘。
数据挖掘系统框架:
2.数据挖掘的方法
数据挖掘的研究融合了多个不同学科领域的技术与成果,使得目前的数据挖
掘方法表现出多种多样的形式。从统计分析类的角度来说,统计分析技术中使用
的数据挖掘模型有线形分析和非线形分析、回归分析、逻辑回归分析、单变量分
析、多变量分析、时间序列分析、最近序列分析、最近邻算法和聚类分析等方法。