数据挖掘技术在移动通信中的应用
1 引言
数据挖掘汇集了统计学、人工智能、数据库等学科的内容,是一门新兴的交叉学科。
这门学科旨在帮助人们从海量数据中发现有价值的信息,目前在商业中的应用刚刚起步。
国内日趋激烈的移动通信市场竞争促使各移动通信运营商去降低运营成本、提供差异化的
客户服务,而数据挖掘技术的应用可以帮助运营商分析客户消费行为,识别客户特征,辅
助运营商进行有效的市场营销和客户服务。
2 数据挖掘技术概述
“数据挖掘包含了一系列旨在从数据集中发现有用而尚未发现的模式( Pattern)的技
术。”[1]。确切地说,数据挖掘是一种知识发现的过程,它主要基于统计学、人工智能、机
器学习等技术,高度自动化地分析数据,做出归纳性的推理,从中挖掘出潜在的模式,并
对未来情况进行预测,以辅助决策者评估风险、做出正确的决策。数据挖掘与联机分析处
理(On-Line Analytical Processing, OLAP)都是分析型工具。联机分析处理作为验证型分
析工具,“更多地依赖用户输入的问题和假设”[2], 使得用户能够快速地检索到所需要的数
据,而数据挖掘能够自动地发现隐藏在数据中的模式(Pattern)。
在实际应用中,数据挖掘主要采用以下几种方法进行模式的发现:
(1)相关分析和回归分析:相关分析主要分析变量之间联系的密切程度;而回归分
析主要基于观测数据建立变量之间适当的依赖关系。相关分析是回归分析的基础。
(2)时间序列分析:与相关分析类似,目的也是为了挖掘出数据之间的联系,但时
间序列分析更加侧重于数据在时间先后上的因果关系。
(3)分类分析:分类分析首先为每一个观测赋予一个标记,然后检查这些被标记的
观测,描述出这些观测的特征。这种描述可以是一个数学公式或者模型,利用它可以分类
新的观测。常用的几种典型的分类模型有线性回归模型、决策树模型、基于规则模型和神
经网络模型等。
聚类分析:与分类分析不同,聚类分析的输入是一组未标定的记录,目的是根据一定
的规则,合理地划分记录集合。聚类分析和分类分析是一组互逆的过程,因此在很多分类
分析中适用的算法也同样适用于聚类分析。
3 数据挖掘在移动通信中的应用
目前移动通信运营商都具有业务营运系统、客户服务呼叫中心、业务受理网站等客户
信息系统,这些系统具有如下特点:
(1)各个信息系统都各自比较完整地管理着客户某一部分的信息,众多的客户数据、
市场营销数据、帐务数据以不同的数据格式和访问方式分散在不同的系统中,形成众多的