没有合适的资源?快使用搜索试试~ 我知道了~
讲述数据挖掘方面的知识,在宏观经济学中的应用, 着重强调一下,此文章作者非本人,放在这里,主要是资源共享,大家一起学习,共同进步。
资源详情
资源评论
资源推荐
四川大学本科毕业论文 数据挖掘算法在宏观经济预测中的应用
1 导论
1.1 选题目的及意义
选择数据挖掘算法在宏观经济预测中的应用作为论文的研究题目,考虑的
原因主要有三点:
第一,对宏观经济进行预测是来源于四川省经委的实际课题《基于景气度
的宏观经济预测》。
第二,宏观经济反映整个国民经济的运行及发展状况,它不仅影响整个国
家的经济政治等多方面的稳定,还对身处宏观经济其中的所有个体都产生很大
的影响,因此选择宏观经济预测作为研究的方向,由宏观经济预测来指导国家
宏观调控、战略制定等方面的工作,都具有现实和重要的意义。
第三,数据挖掘算法作为知识发现的新技术,正被广泛的应用于各个领域 ,
为管理者提供决策服务,尤其是在预测趋势和行为这个方面显示出很好的应用
效果,具有很好的发展前景。将数据挖掘算法应用到宏观经济预测中,是一个
很好的研究方向。
鉴于此,本文选择了数据挖掘算法在宏观经济中的应用作为探讨和研究的
内容。
1.2 文献综述
国内外对于数据挖掘(Data Mining)技术的研究其实已经经历了数个年
头。数据挖掘技术本身是一个逐渐演变的过程,最初的数据挖掘主要表现为对
电子数据的一些简单处理,人们通过某些方法从电子数据中获得有用的信息,
从而实现自动决策支持,在这个阶段机器学习成为主要的方法之一。所谓机器
学习就是将一些已知的并且已经被成功解决的问题作为范例输入到计算机中,
然后机器通过学习这些范例,总结并产生相应的规则,由于这些规则具有通用
性等特点,因此可以利用它们来解决某一类的问题
[1]
。随后出现了神经网络技
术,人们对数据挖掘的研究开始转向知识工程、专家系统等方面,其中知识工
程不同于机器学习的原理,它是直接向计算机输入已被代码化的规则,然后计
算机通过使用这些规则来解决实际问题。而专家系统由于投资大,且效果不甚
理想,并未得到广泛的应用。在 20 世纪 80 年代末期出现了一个新的术语——
数据库中的知识发现(KDD),它泛指所有从源数据中发掘模式、联系或者规
则的方法
[1]
。随着对数据挖掘技术研究的深入,人们逐渐认识到数据挖掘中有
许多工作可以由统计方法来完成,并且开始将统计方法与数据挖掘技术有机的
结合起来。
与国外相比,国内对数据挖掘技术的研究稍晚。目前国内的许多科研单位
和高等院校纷纷开始投入到对数据挖掘技术的基础理论及其应用等方面的研究
中,研究方向包括了模糊方法在知识发现中的应用、数据立方体代数的研究、
关联规则开采算法的优化和改造、非结构化数据的知识发现以及 Web 数据挖掘
等等。
除了这些已经处于研究阶段的内容,还有一些领域正开始成为数据挖掘技
1
四川大学本科毕业论文 数据挖掘算法在宏观经济预测中的应用
术新的研究焦点,包括网站的数据挖掘(Web-site Data Mining)、生物信息
或基因的数据挖掘及文本的数据挖掘(Textual Data Mining)。将来数据挖掘
技术的研究还可能会延伸到许多尚未触及的领域,比如知识发现语言的形式化
描述,即研究专门用于知识发现的数据挖掘语言,类似于标准化的 SQL 语言;
数据挖掘过程中的可视化方法,即让知识发现的过程能够被用户理解,便于在
知识发现的过程中进行人机交互;对各种非结构化数据的进一步开采,如对文
本数据、图形数据、视频图像数据、声音数据乃至综合多媒体数据的开采等。
从数据挖掘技术的研究现状及未来发展趋势来看,其应用是非常广泛的,
涉及到了很多领域的不同方面,比如市场、金融、经济、工程、生物、天文、
产品制造、甚至司法工作。本文来源于四川省经委的实际课题《基于景气度的
宏观经济预测》,因此将研究的重点放在了数据挖掘技术在经济预测中的应用
上。
1.3 研究思路
本文所研究的主要内容是数据挖掘算法在宏观经济预测中的应用,遵循的
写作思路是,利用四川省 2002—2005 年的历史统计数据,建立多个数据挖掘算
法的预测模型,分别对四川省宏观经济预测中的工业产品销售收入指标进行预
测,然后对各种算法的预测效果进行对比分析,根据相对误差、景气数据、组
合互补性等因素,从中选择出某几个算法模型进行组合,从而确立一个最适合
该指标,同时预测效果最为理想的数据挖掘算法模型。
本文拟采用的研究 方 法 主 要是 , 运 用 一些 数 据 挖 掘方 面 的 软件 ( 如
SPSS、MATLAB、Knowledge miner 等)建立和调试几种数据挖掘算法模型
(包括 AC 模型、GMDH 模型、BP 神经网络模型、AR 模型),并进行预测。
研究所涉及的数据均是来源于四川省统计局的历史统计数据,因此数据基础是
准确和权威的。
2 宏观经济预测概述
2.1 宏观经济预测
众所周知,经济学将经济划分为两大类,一类是我们所熟知的微观经济
(Micro Economy),而另一类则是让我们感觉离生活比较遥远的宏观经济
(Macro Economy)。其实宏观经济与我们的生活息息相关,它是一个社会
的大经济环境,反映的是整个国民经济的运转及发展状况,渗透于社会活动的
方方面面。它不仅影响着整个国家的经济及政治稳定,同时也对身处其中的个
体如企业、单位、组织甚至个人产生很大影响。正是由于宏观经济的巨大影响
力,才使得宏观经济预测成为了一个重要的研究课题。
宏观经济预测是指对整个国民经济或地区、部门的经济发展前景的预测,
它以整个社会(或地区、部门)的经济发展总图景作为考察对象,研究经济发
展中各个有关的总指标、相对数指标和平均数指标之间的联系
[2]
。例如,研究
和预测国民经济发展水平、发展速度和建设规模,预测社会物价总水平的变动,
2
四川大学本科毕业论文 数据挖掘算法在宏观经济预测中的应用
预测各个地区、国民经济各部门、社会再生产各环节的发展水平、速度和比例
关系等。通过对宏观经济的历史发展过程及现状进行研究分析,进而对其未来
的走势做出相对准确的预测和判断,一方面可以为国家高层进行宏观调控、制
定战略发展方向等提供依据和指导,另一方面也为处于宏观经济浪潮中的个体
的发展指明方向,使其在开展业务的过程中符合国家政策导向,顺应整个宏观
经济前进的大趋势。
2.2 预测的可行性
由于经济预测的对象是市场经济,它是一种风险型经济,同时经济环境本
身也是复杂多变的,经济预测还有人的意志和活动参与其中,这就使得经济预
测要比一般的预测如气象预测困难许多。但是这并不意味着经济预测不具备科
学上的可行性。首先,经济发展具有连贯性的特征,或称为延续性。一方面表
现为时间的连贯性,主要是由于系统惯性原理造成,也就是说,在经济系统中,
如果过去一直受某种政策所支配,现在即使停止执行这种政策,经济系统也无
法立即消除这种政策带来的影响,而是会按照其原有的惯性运行一段时间,这
是运用时间序列分析方法进行趋势外推的基本假设;另一方面表现为经济系统
结构的连贯性,认为它在短期内是不变的,具有相对的稳定性,这是利用因果
关系建立结构模型进行预测的主要依据
[3]
。其次,经济现象及经济变量之间存
在一种相关性的关系,这种相关性可以是线性相关,也可以是非线性相关,可
以是正相关,也可以是负相关。这些关系在一定的经济系统中通常显示为一种
因果关系,成为建立预测模型所依据的基础。再次,经济形态的结构和变化都
有一定的模式,某些模式之间彼此有相似之处,再加上对经济发展规律的认识,
掌握其先兆模式,就可以类推出与先兆模式相似的经济发展模式。最后,通过
对经济发展过程中的偶然性事件进行剖析,方能揭示经济系统内部隐藏的必然
性的规律
[3]
。因此,经济发展的这一系列特征决定了经济预测的可行性。
有人说过,“预测是科学与艺术的完美结合。”
[4]
为了预测经济在某一时期的
发展趋势,就必须要将定量预测方法与定性预测方法相结合。比如在预测中我
们常常需要对某一时期的实际经济过程进行模拟,这种模拟的经济过程与实际
的经济过程相比,无疑会有一定的偏差,而且这种偏差带有随机性,因此就会
造成预测结果出现一定的误差。那么处理的办法除了对实际经济过程作出区间
估计以外,还可以借助和参考一些定性预测方法所提供的经济可能变动的方向,
来对模拟过程进行调整。本文着重讨论和研究的是定量经济预测方法,特别是
数据挖掘算法(Data Mining)在宏观经济预测中的应用,因此接下来将首先
对数据挖掘算法的概念、功能、应用领域等进行概括的论述。
3 数据挖掘算法概述
3.1 数据挖掘算法
3
四川大学本科毕业论文 数据挖掘算法在宏观经济预测中的应用
所谓数据挖掘(Data Mining),学术上的定义是 指对数据库中的数据进
行一定的处理,从大量的、不完全的、有噪声的、模糊的、随机的数据中提取
隐含的、事先未知的、但是又潜在有用的信息和知识的过程
[4]
。简单来讲,数
据挖掘就像是从矿石中采矿,原始数据就是未经开采的矿石,而通过一系列提
取和处理之后所得到的才是真正有价值的东西。经过挖掘以后得到的信息可以
称为知识,这种知识的获取首先与科学发现有关,从大量实验数据中发现数据
的整体结构特性和数据之间的函数关系,并根据统计特征去推断客观世界中存
在的规律性;其次,在商业数据等事实数据所构成的数据库中发现其中隐含的
规则或规律性。那么我们也可以从中看出数据与知识这两种概念的根本区别,
知识相对于数据而言,具有更多有价值的规律性,而正是这种规律性成为了我
们根据过去推测未来的依据,即这些建立在大量数据基础上推断出的规律成为
预测的基础。
数据挖掘(Data Mining)技术实际上是随着信息爆炸应运而生的,如何
才能及时从现代社会的海量信息中发现有用的知识、提高信息的利用率几乎成
为信息时代中每个人都必须要面对的问题。大量数据的确隐含了很多宝贵知识,
但是只有在充分利用这些数据为业务决策、战略发展等服务的情况下,数据才
能成为真正的资源,否则海量数据反而可能成为包袱,甚至成为垃圾。此外,
数据挖掘技术从一开始就是面向应用的。它不仅仅是对特定数据库进行简单的
检索、查询及调用,它还要对数据库中的这些数据进行微观、中观乃至宏观的
统计、分析、综合及推理,利用数据分析的结果去指导实际问题的求解,发现
事件之间的相互关联,甚至可以利用已有的数据对未来的活动发展进行某种程
度的预测。因此数据挖掘技术的意义,实际上体现为,它将人们对数据的应用
从传统的低层次的末端查询操作,提高到了为各级经营决策者提供决策支持的
水平
[4]
。而正是以现代社会人们对决策支持的巨大需求作为驱动力,要求对数
据的操作必须比单纯的数据库查询更为强大,才使得数据挖掘技术开始蓬勃发
展。
3.2 数据挖掘步骤
应用数据挖掘技术进行数据分析推断的步骤大致可以归结为以下几步(见
图 1):
4
确定挖掘目的及分析对象
数据准备工作
数
据
收
集
数 据
预 处
理
建
立
模
型
四川大学本科毕业论文 数据挖掘算法在宏观经济预测中的应用
反
馈
调
试
图 1 数据挖掘技术的应用步骤图
1.确定挖掘目的及分析对象:我们在使用数据挖掘技术进行工作之前,必
须要搞清楚挖掘的目的是什么,以什么作为数据分析的对象。尽管事先我们无
法对挖掘的结果做出预测,但是对挖掘对象及目的应该有清晰的预见,而不是
带着盲目性去进行数据挖掘。
2.数据准备工作:
(1)数据收集:收集与分析对象有关的内部和外部数据信息,并从中选择出
适合于数据挖掘应用的数据。
(2)数据预处理:数据收集阶段所得到的数据有可能存在一些不一致性,或
者是有缺失数据存在等问题,因此要对这些数据进行整理和预处理。比如对数
据进行简单的泛化处理,采用环比或定比方法去除数据的量纲,做数据之间的
相关性分析以剔除无用数据等等。通过这些处理在原始数据的基础之上得到更
为丰富的数据信息,便于数据挖掘的顺利进行。
(3)建立模型:根据将要采用的数据挖掘算法来建立数据分析模型,这是数
据挖掘成功的关键。
3.数据挖掘:利用上一步建立的数据分析模型,对经过预处理的数据进行
挖掘。
4.分析评估结果:对数据挖掘结果进行分析和评估。这一步既需要直接用
实际数据来验证模型的正确性,也需要借助专业人员的经验进行定性的评估。
根据评估来调整数据挖掘模型,反复调试至最佳状态。
5.辅助决策:将最终的分析结果用于辅助决策。决策者可以根据数据挖掘
的结果,结合实际情况来制定发展规划、调整战略策略等。
3.3 功能及应用领域
现阶段人们广泛的在各个领域使用数据挖掘技术,通过它来预测未来的趋
势及行为,做出前摄的、基于知识的决策。目前主要的应用集中在这样几个领
域:市场业无疑是数据挖掘技术的用武之地,无论是市场定位、或者是消费者
行为分析,数据挖掘技术都被用于辅助制定市场策略,管理信息系统( MIS-
Management Information System)和零售终端(POS-Point Of Sales)的普及使得
我们更容易得到反映客户购买情况的数据,通过相关分析、统计方法等技术,
很快就能从客户历史数据中得到有用的信息,如客户购买取向兴趣等;接下来
是金融行业,由于金融业务涉及到大量的数据,很难通过人工方式或者是一般
5
数据挖掘
分析评估结果
辅助决策
剩余20页未读,继续阅读
lu_yu799
- 粉丝: 0
- 资源: 16
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0