没有合适的资源?快使用搜索试试~ 我知道了~
规划问题算法-就业问题的数学建模分析.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 106 浏览量
2022-05-01
19:59:44
上传
评论
收藏 854KB PDF 举报
温馨提示
试读
54页
规划问题算法-就业问题的数学建模分析.pdf
资源推荐
资源详情
资源评论
全
全
国
国
第
第
六
六
届
届
研
研
究
究
生
生
数
数
学
学
建
建
模
模
竞
竞
赛
赛
题 目
就业问题的数学建模分析
摘 要
就业问题分析的难点在于涉及面广、影响因素多、数据量大,因此本文分宏
观、中观、微观三个层次,通过聚类分析、主成分分析和相关分析,从影响就业
的因素中归纳出 6 个关键性的就业因素影响指标。依据 6 个指标与城镇登记失业
率的高度相关性,建立了城镇登记失业率由 6 个指标线性组合构成的预测模型。
考虑到我国城镇登记失业率定义的局限性,按照国际标准对失业率进行重新建
模,并以 2008 年的失业率数据对比分析了国际国内两种失业率定义的合理性。
考虑到地区和行业的差异,以 2001~2007 年的数据分别分地区和分行业建立
了失业率预测模型和从业人数预测模型,提出了地区内部失业率、预期岗位裕量、
行业内部失业率、国家投资回报指数的概念,并以 2008 年的数据验证了模型的
准确性。依据分地区精确预测模型和分行业精确预测模型分别对 2009 年和 2010
年上半年的失业率和从业人数进行了预测,分地区预测失业率的结果:2009 年
第一季度为 4.38%,第二季度为 4.82%,第三季度为 4.33%,第四季度为 4.91%,
2010 年第一季度为 4.57%,第二季度为 4.92%;分行业预测的结果为:2009 年
第一季度为 4.32%,第二季度为 4.83%,第三季度为 4.42%,第四季度为 4.09%,
2010 年第一季度为 4.85%,第二季度为 4.70%。
依据分地区精确预测模型和分行业精确预测模型得到的预期岗位裕量和国
家投资回报指数两个指标,对行业和地区进行了划分,总结出从促进就业的角度
对政府单位投资反应最灵敏的十大行业和十大地区,并与国家十大产业振兴计划
对比分析,验证了国家政策的科学合理性和模型的准确有效性。
关键词:主成分分析 聚类分析 预测模型 预期岗位裕量 投资回报指数
参赛队号
9000221
队员姓名
沈新民 李杰 曹建平
参赛密码
(由组委会填写)
2
一、问题重述与分析
失业、经济增长和通货膨胀为宏观经济中特别重要的三个指标,就业是社会、
国民经济中极其重要的问题。我国采用城镇登记失业率,是指城镇登记失业人数
同城镇从业人数与城镇登记失业人数之和的比。其中,城镇登记失业人员是指有
非农业户口,在一定的劳动年龄内(16 岁以上及男 50 岁以下、女 45 岁以下),
有劳动能力,无业而要求就业,并在当地就业服务机构进行求职登记的人员。
从经济学的角度,影响就业(或者失业)的因素很多。从宏观层面上,消费、
投资、政府购买和进出口都是重要的因素;而从中观层面,不同地区、不同产业
也会表现出不同的特征;从微观层面看,劳动者的受教育程度、性别、年龄的差
异也会影响就业。
就我国的现实情况,2008 年我国经济社会经受了历史罕见的考验,就业形
势十分严峻。据此,中央政府从 08 年 10 月开始实施了 40000 亿元的投资计划,
09 年我国在就业方面的目标是城镇新增就业 900 万人以上,城镇登记失业率控
制在 4.6%以内。
就业问题涉及的因素是纷繁复杂的,要在众多的数据中寻找出影响就业的关
键因素并用来预测未来的就业前景,对因素进行分类是必需的。本文将影响就业
的因素按照宏观、中观、微观三个层面划分,并通过相关分析、聚类分析、主成
分分析得到优化重组后的就业影响因子,再用预测的就业影响因子预测就业人数
和失业率。这种把就业问题作为一个系统来研究的方法比直接用就业人数和失业
率的历史数据预测更加科学合理。同时本文对失业率和就业人数进行分地区和分
行业的精确建模,为促进就业提供合理建议。
预测的目的是为了指导国家投资的合理使用,通过对预期岗位裕量和国家投
资回报指数分析,得出国家投资对提高就业率最有效的十大行业和十大地区,并
给出促进就业的具体建议,将国家的投资用到最合理、最有效的地方,实现就业
人数的最大化和失业率的最小化。
二、基本假设与符号说明
2.1 基本假设
假设一:所有的因素都可以用某个指标来表示,因此在下面的叙述中都
用定量化的指标来表示各种因素。
假设二:每年的数据都可以视为是该年四个季度数据按照某种计算方法
得到的,因此可以将按年统计的历史数据插值为以季度为考察单元的数
据,并都是以 2001 年第一季度为季度起始计数 1。
假设三:由于每个因素都对应很多指标,分析中不可能面面俱到,因此
选取最能代表该因素特征的指标来表示,并假设此指标可以完全体现该
因素,这是下面很多因素指标选取的依据。
假设四:主成分分析的累计贡献率达到 80%为比较满意,90%为高度满
意,并认为高度满意的情况下主成分分量可以完全的代表原变量。
假设五:对于指数﹑比率等的度量性年度数据,将其视为该年第四季度
的季度数据;对于累计性年度数据,同一季度的季度增长率应以年增长
率为中心上下波动,且偏离(方差)不大。
假设六:未来的数据可以由历史数据准确的预测,因此本文中采用
2001~2007 年的数据进行预测。
3
2.2 符号说明
GPC 国民经济核算指数
JPC 价格指数
CPC 财政税收指数
BPC 金融保险指数
SPC 三大产业指数
MACRO 宏观指标
HPC 分行业指标
DPC 分地区指标
MESO 中观指标
MICRO 微观指标
三、问题 1:影响就业的指标的分析
3.1 影响就业的指标的分类
从经济学的角度来说,影响就业(或者失业)的指标很多,其分类也是多种
多样的,本题中是要在大量数据中提取有用的信息,属于数据挖掘范畴,因此本
文首先对影响就业的因素进行了详细的分析。本文采用宏观、中观、微观三层分
类法,对影响就业的指标通过聚类分析、主成分分析、相关分析进行优化重组,
使用层次分析法逐层计算。
从宏观层面来看,宏观经济学是以国民经济总过程的活动为研究对象,依据
这一概念,这里的宏观层面指标本文主要分析国民经济核算、价格指数、财政税
收、金融保险、三大产业五大类。
从中观层面来看,中观经济学是以某一部门、某一集团或某一地区的经济活
动为研究对象,因此这里的中观层面指标本文主要进行分地区、分行业讨论。
从微观层面来看,微观经济学是以单个经济单位(单个的生产者、单个的消
费者、单个市场的经济活动)作为研究对象,因此微观层面指标本文主要分析劳
动者的受教育程度、性别、年龄三个方面
[1,2,3]
。
由于历史数据多是以年为单位给出的,近期数据多是以季度或者月份给出
的,因此为了实现数据的统一,依据假设二,每年的数据都可以视为是该年四个
季度数据按照某种计算方法得到的,本文对按年给出的数据先进行插值处理,并
将考察的数据定位在 2001~2007 年,以 2001 年第一季度为季度起始计数 1,通
过 7 年 28 个季度的数据寻找规律并对未来进行预测。
3.2 宏观层面指标分析
宏观层面指标可以分为国民经济核算、价格指数、财政税收、金融保险、三
大产业五大类,每一类又包含了相当多的内容,针对每一类本文依据假设三选取
指标,通过主成分分析将其逐步优化得到宏观指标 MACRO。
3.2.1 国民经济核算
国民经济核算又分为国内生产总值、消费、投资、对外经济贸易和国内生产
总值指数五个方面,依据假设三,选取国内生产总值增长率、居民消费指数、固
定资产投资增长率、进出口贸易总额、人均国内生产总值作为对应的指标,依据
国家统计年鉴中 2001~2007 年的统计数据
[1,2]
,按照如下的步骤和流程图 3.2 将
其转化成按季度的数据。
为了更好的进行预测,需要季度指标,但收集到的数据大部分是年度数据。
在保证一定的准确度的前提下,需要年度数据映射到季度中去。通过对各个指标
更多数学建模资料请关注微店店铺“数学建模学习交流”
https://k.weidian.com/RHO6PSpA
4
的分析,可以将指标分为两类。一类是指数﹑比率等的度量性数据,比如居民消
费指数;另一类是累积性的数据,比如年度生产总值。对于前一类数据,为了处
理的方便,依据假设五将年度指标看做是当年第四季度指标。这样,对于时间序
列的趋势可以进行拟合分析。
以国内生产总值增长率为例,其原始数据如表 3.1 所示。
表 3.1 国内生产总值增长率原始数据
[2,3]
(单位:%)
时间
2001
2002
2003
2004
2005
2006
2007
国内生产总值增长率
8.3 9.1 10.0
10.1
10.4
11.6
13.0
分别采用线性函数、指数函数、二次函数和 S 函数进行数据拟合,得到的对
比结果如表 3.2 所示。
表 3.2 四种不同函数下拟合结果示意图
模型 拟合方程
准确性度量
MAPE
MAD
MSD
线性方程 Yt = 7.57 + 0.70×t
2.80 0.30
0.13
二次方程 Yt = 8.27 + 0.23×t + 0.06×t^2
2.55 0.26
0.09
指数方程 Yt = 7.85×(1.07^t)
2.60 0.27
0.10
S-曲线方程
Yt = (100) / (11.121 - 0.232×(1.47^t))
3.41 0.31
0.18
其中 MAPE、MAD、MSD 分别表示绝对百分数误差均数、绝对差异均数、
平方差异均数,其值越小表示拟合得越好。由表 3.2 可知,采用二次方程的拟合
结果比较好,拟合的结果如图 3.1 所示。
十
二
月
2
0
0
7
十
二
月
2
0
0
6
十
二
月
20
0
5
十
二
月
2
0
0
4
十
二
月
2
0
0
3
十
二
月
2
0
0
2
十
二
月
2
0
0
1
13
12
11
10
9
8
时间
国内生产总值增长率
平均百分误差 (MAPE) 2.55802
平均绝对误差 (MAD) 0.26054
平均偏差平方和 0.09585
准确度度量
实际
拟合值
变量
国内生产总值增长率 的趋势分析图
二次趋势模型
Yt = 8.271 + 0.230*t + 0.0583*t**2
图 3.1 二次方程的拟合结果示意图
仿照上述过程就可以得到其他季度的数据,处理过的数据见附表 1。
对于第二类累计性指标处理起来有一定的复杂度,由已知的年度总数据求四
个季度数据相当于由一个方程求四个未知数。依据假设五,利用非线性规划对季
度数据进行优化,优化对象为季度同期增长率,优化方程如下所示:
目标函数为:
( ) ( ) ( )
i i i i
f R mean R Ry std R
(3.1)
5
其中:
1 2 3 4
T
i i i i i
R r r r r
,
ij
r
为第 i 年 j 季度的同期增长率;
i
Ry
为第 i 年年增长率;
mean(·)平均值函数;std(·)标准差;
适应参数,随迭代次数改变。
约束条件为:
1
*
0 1
i i i
ij
D R D
r
(3.2)
其中:
1 2 3 4
[ , , , ]
i i i i i
D d d d d
,
ij
d
为第 i 年 j 季度的指标。
这样就可以利用最优化求取最优值
i
R
使目标函数最小,进而得到各季度数据。
归纳上面的过程,年度数据转化为季度数据的流程如图 3.2 所示。
图 3.2 年度数据转化成季度数据的计算流程图
按照如图 3.2 所示的年度数据转化成季度数据的流程图,可以得到 2001~
2007 年按季度的国民经济核算统计数据见附表 1。
按照统计学知识进行主成分分析
[4]
,主成分分析的思路如下所述。
主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,
从数学角度来看,这是一种降维处理技术。假定有 n 个样本,每个样本共有 p 个
变量描述,这样就构成了一个 n×p 阶的数据矩阵:
…
…
…
…
11 1
1
p
n np
x x
X
x x
(3.3)
剩余53页未读,继续阅读
资源评论
普通网友
- 粉丝: 12w+
- 资源: 9335
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- git使用文档(一步一步教你使用Git仓库管理代码)
- 进制转换(通用版).cpp
- linux实践之从DistroWatch排名第三的EndeavourOS转到排名第五的Manjaro工作机迁移
- Discuz模板+资讯博客课程干货+商业版(GBK+UTF)
- 基于Selenium的Java爬虫实战(内含谷歌浏览器Chrom和Chromedriver版本123.0.6292.0)
- RB308A-SOT23-5 单节锂电池保护IC 深圳市可芯电子有限公司.pdf
- Ubuntu下安装JDK
- 基于Selenium的Java爬虫实战(内含谷歌浏览器Chrom和Chromedriver版本123.0.6291.0)
- Android基础之用Eclipse建立工程
- WZLR(2).ipynb
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功