论文研究- 大系统建模中的主成分分析法.pdf

所需积分/C币:5 2019-09-20 12:00:53 778KB .PDF

论文研究- 大系统建模中的主成分分析法.pdf,  大系统、尤其是社会经济大系统建立数学模型是困难的,难点在于大系统中变量多,变量之间关系复杂,而且对大系统运行机制也不完全了解。而目前由观测数据直接建立数学模型的方法还基本上属于尝试法,即便最简单的多项式模型种类在次数不变的情况下也随变量的增加而惊人地增加,
70 系统工程理论与实践 1991年1月 主成分的几何解释 设X=(X",X",X".对于其有m个观测样本x=(x1xy,“,xn),k=1,2…,m,主成分 分析汏求矩阵特征值与特征向量而确定主成分,实际上是作正交变换,即将坐标系进行旋转与反射,如 果对协方差阵求特征值与特征向量则还进行了平移;如果对相关系数矩阵求特征值与特征向量,实际上 事先对随机变量进行了标准化,即进行了坐标系的平移与长度方向上放大缩小。 由于平移、反射、旋转等变换并不改变样本点之间欧氏距离与相对位置,所以从坐标变换后样本点 的相对位置与分布情况,可以立刻了解原坐标系下样本点的相对位置与分布情况 设m个样本点的样本均值、样本方差为:=(”),其中、1x,m ∑( 经正交变换后,m个样本点的样本均值、样本方差为,J=(1y2“”n)其中= 所以 ∑∑(y-y,) n ∑Σxn-x)-∑ 上节性质2表明在X的一切线性组合中,若其系数满足标准化条件B'B=1,则y1具有最大方 差。一般来说,一个事物的变异性越大,它包含的信息也越多,变异性越小,它包含的信息也越少,显 然若一个事物一成不变,则无需再对它进行研究 从几何上考虑,样本方差代表样本点在坐标方向的投影距离均值位置的离散程度。坐标旋转,平移 不改变方差总和。所以从几何角度看问题,主成分分析法是找出样本点散布最开的几个相互正交的方 向。第一主成分是样本点散布最开的方向,第二主成分是第一主成分所生成向量空间正交补内样本点散 布最开的方向。第J个主成分是第一主成分,第二主成分,…第J-1主成分所生成向量空间的正交补 内样本点散布最开的方向。 般相关系数矩阵(或协方差阵),其特征根相差很大,或 =0,则表明在y Y方向上样本点很集中,甚至投影区间长度为零,这时样本点几手甚至完全集中在P维空 间的一个维超平面上。这样原来p维向量的问题被压缩成r-1维变量的问题。(或者在指定贡献率 要求精度意义之下)主成分分析法不仅找出了这些方向,还由特征值(即方差)的大小表达了样本点散 布的阶中心矩,在X服从正态分布时,主成分分析法还可以给出r-1维超平面上长方体区域内样本 点出现的概率 主成分分析法从几何上考虑是从p维空间选择相互正交的p个方向,这样原来随机变量各分量实际 是坐标轴方向,在求主成分时,相关系数很高的一批随机变量几乎就用与样本点所最接近的方向、即 某个主成分所代替的,所以主成分分析法具有自动筛选、组合、并让相关系数很高的随机变量综合成 个主成分的作用。 从儿何上考虑上述结论显然成立、不妨设x,x…,x为相关系数高的一组随机变量,则样本点 第1期 大系统建模中的主成分分析法 71 在x",x),…,x"所生成子空间的投影在一条直线附近,当x"),x,x,…,x的方差和足够大时就被 选为主成分,即使方差不是足够大,只要与先人选主成分都正交,也会被选为主成分或以其为主构成主 成分。 四、主成分分析法的应用 科研效率评价是一件十分有意义的工作,对科技体制改革有一定参考价值。 因为科学研究的产出不如生产那样单纯,用两个指标可以概括了的,也不像生产那样正常,产出 与投入劳动几乎成止比,所以有一定难度。科学研究由于课题任务性质不同,目的要求不同,有的主要 表现为经济效益,有的主要表现为社会效益;有时处于“十月怀胎”光付出劳动,看不到成果,有的“ 朝分娩”,只要在原已付出劳动的基础上,再增加一点新的劳动,立即产生重大成果。即使经济效益 (社会效益)也有多种表现形式,因此科研效率不是一、两个统计指标可以描述清楚的,必须由多项指 标共同描述 对多指标的问题过去一般用层次分析法来评价。这种方法简便易行,但也有以下几个问题:一是根 据少数人经验、直党来评定权数,难于做到准确、客观;二是不对数据进行处理,重复信息没有剔除, 容易造成重复计分;三是加权打分的办法不一定全符合实际情况。也可能造成较人的偏差。 因此我们选择了人均经济收入、人均技术收入、人均课题数、人均发表论文篇数、人均出版著作字 数、推广应用课题比例等二十几项指标l,对江苏省1986、1987、1988年分地风的数据采用主成分方 法进行分析。按09的贡献率,选取了七个主成分,比原来随机变量分量数大为压缩,有几个特征值已 接近于0,显示了主成分分析法的优越性 用主成分分析法求出的七个主成分不仅剔除了重复信息,而且实际意义明显,与定性认识完全吻 合。第一主成分是与人均经济收人相关的信息:第二主成分是人均课题数等与课题活动高度相关的指 标;第三主成分是关于人均技术性收入的指标;第四主成分是关于人均发表论文篇数的综合信息; 由此可见主成分分析确有不借助于定性知识就可以给变量分类并排序的功能。 七个主成分求出后要建立效率评价函数,根据对实际问题的分析,主成分分别表示社会效益、经济 效益不同方面的效率,因此采用线性函数,考虑到主成分已经含有方差的信息,不再另外赋系数了,常 数项则根据主成分全为零时效率应为零,所以常数项取为零。得到评价函数 1()=1.0833×10x,+0.59767x,+0.3126x,+3.509x+2981x,+0.2833x-0.6124x 2.3748x+…+49.60x1,+37.859x 其中:x1代表经济收人;x2代表经济收人占总收入的比重;…x12代表人均发表论文篇数;x1代表人 均出版著作千字数 将江苏省科研机构1986,1987,1988年各项统计数值代入上述评价函数,则三年评价值分别为 18273,19.209,20.682。表明科技体制改革以来科研效率是不断提高的,提高幅度大约在5~7 按此评价函数还可寻找效率提高的原因及可以继续挖掘潜力的地方。由数据可以看出效率提高主要 原因有两条:一是经济收人增加很快,其中技术性收入更快一些,表明科技体制改革要求科学技术面向 经济建设主战场收到一定的成效。二是课题活动加强了,从事课题研究人员比例增加了、人均工作量增 加了,说明科技体制改革实行所长负责制,课题承包调动了科研人员的积极性。从评价函数也可以发现 课题活动的社会效益有所降低,影响科研效率的进一步提高,应做到经济效益与社会效益一起抓。因此 评价函数不仅从定性上分析是正确的,而且起到定性分析尚难起到的作用,所以主成分分析法用于科研 效率评价是成功的。 此外,我们还用主成分分析方法进行了江苏科技发展后劲的分析评价工作。向因为科技系统的工作 基础是很长一段时间内积累的结果,某一时刻科技系统状况会影响科技系统发展很长一段时间,因此科 技发展后劲是科技体制改革中应予以特别注意的问题,不仅不能择取“杀鸡取蛋”的短期化行为,而且应 按客观规律办事,努力增强科技发展后劲 系统工程理论与实践 1991年1月 科技发展后劲也是一项综合性指标,它的信息蕴含于大量统计数据之中,无论是反映科研机构人员 的数量、质量或结构指标,科研机构现有物质条件的数量与质量指标,还是科硏机构的经济实力、活力 指标,以及技术储备、研究成果的数量、质量指标都与科技发展后劲密切相关。因此我们选择了职工人 数、从事科技活动人数、职工职称、学历统计数据、内部建设支出、仪器设备费、年末银行存款,课题 总数、获奖指数、发表论文篇数等30多项指标。然后对1986、1987、1988年江苏省各地区的统计数 据进行主成分分析 用方法求出相关系数矩阵的特征值之间相差数十万倍,选责献率为0835、则得到七个主成分。第 主成分是职工人数,从事科技活动人数、内部建设支出、仪器设备费、课题总数、技术服务收入这一 类相关系数在09以上的指标的综合信息;第二主成分是年木银行存款与总收人、总攴出、劳务费之比 这-类反映年末银行存款实际价值及相对多少的综合指标;第三主成分是内部建设支出与总收入、总支 出、以劳务费之比这一类关于仪器设备土建等实际使用金额(排除物价上涨因素)及仪器设备更新淘汰 方面的综合指标 因此主成分不仅实际意义明显,排序恰当,而且把相关系数很高的随机变量自动 组合在一起,其有不依靠定性知识就可以将许多变量恰当分解组合的功能。 求出主成分之后要建立分析评价函数,因为主成分的实际意义明显,可以按照机理选择适合的数学 模型,而不必如层次分析法一定采用加权求和的形式 首先,科技发展后劲从定性看,主要包括人、财、物、技术储备、组织管理等几个方面的囚素。这 些因素缺一不可、即使某一方面较为落后与其它方面不相适应,也将显著影响科技发展后劲。所以就现 阶段而言.科技发展后劲的大小是受上述诸方面中最薄弱的部分控制的 其次,我们所讨论的科技发展后劲指的是较长时间内持续起作用的影响力,那么上述各方面的情况 应该综合加以考虑,某一方面虽然起过其它方面可能暂时不能充分发挥其作用,但如果今后增强薄弱环 节、则这个方面仍有可能充分发挥它对科技发展后劲的贡献,因此科技发展后劲各方面的情况都应该予 以考虑 第三类似社会经济系统。科技发展后劲的诸方面是既相对独立,又可以部分替代的。如资金充裕可 以弥补仪器设备的不足;科技人员创新精神强,学科、年龄、能力结构合理,也可以抵消技术储备方面 的欠缺;组织管理得法,人员积极性得到充分调动,又可以缓合科技人员人F不够的矛盾。因此科技发 展后劲的综合评价中不可孤立地看待每个方面 出于上述三方面的考虑,我们首先计算各年度各主成分的得分值,记刈un(其中i=1,2…7代 第j个主成分得分,j代表年份),分析评价函数形式为 z0)=mn+∑vn+J兀 其中 ,当u,>0k 当.<0k un+1|n|a1符号不同时(同一个 u代表用样本均值代入主成分的得分。 按上述函数计算出江苏省科技发展后劲评价值,1986年为17.387,1987年为15854,1988年为 14.95。即江苏省科技发展后劲是逐年下降的,每年下降幅度在10%左右。 这一结果令人震惊,但这是否是危言耸听,由于主成分分析法不适用而造成的倾向性误差呢?事实 :,统计数据确实表明江苏的科技发展后劲正在下降。内部建设支出这一反映科研物质条件改善的指标 每年下降幅度上8%以上,如果考虑物价上涨因素,考虑研究总支出的变化、则内部建设支出下降总幅 度在35%以上。如果把其中仪器设备费单独拿出来进行比较,可以发现仪器设备费下降幅度更大,达 0%以上。科研的物质条件受到如此大的削弱,怎么不会造成科技后劲的锐减呢! 下转第16页) 16 系统工程理论与实践 1991年1月 间接工时预测、计算工时差额来预测未来进度 本系统管理200多种项目大项,年数十亿基建投资、数十万吨钢材的设备与材料,是一个比较大 的系统,预计1994年全部开发完成 参加文献 (I) Gilbert Common Wealth Conpanies, G/C CUE System Description. 〔2)魏国华等:实用运筹学,复旦大学出版社,1987年 (上转第72) 再看每个课题平均发表论文篇数,这也在下降,两年之中平均下降了27%。它反映科技人员不及 过去重视科研水平的提高与交流,这样做的后果一方面影响科技人员水平的提高,另一方面也影响科研 工作的进一步深入。显然这也将造成科技发展后劲的下降。由此可见主成分分析法的结果没有倾向性误 差。至于总的水平下降没有内部建设支出下降这么大,是由于其它因素下降幅度不大,有的因素还有所 上升造成的,所以从定量角度看也是符合实际的 主成分分析法建立的分析评价函数还可以帮助我们找到阻止科技发展后劲继续滑坡的对策建议。从 主成分的得分情况看,为增加江苏科技发展后劲,首先要增加对仪器设备的投资,在承包时应规定仪器 设备的更新率,要控制年末银行存款,这样无须增加投资即可保证科研物质条件的改善。另一方面应注 意科技人才的培养补充,防止因削减事业费不肯补充青年人。造成年龄结构失调将对科技发展产生持久 的不良影响,应引起各级领导的重视。第三是要保证大名数科技人才从事科技工作,并努力提高科研水 平,增加技术储备。 參考文献 ]张尧庭、方开泰:多元统计分析引论,科学出版社,1982年 [2]复日大学数学系:概率论(第二册第二分册),人民教育出版社,1980年。 [3]朱道元:江苏科研效率分析,科研管理(将发表) 14朱道元:江苏科技发展后幼分析,软科学硏究(将发表)。 5]宁俊杰:统计信息分析(下册),南开大学出版社。1986年。

...展开详情
试读 6P 论文研究- 大系统建模中的主成分分析法.pdf
img
  • 至尊王者

    成功上传501个资源即可获取

关注 私信 TA的资源

上传资源赚积分,得勋章
    最新推荐
    论文研究- 大系统建模中的主成分分析法.pdf 5积分/C币 立即下载
    1/6
    论文研究- 大系统建模中的主成分分析法.pdf第1页
    论文研究- 大系统建模中的主成分分析法.pdf第2页

    试读已结束,剩余4页未读...

    5积分/C币 立即下载 >