第 7 章 灰色预测方法
预测就是借助于对过去的探讨去推测、了解未来。灰色预测通过原始数据的处理和灰色模型的
建立,发现、掌握系统发展规律,对系统的未来状态做出科学的定量预测。对于一个具体的问题,
究竟选择什么样的预测模型应以充分的定性分析结论为依据。模型的选择不是一成不变的。一个模
型要经过多种检验才能判定其是否合适,是否合格。只有通过检验的模型才能用来进行预测。本章
将简要介绍灰数、灰色预测的概念,灰色预测模型的构造、检验、应用,最后对灾变预测的原理作
了介绍。
7.1 灰数简介
7.1.1 灰数
灰色系统理论中的一个重要概念是灰数。灰数是指未明确指定的数,即处在某一范围内的数,
灰数是区间数的一种推广。
灰色系统用灰数、灰色方程、灰色矩阵等来描述,其中灰数是灰色系统的基本“单元”或“细胞”。
我们把只知道大概范围而不知其确切值的数称为灰数。在应用中,灰数实际上指在某一个区间
或某个一般的数集内取值的不确定数,通常用记号“
”表示灰数。
灰数有以下几类:
1. 仅有下界的灰数
有下界而无上界的灰数记为
,a
或
a
,其中
a
为灰数
的下确界,它是一个确定的
数,我们称
,a
为
的取数域,简称
的灰域。
一棵生长着的大树,其重量便是有下界的灰数,因为大树的重量必大于零,但不可能用一般手
段知道其准确的重量,若用
表示大树的重量,便有
,0
。
2. 仅有上界的灰数
有上界而无下界的灰数记为
( , ]a
或
( )a
,其中
a
为灰数
的上确界,是一个确定的
数。
一项投资工程,要有个最高投资限额,一件电器设备要有个承受电压或通过电流的最高临界值 。
工程投资、电器设备的电压、电流容许值都是有上界的灰数。
3. 区间灰数
既有下界
a
又有上界
a
的灰数称为区间灰数,记为
aa,
。
海豹的重量在 20~25 公斤之间,某人的身高在 1.8~1.9 米之间,可分别记为
25,20
1
,
9.1,8.1
2
4. 连续灰数与离散灰数
在某一区间内取有限个值或可数个值的灰数称为离散灰数,取值连续地充满某一区间的灰数称
为连续灰数。
某人的年龄在 30 到 35 之间,此人的年龄可能是 30,31,32,33,34,35 这几个数,因此年
龄是离散灰数。人的身高、体重等是连续灰数。
5. 黑数与白数
当
,
或
21
,
,即当
的上、下界皆为无穷或上、下界都是灰数时,称
为黑数。
当
[ , ]a a
且
aa
时,称
为白数。
为讨论方便,我们将黑数与白数看成特殊的灰数。
6. 本征灰数与非本征灰数
本征灰数是指不能或暂时还不能找到一个白数作为其“代表”的灰数,比如一般的事前预测值、
宇宙的总能量、准确到秒或微妙的“年龄”等都是本征灰数。
非本征灰数是指凭先验信息或某种手段,可以找到一个白数作为其“代表”的灰数。我们称此白
数为相应灰数的白化值,记为
~
,并用
a
表示以
a
为白化值的灰数。如托人代买一件价格 100
元左右的衣服,可将 100 作为预购衣服价格
100
的白化数,记为
100100
~
。
从本质上来看,灰数又可分为信息型、概念型、层次型三类。
1.信息型灰数,指因暂时缺乏信息而不能肯定其取值的数,如:预计某地区今年夏粮产量在
100 万 吨 以 上 ,
,100
; 估 计 某 储 蓄 所 年 底 居 民 存 款 总 额 将 达 7000 万 到 9000 万 ,
9000,7000
;预计西安地区 5 月份最高气温不超过 36℃,
36,0
。这些都是信息型灰数。
由于暂时缺乏信息,不能肯定某数的确切取值,而到一定的时间,通过信息补充,灰数可以完全变
白。
2.概念型灰数,也称意愿型灰数。指由人们的某种观念、意愿形成的灰数。如某人希望至少
获得 1 万元科研经费,并且越多越好,
,10000
;某工厂废品率为 1%,希望大幅度降低,
当然越小越好,
01.0,0
。这些都是概念型灰数。
3.层次型灰数,由层次的改变形成的灰数。有的数,从系统的高层次,即宏观层次、整体层
次或认识的概括层次上看是白的,可到低层次上,即到系统的微观层次、分部层次或认识的深化层
次则可能是灰的。例如,一个人的身高,以厘米度量是白的,若精确到万分之一毫米就成灰的了。
7.1.2 灰数白化与灰度
有一类灰数是在某个基本值附近变动的,这类灰数白化比较容易,我们可以其基本值为主要白
化值。以
a
为基本值的灰数可记为
a
aa
或
,, aa
,其中
a
为扰动灰元,此灰数
的白化值为
aa
~
。如今年的科研经费在 5 万元左右,可表示为
5000050000
,或
,50000,50000
,它的白化值为 50000。
对于一般的区间灰数
ba,
,我们将白化值
~
取为:
ba )1(
~
,
1,0
定义 7.1 形如
ba )1(
~
,
1,0
的白化称为等权白化。
定义 7.2 在等权白化中,取
2
1
而得到的白化值称为等权均值白化。
当区间灰数取值的分布信息缺乏时,常采用等权均值白化。
定 义 7.3 设 区 间 灰 数
ba,
1
,
dc,
2
,
ba )1(
~
1
,
1,0
,
dc )1(
~
2
,
1,0
,当
时,称
1
与
2
取数一致,当
时,称
1
与
2
取数非一致。
在灰数的分布信息已知时,往往采取非等权白化。例如某人 2000 年的年龄可能是 40 岁到 60
岁,
60,40
是个灰数。根据了解,此人受初、中级教育共 12 年,并且是在 60 年代中期考入
大学的,故此人的年龄到 2000 年为 58 岁左右的可能性较大,或者说在 56 岁到 60 岁的可能性较大。
这样的灰数,如果再作等权白化,显然是不合理的。为此,我们用白化权函数来描述一个灰数对其
取值范围内不同数值的“偏爱”程度。
对概念型灰数中表示意愿的灰数,其白化权函数一般设计为单调增函数。
一般来说,一个灰数的白化权函数是研究者根据已知信息设计的,没有固定的程式。函数曲线
的起点和终点一般应有其含义。如在外贸谈判中,就有一个由灰变白的过程。开始谈判时,甲方说
我的出口额至少要 5 亿元,乙方说我的进口额不大于 3 亿。则成交额这一灰数将在 3 亿与 5 亿间取
值,其白化权函数可将起点定为 3 亿,终点定为 5 亿。
灰度即为灰数的测度。灰数的灰度在一定程度上反映了人们对灰色系统之行为特征的未知程度 。
在实际应用中,我们会遇到大量的白化权函数未知的灰数,例如由一般灰色系统之行为特征预测值
构成的灰数,就难以给出其白化权函数。
我们认为,灰数的灰度主要与相应定义信息域的长度及其基本值有关。如果考虑一个 4000 左
右的灰数,给出其估计值的两个灰数
4002,3998
1
和
4100,3900
2
,显然
1
比
2
更有
价值,亦即
1
比
2
灰度小,若再考虑一个基本值为 4 的灰数,给出灰数
6,2
3
,虽然
1
与
3
的长度都是 4,但
1
比
3
的灰度小是显而易见的。
7.2 灰色预测的概念
7.2.1 灰色系统及灰色预测的概念
1. 灰色系统基本概念
灰色系统产生于控制理论的研究中。
若一个系统的内部特征是完全已知的,即系统的信息是充足完全的,我们称之为白色系统。
若一个系统的内部信息是一无所知,一团漆黑,只能从它同外部的联系来观测研究,这种系统
便是黑色系统。
灰色系统介于二者之间,灰色系统的一部分信息是已知的,一部分是未知的。
区别白色和灰色系统的重要标志是系统各因素间是否有确定的关系。
在工程技术、社会、经济、农业、生态、环境等各种系统中经常会遇到信息不完全的情况。比
如:农业方面,农田耕作面积往往因许多非农业的因素而改变,因此很难准确计算农田产量、产值 ,
这是缺乏耕地面积信息;生物防治方面,害虫与天敌间的关系即使是明确的,但天敌与饵料、害虫
与害虫间的许多关系却不明确,这是缺乏生物间的关联信息;一项土建工程,尽管材料、设备、施
工计划、图纸是齐备的,可是还很难估计施工进度与质量,这是缺乏劳动力及技术水平的信息;一
般社会经济系统,除了输出的时间数据列(比如产值、产量、总收入、总支出等)外,其输入数据
列不明确或者缺乏,因而难以建立确定的完整的模型,这是缺乏系统信息;工程系统是客观实体,
有明确的“内”、“外”关系(即系统内部与系统外部,或系统本体与系统环境),可以较清楚地明确
输入与输出,因此可以较方便地分析输入对输出的影响,可是社会、经济系统是抽象的对象,没有
明确的“内”、“外”关系,不是客观实体,因此就难以分析输入(投入)对输出(产出)的影响,这
是缺乏“模型信息”(即用什么模型,用什么量进行观测控制等信息)。信息不完全的情况归纳起来
有:元素(参数)信息不完全;结构信息不完全;关系信息(特指“内”、“外”关系)不完全;运行
的行为信息不完全。
一个商店可看作是一个系统,在人员、资金、损耗、销售信息完全明确的情况下,可算出该店
的盈利大小、库存多少,可以判断商店的销售态势、资金的周转速度等,这样的系统是白色系统。
遥远的某个星球,也可以看作一个系统,虽然知道其存在,但体积多大,质量多少,距离地球
多远,这些信息完全不知道,这样的系统是黑色系统。
人体是一个系统,人体的一些外部参数(如身高、体温、脉搏等)是已知的,而其他一些参数
如人体的穴位有多少,穴位的生物、化学、物理性能,生物的信息传递等尚未知道透彻,这样的系
统是灰色系统。
显然,黑色、灰色、白色都是一种相对的概念。世界上没有绝对的白色系统,因为任何系统总有
未确知的部分,也没有绝对的黑色系统,因为既然一无所知,也就无所谓该系统的存在了。
2. 灰色系统的特点
灰色系统理论以“部分信息已知、部分信息未知”的 “小样本”、“贫信息”不确定型系统的研究对象。
(1)用灰色数学来处理不确定量,使之量化。
在数学发展史上,最早研究的是确定型的微分方程,即在拉普拉斯决定论框架内的数学。他认为
一旦有了描写事物的微分方程及初值,就能确知事物任何时候的运动。随后发展了概率论与数理统
计,用随机变量和随机过程来研究事物的状态和运动。模糊数学则研究没有清晰界限的事物,如儿
童和少年之间没有确定的年龄界限加以截然划分等,它通过隶属函数来使模糊概念量化,因此能用
模糊数学来描述如语言、不精确推理以及若干人文科学。灰色系统理论则认为不确定量是灰数,用
灰色数学来处理不确定量,同样能使不确定量予以量化。
不确定量 量化(用确定量的方法研究)
1、概率论与数理统计; 2、模糊数学; 3、灰色数学(灰色系统理论)
(2)充分利用已知信息寻求系统的运动规律。
研究灰色系统的关键是如何使灰色系统白化、模型化、优化。
灰色系统视不确定量为灰色量。提出了灰色系统建模的具体数学方法,它能利用时间序列来确定
微分方程的参数。灰色预测不是把观测到的数据序列视为一个随机过程,而是看作随时间变化的灰
色量或灰色过程,通过累加生成和累减生成逐步使灰色量白化,从而建立相应于微分方程解的模型
并做出预报。这样,对某些大系统和长期预测问题,就可以发挥作用。
(3)灰色系统理论能处理贫信息系统。
灰色预测模型只要求较短的观测资料即可,这和时间序列分析,多元分析等概率统计模型要求较
长资料很不一样。因此,对于某些只有少量观测数据的项目来说,灰色预测是一种有用的工具。
3.灰色预测
灰色系统分析方法是通过鉴别系统因素之间发展趋势的相似或相异程度,即进行关联度分析,
并通过对原始数据的生成处理来寻求系统变动的规律。生成数据序列有较强的规律性,可以用它来
建立相应的微分方程模型,从而预测事物未来的发展趋势和未来状态。
灰色预测是用灰色模型 GM(1,1)来进行定量分析的,通常分为以下几类:
(1) 灰色时间序列预测。用等时距观测到的反映预测对象特征的一系列数量(如产量、销量、
人口数量、存款数量、利率等)构造灰色预测模型,预测未来某一时刻的特征量,或者达到某特征
量的时间。
(2) 畸变预测(灾变预测)。通过模型预测异常值出现的时刻,预测异常值什么时候出现在特
定时区内。
(3) 波形预测,或称为拓扑预测,它是通过灰色模型预测事物未来变动的轨迹。
(4) 系统预测,是对系统行为特征指标建立一族相互关联的灰色预测理论模型,在预测系统整体
变化的同时,预测系统各个环节的变化。
上述灰预测方法的共同特点是:
(1)允许少数据预测;
(2)允许对灰因果律事件进行预测,比如
灰因白果律事件 在粮食生产预测中,影响粮食生产的因子很多,多到无法枚举,故为灰
因,然而粮食产量却是具体的,故为白果。粮食预测即为灰因白果律事件预测。
白因灰果律事件 在开发项目前景预测时,开发项目的投入是具体的,为白因,而项目的
效益暂时不很清楚,为灰果。项目前景预测即为灰因白果律事件预测。
(3)具有可检验性,包括:建模可行性的级比检验(事前检验),建模精度检验(模型检
1,2,3
验),预测的滚动检验(预测检验)。
7.2.2 预备知识
1.生成数
分为累加生成数(AGO)与累减生成数(IAGO)
(1) 累加生成数 1-AGO 指一次累加生成。
记原始序列为
(0) (0) (0) (0)
{ (1), (2),..., ( )}X x x x n
生成序列为
(1) (1) (1) (1)
{ (1), (2),..., ( )}X x x x n
上标“0”表示原始序列,上标“1”表示一次累加生成序列。其中,
(1) (0) (1) (0)
0
( ) ( ) ( 1) ( )
k
i
x k x i x k x k
(2) 累减生成数(IAGO) 是累加生成的逆运算。
记原始序列为
(1) (1) (1) (1)
{ (1), (2),..., ( )}X x x x n
,对
(1)
X
做一次累减生成,则得生成序列
(0) (0) (0) (0)
{ (1), (2),..., ( )}X x x x n
,其中,
(0) (1) (1)
( ) ( ) ( 1)x k x k x k
,规定
(1)
(0) 0x
。
累加生成与累减生成之间的关系如下图所示:
1-AGO IAGO
(0)
X
(1)
X
(0)
X
2.关联度
为了定量地研究两个事物间的关联程度,人们提出了各种形式的指数,如相关系数和相似系数
等等。这些指数大多以数理统计原理为基础,需要足够的样本个数或者要求数据服从一定的概率分
布。
在客观世界中,有许多因素之间的关系是灰色的,分不清哪些因素之间关系密切,哪些不密切
这样就难以找到主要矛盾和主要特性。灰因素关联分析,目的是定量地表征诸因素之间的关联程度 ,
从而揭示灰色系统的主要特性。关联分析是灰色系统分析和预测的基础。
关 联分析是 一 种 相 对 性 的 排序分析。从 思 路 上 来 看 , 源于几何 直 观 。 如 图 7.1 所 示 的
A、B、C、D 四个时间序列,曲线 A 与 B 比较平行,我们就认为 A 与 B 的关联程度大。曲线 C 与
A 随时间变化的方向很不一致,认为 A 与 C 的关联程度较小。曲线 A 与 D 相差最大,则认为两者
的关联程度最小。
将曲线 A 与 B、C、D 的关联程度分别记为 r
AB
,r
AC
,r
AD
,
则它们之间有如下排序关系:
r
AB
,r
AC
,r
AD
,相应的序列{r
AB
,
r
AC
,
r
AD
}称为关联序。
x
A
B
C
D
t
图 7.1 时间序列的几何关联性
由此可见,关联分析实质上是一种曲线间几何形状的分析比较,即几何形状越接近,则发展变
化趋势越接近,关联程度越大;反之亦然。