【免费】第07章对策论1资源-CSDN文库

需积分: 0 176 浏览量 2022-08-04 16:25:50 上传评论收藏 176KB PDF 举报

资源详情

资源评论

资源推荐

-154-

第七章对策论

§1 引言

社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾，应用科学的方法来

解决这样的问题开始于 17 世纪的科学家，如 C.，Huygens 和 W.，Leibnitz 等。现代对

策论起源于 1944 年 J.，Von Neumann 和 O.，Morgenstern 的著作《Theory of Games and

Economic Behavior》。

对策论亦称竞赛论或博弈论。是研究具有斗争或竞争性质现象的数学理论和方法。

一般认为，它既是现代数学的一个新分支，也是运筹学中的一个重要学科。对策论发展

的历史并不长，但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常

生活等有着密切的联系，并且处理问题的方法又有明显特色。所以日益引起广泛的注意。

在日常生活中，经常看到一些具有相互之间斗争或竞争性质的行为。具有竞争或对

抗性质的行为称为对策行为。在这类行为中。参加斗争或竞争的各方各自具有不同的目

标和利益。为了达到各自的目标和利益，各方必须考虑对手的各种可能的行动方案，并

力图选取对自己最为有利或最为合理的方案。对策论就是研究对策行为中斗争各方是否

存在着最合理的行动方案，以及如何找到这个合理的行动方案的数学理论和方法。

§2 对策问题

对策问题的特征是参与者为利益相互冲突的各方，其结局不取决于其中任意一方的

努力而是各方所采取的策略的综合结果。

先考察一个实际例子。

例 1（囚徒的困境）警察同时逮捕了两人并分开关押，逮捕的原因是他们持有大

量伪币，警方怀疑他们伪造钱币，但没有找到充分证据，希望他们能自己供认，这两个

人都知道：如果他们双方都不供认，将被以持有大量伪币罪被各判刑 18 个月；如果双

方都供认伪造了钱币，将各被判刑 3 年；如果一方供认另一方不供认，则供认方将被从

宽处理而免刑，但另一方面将被判刑 7 年。将嫌疑犯

、

被判刑的几种可能情况列

于表 1。

表 1

嫌疑犯 B

供认不供认

嫌疑犯 A

供认

不供认

（3，3）（0，7）

（7，0）（1.5，1.5）

表 1 中每对数字表示嫌疑犯

BA、被判刑的年数。如果两名疑犯均担心对方供认并希

望受到最轻的惩罚，最保险的办法自然是承认制造了伪币。

从这一简单实例中可以看出对策现象中包含有的几个基本要素。

2.1 对策的基本要素

（i）局中人

在一个对策行为（或一局对策）中，有权决定自己行动方案的对策参加者，称为局

中人。通常用

表示局中人的集合．如果有 n 个局中人，则 },,2,1{ nI L

。一般要求

一个对策中至少要有两个局中人。在例 1 中，局中人是

BA、两名疑犯。

（ii）策略集

一局对策中，可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参

加对策的每一局中人

，

i∈

，都有自己的策略集

S 。一般，每一局中人的策略集中

至少应包括两个策略。

-155-

（iii）赢得函数（支付函数）

在一局对策中，各局中人所选定的策略形成的策略组称为一个局势，即若

s 是第 i

个局中人的一个策略，则

个局中人的策略组

),,,(

21 n

ssss L=

就是一个局势。全体局势的集合 S 可用各局中人策略集的笛卡尔积表示，即

SSSS ×××= L

当局势出现后，对策的结果也就确定了。也就是说，对任一局势，

Ss∈ ，局中人

i 可以得到一个赢得 )(sH

。显然， )(sH

是局势 s 的函数，称之为第 i 个局中人的赢

得函数。这样，就得到一个向量赢得函数

))(,),(()(

sHsHsH

。

本节我们只讨论有两名局中人的对策问题，其结果可以推广到一般的对策模型中

去。

2.2 零和对策（矩阵对策）

零和对策是一类特殊的对策问题。在这类对策中，只有两名局中人，每个局中人都

只有有限个策略可供选择。在任一纯局势下，两个局中人的赢得之和总是等于零，即双

方的利益是激烈对抗的。

设局中人Ⅰ、Ⅱ的策略集分别为

},,{

11 m

L= ， },,{

12 n

当局中人Ⅰ选定策略

和局中人Ⅱ选定策略

后，就形成了一个局势 ),(

，可见

这样的局势共有

mn 个。对任一局势 ),(

，记局中人Ⅰ的赢得值为

a ，并称

⎥

⎦

⎤

⎢

⎣

⎡

mnmm

aaa

LLLL

22221

11211

为局中人Ⅰ的赢得矩阵（或为局中人Ⅱ的支付矩阵）。由于假定对策为零和的，故局中

人Ⅱ的赢得矩阵就是

A− 。

当局中人Ⅰ、Ⅱ和策略集

S 、

S 及局中人Ⅰ的赢得矩阵

确定后，一个零和对策

就给定了，零和对策又可称为矩阵对策并可简记成

};,{

ASSG = 。

例 2 设有一矩阵对策

};,{

ASSG

，其中 },,{

3211

=S ，

},,,{

43212

=S ，

⎥

⎦

⎤

⎢

⎣

⎡

−−

161006

1018214

2230612

从

A中可以看出，若局中人Ⅰ希望获得最大赢利 30，需采取策略

，但此时若局

中人Ⅱ采取策略

，局中人Ⅰ非但得不到 30，反而会失去 22。为了稳妥，双方都应考

虑到对方有使自己损失最大的动机，在最坏的可能中争取最好的结果，局中人Ⅰ采取策

略

321

、、时，最坏的赢得结果分别为

-156-

22}22,30,6,12min{

−

−−

2}10,18,2,14min{ =

10}16,10,0,6min{

−

=−

−

其中最好的可能为

2}10,2,22max{

−− 。如果局中人Ⅰ采取策略

，无论局中人Ⅱ

采取什么策略，局中人Ⅰ的赢得均不会少于 2。

局中人Ⅱ采取各方案的最大损失为

14}6,14,12max{

−

， 2}0,2,6max{ =− ，

30}10,18,30max{

− ，和 16}16,10,22max{

−

。当局中人Ⅱ采取策略

时，其损

失不会超过 2。注意到在赢得矩阵中，2 既是所在行中的最小元素又是所在列中的最大

元素。此时，只要对方不改变策略，任一局中人都不可能通过变换策略来增大赢得或减

少损失，称这样的局势为对策的一个稳定点或稳定解。

定义 1 设

),( yxf 为一个定义在 Ax

∈

及

∈

上的实值函数，如果存在 Ax ∈* ，

By ∈*

，使得对一切 Ax∈ 和

∈ ，有

)*,(*)*,(*),( yxfyxfyxf

≤

则称

*)*,( yx 为函数 f 的一个鞍点。

定义 2 设

};,{

ASSG = 为矩阵对策，其中 },,,{

211 m

，

},,,{

212 n

L= ，

nmij

= )( 。若等式

maxminminmax

jiij

aaa

（1）

成立，记

** jiG

aV = ，则称

V 为对策

的值，称使（1）式成立的纯局势 ),(

** ji

为

对策

G 的鞍点或稳定解，赢得矩阵中与 ),(

** ji

相对应的元素

** ji

a 称为赢得矩阵的鞍

点，

与

分别称为局中人Ⅰ与Ⅱ的最优纯策略。

给定一个对策

G ，如何判断它是否具有鞍点呢？为了回答这一问题，先引入下面

的极大极小原理。

定理 1 设

};,{

ASSG = ，记

aminmax

，

amaxmin

−

，则必有

0≤+

。

证明

)(minmax

a−=

，易见

为Ⅰ的最小赢得，

为Ⅱ的最小赢得，由于 G

是零和对策，故 0≤

必成立。

定理 2 零和对策

具有稳定解的充要条件为 0

。

证明：（充分性）由

和

的定义可知，存在一行例如

行，

为

行中的最小元

素，且存在一列例如

q 列，

− 为 q 列中的最大元素。故有

≥

a 且

−≤

又因

0=+

，所以

−= ，从而得出

a ，

a 为赢得矩阵的鞍点， ),(

为 G 的稳定解。

（必要性）若

G 具有稳定解 ),(

，则

a 为赢得矩阵的鞍点。故有

pqpj

aaa

≥= minminmax

pqiq

aaa

≤=− maxmaxmin

剩余12页未读，继续阅读

评论收藏

内容反馈

那你干哈

粉丝: 28
资源: 289

第07章对策论1

评论0

最新资源

第07章 对策论1

评论0

算法第07章 对策论.pdf

第07章 对策论.pdf

数学建模-7第七章 对策论.zip

MATLAB技术资料---第07章 对策论.zip

数学建模-7.第七章 对策论.zip

第07章 对策论.zip

matlab数学建模算法全

30个重要数学模型

30个常用数学模型与其对应的获奖论文

数学建模的29个通用模型及matlab解法.zip

算法大全matlab全国大学生数学建模材料

数学建模32种常规方法.PDF详细讲解

matlab的算法大全

数模大全 数学建模算法大全

数学建模-30种算法-汇总大全.zip

数学建模常用32种算法.zip

常用数学模型及其算法

BurpLoaderKeygen.jar.zip

最新版ISO/IEC 27001:2022、ISO 27002:2022中英文合集

Goby红队版-win-x64-2.4.7版本

Chrome Header Editor 插件

ISO SAE 21434-2021 中文版.pdf

OpenVAS GVM 中文翻译补丁

安全认证cisp教材全套

STM32F103C8T6核心板-电路原理图1.PDF

软件工程导论(第六版)课后习题答案1

现代永磁同步电机控制原理及MATLAB仿真__袁雷编著1

OpenVAS离线资源

最新资源

第07章对策论1

算法第07章对策论.pdf

第07章对策论.pdf

数学建模-7第七章对策论.zip

MATLAB技术资料---第07章对策论.zip

数学建模-7.第七章对策论.zip

第07章对策论.zip

数模大全数学建模算法大全