没有合适的资源?快使用搜索试试~ 我知道了~
第07章 对策论1
需积分: 0 0 下载量 176 浏览量
2022-08-04
16:25:50
上传
评论
收藏 176KB PDF 举报
温馨提示
试读
13页
§1引言社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾,应用科学的方法来解决这样的问题开始于 17 世纪的科学家,如 C.,Huygens 和 W.,L
资源详情
资源评论
资源推荐
-154-
第七章 对策论
§1 引言
社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾,应用科学的方法来
解决这样的问题开始于 17 世纪的科学家,如 C.,Huygens 和 W.,Leibnitz 等。现代对
策论起源于 1944 年 J.,Von Neumann 和 O.,Morgenstern 的著作《Theory of Games and
Economic Behavior》。
对策论亦称竞赛论或博弈论。是研究具有斗争或竞争性质现象的数学理论和方法。
一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。对策论发展
的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常
生活等有着密切的联系,并且处理问题的方法又有明显特色。所以日益引起广泛的注意。
在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为。具有竞争或对
抗性质的行为称为对策行为。在这类行为中。参加斗争或竞争的各方各自具有不同的目
标和利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并
力图选取对自己最为有利或最为合理的方案。对策论就是研究对策行为中斗争各方是否
存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。
§2 对策问题
对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的
努力而是各方所采取的策略的综合结果。
先考察一个实际例子。
例 1(囚徒的困境) 警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大
量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个
人都知道:如果他们双方都不供认,将被以持有大量伪币罪被各判刑 18 个月;如果双
方都供认伪造了钱币,将各被判刑 3 年;如果一方供认另一方不供认,则供认方将被从
宽处理而免刑,但另一方面将被判刑 7 年。将嫌疑犯
A
、
B
被判刑的几种可能情况列
于表 1。
表 1
嫌疑犯 B
供认 不供认
嫌疑犯 A
供认
不供认
(3,3) (0,7)
(7,0) (1.5,1.5)
表 1 中每对数字表示嫌疑犯
BA、 被判刑的年数。如果两名疑犯均担心对方供认并希
望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。
从这一简单实例中可以看出对策现象中包含有的几个基本要素。
2.1 对策的基本要素
(i)局中人
在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局
中人。通常用
I
表示局中人的集合.如果有 n 个局中人,则 },,2,1{ nI L
=
。一般要求
一个对策中至少要有两个局中人。在例 1 中,局中人是
BA、 两名疑犯。
(ii)策略集
一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参
加对策的每一局中人
i
,
I
i∈
,都有自己的策略集
i
S 。一般,每一局中人的策略集中
至少应包括两个策略。
-155-
(iii)赢得函数(支付函数)
在一局对策中,各局中人所选定的策略形成的策略组称为一个局势,即若
i
s 是第 i
个局中人的一个策略,则
n
个局中人的策略组
),,,(
21 n
ssss L=
就是一个局势。全体局势的集合 S 可用各局中人策略集的笛卡尔积表示,即
n
SSSS ×××= L
21
当局势出现后,对策的结果也就确定了。也就是说,对任一局势,
Ss∈ ,局中人
i 可以得到一个赢得 )(sH
i
。显然, )(sH
i
是局势 s 的函数,称之为第 i 个局中人的赢
得函数。这样,就得到一个向量赢得函数
))(,),(()(
1
sHsHsH
n
L
=
。
本节我们只讨论有两名局中人的对策问题,其结果可以推广到一般的对策模型中
去。
2.2 零和对策(矩阵对策)
零和对策是一类特殊的对策问题。在这类对策中,只有两名局中人,每个局中人都
只有有限个策略可供选择。在任一纯局势下,两个局中人的赢得之和总是等于零,即双
方的利益是激烈对抗的。
设局中人Ⅰ、Ⅱ的策略集分别为
},,{
11 m
S
α
α
L= , },,{
12 n
S
β
β
L=
当局中人Ⅰ选定策略
i
α
和局中人Ⅱ选定策略
j
β
后,就形成了一个局势 ),(
ji
β
α
,可见
这样的局势共有
mn 个。对任一局势 ),(
ji
β
α
,记局中人Ⅰ的赢得值为
ij
a ,并称
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎣
⎡
=
mnmm
n
n
aaa
aaa
aaa
A
L
LLLL
L
L
21
22221
11211
为局中人Ⅰ的赢得矩阵(或为局中人Ⅱ的支付矩阵)。由于假定对策为零和的,故局中
人Ⅱ的赢得矩阵就是
A− 。
当局中人Ⅰ、Ⅱ和策略集
1
S 、
2
S 及局中人Ⅰ的赢得矩阵
A
确定后,一个零和对策
就给定了,零和对策又可称为矩阵对策并可简记成
};,{
21
ASSG = 。
例 2 设有一矩阵对策
};,{
21
ASSG
=
,其中 },,{
3211
α
α
α
=S ,
},,,{
43212
β
β
β
β
=S ,
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
⎡
−−
−−
=
161006
1018214
2230612
A
从
A中可以看出,若局中人Ⅰ希望获得最大赢利 30,需采取策略
1
α
,但此时若局
中人Ⅱ采取策略
4
β
,局中人Ⅰ非但得不到 30,反而会失去 22。为了稳妥,双方都应考
虑到对方有使自己损失最大的动机,在最坏的可能中争取最好的结果,局中人Ⅰ采取策
略
321
α
α
α
、、 时,最坏的赢得结果分别为
-156-
22}22,30,6,12min{
−
=
−−
2}10,18,2,14min{ =
10}16,10,0,6min{
−
=−
−
其中最好的可能为
2}10,2,22max{
=
−− 。如果局中人Ⅰ采取策略
2
α
,无论局中人Ⅱ
采取什么策略,局中人Ⅰ的赢得均不会少于 2。
局中人Ⅱ采取各方案的最大损失为
14}6,14,12max{
=
−
, 2}0,2,6max{ =− ,
30}10,18,30max{
=
− ,和 16}16,10,22max{
=
−
。当局中人Ⅱ采取策略
2
β
时,其损
失不会超过 2。注意到在赢得矩阵中,2 既是所在行中的最小元素又是所在列中的最大
元素。此时,只要对方不改变策略,任一局中人都不可能通过变换策略来增大赢得或减
少损失,称这样的局势为对策的一个稳定点或稳定解。
定义 1 设
),( yxf 为一个定义在 Ax
∈
及
B
y
∈
上的实值函数,如果存在 Ax ∈* ,
By ∈*
,使得对一切 Ax∈ 和
B
y
∈ ,有
)*,(*)*,(*),( yxfyxfyxf
≤
≤
则称
*)*,( yx 为函数 f 的一个鞍点。
定义 2 设
};,{
21
ASSG = 为矩阵对策,其中 },,,{
211 m
S
α
α
α
L
=
,
},,,{
212 n
S
β
β
β
L= ,
nmij
aA
×
= )( 。若等式
**
maxminminmax
jiij
i
j
ij
j
i
aaa
=
=
(1)
成立,记
** jiG
aV = ,则称
G
V 为对策
G
的值,称使(1)式成立的纯局势 ),(
** ji
β
α
为
对策
G 的鞍点或稳定解,赢得矩阵中与 ),(
** ji
β
α
相对应的元素
** ji
a 称为赢得矩阵的鞍
点,
*i
α
与
*j
β
分别称为局中人Ⅰ与Ⅱ的最优纯策略。
给定一个对策
G ,如何判断它是否具有鞍点呢?为了回答这一问题,先引入下面
的极大极小原理。
定理 1 设
};,{
21
ASSG = ,记
ij
j
i
aminmax
=
μ
,
ij
i
j
amaxmin
−
=
ν
,则必有
0≤+
ν
μ
。
证明
)(minmax
ij
i
j
a−=
ν
,易 见
μ
为Ⅰ的最小赢得,
ν
为Ⅱ的最小赢得,由于 G
是零和对策,故 0≤
+
ν
μ
必成立。
定理 2 零和对策
G
具有稳定解的充要条件为 0
=
+
ν
μ
。
证明:(充分性)由
μ
和
ν
的定义可知,存在一行例如
p
行,
μ
为
p
行中的最小元
素,且存在一列例如
q 列,
ν
− 为 q 列中的最大元素。故有
μ
≥
pq
a 且
ν
−≤
pq
a
又因
0=+
ν
μ
,所以
ν
μ
−= ,从而得出
μ
=
pq
a ,
pq
a 为赢得矩阵的鞍点, ),(
qp
β
α
为 G 的稳定解。
(必要性)若
G 具有稳定解 ),(
qp
β
α
,则
pq
a 为赢得矩阵的鞍点。故有
pqpj
j
ij
j
i
aaa
=
≥= minminmax
μ
pqiq
i
ij
i
j
aaa
=
≤=− maxmaxmin
ν
剩余12页未读,继续阅读
那你干哈
- 粉丝: 28
- 资源: 289
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于FREERTOS、LCD1602、MCP3202(SPI接口)2通道ADC采集proteus仿真设计
- 基于 Java+NLP的微博舆情分析系统
- 基于Python+NLPIR的网易新闻舆情分析系统
- 基于STM32F103C8T6、LCD1602、MCP3204的 4通道12位ADC转换proteus仿真设计
- 字模转换软件,适用微雪汉字库
- 实现函数P197.4.ms11
- 基于python+flask的舆情分析系统,包括爬虫、可视化、数据分析、情感分析等模块
- 文本检测-基于Pytorch实现的可微分二值化实时场景文本检测算法-附项目源码-优质项目实战.zip
- 8.2.cpp
- 开源流媒体框架ZLMediaKit C API JAVA实现,打造属于自己的流媒体服务
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0