论文研究-基于演化博弈的讨价还价策略研究.pdf

所需积分/C币:10 2019-09-20 18:25:00 679KB .PDF

论文研究-基于演化博弈的讨价还价策略研究.pdf,  通过建立“双种群”复制动态模型,研究了有限理性假设下“多对多”讨价还价的策略演化问题,证明了只有严格纳什均衡才能成为“多对多”讨价还价的演化稳定策略. 并利用计算机仿真发现:当买卖双方种群的初始策略为随机分布时,讨价还价的演化稳定策略以最大概率收敛到对称纳什均衡,产生买卖双方最大初始期望收益乘积的纳什均衡可以比较准确地预测“多对多”讨价还
第5期 詹文杰,等:基于演化博弈的讨价还价策略研究 1183 式(3)和(4)右边同除以(V-C,进行归一化处理,可得到表1.买卖双方收益归一化处理后所带来的 好处是:增加了模型的一般化程度,即模型不需要考虑V和C的具体数值V>C 表1买卖双方一次随机匹配后的归一化收益 0.00.10.20.30.40.50.60.70.80.91.0 0.50,0.45,0.40,0.35,0.30,0.25,0.20,0.15,0.10,0.05,0.00 0.500.550.600.650.700.750.800.850900951.0 0.5,0.50,0.45,0.40,0.35,0.30,0.25,0.20,0.15,0.10,0 0.450.500.550.600.650.700.750.800.850.900 0.60,0.55,0.50,0.45,0.40,0.35,0.30,0.25,020,0 0 0.2 0.400.450.500.550.600.650.700.750.80 0.65,0.60,0.55,0.50,0.45,0.40,0.35,030,0, 0.3 0.350.400.450.500.550.600.650.700 0 0.4 0.70,0.65,0.60,0.55,0.50,0.45,0.40,0,0, 0.300.350.400.450.500.550.600 0 0.75,0.70,0.65,0.60,0.55,0.50,0, 0 0 0.250.300.350.400.450.500 0 0.80,0.75,0.70,0.65,0.60,0, 0. 0 0.6 0.200.250.300.350.400 0.85,0.80,0.75,0.70,0 0 0. 0.7 0.150.200.250.300 0.90,0.85,0.80,0,0,0,0, 0.100.150.200 0000000 00000000000 00000000000000000 0. 0 0 0 0.9 .95,0.90,0, 0, 0.050.100 0.10,0, 0. 0000 0. 00000 00000 0.000 0 注:在每个单元中,上方数字为买方收益,下方数字为卖方收益:;有下划线的单元为纳什均衡 表1进行静态纳什均衡分析,可得:买卖双方一次随机匹配的纯策略纳什均衡为81+6;=1.0,即表1中 的反对甪线·在这11组纯策略纳什均衡中,有如下9组严格策略纳什均衡:(s;=0.1-,s;=0.9),(s:=O.2, =0.8),(s:=0.3,s;=07),(s;=0.4,s;=0.6),(s=0.5,s;=0.5),(sz=0.6,s;=0.4),(sz=0.7, s;=0.3),(8=0.8,;=0.2),(s;=0.9.s=0.1),其中(;=0.5.5=0.5)又称为对策纳什均衡;有2组 纯策略不严格策略纳什均衡:(s;=0,S;=1.0)和(s;=1.0,;=0) 通过表1还可以看岀:头卖双方的策略空间相同,且双方的收益对称(即第讠行j列的头方收益等于第 j行i列的卖方收益).因此,该博弈是一个对称博弈,可得如下对称收益矩阵A: 0.500.450.400.350.300.250.200.150.100.050.00 0.550.500.450.400.350.300.250.200.150.100 0.600.550.500.450.400.350.300.250.2000 0.650.600.550.500.450.400.350.30000 0.700.650.600.550.500.450.400 0 0.750.700.650.600.550.50000 0 0.800.750.700.650.6000000 0 0.850.800.750.700000000 0.900.850.8000000000 0.950.9000 0 0 0 0 1.0000000 0 0 0 22复制动态方程 令E(πb(切)和E(πα;(t)分别为采取第讠种策咯的买方和第j种策略的卖方在第t个演化阶段的归一 1184 系统工程理论与实践 第34卷 化期望收益.由于在每一个阶段买卖双方随机匹配,且存在无限多的买方和卖方,有: E(xb()=∑a/(1) E(xa1(1)=∑an2(),j=0,1,…,10 邇过式(⑥)和(7)不难发现:在任意一个演化阶段,每种头方策略的賜望收益仅与该阶段中各种卖方策 略的比例相关,而与其自身策略的比例无关;同样每种卖方策略的期望收益也仅与该阶段中各种买方策略 的比例相关,而与其自身策略的比例无关 令E(()和E(元()分别为全体买方和卖方在第个演化阶段的加权平均收益,有: E(b(+)=∑x1(E(mb1(1)=∑x(∑ay( 8 E(元a(t)=∑y()E(x1()=∑(t)∑;;() 根据复制动态方程25-26,在第t+1个演化阶段买卖双各种策略在种群中的比例分别为 10 Cil (t)∑=0a;y/(t) (t+1)=x( E(Tb: (t) 2=0,1 10 E(7O)∑k=0m(1)∑=0(t) (10 e(a 31(t+1)=3/(t E(a(t)n(t)∑=0“)=0,1,…,10 23模型分析 定理1在双种群演化博弈中,有且仅有严格纳什均衡可以成为演化稳定策略( evolutionarily stable strat- 简称ESS)1 证明①充分性:严格纳什均衡一定是演化稳定簧略. 假设存在严格纳什均衡(s383),其中s(s∈S)为买方策略,S(s,∈S)为卖方策略,S为策略空间. 根据严格纳什均衡的定义有:对于8k≠8;,Vsk∈S,sk的收益均满足U(sk,6)<U(s;s).同理,对于 sk≠s;vsk∈S,sk的收益也满足U(s,sk)<U(s;,s;).因此,(s;,s;)是演化稳定均衡 ⑦必要性:演化稳定策略一定是严格纳什均衡 纳什均衡分为严格纳什均衡和不严格纳什均衡两种类型,其中不严格纳什均衡包括纯策略不严格纳什均 衡和混合策略纳什均衡两种形式.下面,我们通过必要性命题的逆否命题来进行证明,即证明两种不严格纳 什均衡不是演化稳定策略.具体如下 假设,存在纯策略不严格纳什均衡(s;5).根据不严格纳什均衡的定义有:对于k≠6;,Vsk∈S,sk的 收益均满足U(sk,8)≤U(68),且存在5m≠81满足U(sm,s)=U(5,83).如果在买方种群中加入微 小扰动e(sm)>0,扰动后的买方种群为(sm)+(1-);因为U(sm,8)=U(s,6),所以扰动后的买方 种群保持现状而无法回到(s;s).同理,对于sk≠sj,Vsk∈S,如果在卖方种群中加入微小扰动后;由于 U(s:Sm)=U(s,s),使得扰动后的卖方种群冋样也无法回到(ss).因此,纯策略不严格纳什均衡不是演 化稳定策略 假设.=(1,P2,…,D1)为买方的混合策略,q=(q1,g2,…,q1)为卖方的混合策略,且(,q)构成 混合策略纳什均衡.根据混合策咯纳什均衡的定义有:在卖方为φ的情况下,各种买方纯策略的期望收益都 应该相同,我们有{U(P,q)=U(mq)p,p;∈C(m)};其中,Pz和P;分别表示纯策略6和s;的概率向 量,C()是γ中概率大于零的纯策略的集合.一旦在卖方种群中加入徵小扰动,卖方新的混合策略为q*≠q 如果此时头方各种纯策略的期望收益不尽相同,即存在{U(Pz,q*)≠U(P;,q")≠},那么我们就叮求出 pm= argmax{U(Pk,q*)pk∈C(m)},使得U(m,q*)>U(,q*),(,q)不是演化稳定策略;如果此时买方各 种纯策略的期望收益还是相同,(,α)将保持现状,无法回到(q).因此混合策略纳什均衡(,q)不是演 化稳定策略.同理,在买方种群中加入微小扰动后,(,q)也不是演化稳定策略. 1. Weibul进行了类似定理的证明(见参考文献|25],pp.149),我们补充和完善了定理的证明 第5期 詹文杰,等:基于演化博弈的讨价还价策略研究 1185 3数值仿真 通过式(10)和(1〕)可得复制动态演化模型为递推公式组成的非线性系统,很难进行解析求解.为了检 验模型的有效性和定理的正确性,我们进行∫如下数值仿真:每一次实验中,头方和卖方种群的初始策略随 机产生即x:(0)和y(0)均为随机数,且满足∑=0x:(0)=1.0和∑/=0(0)=10;在初始条件已知的情 况下,买方和卖方的策略种群分别依据式(10)和(1)进行演化;当买方种群和卖方种群都收敛到了一个纯 策略时,演化结束 表2仿真实验中演化稳定策略的次数统计 3.1定理的检验 研究共进行了500次仿真实验,表251000.10.203040.50.60.70.80910 给出了随机初始种群下各种演化稳定策略的0000000000000 次数统计结果.可以看出:模型的演化稳定0.100000000010 策略全部收敛到了严格纳什均衡,定理得到了0.2000000001230 检验.其中,收敛到对称纳什均衡(S;=0.5,0.300000002539000 s;=0.5)的频次最高,为40.62%;收敛到其他0400000012270000 严格纳什均衡的频次以对称纳什均衡为中心05000002031000000 依次递减,且基本呈对称分布如收敛到(1=0600001228000000 0.70002446 0 0000 0.4,s;=0.6)的频次与收敛到(s;=0.6,5j08001100 04)的频次相差不大,分别为2445%和 0 0000 000000 24.49%,依此类推 1.00000 0 0000 3.2初始状态与演化稳定策略的关系 在仿真实验中发现一个有趣的现象,即初始状态下期望收益最大的买方或卖方策略很可能成为最终的演 化稳定策略.依据定理和实验观察,本文提出如下的经验公式来描述初始状态与演化稳定策略的关系. 令x;(0)和y(0)(,-0,1,…,10)分别为买方和卖方的策略初始状态,通过式(6)和(7)分别求出所 有买方和卖方的期望收益初始值,分别用E(b2(0)和E(a;(0)表示.可得: (9,9)= argillan{E(xb(O)xE(u3(O)s+s;=1.0},,=1,2,…,10 (12) 显然s+59=1.0,即s,s9表示产生最大初始期望收益乘积的纳什均衡我们用式(12)所求出的纳什 均衡来预测最终的演化稳定策略,在50,000次仿真实验中,有42,342次预测正确,准确率达到84.68%.因此, 可以得出如下结论:在讨价还价的策略演化过程中,产生最大初始期望收益乘积的纳什均衡(即S9,s9)可以 比较准确地预测最终的演化稳定簧略(ESS) 下面,我们解释为什么在随机初始状态下,演化稳定策略收敛到对称纳什均衡的频率最大.假设,买方和 卖方种群的初始策略状态随机,即x(O)和y(0)(,=0,1,…,10)均为随机数,用z(O)和70)分别表示 每种纯策略初始状态的均值,可得: (0)-x2(0) 71(0)=了2(0) y1 其中a和β为常数,通常情况下a==1/11 令B(πb(0)和E(πa;(0)分别表示各种纯策略初始状态均值下的期望收益.根据式(6)和(7)有: E(rb(0)=∑a,列0)=BA 0.1 E(xa1(O)-∑a1(0)=aA,j=0,1,…,10 i=0 其中,A2和A;分别表示对称收益矩阵A的行向量根据式(5)有:A0=2.75,A1=3.25,A2=360 A3=380,A4=3.85,A5=3.75,A6=3.50,A7=3.10,A8=2.55,Ag=1.85,A10=1.00 令E;(0)=E(πb;(0)×E(πa(0).根据式(15)和(16),可得所有满足严格纳什均衡的E;(0) 19(0)=A1A9aB=E9,1(0)=49A1a=6.0125a;同理,E2.8(0)=E82(0)=9.18a6,E3,7(0) E7,3(0)=11.78a3,E46(0)=E6,4(0)=134750,E5.5(0)=14.8225a3.对它们从大到小依次排序有 E5,5(0)>[E4,6( (0)>E3,7(0)=E7,8(0)>[E28(0)=E8,2(0)>E19(0)=E91(0)(17) 1186 系统工程理论与实践 第34卷 从不等式(17)可得:1)对称纳什均衡(=0.5,5=0.5)所产生的初始状态均值下期望收益的乘积最 大;2)与其相邻的两个严格纳什均衡(s2=0.4,s;=0.6)和(s2=0.6,s=0.4)所产生的乘积次之,且两者 相等:3)其余以此类推.因此,E,(0)的大小顺序在一定程度上解释了为什么在随机初始状态下,演化稳定 策略收敛到对称纳什均衡的频次最高,而收敛到其他严格纳什均衡的颎次依次递减且对称分布 3.3演化稳定策略的收敛过程 演化博弈比经典博弈的优势是不仅能找到均衡,而且还可以描述均衡形成的过程.但是,现有的演化博 弈理论中所提到的李雅普诺夫稳定、渐逃稳定和指数稳定等概念μ25,主要描述的是演化稳定策咯邻域的收 敛过程缺乏对其整个收敛过程(0<t<∞)的描述,如演化稳定策略在其整个收敛过程中是否满足单调性 为此我们在仿真实验中对上述问题进行∫探讨.硏究发现:绝大部分演化稳定策略的收敛过程是单调的,即 演化稳定策略在种群中所占比例的一阶导数在任意演化阶段都不小于0(x(t)≥0或v;(t)≥0);但是,有极 少数演化稳定策略的收敛过程不满足单调性即在其收敛过程中会出现()<0或(1)<0的现象 图2给出了一个演化稳定策略的收敛过程非单调的特例.在该例子中,买卖双方种群的初始策略分别 为:x:(0)=(0.1243,0.0192,0,1017.0.0157,0.1931,0.1386,0.1770.068,0.0217,0.0849,0.0564)和v1(0) (0.1162,0.0581,0.0300,0.0642,0.0848,0.0836,0.1700,0.0504,0.1268,0.1179,0.0981).从图1和图2中可以看 出:演化稳定策略是(s=0.4,5;=06);其中,买方的演化稳定策略s4在其种群中所占比例的一阶导数在 任意演化阶段都不小于0,即4(t)≥0(0<t<∞);而卖方的演化稳定策略s6在其种群中所占比例的一阶 导数在t∈[4,18阶段出现∫小于0情况.即v(<0(4≤t≤18).造成这种现象的原因是:每种卖方策略 各个演化阶段的期望收益是由买方策略的种群所决定的(见式(7),而在t∈[4,18阶段,由于x5(t)和6(t) 的显著存在,使得(t)和y4(t)的期望收益大于6(t);在其后的演化阶段,随着x(t)和r6(t)的逐渐消上 5(t)和y4(t)也逐渐减少直至消广 y() 06 5 04 图1x:4()的单调收敛过程 图2y6(t)的非单调收敛过程 4结论与展望 通过建立“双种群”复制动态演化博弈模型,本文硏究了买卖双方直接交易的多对多讨价还价中的交易 策略及其动态过程,得出如下结论:当头卖双方种群的初始策略为随机分布时,多对多讨价还价的演化稳定 策略一定为严格纳什均衡,并且以最大概寳收敛到其中的对称纳什均衡,即所谓的“五-五分成”,收敛到其 他严格纳什均衡的概率则以对称纳什均衡为中心逐渐递减;产生买卖双方最大初始期望收益乘积的纳什均衡 可以比较准确地预测最终的演化稳定策略,且演化稳定策略的收敛过程不一定都是单调的. 为了使结论具有稳定性,研究中还考虑了其他形式的策略空间,如S={0,0.05.0.1,,1.0}和 {0,0.01,0.02,…,1.0},均得到了相同的结论.斫究丰富了讨价还价理论:在“完全理性”的假设条件下,经典 理论认为,“五-五分成”(即对称纳什均衡)是“一对一”讨价还价的约定俗成解或“聚点均衡”,即使产生偏 离也是由于买卖双方所处的地位不同(例如“破产点”的不同2-3);在“有限理性”假设条件下,随机初始策 略种群的“多对多”讨价还价以最大概率收敛到“五-五分成”的对称纳什均衡,产生偏离的原因是买卖双 方种群的初始策略分布不同.研究具仃实际意义:在设计多边谈判支持系统( negotiation support syste,简 称NSS)时,应该更多地关注买卖双方的初始策略分布情况,理由是产生买卖双方最大初始期望收益乘积的 纳什均衡可以比较准确地预测“多对多”讨价还价的最终结果 研究没有考虑讨价还价参与方的禀赋差异,即假设所有买方对标的物的估计相同,所有卖方具有同样的 第5期 詹文杰,等:基于演化博弈的讨价还价策略研究 1187 成本;也没有考虑买卖双方策略的自主学习过程,即假设买卖双方在策略学习过程中缺乏能动性:,只能依据 复制动态方程被动地学习,不能进行有意识地自主学习127-2.这些都是今后的研究方向 参考文献 1]谢识予.经济博弈论[.3版.上海:复旦大学出版社,2010:348 2 Nash J. The bargaining problemJ. Econometrica, 1950, 18(2): 155-162 3 Nash J. Two-person cooperative gamesJ. Econometrica, 1953, 21(1):128 140 4 Rubinstein A. Perfect equilibriun in a bargaining modelJ. Econoinetrica, 1982, 50(1):97-109 5 Fudenberg D, Tirole J Sequential bargaining with incomplete information[J. Review of Economic Studies, 1983 50(0):221-247 6 Rubinstein A. A bargaining model with incomplete information about timc prcfcrcnces[J]. Economctrica, 1985 53(5):1151-1172 7 Binmore K, Rubinstein A, Wolinsky A. The Nash bargaining solution in economic modelingJ. The RAND Journal of Economics, 1986, 17 (2): 176-188 8 Ausubel L M, Cramton P: Deneckere R J. Bargaining with incomplete information M// Handbook of Game Theory. Amsterdan: Elsevier, 2002, Chapter 50 ⑨]马本江,邱菀华.一次交易中的讨价还价策略及其博弈分析[J.管理工程学报,205,19(4):123-125 Ma. Benjiang, Qiu Wanhua. The strategy of argy-hargy and its analysis with game t heory in one trade[ J.Journal of Industrial Engineering/Engineering Management, 2005, 19(1): 123-125 10苏秦,刘强.单买方多供应商多边谈判中的买方策略选择.系统工程理论与实践,2010,30(6):1002-1009 Su Qin, Liu Qiang. Buyer's choices of strategies in one-buyer-multi-supplier multilateral negotiation[]. Systems Engineering- Theory &z Practice, 2010, 30(6): 1002-1009 1]玉刊良,玉嵩.非对称信息下讨价还价的动态博弈:以三阶段讨价还价为例J.系统工程理论与实践,2010,30(9):1636 1642 Wang Kanliang, Wang song. Dyllamic gaine of asyMmetry information bargaining with tri-stages bargaining as exampleJ. Systems Engineering- Theory Practice, 2010, 30(9): 1636-1642 12」邹小燕,王正波.电力市场中关于直购电力价格的讨价还价博弈模型J」.管理工程学报,2005,19(4):96-99 Zou Xiaoyan, Wang Zhengbo. The bargain game model on clcctric powcr price in a bilateral electricity markctJI Journal of Industrial Engineering/Engineering Management, 2005, 19(4):96-99 13李勇军,梁橾.一种基于DEA与Nash讨价还价博弈的固定成本分摊方法J.系统工程,2008,26(6):73-7 Li Yongjun, LiangLiang. A method of allocating the fixed cost based on data envelopment analysis and Nash bargain gamcJ. Systems Enginccring. 2008, 26(6):73-77 「14李娟,黄培清,骆建文.基于讨价还价博弈下的供应链回购合同硏究「J.管理工程学报,2009,23(2):55-59 Li Juan, Huang Peiqing, Luo Jianwen. Research on supply chain buy back contracts based on bargaining gameJ Journal of Industrial Engineering/Engineering Management, 2009, 23(2):55-59 15 Krishna V, Serrano R. Multilateral bargaining. The Review of Economic Studies, 1996, 63(1) :61-80 16 Bennett E Multilateral bargaining problems[J]. Games and Economic Behavior, 1997, 19(2): 151-179 17 Cai H. Delay in multilateral bargaining under complete information]. Journal of Economic Theory, 2000, 93(2) 260-276. 18]韩雪.基于协调人的多对多谈判支持系统研究D〕.哈尔滨:哈尔滨工业大学,2009 [19 Maynard Smith J, Price G R. The logic of animal confict[J. Nature, 1973, 246(11):15-18 20 Friedman D. On economic applications of evolutionary game theory[ J. Journal of Evolutionary Economics, 1998 8(1):15-43 21 Friedman D. Evolutionary economics goes mainstream: A review of the theory of learning in games J. Journal of Evolutionary Economics, 1998. 8(4):423 432 22 Young H P. An evolutionary model of bargaining[J. Journal of Economic Theory, 1993, 59(1): 145-168 23 Binmore K, Piccione M. Samuelson L. Evolutionary stability in alternating-offers bargaining games J. Journal of Economic Theory, 1998, 80(2):257-291 24高洁,盛昭瀚.发电侧电力市场竞价策略的演化博弈分析J.管理工程学报,2004,18(3):91-95 Gao Jie, Sheng Zhaohan. Evolutionary game analysis of price competition strategy for power generation-side market J. Journal of Industrial Engineering/ Engineering Management, 2004. 18 (3):91-95 25 Weibull W. Evolutionary game theory[M. Cambridge: MIT Press, 1995 26 Vega- Redondo F. Evolution, games, and cconomic bchaviourM. Oxford Univcrsity Press, 1996 127]黄凯南.演化博弈与演化经济学阿.经济研究,2009(2):132-145. Huang Kainan. Evolutionary games and evolutionary economics[J. Economic Research Journal, 2009(2):132 28 Brenner T. Agent learning representation- Advice in modeling economic learning[M// Tesfatsion L, Judd K L. Ilandbook of Computational Economics. Amsterdam: Elsevier, 2006: 895-947

...展开详情
img
  • 至尊王者

    成功上传501个资源即可获取

关注 私信 TA的资源

上传资源赚积分,得勋章
    最新推荐