博弈论是经济学、决策科学和计算机科学等领域的重要理论,它研究在有冲突和合作的多主体决策场景下,参与者如何选择最优策略以达到最有利的结果。这篇国外的博弈论讲座第二部分主要涵盖了静态完全信息博弈的基本概念、严格优势策略的消除、纳什均衡及其应用,以及混合策略均衡。
正常形式(或战略形式)表示法是博弈论中用来描述游戏的一种方式。它包括有限的玩家集合(如{1, 2, ..., n})、每个玩家的策略空间(S1, S2, ..., Sn)以及支付函数(u1, u2, ..., un),这些函数定义了每个玩家在所有玩家策略组合下的收益。例如,囚徒困境展示了这种表示法,两个囚犯可以选择沉默(Mum)或坦白(Confess),每种策略组合都有相应的刑期结果。
静态(或同时行动)完全信息博弈是指所有玩家对其他人的策略和支付函数都完全了解的游戏。每个玩家在不知道其他人选择的情况下独立决定自己的策略,然后按照所有玩家的选择获得其对应的收益,游戏随之结束。
接着,讲座介绍了如何解决囚徒困境。在这个例子中,坦白(Confess)总是优于沉默(Mum),因为无论对方选择什么,坦白的囚犯都会得到更好的结果。这就是所谓的“严格优势策略”——一种策略相对于另一种策略,在任何情况下都能带来更好的结果。如果在正常形式游戏中,策略si'对于玩家i被si"严格支配,意味着对于所有可能的其他玩家策略组合,ui(s1, s2, ..., si-1, si', si+1, ..., sn) < ui(s1, s2, ..., si-1, si", si+1, ..., sn)。
进一步地,迭代消除严格优势策略是寻找纳什均衡的一个方法。这个过程涉及连续剔除那些总是可以被其他策略替代的策略,直到剩下的策略集合中不存在严格优势策略。在囚徒困境中,经过迭代消除后,剩下的唯一策略组合就是两个囚犯都坦白,这正是纳什均衡,因为在该状态下,没有单个囚犯有动机改变自己的策略。
纳什均衡是博弈论中的核心概念,由约翰·纳什提出,指的是在一个博弈中,每个玩家的策略都是对其他玩家策略的最佳响应,即使在知道所有其他人的选择后,也没有玩家有动力单独改变自己的策略。
讲座提到了纳什均衡的应用和混合策略均衡。在某些博弈中,可能存在多个纳什均衡,或者纯策略纳什均衡不存在,此时混合策略均衡就变得重要。混合策略是指玩家不固定使用某一种策略,而是以一定的概率选择多种策略。混合策略纳什均衡确保了即使在不确定对手策略的情况下,每个玩家仍然没有改变策略的动机,因为他们预期到对手的混合策略会使得自己当前的策略选择平均收益最大化。
总结来说,这个博弈论讲座第二部分深入讲解了静态完全信息博弈的结构、策略的分析方法,特别是如何通过迭代消除严格优势策略来找到纳什均衡,并简要触及了混合策略均衡的概念。这些知识对于理解博弈中的决策行为和优化问题至关重要,不仅在经济学中,还在诸如计算机科学、政治学、生物学等许多领域有着广泛的应用。