博弈论是经济学、管理学等领域中研究决策者之间相互作用的一种理论工具,它通过分析不同决策者的行为选择及其结果,揭示了在特定环境下如何达到稳定的结果。本讲义主要介绍了博弈论的基础概念,以“囚徒困境”为例,阐述了博弈的均衡概念,包括占优均衡和纳什均衡,并探讨了个人理性与集体理性之间的冲突。
囚徒困境是博弈论中的一个经典案例,用于说明在两个相互依赖的决策者中,尽管双方可能都有共同的利益,但最终却可能导致双方都采取不利的行动。在这个例子中,两个囚犯面临的选择是坦白或不坦白。如果双方都不坦白,他们将因非法持械罪被判两年;如果一方坦白而另一方不坦白,坦白者将被释放,不坦白者则会被判十二年;如果双方都坦白,都将被判十年。在这个困境中,每个囚犯的最佳策略是坦白,即使这意味着共同承担更重的刑罚,这是由博弈的结构决定的。
接着,我们引入了博弈均衡的概念。在博弈中,均衡是指所有参与者都不愿改变当前策略的状态。占优均衡是一种特殊类型的均衡,其中每个参与者不论对方选择何种策略,都有一个最优策略。在囚徒困境中,坦白是每个囚犯的占优策略,因为无论对方选择坦白还是不坦白,坦白总是带来较小的损失,所以最终的占优均衡是双方都坦白,各判十年。
然而,占优均衡并不总是纳什均衡。纳什均衡是博弈理论中的核心概念,由诺贝尔奖得主约翰·纳什提出,它定义为:在给定其他参与者策略的情况下,没有任何参与者有动机改变自己的策略。在囚徒困境中,坦白坦白的状态就是一个纳什均衡,因为每个囚犯都不愿意单独改变策略,即使这个结果并不理想,因为它是最坏情况下的最好选择。
此外,囚徒困境揭示了一个重要问题,即个人理性与集体理性之间的矛盾。每个囚犯为了自身利益选择坦白,但这一行为导致了整体上更糟糕的结果。这种情况在现实生活中广泛存在,特别是在多个人共同决策的场景下,个体追求自身利益可能导致集体利益受损。
讲义提到了完全信息静态博弈的其他著名案例,比如智猪博弈,这是一个模拟资源分配问题的博弈模型,进一步展示了博弈论在理解复杂决策问题中的应用。
博弈论通过分析像囚徒困境这样的案例,帮助我们理解在有限信息和互动决策环境中,人们如何选择策略并形成稳定的结果。这些理论不仅在经济学和管理学中有着深远的影响,也广泛应用于社会学、政治学、生物学等多个学科,为理解和解决现实世界中的决策问题提供了有力的工具。