对策论,亦称竞赛论或博弈论,是研究具有斗争或竞争性质现象的数学理论和方法。它作为现代数学的一个新分支,同时也被视为运筹学中的一个重要学科。对策论的历史虽然不长,但它所研究的问题与人们的政治、经济、军事活动乃至日常生活紧密相关,并且其解决问题的独特方法吸引了越来越多人的关注。
在对策论中,具有相互之间斗争或竞争性质的行为称为对策行为。在这种行为中,参与斗争或竞争的各方各自具有不同的目标和利益。为了实现各自的目标和利益,各方必须考虑对手可能采取的各种行动方案,并努力选取对自己最有利或最合理的方案。对策论旨在研究是否存在最合理的行动方案,并探讨如何找到这一合理的行动方案的数学理论和方法。
对策问题的特征是参与者为利益相互冲突的各方,结局并不取决于其中任意一方的努力,而是由各方采取的策略的综合结果所决定。一个对策中至少要有两个局中人。局中人是有权决定自己行动方案的对策参与者,通常用集合I表示局中人的集合,如果有n个局中人,则用In表示。在例1(囚徒的困境)中,局中人即为两名疑犯。
策略集是一局对策中,可供局中人选择的一个实际可行的完整的行动方案。每一局中人的策略集至少应包括两个策略。在囚徒困境的例子中,两名疑犯各自有两个策略可供选择:供认或不供认。
赢得函数,也称为支付函数,是定义在一局对策中,各局中人所选定的策略形成的策略组(局势)上的函数。对任一局势,局中人获得的结果就是该局势下局中人的赢得值。
零和对策(或称为矩阵对策)是一类特殊的对策问题,在这类对策中,只有两名局中人,每个局中人都只有有限个策略可供选择。在任一纯局势下,两个局中人的赢得之和总是等于零,这意味着双方的利益是激烈对抗的。零和对策可以简单地记作(A; S1, S2),其中A为局中人Ⅰ的赢得矩阵(同时是局中人Ⅱ的支付矩阵),S1、S2分别为局中人Ⅰ和Ⅱ的策略集。
在实际应用中,对策论通过构建数学模型来模拟和分析参与人之间的策略互动,例如囚徒困境模型可以用来分析和预测在一定规则下,各方的最佳行动策略及其结果。随着问题的复杂化,对策论模型变得更加精细化,如考虑信息不对称、不确定性等因素,使得对策论不仅在理论研究上,也在实际应用中发挥着重要作用。在经济学、社会学、心理学、计算机科学、生物学等领域,对策论均得到了广泛应用,成为分析和解决各种竞争与合作问题的有力工具。