为了解释合作的发展,对空间迭代囚徒困境游戏进行了广泛的研究。 考虑到较大的策略空间大小和无限的交互时间,采用通用的“最佳模仿”更新规则是不现实的,该规则假设人类玩家具有比一次射击游戏更强的识别邻居策略的能力。 本文提出了一种新颖的局部极值动态系统,该系统中的每个玩家只需要识别邻居的收益,并在邻居获得最低收益时随机改变其策略即可。 在此更新规则下,针对不同大小的邻域(以其相应的半径r为特征),探讨了合作的演变。 结果表明,当r = 1时,系统陷入棋盘状状态,其中一半玩家始终使用类似于AllD的策略,另一半则不断更改其策略。 当r = 2时,系统首先进入类似AllD的状态,然后从该状态逃逸,最后演变为类似TFT的状态。 当r较大时,系统将锁定在具有与r = 1相似的低平均适应度的情况下。 活跃参与者的数量和形成集群的能力共同区分了不同r值的进化过程。 目前的发现进一步提供了对生物和社会系统中合作和集体行为演变的一些见解。 ### 局部极值动力学下空间迭代囚徒困境游戏中合作的演变 #### 研究背景及动机 本文探讨了在空间迭代囚徒困境(Spatial Iterated Prisoner’s Dilemma,简称SIPD)游戏中合作行为的演化机制。传统上,在这类游戏中通常采用“最佳模仿”(Imitate-the-Best)的更新规则,即参与者倾向于模仿周围表现最好的个体的策略。然而,在实际的社会互动中,人们往往没有足够的认知资源或动机去精确地评估所有邻居的表现。因此,本文引入了一种新的局部极值动态(Localized Extremal Dynamics)模型,以更真实地反映有限视野下的个体决策过程。 #### 研究方法与设计 **局部极值动态模型**:在这个模型中,每个参与者只需识别其直接邻居的收益,并在自己的收益低于邻居中最低收益时,随机更换策略。这种方法降低了对参与者认知能力的要求,使得模型更加贴近真实情境。 **研究变量**: - **邻域大小**:通过改变邻域的半径\( r \),研究不同邻域大小下合作行为的变化。 - **策略空间**:考虑了两种基本策略——“总是背叛”(AllD)和“以牙还牙”(Tit-for-Tat,简称TFT)。 #### 主要结果分析 1. **当\( r = 1 \)**:系统倾向于进入一个稳定的“棋盘状”状态。在这种状态下,约一半的参与者会持续使用AllD策略,而另一半则会频繁更换策略。这种模式导致合作水平较低且难以维持。 2. **当\( r = 2 \)**:系统最初可能会表现出AllD的特点,但随着时间推移,会逐渐脱离这种状态,并向类似TFT的状态转变。这种转变促进了合作的增加,因为参与者能够更好地学习并模仿有利的策略。 3. **当\( r > 2 \)**:随着邻域半径的增加,系统的整体适应度降低,合作行为也随之减少。此时,参与者之间的互动变得更为复杂,形成集群的能力减弱,这反过来又阻碍了合作的演化。 #### 进一步的讨论 - **活跃参与者数量的影响**:研究显示,活跃参与者的数量对合作行为的演化有显著影响。较高的活跃度有助于推动系统向更高水平的合作发展。 - **集群能力的作用**:参与者形成集群的能力对于促进合作至关重要。在某些邻域大小下,集群的形成能够促进正面互动,从而增强合作倾向。 - **对实际情境的启示**:这些发现不仅对理解社会和生物系统中的合作行为具有重要意义,也为设计鼓励合作的制度提供了理论支持。例如,在组织管理中,通过调整团队规模或交流模式,可以促进团队成员之间的积极互动。 #### 结论 本文通过引入局部极值动态模型,揭示了在不同邻域大小下合作行为在空间迭代囚徒困境游戏中的演化规律。研究结果显示,邻域大小对于合作行为的出现和发展有着关键性的影响。特别是当邻域半径为2时,系统能最有效地促进合作的演化。此外,活跃参与者的数量以及形成集群的能力也对合作行为的演化起到了重要的作用。这些发现为理解合作行为在各种社会和生物系统中的发展提供了一个新的视角,并为实际应用提供了有价值的参考。
剩余9页未读,继续阅读
- 粉丝: 6
- 资源: 888
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 四通道电子负载,电池容量测试仪器,全套资料,包含,原理图pcb 和bom程序源码非常全和宝贵资料
- 有需要学习基于分布式驱动电动汽车的搭建,附着系数估计,车辆状态参数估计(包括扩展卡尔曼,无迹卡尔曼,容积卡尔曼,高阶容积卡尔曼,平方根容积卡尔曼等方法)和电机无传感器控制等方向的内容
- 蒙特卡洛模拟研究,CFA模型,SEM模型,潜变量增长模型,统计功效,样本量,模拟研究 在matlab中用蒙特卡洛算法对电动汽车充电负荷进行模拟,可自己修改电动汽车数量,lunwen复现 参考lun
- 基于分布式驱动电动汽车的车辆状态估计,采用的是容积卡尔曼(ckf)观测器,可估计包括纵向速度,质心侧偏角,横摆角速度,侧倾角四个状态 模型中第一个模块是四轮驱动电机;第二个模块是carsim输出的真
- 七自由度整车模型 分别采用魔术公式和dugoff 两种轮胎模型建立的七自由度整车模型 包含模型所有文件和魔术公式轮胎模型和说明文档以及参考资料 本模型可进行角阶跃、制动、等速圆周等工况验证 可加入相应
- MATLAB Simulink仿真平台,蓄电池控制 包括蓄电池双向DC DC控制,采用电压外环电流内环控制,使输出电压稳定,也可采用功率外环电流内环控制,使输出功率稳定
- 自动驾驶,carsim,simulink联合仿真,基于lqr算法的路径跟踪控制, carsim2019,matlab2018,以上
- 基于深度强化学习的混合动力汽车能量管理策略 1.利用DQN算法控制电池和发动机发电机组的功率分配 2.状态量为需求功率和SOC,控制量为EGS功率 3.奖励函数设置为等效油耗和SOC维持
- FMCW激光雷达 正弦波 三角波 目标检测 双模调制
- 安-川7-内部资料,包含源码与详细说明,以及运行环境软件. 电流环扰动观测器、速度补偿、摩擦扰动观测器、标幺化计算、转矩补偿、位置环、速度环、电流环 三环分析、参数计算.....
- (Matlab)基于贝叶斯(bayes)优化卷积神经网络-门控循环单元(CNN-GRU)回归预测,BO-CNN-GRU Bayes-CNN-GRU多输入单输出模型 1.优化参数为:学习率,隐含层节点
- 运动控制卡 倒R角程序 G代码 halcon联合运动控制卡联合相机 运动控制卡内容: 回原点 单轴运动 速度控制 位置控制 直线插补 圆弧插补 直线圆弧插补 G代码计算 根据输入参数生产R角参数,并且
- C#联合halcon深度学习源码 继电器识别 在halcon等图像处理算法不稳定的情况下,需要用深度学习来解决 下面这个案例非常有参考价值,是基于深度学习来识别工厂的零件 因为这个零件种类比较多
- 永磁同步电机基于SVPWM改进的直接转矩控制 针对传统直接转矩控制存在的转矩脉动大、采样率高等问题,基于SVPWM改进的DTC可以解决上述存在的问题 模型仿真效果良好,可提供和对应的参考文献,适合入
- C#联合halcon条形码识别源代码 缺陷检测 飞拿 海康相机 海康相机,传感器检测到条形码后,触发相机拿照,识别二wei码,查找二wei码缺陷,发现缺陷后,通过串口发送指令停机并且报告
- 基于 Qt5.14+OpenCV4.6.0 的通用化视觉软件,qt编译器直接运行, qt编译器直接运行 支持多相机多线程,每个工具都是单独的DLL,主程序通过 公用的接口访问以及加载各个工具 算法工