设计了一种使用角色来代替智能体的多智能体协同学习方法。根据多智能体系统的特性在多智能体系统中划分若干角色,每个角色拥有其独立的状态空间和动作空间,为智能体的状态空间和动作空间来的子空间。把多智能体系统对智能体的学习转变为对角色的学习。用角色的分配来代替多智能体系统的决策,使用强化学习的方法训练决策层,使其在各个状态下都能选择到最优的角色分配策略。在“星际争霸II学习环境”(SC2LE)中进行实验,验证了该方法在有效降低状态空间的情况下,仍然具有可行性与高鲁棒性。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~