VIP会员
作者:CSDN
出版社:CSDN《程序员》
ISBN:1111111111117
VIP会员免费
(仅需0.8元/天)
¥ 40000.0
温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!
电子书推荐
-
多智能体强化学习 评分:
多智能体强化学习市面上相关的资料确实少,很经典的一本书
上传时间:2018-03 大小:13.41MB
- 7.85MB
maddpg-keras:在Keras中实现多代理深度确定性策略梯度(MADDPG)算法
2021-04-10马迪克-凯拉斯 在Keras中实现多代理深度确定性策略梯度(MADDPG)算法
- 6KB
基于多智能体的深度强化学习RL的优化OBSS干扰的matlab仿真,matlab2021a测试,深度强化学习训练过程仿真较长。
2022-05-01基于多智能体的深度强化学习RL的优化OBSS干扰的matlab仿真,matlab2021a测试,深度强化学习训练过程仿真较长。
- 874KB
Distributed-DRL:分布式深度强化学习
2021-05-26分布式DRL 分布式深度强化学习 该框架的灵感来自OpenAI的通用RL培训系统Rapid 。 快速框架: 我们的框架: 教程 该框架将强化学习过程分为五个部分: 重播缓冲区(选项) 参数服务器 火车(学习) 推出 测试 @ ray . remote class ReplayBuffer : ... # replay buffer @ ray . remote class ParameterServer ( object ): ... # keep the newest network weights here # could pull and push the weights # also could save the weights to local @ ray . remote ( num_gpus = 1 ,
- 14KB
多智能体仿真matlab代码
2015-08-12Consensus Problems in Networks of Agents With Switching Topology and Time-Delays 多智能体仿真
- 872KB
多智能体深度强化学习的若干关键科学问题
2020-05-25强化学习作为一种用于解决无模型序列决策问题的方法已经有数十年的历史, 但强化学习方法在处理高维变量问题时常常会面临巨大挑战。
- 7.64MB
BioMARL:基于生物启发式算法的多智能体强化学习算法
2021-03-27BioMARL:基于生物启发式算法的多智能体强化学习算法项目介绍:多智能体系统(MAS)通过解决复杂任务的规模,可靠性和智能性,已被广泛的地面不同的应用领域,如计算机网络,机器人和智能电网等。和生产的重要因素。...
- 116KB
CityFlow:用于大规模城市交通场景的多智能体强化学习环境
2021-08-04CityFlow 是一种用于大规模城市交通场景的多智能体强化学习环境。 检查这些功能! 一种微观交通模拟器,可模拟每辆车的行为,提供最高级别的交通演变细节。 支持灵活定义路网和交通流 为强化学习提供友好的...
- 1.58MB
论文研究-多智能体强化学习在城市交通网络信号控制方法中的应用综述.pdf
2019-07-22为了研究该方法的现状、存在问题及发展前景,系统跟踪了多智能体强化学习在国内外交通控制领域的具体应用,包括交通信号MARL控制概念模型、完全孤立的多智能体强化学习(MARL)的控制、部分状态合作的多智能体强化...
- 655KB
论文研究-基于多智能体强化学习的多机器人协作策略研究.pdf
2019-09-20论文研究-基于多智能体强化学习的多机器人协作策略研究.pdf, 研究了一种基于智能体动作预测的多智能体强化学习算法. 在多智能体系统中,学习智能体选择动作不可避免地要...
- 338KB
基于多智能体强化学习的新强化函数设计 (2009年)
2021-05-16为了提高强化学习算法在多智能体系统中的性能表现,针对典型的多智能体系统-Keepaway平台总是以失败告终的特点,受与之有相同特点的单智能体系统杆平衡系统所采用强化函数的启发,重新设计一种新的惩罚式的强化函数...
- 3KB
多智能体MATLAB方针代码
2019-04-15此示例代码是多代理系统(MAS)的服务器,用于处理多代理问题。每个代理Agent都可协调运行
- 427KB
多智能体强化学习综述_杜威.pdf
2020-02-09多智能体系统是一种分布式计算技术,可用于解决各种领域的问题,包括机器人系统、分布式决策、交通控制和商业管理等。这是被高引用的综述论文,入门可以看看。
- 567KB
一种基于分布式强化学习的多智能体协调方法
2017-12-25一种基于分布式强化学习的多智能体协调方法,通过协商协调合作完成复杂的控制任务。
- 345KB
分布式强化学习系统的体系结构研究
2017-12-25强化学习是一种重要的机器学习方法,随着计算机网络和分布式处理技术的飞速发展,多智能体系统中的分布 式强化学习方法正受到越来越多的关注。论文将目前已有的各种分布式强化学习方法总结为中央强化学习、独立强化 学习、群体强化学习、社会强化学习四类,然后探讨了这四类分布式强化学习方法的体系结构框架,并给出了这四类分布 式强化学习方法的形式化定义。
- 467KB
多智能体系统中的分布式强化学习研究现状
2017-12-25多智能体系统中的分布式强化学习研究现状,分析比较优劣,探讨未来发展。
- 6KB
Multi-Agent-Deep-Deterministic-Policy-Gradients:多主体深度确定性策略梯度(MADDPG)算法的Pytorch实现
2021-04-16多代理深确定性策略梯度 多主体深度确定性策略梯度(MADDPG)算法的Pytorch实现 这是我在论文中提出的算法的实现:“针对混合合作竞争环境的多主体Actor评论家”。 您可以在这里找到本文: : 您将需要安装多代理粒子环境(MAPE),可以在这里找到: : 确保创建具有MAPE依赖项的虚拟环境,因为它们有些过时了。 我还建议使用PyTorch 1.4.0版运行此程序,因为最新版本(1.8)似乎与我在计算批评者损失时使用的就地操作存在问题。 将主存储库克隆到与MAPE相同的目录中可能是最容易的,因为主文件需要该软件包中的make_env函数。 可以在以下位置找到本教程的视频: :
- 2.38MB
基于 DDPG 智能体的四足机器人运动控制
2021-05-30MATLAB强化学习实战(十四) 基于 DDPG 智能体的四足机器人运动控制 https://blog.csdn.net/wangyifan123456zz/article/details/109679138#comments_16710443
- 127KB
Python-TensorFlow实现的强化学习算法集锦
2019-08-11Reinforcement Learning implementations and research prototyping in TensorFlow
- 9.21MB
MultiAgentLearning:多智能体学习库
2021-05-20在线阅读: 注: 所有文档写在docs文件夹下 ctrl+k添加跳转链接 多智能体系统 百度百科: 论文 视频 文章、回答 知乎问题: 知乎问题: 环境 多智能体强化学习 深度学习 《PyTorch深度学习实践》完结合集 视频 论文 文章、回答 强化学习 先打好强化学习的基础,再对多智能体强化学习进行研究。 视频 [伏羲课堂]基于知识引导的强化学习相关算法介绍 论文 文章、回答 环境 gym retro high-way 我的文章 浅谈强化学习 多智能强化学习 视频 知乎回答:如何入门MARL(多智能体强化学习)? 【CAC2020Workshop】 孙长银、穆朝絮——多智能体深度强化学习的若干关键科学问题 论文 多智能体强化学习的相关论文 文章、回答 多智能体强化学习笔记05 值函数分解方法 SMAC源码详解 工具 XMind——思维导图 MindManager——思维导
- 204KB
多智能体一致性
2018-09-13多智能体一致性方面的研究及其方法,主要针对非线性系统而言。
- 40.58MB
多智能体系统的协同群集运动控制
2019-04-15《多智能体系统的协同群集运动控制》以多智能体系统协同群集运动控制为主线,首先介绍了图论和控制器设计所用到的基础理论知识;其次,分别从拓扑结构的边保持和代数连通度两个角度介绍了连通性保持条件下的协同群集运动控制协议设计方法;进而,针对典型的轮式移动机器人非完整约束模型介绍了连通性保持条件下的协同控制策略,为简化系统复杂拓扑结构,还介绍了基于骨干网络提取的协同群集运动控制策略;书中将个体动态模型提升到高阶非线性系统模型,介绍了高阶非线性系统协同控制协议设计方法;最后,针对多智能体系统非合作行为检测与隔离进行了详细介绍,并提出了相关算法。
- 1KB
多智能体一致性仿真程序
2018-12-11多智能体一致性MATLAB仿真程序,研究了一阶一致性问题,使用LMI工具箱求解
- 7KB
事件触发的多智能体一致性
2019-04-01基于事件触发的多智能体一致性算法的研究,本人亲测程序可用
- 932KB
论文研究-基于场景任务划分的多智能体Q-学习研究.pdf
2019-09-11从研究分层强化学习入手,提出由MAS中任务结构分析产生的分层合作研究方法,通过区分子任务并以此建立更大粒度层面上的基于任务场景的状态空间,并结合以联合动作为基础的任务动作与势能场模型,从而解决强化学习中的状态空间的维数灾难。文中给出了基于机器人足球的子任务的算法应用,其效能得到实验的验证。
- 1KB
多智能体系统仿真的代码。
2018-07-18多智能体系统仿真,带通信延迟的,这为第二部分,一一部分在另一个文件中,分两个因为懒得打包。看不懂话要网络拓扑图的可以留言。备注:CSDN老是加积分,这点很生气。我设的积分不多,如果没积分的话,直接和我说,给不给看心情,但不要说谎,下载明细我看的到的,积分不够的时候,我也用淘宝买过订单下过文件。真诚交流,拒绝借口!
- 308KB
基于多智能体的自然灾害动态风险评估模型
2011-03-17将多智能体建模方法引入灾害风险评估领域,以期为灾害风险评估开拓新的研究思路。区别于一般静态评估 模型,基于多智能体的风险评估模型自下而上,从微观上建立灾害系统各要素之间的相互关系,在多风险情景下,仿 真模拟灾害系统状态的变化,以实现动态的风险评估。在理解多智能体建模的一般原理的基础上 ,设计了基于多智 能体的自然灾害动态风险评估的总体模型和主要智能体的结构 ,并总结了多智能建模在风险评估方面的优势。
- 58KB
多智能体技术
2012-02-08多智能体技术 很好的初级书籍
- 100KB
多智能体 机器学习算法
2018-08-21针对多智能体系统进行机器学习的思路和方法总结,可以参考
- 396KB
多智能体一致性问题报告
2018-04-16利用matlab仿真多智能体在饱和条件下的运动情况,和在有限时间下的仿真