model-free-algorithms:TF1.x中的TD3，SAC，IQN，Rainbow，PPO，Ape-X等

共75个文件

py：54个

yaml：7个

png：6个

reinforcement-learning

rainbow

ddpg

需积分: 49 9 下载量 87 浏览量 2021-05-16 15:09:30 上传评论 2 收藏 12.42MB ZIP 举报

温馨提示

地位。存档（代码按原样提供，预计不会进行更新）笔记。请参阅我的仓库以了解TF2.x中的强化学习算法实现的算法算法在实现。 TD3 [] SAC [] IQN [ ] 彩虹[ ] Apex [] 嘈杂的网[ ] PER [] MultiStep ] PPO [] A2C [] GAE [] NAE [] 整体架构该存储库旨在表示一个漂亮的Tensorboard图，这对于调试非常有用。典型的图形如下所示：笔记分布式算法是使用Ray （灵活，高性能的分布式执行框架）实现的。由于缺少Mujoco许可证，所有用于连续控制的算法首先在LunarLanderContinuous-v2上进行测试，然后在OpenAI的Gym的BipedalWalker-v2环境中进行测试并解决。 Rainbow，IQN已在CartPole-v0上经过测试，并且可以稳

资源推荐

资源详情

资源评论