玩Atari游戏的分布式A3C算法
此回购包含了我们从事打Atari游戏的RL代理商的分布式培训工作的代码。 有关更多详细信息,请阅读我们关于该主题的论文: : 或访问我们的博客《 。 它是A3C算法的分布式版本。 我们的实现基于 。 准备使用 Manager在大型CPU群集上(已在多达1500个内核上进行了测试)
要求
Python 2.7.13
lur饮17.02.7
Tensorflow 1.2
其他Python要求描述
笔记
在我们的实验中,我们将。 我们的代码应与常规的TensorFlow 1.2一起使用,但是我们没有对其进行测试也没有任何基准测试。
安装
git clone https://github.com/deepsense-ai/Distributed-BA3C.git
创建virtualenv: virtualenv a3c_virtualenv
激活v