DRLND-Navigation:基于价值的方法。 将深度学习架构应用于强化学习任务。 训练自己的代理,从感官数据导航虚拟世界

preview
需积分: 12 0 下载量 126 浏览量 2021-02-20 05:36:49 上传 评论 收藏 27.52MB ZIP 举报