通过简单的强化学习登陆火箭 此仓库给出了一个使用简单的强化学习方法击败Lunar Lander环境的示例。 该代理使用pytorch库结合使用CEM和神经网络。 您可以使用此按钮快速启动此项目并在云上运行 您可以在此处查阅随附的“中型”文章,以逐步了解如何制作代理: :
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~