逆向软Q学习
从他们的控制演示中了解代理对环境动态的信念。
用法
使用软件包管理器安装Python依赖项
pip install -r requirements.txt
安装(版本0.9.2)并更换gym/envs/box2d/lunar_lander.py与isql/lunar_lander.py 。
安装并将baselines/baselines/deepq/{build_graph|simple}.py替换为isql/{build_graph|simple}.py 。
到isql/ 。
问题和意见
如果您有疑问或发现错误,请通过sgr [at] berkeley [dot] edu与作者联系。 请注意,并非所有单元格都井井有条,因此您可能必须四处寻找处理NameErrors的方法。
引文
如果您发现此软件在您的工作中很有用,我们恳请您引用以下:
@InProceedings