谷歌师兄的leetcode刷题笔记使用
Tensorflow
和
Emuhawk
的
DQN
该项目包含允许
DQN
代理在
Pong、Mario
Tennis
和
Super
Smash
Brothers(全部用于
N64)中学习和表现良好的代码。
它由一个
python
服务器(通过
tensorflow
完成所有
ML)和一个
lua
客户端(可通过
EmuHawk
的
Lua
脚本控制台运行)组成。
虽然这个项目可能永远不会处于“可发布”状态,但我认为其中的大部分内容对于那些希望在
NES、SNES、N64
和其他经典主机游戏上使用深度强化学习算法的人来说可能是有用的。
结果
马里奥网球
在
Hard
Mario
CPU
上训练(机器人是
Daisy)
视频:
随着时间的推移平均奖励:
超级粉碎兄弟
受过
9
级皮卡丘的训练(机器人是
Yoshi)
视频:
随着时间的推移平均奖励:
乒乓
随着时间的推移平均奖励:
基本配置
现在,我们必须在
Bizhawk
中使用“更快、更不可靠(内存泄漏!)”的
Lua
版本。
因此,要配置
Bizhawk
并测试它是否正常工作,请执行以下操
评论0
最新资源