疯马里奥
PyTorch用于构建AI驱动的Mario。
设置
安装
使用environment.yml安装依赖项
conda env create -f environment.yml
检查新环境mario是否。
激活马里奥环境
conda activate myenv
跑步
要开始学习Mario,
python main.py
这将启动双重Q学习,并将关键训练指标记录到checkpoints 。 此外,还将保存MarioNet的副本和当前的勘探速率。
如果有GPU,将自动使用GPU。 在CPU上的培训时间约为80个小时,在GPU上的培训时间为20个小时。
要评估训练有素的马里奥,
python replay.py
这使Mario可以在一个窗口中玩游戏。 性能指标将记录到checkpoints下的新文件夹中。 在Mario.load()更改load_dir ,例如checkpo
评论0