没有合适的资源?快使用搜索试试~ 我知道了~
Contra-PPO-pytorch:相反的最近策略优化(PPO)算法
共10个文件
py:5个
dockerfile:1个
gif:1个
需积分: 46 6 下载量 136 浏览量
2021-05-09
18:28:58
上传
评论
收藏 38.39MB ZIP 举报
温馨提示
[PYTORCH]针对矛盾的最近策略优化(PPO) 介绍 这是我的python源代码,用于训练代理播放相反的声音。 通过使用纸张近端策略优化算法推出近端政策优化(PPO)算法。 供您参考,PPO是OpenAI提出的算法,用于训练OpenAI Five,这是第一款在电竞游戏中击败世界冠军的AI。 具体来说,OpenAI五人队在2018年8月派出了一支由MMR排名的脚轮和前专业人士组成的团队,在Dota 2玩家的99.95%中。 样品结果 动机 自从我发布我的A3C实现( )和PPO实现( )以来,已经有一段时间了,以训练代理人玩超级马里奥兄弟。 由于PPO在完成的关卡数量上胜过A3C,因此,下一步,我想看看前者在另一个著名的NES游戏中的表现如何:对战 如何使用我的代码 使用我的代码,您可以: 通过运行python train.py训练模型。 例如: python train.py
资源推荐
资源详情
资源评论
收起资源包目录
Contra-PPO-pytorch-master.zip (10个子文件)
Contra-PPO-pytorch-master
Dockerfile 305B
README.md 2KB
trained_models
ppo_contra_level1 12.57MB
test.py 2KB
train.py 7KB
src
process.py 1KB
env.py 5KB
model.py 1KB
output
video_1.mp4 3.74MB
demo
video-1.gif 24.75MB
共 10 条
- 1
资源评论
香港键师傅
- 粉丝: 27
- 资源: 4647
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功