没有合适的资源?快使用搜索试试~ 我知道了~
MPE-Multiagent-RL-Algos:使用OpenAI MPE环境的多主体RL的简单验证实验代码
共179个文件
py:142个
png:25个
md:12个
需积分: 34 10 下载量 75 浏览量
2021-04-01
16:17:18
上传
评论
收藏 3.62MB ZIP 举报
温馨提示
MPE-多主体强化学习算法 MPE 这是使用OpenAI Multi-Agent RL的简单验证实验代码。 该环境总结了许多基准,并最初为算法做准备。 由于环境设置简单, MPE似乎是验证我们新的Multi-Agent RL算法并与其他基准进行比较的良好玩具实验环境。 我为您编写了一些著名的多主体RL算法,以便您可以更改较少的代码来实现自己的算法并验证实验结果。 笔记: 如果要成功运行此MPE环境,则必须确保已下载 。 但是,我已经将基准的文件推送到项目中,如果您发现从OpenAI下载的基准有任何问题,则可以使用我的文件。 要求 Python> = 3.6.0 PyTorch == 1.2.0 OpenAI体育馆== 0.10.5 演算法 待办事项清单 评估和渲染 数字与比较 上传训练模型.pt 致谢 我一直以硕士生的身份学习。 我的代码和对算法的理解可能存在一些问
资源推荐
资源详情
资源评论
收起资源包目录
MPE-Multiagent-RL-Algos:使用OpenAI MPE环境的多主体RL的简单验证实验代码 (179个子文件)
README.md 5KB
gail-result.md 3KB
README.md 2KB
README.md 2KB
README.md 1KB
README.md 893B
README.md 833B
README.md 629B
README.md 532B
README.md 504B
README.md 330B
README.md 301B
humanoidstandup-training.png 684KB
walker2d-training.png 629KB
humanoid-training.png 538KB
hopper-training.png 534KB
halfcheetah-training.png 504KB
HalfCheetah-unnormalized-stochastic-scores.png 52KB
HumanoidStandup-unnormalized-stochastic-scores.png 49KB
Hopper-unnormalized-stochastic-scores.png 48KB
Walker2d-unnormalized-stochastic-scores.png 47KB
Humanoid-unnormalized-stochastic-scores.png 46KB
HumanoidStandup-unnormalized-deterministic-scores.png 45KB
Humanoid-unnormalized-deterministic-scores.png 43KB
HalfCheetah-unnormalized-deterministic-scores.png 43KB
Hopper-normalized-stochastic-scores.png 42KB
HalfCheetah-normalized-stochastic-scores.png 41KB
Walker2d-normalized-stochastic-scores.png 41KB
HumanoidStandup-normalized-stochastic-scores.png 40KB
Humanoid-normalized-stochastic-scores.png 40KB
Walker2d-unnormalized-deterministic-scores.png 38KB
Humanoid-normalized-deterministic-scores.png 35KB
Hopper-unnormalized-deterministic-scores.png 33KB
HalfCheetah-normalized-deterministic-scores.png 33KB
HumanoidStandup-normalized-deterministic-scores.png 32KB
Walker2d-normalized-deterministic-scores.png 31KB
Hopper-normalized-deterministic-scores.png 30KB
kfac.py 44KB
ddpg.py 21KB
build_graph.py 20KB
acer.py 18KB
plot_util.py 18KB
ddpg_learner.py 17KB
tf_util.py 16KB
trpo_mpi.py 15KB
logger.py 14KB
trpo_mpi.py 14KB
distributions.py 13KB
deepq.py 13KB
ddpg.py 11KB
ppo2.py 10KB
retro_wrappers.py 9KB
pposgd_simple.py 9KB
run_mujoco.py 9KB
utils.py 9KB
a2c.py 9KB
atari_wrappers.py 9KB
misc_util.py 8KB
config.py 8KB
her.py 7KB
run.py 7KB
cmd_util.py 7KB
models.py 7KB
rollout.py 7KB
acktr.py 7KB
policies.py 6KB
monitor.py 6KB
replay_buffer.py 6KB
benchmarks.py 6KB
running_mean_std.py 6KB
vec_env.py 6KB
models.py 6KB
gail-eval.py 6KB
model.py 6KB
buffer.py 6KB
main.py 6KB
normalizer.py 5KB
vdn.py 5KB
behavior_clone.py 5KB
shmem_vec_env.py 5KB
segment_tree.py 5KB
adversary.py 5KB
env_wrappers.py 5KB
mujoco_dset.py 4KB
test_serialization.py 4KB
mpi_util.py 4KB
subproc_vec_env.py 4KB
util.py 4KB
test_vec_env.py 4KB
mpi_running_mean_std.py 4KB
schedules.py 4KB
replay_buffer.py 4KB
plot.py 4KB
fetch_data_generation.py 4KB
rollout.py 3KB
results_plotter.py 3KB
kfac_utils.py 3KB
custom_cartpole.py 3KB
buffer.py 3KB
mpi_adam.py 3KB
共 179 条
- 1
- 2
资源评论
易烊千玺的小朋友
- 粉丝: 33
- 资源: 4516
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功