没有合适的资源?快使用搜索试试~ 我知道了~
deepDGP:TensorFlow中针对OpenAI-Gym环境的深度确定性策略梯度的实现
共39个文件
py:8个
pyc:5个
png:5个
需积分: 9 0 下载量 40 浏览量
2021-05-08
12:06:08
上传
评论
收藏 41.37MB ZIP 举报
温馨提示
强化学习 深度确定性策略梯度 我们介绍由提出的名为DeepDGP的强化学习算法的实现 。 有关更多详细信息,请参阅我的。 训练有素的 使用说明 我们建议使用python 3。 pip3 install gym pip3 install tensorflow pip3 install tqdm pip3 install matplotlib 要训练和运行,请从获得一个月的试用许可证。 如果您是使用.edu地址的学生,则可以免费获得1年MuJoCo许可证。 cd src python3 train . py - - env_id = '<any>' - - model_dir = .. / trained_models / 运行我们的预训练模型 cd src python3 run.py --env_id=Pe
资源推荐
资源详情
资源评论
收起资源包目录
deepDGP-master.zip (39个子文件)
deepDGP-master
src
train.py 3KB
compare_results.py 2KB
noise.py 673B
run.py 695B
models.py 3KB
ddpg.py 21KB
__pycache__
ddpg.cpython-36.pyc 11KB
train.cpython-36.pyc 2KB
models.cpython-36.pyc 3KB
ReplayBuffer.cpython-36.pyc 2KB
noise.cpython-36.pyc 1KB
ReplayBuffer.py 2KB
plot.py 1KB
trained_models
HalfCheetah-v2
model.ckpt.index 3KB
train_stats.npy 11KB
model.ckpt.data-00000-of-00001 187KB
model.ckpt.meta 407KB
buffer.pkl 19.93MB
checkpoint 77B
HalfCheetah-v2-lessnoisy-30-rollouts
rewards.png 30KB
model.ckpt.index 3KB
train_stats.npy 75KB
model.ckpt.data-00000-of-00001 187KB
model.ckpt.meta 415KB
train_errors.png 26KB
buffer.pkl 49.86MB
checkpoint 77B
Pendulum-v0
model.ckpt.index 3KB
train_stats.npy 243KB
model.ckpt.data-00000-of-00001 149KB
model.ckpt.meta 409KB
buffer.pkl 25.56MB
checkpoint 77B
LICENSE 1KB
assets
rewards.png 91KB
overview.png 50KB
train_errors.png 69KB
README.md 5KB
_config.yml 59B
共 39 条
- 1
资源评论
FranklinZheng
- 粉丝: 31
- 资源: 4566
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功