没有合适的资源?快使用搜索试试~ 我知道了~
model-free-algorithms:TF1.x中的TD3,SAC,IQN,Rainbow,PPO,Ape-X等
共75个文件
py:54个
yaml:7个
png:6个
需积分: 49 9 下载量 87 浏览量
2021-05-16
15:09:30
上传
评论 2
收藏 12.42MB ZIP 举报
温馨提示
地位。 存档(代码按原样提供,预计不会进行更新) 笔记。 请参阅我的仓库以了解TF2.x中的强化学习算法 实现的算法 算法在实现。 TD3 [] SAC [] IQN [ ] 彩虹[ ] Apex [] 嘈杂的网[ ] PER [] MultiStep ] PPO [] A2C [] GAE [] NAE [] 整体架构 该存储库旨在表示一个漂亮的Tensorboard图,这对于调试非常有用。 典型的图形如下所示: 笔记 分布式算法是使用Ray (灵活,高性能的分布式执行框架)实现的。 由于缺少Mujoco许可证,所有用于连续控制的算法首先在LunarLanderContinuous-v2上进行测试,然后在OpenAI的Gym的BipedalWalker-v2环境中进行测试并解决。 Rainbow,IQN已在CartPole-v0上经过测试,并且可以稳
资源推荐
资源详情
资源评论
收起资源包目录
model-free-algorithms-master.zip (75个子文件)
model-free-algorithms-master
.gitignore 81B
results
apex-td3.png 252KB
ppo.png 215KB
td3-sac.png 185KB
Architecture.png 158KB
BipedalwalkerHardcore-v2.gif 11.85MB
apex-sac.png 266KB
Architecture.graffle 26KB
TFGraph.png 166KB
algo
off_policy
rainbow_iqn
agent.py 6KB
args.yaml 2KB
networks.py 9KB
single_train.py 5KB
replay
proportional_replay.py 1KB
basic_replay.py 6KB
utils.py 2KB
ds
container.py 389B
sum_tree.py 1KB
prioritized_replay.py 3KB
uniform_replay.py 1KB
basic_agent.py 8KB
apex
worker.py 5KB
buffer.py 2KB
td3_args.yaml 2KB
learner.py 2KB
sac_args.yaml 2KB
distributed_train.py 3KB
readme.md 1KB
sac
agent.py 9KB
args.yaml 2KB
networks.py 10KB
td3
agent.py 7KB
args.yaml 2KB
networks.py 4KB
on_policy
single_train.py 2KB
ppo
buffer.py 4KB
agent.py 11KB
args.yaml 2KB
networks.py 8KB
a2c
worker.py 2KB
args.yaml 2KB
learner.py 3KB
distributed_train.py 4KB
readme.md 2KB
requirements.txt 118B
layers
rmc.py 5KB
cbn.py 3KB
adain.py 837B
cln.py 3KB
run
grid_search.py 5KB
train.py 4KB
utility
image_processing.py 4KB
plot.py 3KB
rl_losses.py 2KB
run_avg.py 2KB
tf_distributions.py 5KB
timer.py 2KB
yaml_op.py 1KB
utils.py 5KB
tf_utils.py 8KB
decorators.py 361B
schedule.py 3KB
display.py 1KB
aggregator.py 345B
logger.py 6KB
debug_tools.py 1KB
losses.py 278B
env
wrappers.py 3KB
gym_env.py 8KB
open_tensorboard.sh 47B
readme.md 5KB
test
gym_test.py 1KB
dist_test.py 0B
basic_model
layer.py 24KB
model.py 16KB
共 75 条
- 1
资源评论
weixin_42138139
- 粉丝: 23
- 资源: 4653
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 【创新无忧】基于豪猪优化算法CPO优化相关向量机RVM实现数据多输入单输出回归预测附matlab代码.rar
- 【创新无忧】基于黑翅鸢算法BKA优化广义神经网络GRNN实现电机故障诊断附matlab代码.rar
- 【创新无忧】基于黑翅鸢算法BKA优化极限学习机ELM实现乳腺肿瘤诊断附matlab代码.rar
- 【创新无忧】基于黑猩猩优化算法Chimp优化广义神经网络GRNN实现电机故障诊断附matlab代码.rar
- 【创新无忧】基于黑猩猩优化算法Chimp优化广义神经网络GRNN实现光伏预测附matlab代码.rar
- 【创新无忧】基于黑翅鸢算法BKA优化极限学习机KELM实现故障诊断附matlab代码.rar
- 【创新无忧】基于黑猩猩优化算法Chimp优化广义神经网络GRNN实现数据回归预测附matlab代码.rar
- 【创新无忧】基于黑猩猩优化算法Chimp优化极限学习机ELM实现乳腺肿瘤诊断附matlab代码.rar
- 【创新无忧】基于黑猩猩优化算法Chimp优化极限学习机KELM实现故障诊断附matlab代码.rar
- 【创新无忧】基于花朵授粉优化算法FPA优化广义神经网络GRNN实现电机故障诊断附matlab代码.rar
- 【创新无忧】基于黑猩猩优化算法Chimp优化相关向量机RVM实现北半球光伏数据预测附matlab代码.rar
- 【创新无忧】基于黑猩猩优化算法Chimp优化相关向量机RVM实现数据多输入单输出回归预测附matlab代码.rar
- 【创新无忧】基于花朵授粉优化算法FPA优化广义神经网络GRNN实现数据回归预测附matlab代码.rar
- 【创新无忧】基于花朵授粉优化算法FPA优化广义神经网络GRNN实现光伏预测附matlab代码.rar
- 【创新无忧】基于花朵授粉优化算法FPA优化极限学习机ELM实现乳腺肿瘤诊断附matlab代码.rar
- 【创新无忧】基于花朵授粉优化算法FPA优化相关向量机RVM实现数据多输入单输出回归预测附matlab代码.rar
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功