没有合适的资源?快使用搜索试试~ 我知道了~
softlearning:Softlearning是用于在连续域中训练最大熵策略的强化学习框架。 包括Soft Actor-Cr...
共132个文件
py:109个
yml:4个
sh:3个
需积分: 23 2 下载量 125 浏览量
2021-02-04
13:41:14
上传
评论
收藏 157KB ZIP 举报
温馨提示
软学习 软学习是一种深度强化学习工具箱,用于在连续域中训练最大熵策略。 该实现相当薄,并且主要针对我们自己的开发目的进行了优化。 对于大多数模型类(例如策略和值函数),它都使用tf.keras模块。 我们使用Ray进行实验编排。 Ray Tune和Autoscaler实现了几项简洁的功能,使我们能够无缝运行与用于本地原型制作的实验脚本相同的实验脚本,以在任何选定的云服务(例如GCP或AWS)上启动大规模实验,并智能地并行化和分发培训以提高效率。资源分配。 此实现使用Tensorflow。 对于软参与者批评的PyTorch实现,请看一下 。 入门 先决条件 该环境可以使用conda在本地运行,
资源推荐
资源详情
资源评论
收起资源包目录
softlearning:Softlearning是用于在连续域中训练最大熵策略的强化学习框架。 包括Soft Actor-Critic算法的正式实现 (132个子文件)
Dockerfile.softlearning.base.cpu 5KB
.dockerignore 210B
.env 131B
.gitignore 1KB
Dockerfile.softlearning.base.gpu 6KB
LICENSE 1KB
locals 24B
README.md 12KB
flexible_replay_pool_test.py 27KB
variants.py 16KB
sql.py 15KB
main_test.py 14KB
instrument.py 14KB
rl_algorithm.py 13KB
serialization.py 13KB
sac.py 11KB
gaussian_policy.py 11KB
serialization_test.py 10KB
base_policy.py 10KB
main.py 9KB
flexible_replay_pool.py 9KB
softlearning_env.py 9KB
pusher_2d.py 9KB
hindsight_experience_replay_pool.py 8KB
utils.py 8KB
dm_control_adapter.py 7KB
console_scripts.py 7KB
real_nvp_policy_test.py 7KB
hindsight_experience_replay_pool_test.py 7KB
real_nvp_flow.py 6KB
gym_adapter_test.py 6KB
robosuite_adapter.py 6KB
gaussian_policy_test.py 6KB
gym_adapter.py 6KB
multi_goal.py 6KB
robosuite_adapter_test.py 6KB
simple_replay_pool_test.py 5KB
real_nvp_flow_test.py 5KB
image_pusher_2d.py 5KB
base_value_function_test.py 4KB
uniform_policy_test.py 4KB
simulate_policy.py 4KB
remote_sampler.py 4KB
real_nvp_policy.py 4KB
tune.py 4KB
base_value_function.py 4KB
dm_control_adapter_test.py 4KB
__init__.py 3KB
goal_replay_pool.py 3KB
simple_sampler.py 3KB
rescale_observation_test.py 3KB
install_mujoco.py 3KB
remote_sampler_test.py 3KB
__init__.py 3KB
kernel.py 3KB
main.py 3KB
rescale_observation.py 3KB
utils.py 3KB
convnet.py 2KB
__init__.py 2KB
plotter.py 2KB
__init__.py 2KB
conditional_scale_test.py 2KB
__init__.py 2KB
__init__.py 2KB
vanilla.py 2KB
__init__.py 2KB
base_sampler.py 2KB
utils.py 2KB
conditional_scale.py 2KB
feedforward_test.py 2KB
simple_replay_pool.py 2KB
conditional_shift.py 2KB
variants.py 2KB
sync_gs.py 2KB
softlearning_env_test.py 2KB
conditional_shift_test.py 2KB
archive_gs.py 2KB
setup.py 1KB
uniform_policy.py 1KB
union_pool.py 1KB
utils.py 1KB
goal_sampler.py 1KB
tensorflow.py 1KB
feedforward.py 1KB
__init__.py 970B
video.py 851B
git.py 715B
__init__.py 697B
replay_pool.py 671B
utils.py 613B
times.py 495B
misc.py 492B
gcp.py 385B
helpers.py 314B
gym.py 313B
dict.py 291B
random.py 268B
__init__.py 199B
__init__.py 160B
共 132 条
- 1
- 2
资源评论
传奇panda
- 粉丝: 27
- 资源: 4581
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功