softlearning：Softlearning是用于在连续域中训练最大熵策略的强化学习框架。包括SoftActor-Critic算法的正式实现资源-CSDN文库

共132个文件

py：109个

yml：4个

sh：3个

machine-learning

deep-neural-networks

reinforcement-learning

deep-learning

deep-reinforcement-learning

需积分: 23 125 浏览量 2021-02-04 13:41:14 上传评论收藏 157KB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

softlearning：Softlearning是用于在连续域中训练最大熵策略的强化学习框架。包括Soft Actor-Critic算法的正式实现（132个子文件）

Dockerfile.softlearning.base.cpu 5KB

.dockerignore 210B

.env 131B

.gitignore 1KB

Dockerfile.softlearning.base.gpu 6KB

LICENSE 1KB

locals 24B

README.md 12KB

flexible_replay_pool_test.py 27KB

variants.py 16KB

sql.py 15KB

main_test.py 14KB

instrument.py 14KB

rl_algorithm.py 13KB

serialization.py 13KB

sac.py 11KB

gaussian_policy.py 11KB

serialization_test.py 10KB

base_policy.py 10KB

main.py 9KB

flexible_replay_pool.py 9KB

softlearning_env.py 9KB

pusher_2d.py 9KB

hindsight_experience_replay_pool.py 8KB

utils.py 8KB

dm_control_adapter.py 7KB

console_scripts.py 7KB

real_nvp_policy_test.py 7KB

hindsight_experience_replay_pool_test.py 7KB

real_nvp_flow.py 6KB

gym_adapter_test.py 6KB

robosuite_adapter.py 6KB

gaussian_policy_test.py 6KB

gym_adapter.py 6KB

multi_goal.py 6KB

robosuite_adapter_test.py 6KB

simple_replay_pool_test.py 5KB

real_nvp_flow_test.py 5KB

image_pusher_2d.py 5KB

base_value_function_test.py 4KB

uniform_policy_test.py 4KB

simulate_policy.py 4KB

remote_sampler.py 4KB

real_nvp_policy.py 4KB

tune.py 4KB

base_value_function.py 4KB

dm_control_adapter_test.py 4KB

__init__.py 3KB

goal_replay_pool.py 3KB

simple_sampler.py 3KB

rescale_observation_test.py 3KB

install_mujoco.py 3KB

remote_sampler_test.py 3KB

__init__.py 3KB

kernel.py 3KB

main.py 3KB

rescale_observation.py 3KB

utils.py 3KB

convnet.py 2KB

__init__.py 2KB

plotter.py 2KB

__init__.py 2KB

conditional_scale_test.py 2KB

__init__.py 2KB

vanilla.py 2KB

__init__.py 2KB

base_sampler.py 2KB

utils.py 2KB

conditional_scale.py 2KB

feedforward_test.py 2KB

simple_replay_pool.py 2KB

conditional_shift.py 2KB

variants.py 2KB

sync_gs.py 2KB

softlearning_env_test.py 2KB

conditional_shift_test.py 2KB

archive_gs.py 2KB

setup.py 1KB

uniform_policy.py 1KB

union_pool.py 1KB

utils.py 1KB

goal_sampler.py 1KB

tensorflow.py 1KB

feedforward.py 1KB

__init__.py 970B

video.py 851B

git.py 715B

__init__.py 697B

replay_pool.py 671B

utils.py 613B

times.py 495B

misc.py 492B

gcp.py 385B

helpers.py 314B

gym.py 313B

dict.py 291B

random.py 268B

__init__.py 199B

__init__.py 160B

共 132 条

评论收藏

内容反馈

传奇panda

粉丝: 27
资源: 4581

softlearning：Softlearning是用于在连续域中训练最大熵策略的强化学习框架。包括Soft Actor-Cr...

最新资源

softlearning：Softlearning是用于在连续域中训练最大熵策略的强化学习框架。 包括Soft Actor-Cr...

软学习是用于在连续领域中训练最大熵策略的强化学习框架。 包括Soft Actor-Critic算法的正式实现。-Python开发

Homotopy Based Reinforcement Learning with Maximum Entropy for

最新无模型深度强化学习研究：从零开始训练机器人“玩乐高”.pdf

Python-逆强化学习算法APPMaxEntGAILVAIL

使用SVD-TLS算法及最大熵估计的burg算法实现股票的谱估计 _SVD-TLS算法_实验报告

用matlab编写的二维最大熵和最小交叉熵实现图像的分割-CSDN下载.2018_03_16

揭开机器学习的面纱：最大熵模型100行代码实现[Python版] - 纯净的天空.pdf

深度逆向强化学习研究综述.pdf

基于深度强化学习SAC算法的投资组合管理.pdf

最大熵算法pdf讲义超详细

最大熵阈值算法的VC实现带代码

用matlab编写的二维最大熵和最小交叉熵实现图像的分割-CSDN下载

基于深度强化学习算法的“电网脑”及其示范工程应用.pdf

基于最大熵神经网络算法的柔性制造系统调度策略研究.pdf

基于遗传算法的一维最大熵多阈值分割

最大熵源码

最大熵模型JAVA实现

Java结合GIS训练算法实现最大熵.zip

mdps-exact-methods_mdp_

基于Matlab的最大熵模糊图像复原算法

最大熵滤波算法matlab仿真.rar_Huber Kalman_Huber 卡尔曼_Huber 滤波_IK4_最大熵算法

李航《统计学习方法》笔记 --从原理到实现：基于R.pdf

基于最大熵的粒子群算法的多阈值图像分割

使用adaboost，贝叶斯朴素法，决策树，knn，逻辑斯蒂，最大熵，svm，感知机算法实现了MNIST数据集学习并分类

基于Java实现最大熵的简明【100012389】

maxentropy：Python中的最大熵模型和最小散度模型.zip

最新资源

softlearning：Softlearning是用于在连续域中训练最大熵策略的强化学习框架。包括Soft Actor-Cr...

软学习是用于在连续领域中训练最大熵策略的强化学习框架。包括Soft Actor-Critic算法的正式实现。-Python开发