没有合适的资源?快使用搜索试试~ 我知道了~
jax-rl:具有连续动作空间的深度强化学习算法的Jax(亚麻)实现
共91个文件
txt:50个
py:34个
sh:1个
需积分: 9 0 下载量 100 浏览量
2021-03-26
11:46:18
上传
评论
收藏 1.28MB ZIP 举报
温馨提示
杰克斯(亚麻)RL 这是强化学习算法的Jax(亚麻)实现: 行为克隆 该存储库的目标是提供一个简单而干净的实现,以在此基础上进行研究。 请不要将此存储库用于基线结果,而应使用SAC的原始实现。 安装 安装并激活Anaconda环境 conda env create -f environment.yml conda activate jax-sac 如果要在GPU上运行此代码,请按照说明进行操作。 请按照使用快速的无头GPU渲染构建mujoco-py。 跑 OpenAI Gym MuJoCo任务 python train.py --env_name=HalfCheetah-v2 --save_dir=./tmp/ DeepMind控制套件(--env-name = dmc-domain-task) python train.py --env_name=dmc-cheetah-ru
资源推荐
资源详情
资源评论
收起资源包目录
jax-rl-main.zip (91个子文件)
jax-rl-main
beautify.sh 104B
train.py 4KB
train_finetuning.py 5KB
configs
bc_default.py 190B
sac_default.py 440B
hard_update.py 183B
awac_default.py 408B
jax_rl
agents
bc
bc_learner.py 1KB
actor.py 467B
actor_critic_temp.py 203B
__init__.py 162B
awac
value.py 1KB
awac_learner.py 4KB
actor.py 1KB
sac
sac_learner.py 4KB
temperature.py 938B
critic.py 2KB
actor.py 958B
evaluation.py 614B
utils.py 920B
datasets
dataset_utils.py 671B
dataset.py 969B
__init__.py 163B
replay_buffer.py 2KB
awac_dataset.py 3KB
d4rl_dataset.py 795B
wrappers
episode_monitor.py 1KB
__init__.py 176B
video_recorder.py 1KB
single_precision.py 191B
common.py 94B
networks
critic_net.py 894B
policies.py 3KB
common.py 3KB
LICENSE 1KB
environment.yml 492B
README.md 2KB
learning_curves
logs
Ant-v2
9.txt 3KB
3.txt 3KB
7.txt 3KB
4.txt 3KB
6.txt 3KB
5.txt 3KB
0.txt 3KB
2.txt 3KB
1.txt 3KB
8.txt 3KB
HalfCheetah-v2
9.txt 3KB
3.txt 3KB
7.txt 3KB
4.txt 3KB
6.txt 3KB
5.txt 3KB
0.txt 3KB
2.txt 3KB
1.txt 3KB
8.txt 3KB
Walker2d-v2
9.txt 3KB
3.txt 3KB
7.txt 3KB
4.txt 3KB
6.txt 3KB
5.txt 3KB
0.txt 3KB
2.txt 3KB
1.txt 3KB
8.txt 3KB
Humanoid-v2
9.txt 2KB
3.txt 2KB
7.txt 2KB
4.txt 2KB
6.txt 2KB
5.txt 2KB
0.txt 2KB
2.txt 2KB
1.txt 2KB
8.txt 2KB
Hopper-v2
9.txt 3KB
3.txt 3KB
7.txt 3KB
4.txt 3KB
6.txt 3KB
5.txt 3KB
0.txt 3KB
2.txt 3KB
1.txt 3KB
8.txt 3KB
images
results.png 620KB
plot.ipynb 1008KB
train_offline.py 3KB
.gitignore 2KB
共 91 条
- 1
资源评论
火锅与理想
- 粉丝: 37
- 资源: 4568
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Java基于springboot+vue的保险业务管理系统源码+数据库+文档说明
- 数据分析-10-扒一扒CXK微博100万+转发量的真假流量粉(包含数据和代码)
- 机械设计除尘降温消毒除臭设备sw16可编辑非常好的设计图纸100%好用.zip
- 2019可运营完整版PHP萌乐游戏代练系统V2.0源码 (完整版可运营去后门)
- 数据分析-11-淘宝李子柒螺蛳粉店铺及评论分析(包含数据和代码)
- 数据分析-12-某电子产品销售数据分析报告及RFM模型(包含数据和代码)
- 数据挖掘/机器学习-01-泰坦尼克号获救预测 Titanic(包含数据和代码)
- 基于 PyQt 的 XSS 漏洞检测系统设计与实现
- 卷积神经网络 CIFAR-10 数据集 例子
- 贫困生资助系统配套资源
- c语言考试必考题型重点复习
- c语言重点习题作业解析
- 机械设计倍速链组装线sw16可编辑非常好的设计图纸100%好用.zip
- 机械设计车四方机床(工程图BOM单)sw12可编辑非常好的设计图纸100%好用.zip
- 机器学习-02-LoanPrediction(贷款预言)(包含代码和数据)
- 圣诞树html网页代码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功