没有合适的资源?快使用搜索试试~ 我知道了~
FOCAL-ICLR:提交给ICLR 2021的FOCAL论文代码
共329个文件
py:230个
stl:43个
xml:16个
需积分: 10 0 下载量 116 浏览量
2021-04-12
19:05:34
上传
评论
收藏 2.57MB ZIP 举报
温馨提示
FOCAL:通过距离度量学习和行为规则化进行高效的全离线元强化学习 通过在许多实际应用中启用RL算法,用于脱机强化学习(OMRL)的元学习是一个未被充分研究的问题,具有巨大的潜在影响。 该问题的一种流行解决方案是使用基于上下文的编码器将任务身份推断为增强状态,对此有效地学习任务表示仍然是一个挑战。 在这项工作中,我们通过结合任务内注意机制和任务间对比学习目标,改进了SOTA OMRL算法之一FOCAL,以更有效地进行任务推理和控制学习。 进行理论分析和实验,以证明我们的端到端和无模型方法与跨多个meta-RL基准的现有算法相比,具有优越的性能,效率和鲁棒性。 安装 要在本地安装,您需要首先安装 。 对于奖励功能有所不同的任务分布(猎豹,蚂蚁),请安装MuJoCo150或plus。 设置LD_LIBRARY_PATH指向MuJoCo二进制文件( /$HOME/.mujoco/mujoco20
资源推荐
资源详情
资源评论
收起资源包目录
FOCAL-ICLR:提交给ICLR 2021的FOCAL论文代码 (329个子文件)
Gemfile 61B
.gitignore 164B
.gitignore 46B
.gitignore 12B
mujoco.h 29KB
sparse-point-robot-vis.ipynb 6KB
rollout.json 264KB
sparse-point-robot.json 1KB
point-robot-wind.json 1KB
sparse-ant-dir.json 974B
sparse-cheetah-vel.json 956B
walker_rand_params.json 945B
sparse-walker-rand-params.json 941B
ant-dir.json 865B
sparse-cheetah-dir.json 831B
cheetah-vel.json 823B
cheetah-dir.json 729B
hopper_rand_params.json 596B
ant-goal.json 572B
humanoid-dir.json 568B
point-robot.json 473B
LICENSE 1KB
LICENSE 1KB
Gemfile.lock 539B
README.md 5KB
README.md 3KB
README.md 2KB
README.md 1KB
README.md 270B
README.md 109B
README.md 84B
mjtypes.py 219KB
glfw.py 53KB
__init__.py 50KB
generate_plot.py 50KB
rl_algorithm.py 32KB
sac.py 29KB
tabulate.py 28KB
transformer.py 27KB
bipedal_walker.py 22KB
mjlib.py 22KB
sac.py 22KB
car_racing.py 19KB
scoring.py 19KB
test_scoring.py 18KB
lunar_lander.py 16KB
monitoring.py 15KB
core.py 13KB
resource.py 13KB
video_recorder.py 12KB
algorithmic_env.py 12KB
__init__.py 12KB
__init__.py 12KB
api.py 12KB
util.py 11KB
launcher_util.py 11KB
mjviewer.py 11KB
hex.py 11KB
go.py 11KB
rendering.py 10KB
acrobot.py 10KB
convergence.py 10KB
test_algorithmic.py 10KB
multi_discrete.py 10KB
agent.py 9KB
car_dynamics.py 9KB
util.py 9KB
logger.py 9KB
scoring.py 9KB
wrappers.py 9KB
train_deep_cnn.py 8KB
agent.py 8KB
train.py 8KB
non_mujoco_point_robot.py 7KB
logger.py 7KB
launch_experiment.py 7KB
play.py 7KB
registration.py 7KB
point_robot.py 7KB
networks.py 6KB
test_monitor.py 6KB
sac.py 6KB
atari_env.py 6KB
api_requestor.py 6KB
mjcore.py 6KB
default.py 5KB
cartpole.py 5KB
walker_rand_params_wrapper.py 5KB
continuous_mountain_car.py 5KB
base.py 5KB
policies.py 5KB
registration.py 5KB
sim_policy.py 5KB
taxi.py 5KB
mujoco_env.py 4KB
divergences.py 4KB
distributions.py 4KB
frozen_lake.py 4KB
mountain_car.py 4KB
http_client.py 4KB
共 329 条
- 1
- 2
- 3
- 4
资源评论
Alysa其诗闻
- 粉丝: 27
- 资源: 4683
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- JavaScript函数
- java-leetcode题解之Range Sum Query 2D - Mutable.java
- java-leetcode题解之Random Pick Index.java
- java-leetcode题解之Race Car.java
- java-leetcode题解之Profitable Schemes.java
- java-leetcode题解之Product of Array Exclude Itself.java
- java-leetcode题解之Prime Arrangements.java
- MCU51-51单片机
- java-leetcode题解之Power of Two.java
- java-leetcode题解之Power of Three.java
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功