没有合适的资源?快使用搜索试试~ 我知道了~
ATLA_robust_RL:通过交替学习的对手(ATLA)框架进行稳健的强化学习
共176个文件
py:74个
model:48个
json:25个
需积分: 13 0 下载量 93 浏览量
2021-05-25
19:24:42
上传
评论
收藏 56.34MB ZIP 举报
温馨提示
健壮的强化学习和经验丰富的对手的交替训练(ATLA) 该存储库包含一个参考实现,用于交替训练已学习的对手(ATLA),以针对状态观察的对抗攻击进行健壮的强化学习。 我们的ATLA训练程序可能有点类似于监督学习的“对抗训练”,但是我们基于 ,该过程表征了RL代理的最佳对抗攻击。 在训练过程中,我们会按照最佳的攻击方式与对手一起学习对手。 代理必须在训练期间击败这个强大的对手,从而在测试期间变得强大,可以抵抗各种强大的攻击。 先前的方法不是基于SA-MDP,而是在训练过程中使用了基于梯度的攻击试探法,这些试探法不够强大,并且在强大的测试时间攻击下变得脆弱。 遵循SA-MDP,我们可以找到最佳对抗攻击,通过解决转换后的MDP,可以在给定代理和环境的情况下获得最低的报酬。 这可以类似于分类问题中的最小对抗性示例()。 在DRL设置中,可以使用任何DRL算法(例如PPO)来解决此MDP。 我们
资源推荐
资源详情
资源评论
收起资源包目录
ATLA_robust_RL:通过交替学习的对手(ATLA)框架进行稳健的强化学习 (176个子文件)
auto_LiRPA 24B
cox 12B
humanoid_sappo_attack_6042.gif 1.34MB
ant_ppo_rs_attack_63.gif 1.29MB
hopper_ppo_natural_3617.gif 1.28MB
walker_ppo_natural_4001.gif 1.1MB
walker_sappo_attack_5044.gif 1.07MB
halfcheetah_ppo_optimal_attack_-743.gif 1.07MB
ant_ppo_optimal_attack_-1141.gif 1.06MB
humanoid_vanilla_ppo_attack_615.gif 957KB
walker_vanilla_ppo_attack_620.gif 870KB
halfcheetah_ppo_rs_attack_85.gif 860KB
ant_atla_ppo_optimal_attack_3835.gif 809KB
ant_ppo_natural_5358.gif 762KB
ant_ppo_natural_5851.gif 733KB
halfcheetah_atla_ppo_optimal_attack_5250.gif 609KB
halfcheetah_ppo_natural_7094.gif 581KB
.gitignore 1KB
.gitignore 803B
.gitignore 58B
.gitmodules 110B
config_halfcheetah_atla_lstm_sappo.json 2KB
config_halfcheetah_sappo_convex.json 2KB
config_hopper_sappo_convex.json 2KB
config_halfcheetah_atla_ppo_lstm.json 2KB
config_walker_sappo_convex.json 2KB
config_halfcheetah_vanilla_ppo.json 2KB
config_halfcheetah_atla_ppo.json 2KB
config_halfcheetah_vanilla_ppo_lstm.json 2KB
config_walker_atla_lstm_sappo.json 2KB
config_hopper_vanilla_ppo.json 2KB
config_ant_atla_lstm_sappo.json 2KB
config_hopper_atla_lstm_sappo.json 2KB
config_walker_vanilla_ppo.json 2KB
config_walker_atla_ppo.json 2KB
config_walker_atla_ppo_lstm.json 2KB
config_ant_atla_ppo_lstm.json 2KB
config_hopper_atla_ppo_lstm.json 2KB
config_hopper_atla_ppo.json 2KB
config_walker_vanilla_ppo_lstm.json 2KB
config_ant_sappo_convex.json 2KB
config_hopper_vanilla_ppo_lstm.json 2KB
config_ant_vanilla_ppo_lstm.json 2KB
config_ant_vanilla_ppo.json 2KB
config_ant_atla_ppo.json 2KB
MuJoCo.json 2KB
README.md 24KB
README.md 11KB
model-lstm-atla-ppo-ant.model 2.11MB
attack-lstm-atla-ppo-ant.model 2.09MB
model-atla-lstm-sappo-ant.model 2.09MB
attack-lstm-ppo-ant.model 2.09MB
attack-atla-lstm-sappo-ant.model 2.09MB
attack-lstm-ppo-walker.model 1.69MB
attack-atla-lstm-sappo-halfcheetah.model 1.69MB
attack-lstm-ppo-halfcheetah.model 1.69MB
attack-atla-lstm-sappo-walker.model 1.69MB
attack-lstm-atla-ppo-halfcheetah.model 1.69MB
model-lstm-atla-ppo-halfcheetah.model 1.69MB
model-atla-lstm-sappo-walker.model 1.67MB
model-lstm-atla-ppo-walker.model 1.67MB
attack-lstm-atla-ppo-walker.model 1.67MB
model-atla-lstm-sappo-halfcheetah.model 1.67MB
model-atla-lstm-sappo-hopper.model 1.66MB
model-lstm-atla-ppo-hopper.model 1.66MB
attack-atla-lstm-sappo-hopper.model 1.66MB
attack-lstm-atla-ppo-hopper.model 1.66MB
attack-lstm-ppo-hopper.model 1.64MB
model-lstm-ppo-ant.model 1MB
model-lstm-ppo-walker.model 855KB
model-lstm-ppo-halfcheetah.model 855KB
model-lstm-ppo-hopper.model 841KB
attack-atla-ppo-ant.model 665KB
attack-ppo-ant.model 653KB
attack-sappo-convex-ant.model 652KB
model-atla-ppo-ant.model 652KB
attack-atla-ppo-walker.model 305KB
attack-ppo-halfcheetah.model 305KB
attack-atla-ppo-halfcheetah.model 305KB
attack-sappo-convex-halfcheetah.model 305KB
attack-sappo-convex-walker.model 305KB
attack-ppo-walker.model 301KB
model-ppo-ant.model 294KB
model-sappo-convex-ant.model 294KB
model-atla-ppo-walker.model 292KB
model-atla-ppo-halfcheetah.model 292KB
attack-atla-ppo-hopper.model 280KB
attack-sappo-convex-hopper.model 280KB
model-atla-ppo-hopper.model 267KB
attack-ppo-hopper.model 267KB
model-sappo-convex-halfcheetah.model 154KB
model-sappo-convex-walker.model 154KB
model-ppo-walker.model 150KB
model-ppo-halfcheetah.model 147KB
model-sappo-convex-hopper.model 143KB
model-ppo-hopper.model 139KB
agent.py 68KB
steps.py 44KB
models.py 27KB
run.py 20KB
共 176 条
- 1
- 2
资源评论
大英勋爵汉弗莱
- 粉丝: 42
- 资源: 4491
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- java项目之图书馆借阅系统的设计与实现源代码.zip
- C++ 控制台模拟ATM自动取款机 程序设计课程期末实验项目,.zip
- PHP实现多服务器session共享之memcache共享中文最新版本
- (OC)MQTT信息收发
- Win7下配置ApachePHPMySQL中文最新版本
- MFC使用MSXML2解析XML文件.zip
- Python大作业封面.doc
- 2d956ffda1551121.png
- RuoYi-Vue3.7z
- rf-practice
- CentOS搭建LAMP平台Web控制面板管理中文最新版本
- 量产HX711电子秤采集模块全套资料 1.串口波特率19200; 2.上电后直接串口打印称重数据; 3.可以发指令校零传感器,读取称重数值; 4.默认使用的是40Kg的传感器,其它传感器需要重新修正参
- LAMP详解及源码编译安装过程中文最新版本
- 广州大学人工智能原理实验(一)代码包
- TWIG模板设计快速入门手册中文最新版本
- 数据库连接工具dbeaver ARM版本
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功