没有合适的资源?快使用搜索试试~ 我知道了~
期权matlab代码-higher_order_invariance:“使用高阶不变性加速自然梯度”的代码
共66个文件
py:53个
m:8个
license:2个
需积分: 9 0 下载量 55 浏览量
2021-05-26
17:20:32
上传
评论
收藏 146KB ZIP 举报
温馨提示
预算matlab代码利用高阶不变性加速自然梯度 该repo包含在瑞典斯德哥尔摩ICML 2018论文中再现结果所必需的代码。 ,,和,由Stanford AI Lab提供。 在这项工作中,我们建议使用中点积分器和测地校正来改善自然梯度优化的不变性。 借助我们的方法,我们能够获得用于深度神经网络训练的加速收敛,以及用于深度强化学习的更高样本效率。 依存关系 在Python 3和TensorFlow中实现了综合实验和深度强化学习实验。 深度神经网络训练实验在MATLAB 2015b进行了编码。 为了进行深度强化学习实验,用户需要获得的有效许可。 进行实验 不变性 我们可以观察到,对于可以精确求解ODE的简单目标,中点积分器和测地校正方法比香草自然梯度提供了更多的不变优化轨迹。 要重现本文中的图2,请运行 python synth/gamma_experiment.py 训练深度神经网络 在CURVES,MNIST和FACES数据集上训练深度自动编码器和分类器。 代码基于基于MATLAB的无Hessian优化深度学习。 () 要下载所有数据集,请运行 cd mat/ wget www.cs.
资源推荐
资源详情
资源评论
收起资源包目录
higher_order_invariance-master.zip (66个子文件)
higher_order_invariance-master
mat
vec.m 68B
conjgrad_1.m 2KB
nnet_train_midpoint_2.m 54KB
nnet_experiments.m 9KB
nnet_train_geo_faster.m 55KB
nnet_train_ng.m 46KB
nnet_train_geo.m 57KB
nnet_train_adam.m 24KB
LICENSE 34KB
README.md 3KB
synth
param_square.py 2KB
param0.py 1KB
gamma_experiment.py 6KB
param_beta_3.py 1KB
param1.py 1KB
rl
baselines
common
misc_util.py 7KB
mpi_running_mean_std.py 4KB
test_identity.py 1KB
atari_wrappers.py 8KB
tf_util.py 11KB
cg.py 896B
runners.py 622B
identity_env.py 678B
cmd_util.py 3KB
running_stat.py 1KB
dataset.py 2KB
__init__.py 191B
vec_env
dummy_vec_env.py 2KB
__init__.py 3KB
vec_frame_stack.py 1KB
subproc_vec_env.py 3KB
vec_normalize.py 2KB
running_mean_std.py 2KB
console_util.py 1KB
mpi_moments.py 2KB
tests
test_schedules.py 823B
test_tf_util.py 1000B
test_segment_tree.py 3KB
segment_tree.py 5KB
distributions.py 12KB
filters.py 3KB
schedules.py 4KB
input.py 1KB
mpi_adam.py 3KB
mpi_fork.py 668B
math_util.py 2KB
results_plotter.py 3KB
bench
benchmarks.py 5KB
monitor.py 6KB
__init__.py 78B
__init__.py 0B
logger.py 14KB
acktr
kfac.py 44KB
acktr_cont_geo.py 10KB
utils.py 1KB
kfac_utils.py 3KB
acktr_cont_midpoint.py 6KB
acktr_cont.py 5KB
run_mujoco.py 2KB
__init__.py 0B
value_functions.py 3KB
policies.py 4KB
.travis.yml 224B
LICENSE 1KB
setup.py 957B
.gitignore 294B
共 66 条
- 1
资源评论
weixin_38621427
- 粉丝: 10
- 资源: 941
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- js基础但是这个烂怂东西要求标题不能少于10个字才能上传然后我其实还没有写完之后再修订吧.md
- electron-tabs-master
- Unity3D 布朗运动算法插件 Brownian Motion
- 鼎微R16中控升级包R16-4.5.10-20170221及强制升级方法
- 鼎微R16中控升级包公版UI 2015及强制升级方法,救砖包
- 基于CSS与JavaScript的积分系统设计源码
- 生物化学作业_1_生物化学作业资料.pdf
- 基于libgdx引擎的Java开发连连看游戏设计源码
- 基于MobileNetV3的SSD目标检测算法PyTorch实现设计源码
- 基于Java JDK的全面框架设计源码学习项目
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功