没有合适的资源?快使用搜索试试~ 我知道了~
离散控制Matlab代码-swirl:通过摇摆的事物加强学习
共76个文件
m:42个
mat:12个
md:7个
需积分: 5 0 下载量 161 浏览量
2021-05-23
08:08:58
上传
评论
收藏 864KB ZIP 举报
温馨提示
离散控制Matlab代码漩涡 通过摇摆的事物加强学习 您已得到一个摆锤,并被告知要通过主动移动支点使其与空中重量保持平衡。 做这个的最好方式是什么? Swirl是强化学习教程的沙盒,探讨了此问题的各种解决方案。 这是一项正在进行的工作,但我的目标是涵盖一系列日益复杂的RL方法,并将每种方法应用于倒立摆任务。 现在,我将每个方法编写为单独的“章节”,其中包括有关该方法的简短教程,该任务的实现说明以及您可以运行以查看其运行效果的脚本。 这是到目前为止的目录: -系统运动方程的推导和用于数值模拟的更新规则。 -使用PID控制的基本启发式解决方案,并讨论了将PID层叠为自上而下的行为层次。 -在粗糙离散的状态空间中将任务设置为Markov决策过程,并通过Bellman方程的直接数值解找到最佳控制策略。 -通过策略迭代实现任务的解决方案。 每个章节都有其自己的目录,其内容在LaTeX中设置,并位于writeups子目录中。 Matlab实现位于code子目录中,并且每一章的README.md文件都包含用于运行代码的指令。 享受!
资源推荐
资源详情
资源评论
收起资源包目录
swirl-master.zip (76个子文件)
swirl-master
1-pid
writeup
1-pid.pdf 89KB
1-pid.tex 4KB
code
pid_controller.m 578B
run_simulation.m 1KB
README.md 193B
LICENSE 1KB
3-pi
writeup
3-pi.tex 9KB
3-pi.pdf 130KB
code
get_force.m 258B
reward_fn.m 674B
get_state.m 694B
transition_probs.m 1020B
optimal_policy.m 379B
value_iteration.m 927B
policy_iteration_ipe.mat 2KB
policy_iteration.mat 2KB
value_fn.m 436B
policy_iteration.m 620B
policy_iteration_ipe.m 746B
iterative_policy_evaluation.m 751B
value_iteration.mat 2KB
rand_within.m 1KB
run_simulation.m 1004B
README.md 2KB
5-td
writeup
5-td.tex 503B
code
q_learning.mat 26KB
double_q_learning.m 2KB
expected_sarsa.mat 23KB
sarsa.m 2KB
expected_sarsa.m 2KB
world.mat 458B
train_script.m 50B
sarsa.mat 23KB
world.m 1KB
q_learning.m 1KB
double_q_learning.mat 26KB
run_simulation.m 838B
README.md 1KB
.gitignore 202B
README.md 2KB
0-sim
writeup
0-sim.pdf 146KB
0-sim.tex 7KB
free_body.png 84KB
code
draw.m 1KB
is_terminal.m 369B
get_force.m 275B
get_state.m 812B
get_reward.m 703B
get_action.m 296B
rk4.m 1KB
ind_max.m 293B
README.md 231B
2-mdp
writeup
substates.png 53KB
2-mdp.pdf 206KB
2-mdp.tex 17KB
code
get_force.m 258B
reward_fn.m 462B
get_state.m 953B
transition_probs.m 891B
policy.m 399B
value_fn.m 833B
policy.mat 284B
rand_within.m 1KB
run_simulation.m 913B
README.md 837B
4-mc
writeup
4-mc.pdf 31KB
4-mc.tex 583B
code
off_mc.mat 22KB
off_mc.m 1KB
world.mat 458B
on_mc.mat 24KB
generate_episode.m 1KB
on_mc.m 2KB
world.m 1KB
run_simulation.m 805B
README.md 1KB
共 76 条
- 1
资源评论
weixin_38562725
- 粉丝: 3
- 资源: 931
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功