没有合适的资源?快使用搜索试试~ 我知道了~
mountain-car-SARSA-AC:使用具有线性函数逼近的SARSA解决山地车问题
需积分: 38 4 下载量 32 浏览量
2021-05-02
09:53:46
上传
评论 2
收藏 7KB ZIP 举报
温馨提示
具有SARSA函数逼近的山地车 该存储库包含两个项目: 使用具有线性函数逼近的SARSA解决山地车问题。 使用Actor Critic解决连续山地车问题。 山地车是最流行的强化学习测试环境之一。 特工必须学习利用滚下山坡而达到目标的势头。 它具有一个连续的状态空间,其中包含一组离散的动作(向左,向右和不执行任何操作)。 我使用了特征向量和权重集的线性组合来近似状态作用值函数Q。使用允许非线性值函数的RBF核近似,将状态样本转换为更高维的空间。 只需运行mountaincar.py并根据需要注释掉env.render()即可切换可视化。 我还包括用于梯度检查和动作选择,值函数和奖励图的可选方法。 将它变成Q-Learning解决方案将花费很少的精力。 对于连续的环境,代理倾向于收敛到选择不移动的局部最优状态。 这是因为对代理而言,每次执行操作都会得到负奖励,而奖励0胜于奖励-99
资源推荐
资源评论
资源评论
步衫
- 粉丝: 33
- 资源: 4640
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功