论文研究-全增量式自然梯度Actor-Critic学习算法 .pdf

所需积分/C币:9 2019-08-16 10:00:04 437KB .PDF
44
收藏 收藏
举报

全增量式自然梯度Actor-Critic学习算法,冯涣婷,程玉虎,尽管策略梯度强化学习算法具有较好的收敛性,但是在梯度估计过程中方差过大,影响了算法的性能。为了提高策略梯度算法的收敛速度

...展开详情
试读 10P 论文研究-全增量式自然梯度Actor-Critic学习算法 .pdf
立即下载
限时抽奖 低至0.43元/次
身份认证后 购VIP低至7折
一个资源只可评论一次,评论内容不能少于5个字
您会向同学/朋友/同事推荐我们的CSDN下载吗?
谢谢参与!您的真实评价是我们改进的动力~
  • 至尊王者

关注 私信
上传资源赚钱or赚积分
最新推荐
论文研究-全增量式自然梯度Actor-Critic学习算法 .pdf 9积分/C币 立即下载
1/10
论文研究-全增量式自然梯度Actor-Critic学习算法 .pdf第1页
论文研究-全增量式自然梯度Actor-Critic学习算法 .pdf第2页

试读结束, 可继续读1页

9积分/C币 立即下载