国科大强化学习18-19春季_强化学习期末报告资源-CSDN文库

共10个文件

pdf：6个

zip：4个

版权申诉

5星 · 超过95%的资源 112 浏览量 2021-09-09 22:18:09 上传评论收藏 28.06MB RAR 举报

资源推荐

资源详情

资源评论

收起资源包目录

package

912333.rar （10个子文件）

folder

新建文件夹

folder

强化学习18-19春季

lecture 6.zip 6KB

RL_lecture3.pdf 1.21MB

lecture 3.zip 6KB

RL_lecture1.pdf 5.58MB

RL_lecture5.pdf 1.63MB

lecture 4.zip 1.94MB

lecture 2.zip 5KB

RL_lecture2.pdf 1.96MB

RL_lecture4.pdf 4.72MB

RL_lecture6.pdf 13.37MB

. . . . . .

强化学习

强化学习

第六讲

教师：赵冬斌

助教：朱圆恒

中国科学院自动化研究所

中国科学院大学

May 17, 2019

. . . . . .

强化学习

回顾

使用逼近器的特点:

较少数量的参数表达复杂的函数 (计算复杂度)

对一个权重的调整可以影响到很多的点 (泛化能力)

多种特征表示和逼近器结构 (多样性)

. . . . . .

强化学习

神经网络

神经网络

人工神经网络 (Artiﬁcial Neural Network，ANN)，简称神经

网络 (Neural Network，NN) 或类神经网络，在机器学习和

认知科学领域，是一种模仿生物神经网络（动物的中枢神经

系统，特别是大脑）的结构和功能的数学模型或计算模型，

用于对函数进行估计或近似

神经网络由大量的人工神经元联结进行计算

神经元由输入结点, 输出结点, 连接权重, 偏置组成

. . . . . .

强化学习

神经网络

前向神经网络, Feedforward Neural Networks

神经网络定义

- 前向传播

- 神经元类型

- 神经网络逼近能力

如何训练神经网络

- 损失函数

- 梯度下降反向传播

. . . . . .

强化学习

神经网络

人工神经元

神经元预激活 (或输入激活)

a(x) = b +



i

w

i

x

i

= b + w

T

x

神经元输出激活

h(x) = g(a(x)) = g(b +



i

w

i

x

i

)

其中

w 是权重 (参数)

b 是偏置

g(·) 是激活函数

内容反馈

版权申诉

Xeuphoria233

2023-06-02

感谢大佬，让我及时解决了当下的问题，解燃眉之急，必须支持！
Tan_L_Y

2023-06-01

超级好的资源，很值得参考学习，对我启发很大，支持！
qq_54532002

2023-05-19

资源不错，对我启发很大，获得了新的灵感，受益匪浅。
rl-小白

2023-08-24

超赞的资源，感谢资源主分享，大家一起进步！
qq_43234707

2022-06-04

用户下载后在一定时间内未进行评价，系统默认好评。

前往

页

gu5218

粉丝: 37
资源: 257

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip