没有合适的资源？快使用搜索试试~ 我知道了~

文库首页行业互联网计算机类校招求职笔记-个人整理

计算机类校招求职笔记-个人整理

需积分: 11 1 下载量 142 浏览量 2021-02-03 20:26:04 上传评论收藏 1.11MB DOCX 举报

温馨提示

试读

24页

适合在校招中求职的同学

资源详情

资源评论

资源推荐

深度学习部分

过拟合与欠拟合

 欠拟合指模型不能在训练集上获得足够低的训练误差；

 过拟合指模型的训练误差与测试误差（泛化误差）之间差距过大；

反映在评价指标上，就是模型在训练集上表现良好，但是在测试集和新数

据上表现一般（泛化能力差）；

降低过拟合风险的方法

所有为了减少测试误差的策略统称为正则化方法，这些方法可能会以增大

训练误差为代价。

 数据增强

 图像：平移、旋转、缩放

 利用生成对抗网络（）生成新数据

 ：利用机器翻译生成新数据

 降低模型复杂度

 神经网络：减少网络层、神经元个数

 决策树：降低树的深度、剪枝

 权值约束（添加正则化项）

 正则化

 正则化

 集成学习

 神经网络：

 决策树：随机森林、

 提前终止

降低欠拟合风险的方法

 加入新的特征

 交叉特征、多项式特征、

 深度学习：因子分解机、、自编码器

 增加模型复杂度

 线性模型：添加高次项

 神经网络：增加网络层数、神经元个数

 减小正则化项的系数

 添加正则化项是为了限制模型的学习能力，减小正则化项的系数则可以

放宽这个限制

 模型通常更倾向于更大的权重，更大的权重可以使模型更好的拟合数据

反向传播算法

反向传播的作用/目的/本质

 反向传播概述：

梯度下降法中需要利用损失函数对所有参数的梯度来寻找局部最小值点；

而反向传播算法就是用于计算该梯度的具体方法，其本质是利用链式法则

对每个参数求偏导。

反向传播的公式推导

 可以用 个公式总结反向传播的过程（反向传播的四个基本公式）：

标量形式：

激活函数

激活函数的作用——为什么要使用非线性激活函数？

 使用激活函数的目的是为了向网络中加入非线性因素；加强网络的表示能

力，解决线性模型无法解决的问题

为什么加入非线性因素能够加强网络的表示能力？——神经网络的

万能近似定理

 神经网络的万能近似定理认为主要神经网络具有至少一个非线性隐藏层，

那么只要给予网络足够数量的隐藏单元，它就可以以任意的精度来近似任

何从一个有限维空间到另一个有限维空间的函数。

 如果不使用非线性激活函数，那么每一层输出都是上层输入的线性组合；

此时无论网络有多少层，其整体也将是线性的，这会导致失去万能近似的

性质。

 但仅部分层是纯线性是可以接受的，这有助于减少网络中的参数。

常见的激活函数

整流线性单元 ReLU

  通常是激活函数较好的默认选择

ReLU相比 sigmoid的优势 (3)

 避免梯度消失

  函数在输入取绝对值非常大的正值或负值时会出现饱和现象——在图像

上表现为变得很平，此时函数会对输入的微小变化不敏感——从而造成梯度消失；

 的导数始终是一个常数——负半区为 ，正半区为  所以不会发生梯

度消失现象

 减缓过拟合

 在负半区的输出为 。一旦神经元的激活值进入负半区，那么该激活值就

不会产生梯度!不会被训练，造成了网络的稀疏性——稀疏激活。

 这有助于减少参数的相互依赖，缓解过拟合问题的发生。

 加速计算

 的求导不涉及浮点运算，所以速度更快。

为什么 ReLU 不是全程可微/可导也能用于基于梯度的学习？

 虽然从数学的角度看 在 点不可导，因为它的左导数和右导数不相等；

 但是在实现时通常会返回左导数或右导数的其中一个，而不是报告一个导数不存在的

错误。从而避免了这个问题。

Tanh 定义域是负无穷到正无穷，值域是[-1,1]

正则化

Batch Normalization（批标准化）

 是一种正则化方法（减少泛化误差），主要作用有：

 加速网络的训练（缓解梯度消失，支持更大的学习率）。

 防止过拟合。

 降低了参数初始化的要求。

动机

 训练的本质是学习数据分布。如果训练数据与测试数据的分布不同会降低模型的泛化

能力。因此，应该在开始训练前对所有输入数据做归一化处理。

 而在神经网络中，因为每个隐层的参数不同，会使下一层的输入发生变化，从而导致

每一批数据的分布也发生改变；致使网络在每次迭代中都需要拟合不同的数据分布，

增大了网络的训练难度与过拟合的风险。

L1/L2 范数的作用、异同

剩余23页未读，继续阅读

内容反馈

JenKinJia

粉丝: 77
资源: 49

上传资源快速赚钱

我的内容管理展开

我的资源快来上传第一个资源

我的收益

登录查看自己的收益

我的积分登录查看自己的积分

我的C币登录后查看C币余额

我的收藏

我的下载

下载帮助

前往需求广场，查看用户热搜

计算机类校招求职笔记-个人整理

评论0

最新资源

计算机类校招求职笔记-个人整理

评论0

计算机应用专业个人求职简历.doc

计算机教师个人求职简历模板.doc

Job-interview-materials:个人整理的一些求职资料，针对服务端岗位(JAVA)

新编计算机文化基础项目制作个人求职书PPT学习教案.pptx

新编计算机文化基础项目制作个人求职书PPT课件.pptx

计算机辅助设计课堂笔记------.pdf

专科自考02316-计算机应用技术-第二章计算机软件系统概述-笔记整理-复习资料

信息系统项目管理师学习笔记-个人整理.doc

C++计算机求职笔记相关资料

热门下载计算机控制技术专业个人求职简历.doc

计算机毕业设计-大学生求职通用个人网站的设计与实现

计算机组成原理-王道-笔记-汇总

JavaScript笔记-个人笔记

计算机网络笔记-重点内容整理.docx

Redis笔记-尚硅谷周阳V1.3-脑图

C# 学习笔记-个人整理

凸优化笔记-个人整理，易于理解

oracle自学笔记-视频实例整理

计算机组成原理笔记-找工作前突击

新版自考金融理论与实务笔记-(整理版).doc

山东-专升本-公共课计算机-笔记-精心版.pdf

个人笔记-html个人笔记-html

《质量免费 Quality is Free》—质量革命的圣经—阅读笔记-Simon整理版.rar

CSS笔记-个人笔记-求权威绕

java校招学习笔记

数据结构看书笔记---lazyfennec整理精选

Java 面经手册·小傅哥.pdf

解压后拖入浏览器扩展程序使用.zip

最新资源