没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
第01课:深度学习概述
什么是深度学习
机器学习,顾名思义,是机器从数据中总结经验,找出某种规律构建模型,并用它来解决实际
问题。而深度学习,是机器学习的一个重要分支和延伸,是包含多隐层的神经网络结构。深度
学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,从而学习到数据本身最关键
的特征。
简单来说,深度学习就是更深、更加复杂的神经网络结构。首先,我将通过一个例子来解释什
么是神经网络。
例如一个房屋价格预测问题。输入 x 是房屋面积大小,输出 y 是房屋的价格。如果要预测价格
与面积的关系,最简单的一种模型就是 y 与 x 近似线性相关。
如上图所示,红色圆圈表示真实样本的价格与面积分布,蓝色虚线表示预测线性模型。这种最
简单的线性模型被称为线性感知机模型。线性感知机模型的基本结构如下:
itjc8.com收集整理
其中,w 为权重系数(Weights),b 为偏移量(Bias)。线性感知机模型表征了房屋价格与
单一变量(房屋面积)的线性关系。
单个神经元(Neuron)与线性感知机的基本结构非常类似,只是在线性的基础上增加了非线
性单元,目的是为了让模型更加复杂。
这里的非线性单元指的就是激活函数。关于激活函数的概念这里不作介绍,后面章节我将详细
介绍。这里,大家把它看成是一个非线性函数即可。这样,线性感知机和非线性单元就构成了
单个神经元。
单个神经元描述的是输出与单一变量之间的关系。还是上面的例子,如果房屋价格不仅与房屋
面积有关,还和房间数目、地理位置等多个因素有关。这样,输入 x 不再是单一变量,而是由
房屋面积、房间数目、地理位置等组成的多维向量。因此,我们就可以使用多个神经元来构建
一个更加复杂的模型。
itjc8.com收集整理
如上图所示, x1、x2、x3 表示输入元素,
表示神经元。h1、h2、h3 是隐藏层神经元,之
所以设置隐藏层神经元是为了分别从不同输入中提取特征,再将这些特征经过输出层神经元
out,预测房价 g。每一个隐藏层神经元与每个输入元素都进行连接,这保证了提取信息的完
整性。这个模型就是最简单的神经网络模型。
上面隐藏层个数为什么是 3?其实,隐藏层神经元个数不是固定的,可以是 2,也可以是 4,
它是个可调参数。更深入地,上面的神经网络模型只有单隐藏层,如果问题比较复杂,训练样
本比较多,我们可以使用更多隐藏层,每一隐藏层的神经元个数都可以设置。一般来说,层数
越多越深,神经网络模型模型越复杂,学习能力越强。这样的深层神经网络就被称为深度学习
模型。
深度学习模型除了标准的神经网络(Neural Network,NN)之外,还包括卷积神经网络
itjc8.com收集整理
(Convolutional Neural Network,CNN)、循环神经网络(Recurrent Neural
Network,RNN)。
CNN 多应用于机器视觉、图像处理,RNN 多应用于序列模型、语音处理等。关于 CNN 和
RNN 的详细内容,我将在之后的章节中详细介绍。
为什么要深度学习
传统的机器学习算法,例如线性回归、逻辑回归、支持向量机、决策树、随机森林等能够处理
很多问题,实际应用也非常广泛。许多数据挖掘竞赛、机器学习算法大赛、Kaggle 等,传统
的机器学习算法都有着很优秀的表现。但是,随着互联网的兴起与蓬勃发展,每天都有海量的
数据产生,如何从大数据中寻找规律建立准确的模型,深度学习逐渐发挥其优势,呈现出比传
统机器学习更大的能力。下面,我们用一张图来说明。
itjc8.com收集整理
上图共有 4 条曲线,从下往上分别为传统机器学习算法、规模较小的神经网络、规模中等的神
经网络、规模较大的神经网络。从每条曲线的趋势可以看出,当数据量较少的时候,传统机器
学习模型的表现是不错的,与神经网络模型差别不大。但随着数据量越来越大,传统机器学习
模型的性能表现开始增长缓慢,似乎到达了瓶颈。而神经网络模型的性能仍然表现出较快的上
升趋势,且规模越大,性能提升越明显。这主要是因为深度学习模型网络结构更加复杂,更能
从大数据中提取有效的特征,准确性较高。所以,近些年来,深度学习在处理大数据和建立复
杂准确的学习模型方面,有着非常不错的表现。
在机器视觉、图像处理方面,深度学习可以说是带来了革命性的变化。近些年来,在全球知名
的图像识别竞赛 ILSVRC 中,深度学习模型,尤其是各种 CNN 模型在错误率方面,不断刷新
纪录,相比之前传统机器学习算法,性能提升有质的飞跃。
图片转载自 cs231n
上图中,从 2010 年开始,开始使用 CNN 模型。转折点是 2012 年, AlexNet 的出现,直接
将错误率降低了近 10 个百分点。这是之前所有机器学习模型无法做到的。2015 年,包含
152 层神经元的 ResNet 模型,竟然将错误率降低至 3.57%,这甚至比人类肉眼识别的准确
率还高!
除了在图像识别方面,深度学习在机器翻译领域也取得了飞跃式的发展。基于 RNN 的机器翻
itjc8.com收集整理
剩余205页未读,继续阅读
资源评论
feng
- 粉丝: 16
- 资源: 15
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功