CNN.rar_CNN_CNN神经网络_卷积神经网络资源-CSDN文库

共1个文件

docx：1个

版权申诉

cnn神经网络

卷积神经网络

130 浏览量 2022-09-23 02:33:37 上传评论收藏 628KB RAR 举报

资源推荐

资源详情

资源评论

收起资源包目录

CNN.rar （1个子文件）

CNN.docx 685KB

一、什么是 Deep Learning？

实际生活中，人们为了解决一个问题，如对象的分类（对象可是是文档、图像等），首先必

须做的事情是如何来表达一个对象，即必须抽取一些特征来表示一个对象，如文本的处理中，

常常用词集合来表示一个文档，或把文档表示在向量空间中（称为 VSM 模型），然后才能

提出不同的分类算法来进行分类；又如在图像处理中，我们可以用像素集合来表示一个图像，

后来人们提出了新的特征表示，如 SIFT，这种特征在很多图像处理的应用中表现非常良好，

特征选取得好坏对最终结果的影响非常巨大。因此，选取什么特征对于解决一个实际问题非

常的重要。

然而，手工地选取特征是一件非常费力、启发式的方法，能不能选取好很大程度上靠经验和

运气；既然手工选取特征不太好，那么能不能自动地学习一些特征呢？答案是能！Deep

Learning 就是用来干这个事情的，看它的一个别名 Unsupervised Feature Learning，就可

以顾名思义了，Unsupervised 的意思就是不要人参与特征的选取过程。因此，自动地学习

特征的方法，统称为 Deep Learning。

二、Deep Learning 的基本思想

假设我们有一个系统 S，它有 n 层（S1,…Sn），它的输入是 I，

输出是 O，形象地表示为： I =>S1=>S2=>…..=>Sn => O，如果输出 O

等于输入 I，即输入 I 经过这个系统变化之后没有任何的信息损失（呵

呵，大牛说，这是不可能的。信息论中有个“信息逐层丢失”的说法（信

息处理不等式），设处理 a 信息得到 b，再对 b 处理得到 c，那么可以

证明：a 和 c 的互信息不会超过 a 和 b 的互信息。这表明信息处理不会

增加信息，大部分处理会丢失信息。当然了，如果丢掉的是没用的信息

那多好啊），保持了不变，这意味着输入 I 经过每一层 Si 都没有任何的

信息损失，即在任何一层 Si，它都是原有信息（即输入 I）的另外一种

表示。现在回到我们的主题 Deep Learning，我们需要自动地学习特征，

假设我们有一堆输入 I（如一堆图像或者文本），假设我们设计了一个

系统 S（有 n 层），我们通过调整系统中参数，使得它的输出仍然是输

入 I，那么我们就可以自动地获取得到输入 I 的一系列层次特征，即

S1，…, Sn。

对于深度学习来说，其思想就是对堆叠多个层，也就是说这一层的

输出作为下一层的输入。通过这种方式，就可以实现对输入信息进行分

级表达了。

另外，前面是假设输出严格地等于输入，这个限制太严格，我们可

以略微地放松这个限制，例如我们只要使得输入与输出的差别尽可能地

小即可，这个放松会导致另外一类不同的 Deep Learning 方法。上述就

是 Deep Learning 的基本思想。

三、浅层学习（Shallow Learning）和深度学习（Deep

Learning）

浅层学习是机器学习的第一次浪潮。

20 世纪 80 年代末期，用于人工神经网络的反向传播算法（也叫

Back Propagation 算法或者 BP 算法）的发明，给机器学习带来了希望，

掀起了基于统计模型的机器学习热潮。这个热潮一直持续到今天。人们

发现，利用 BP 算法可以让一个人工神经网络模型从大量训练样本中学

习统计规律，从而对未知事件做预测。这种基于统计的机器学习方法比

起过去基于人工规则的系统，在很多方面显出优越性。这个时候的人工

神经网络，虽也被称作多层感知机（Multi-layer Perceptron），但实际

是种只含有一层隐层节点的浅层模型。

20 世纪 90 年代，各种各样的浅层机器学习模型相继被提出，例如

支撑向量机（SVM，Support Vector Machines）、 Boosting、最大熵

方法（如 LR，Logistic Regression）等。这些模型的结构基本上可以看

成带有一层隐层节点（如 SVM、Boosting），或没有隐层节点（如

LR）。这些模型无论是在理论分析还是应用中都获得了巨大的成功。

相比之下，由于理论分析的难度大，训练方法又需要很多经验和技巧，

这个时期浅层人工神经网络反而相对沉寂。

深度学习是机器学习的第二次浪潮。

2006 年，加拿大多伦多大学教授、机器学习领域的泰斗 Geoffrey

Hinton 和他的学生 RuslanSalakhutdinov 在《科学》上发表了一篇文章，

开启了深度学习在学术界和工业界的浪潮。这篇文章有两个主要观点：

1）多隐层的人工神经网络具有优异的特征学习能力，学习得到的特征

对数据有更本质的刻画，从而有利于可视化或分类；2）深度神经网络

在训练上的难度，可以通过“逐层初始化”（layer-wise pre-training）来

有效克服，在这篇文章中，逐层初始化是通过无监督学习实现的。

当前多数分类、回归等学习方法为浅层结构算法，其局限性在于

有限样本和计算单元情况下对复杂函数的表示能力有限，针对复杂分类

问题其泛化能力受到一定制约。深度学习可通过学习一种深层非线性网

络结构，实现复杂函数逼近，表征输入数据分布式表示，并展现了强大

的从少数样本集中学习数据集本质特征的能力。（多层的好处是可以用

较少的参数表示复杂的函数）

深度学习的实质，是通过构建具有很多隐层的机器学习模型和海

量的训练数据，来学习更有用的特征，从而最终提升分类或预测的准确

性。因此，“深度模型”是手段，“特征学习”是目的。区别于传统的浅层

学习，深度学习的不同在于：1）强调了模型结构的深度，通常有 5 层、

6 层，甚至 10 多层的隐层节点；2）明确突出了特征学习的重要性，也

就是说，通过逐层特征变换，将样本在原空间的特征表示变换到一个新

特征空间，从而使分类或预测更加容易。与人工规则构造特征的方法相

比，利用大数据来学习特征，更能够刻画数据的丰富内在信息。

四、Deep learning 与 Neural Network

深度学习是机器学习研究中的一个新的领域，其动机在于建立、模拟人

脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像，

声音和文本。深度学习是无监督学习的一种。

深度学习的概念源于人工神经网络的研究。含多隐层的多层感知

器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的

高层表示属性类别或特征，以发现数据的分布式特征表示。

Deep learning 本身算是 machine learning 的一个分支，简单可以

理解为 neural network 的发展。大约二三十年前，neural network 曾经

是 ML 领域特别火热的一个方向，但是后来确慢慢淡出了，原因包括以

下几个方面：

1）比较容易过拟合，参数比较难 tune，而且需要不少 trick；

2）训练速度比较慢，在层次比较少（小于等于 3）的情况下效果并不

比其它方法更优；

所以中间有大约 20 多年的时间，神经网络被关注很少，这段时间

基本上是 SVM 和 boosting 算法的天下。但是，一个痴心的老先生 Hinton，

他坚持了下来，并最终（和其它人一起 Bengio、Yann.lecun 等）提成

了一个实际可行的 deep learning 框架。

Deep learning 与传统的神经网络之间有相同的地方也有很多不同。

二者的相同在于 deep learning 采用了神经网络相似的分层结构，

系统由包括输入层、隐层（多层）、输出层组成的多层网络，只有相邻

层节点之间有连接，同一层以及跨层节点之间相互无连接，每一层可以

看作是一个 logistic regression 模型；这种分层结构，是比较接近人类

大脑的结构的。

评论收藏

内容反馈

版权申诉

四散

粉丝: 49
资源: 1万+

CNN.rar_CNN_CNN神经网络_卷积神经网络

CNN_卷积神经网络_

卷积神经网络（CNN）

CNN 卷积神经网络

CNN 卷积神经网络

CNN卷积神经网络

cnn-示例.rar_CNN_cnn 图像识别_image_卷积神经_图像 cnn

CNN.zip_CNN神经网络_cnn测试_improvegzf_卷积神经_卷积神经网络

卷积神经网络CNN从入门到精通.zip_CNN_CNN 神经网络_CNN神经网络_卷积网络_神经

CNN.rar_CNN_cnn 特征_neural network_卷积神经网络_神经网络特征

卷积神经网络CNN

完整的CNN卷积神经网络

标准CNN（卷积神经网络）

network.rar_CNN_卷积 分类_卷积神经网络_卷积神经预测_卷积预测

CNN卷积神经网络的数字识别.rar_MNIST_cnn 数字识别_卷积神经_卷积神经网络_卷积网络实现数字识别

CNN.rar_卷积核_卷积神经_卷积神经网络 MATLAB_卷积网络_神经网络采样

CNN.rar_CNN_CNN_图像处理_cnn 图像处理_卷积_图像分类

CNN.zip_CLS通信_CNN_matlab CNN_卷积神经_卷积神经网络

卷积神经网络CNN.pdf

CNN_CNN_CNN卷积神经网络代码训练模型_CNN语言_

CNN.zip_CNN_CNN代码_卷积神经网络_神经网络

CNN卷积神经网络PYTHON

卷积神经网络CNN.ppt

cnn-mnist.rar_CNN_CNN mnist_MNIST_MNIST CNN_卷积神经网络

cnn.zip_CNN_卷积神经_卷积神经网络

CNN.rar_CNN特征_cnn 特征_cnn 特征提取_卷积神经_特征提取 cnn

CNN.zip_CNN_CNN keras_keras cnn_卷积神经网络_神经网络

CNN.rar_CNN_CNN MATLAB_matlab二维CNN_神经网络 matlab

最新资源

network.rar_CNN_卷积分类_卷积神经网络_卷积神经预测_卷积预测