一文看懂25个神经网络模型.pdf_神经网络模型资源-CSDN文库

5星 · 超过95%的资源 112 浏览量 2023-05-13 00:01:52 上传评论收藏 1.5MB PDF 举报

神经网络模型一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 一文看懂25个神经网络模型.pdf 在深度学习领域，神经网络模型扮演着至关重要的角色。这篇文档《一文看懂25个神经网络模型》旨在帮助读者理清当前流行的多种神经网络架构。本文将深入探讨几个关键的神经网络组件，包括神经元、卷积神经元、解卷积神经元、池化神经元和插值神经元，以及均值神经元和标准方差神经元。 1. 神经元是神经网络的基本构建单元，其工作原理大体相同。每个神经元接收来自上一层神经元的加权输入，加上一个偏置项，然后通过激活函数得到输出。激活函数如Sigmoid、ReLU或 Tanh，引入非线性，使网络能够学习更复杂的模式。 2. 卷积神经元（CNN）在处理图像等具有空间结构的数据时表现出色。它们与前一层的部分神经元连接，保持局部连接性，以捕捉图像的特征。多个卷积神经元的副本独立训练，每份具有自己的权重，但连接方式相同，形成特征检测滤波器。 3. 解卷积神经元（Deconvolutional Cells）在卷积神经网络的反向传播中使用，用于恢复图像的空间信息。它们与下一层神经元建立连接，用于上采样和特征映射，帮助重建原始输入的细节。 4. 池化神经元通常伴随卷积神经元出现，执行下采样操作，减少计算量并保持关键特征。常见的池化方法有最大池化和平均池化。而插值神经元则相反，它们用于上采样，增加输出的分辨率，但并不保证恢复原始信息。 5. 均值神经元和标准方差神经元常常成对出现，用于描述数据的概率分布。在概率神经网络中，它们分别估计输入数据的平均值和标准差，提供对数据分布的理解，常用于自编码器或变分自编码器中，帮助生成新的样本或进行降维表示。 6. 自编码器（AE）和变分自编码器（VAE）虽然结构类似，但训练和用途不同。AE主要用于无监督学习，通过学习输入数据的压缩表示和重构，提高对数据的理解。而VAE引入了概率模型，允许生成新的、与训练数据分布类似的样本。这只是25个神经网络模型中的一部分，其他还包括循环神经网络（RNN）、长短期记忆网络（LSTM）、门控循环单元（GRU）、生成对抗网络（GAN）等，它们各有特色，适应不同的任务需求。了解这些模型的原理和应用场景是深度学习实践者的必备知识，可以帮助开发者选择合适的模型来解决实际问题。

资源推荐

资源详情

资源评论

1. 引言引言

在深度学习十分火热的今天，不时会涌现出各种新型的人工神经网络，想要实时了解这些新型神经网络的架构还真是不

容易。光是知道各式各样的神经网络模型缩写（如：DCIGN、BiLSTM、DCGAN……还有哪些？)，就已经让人招架不

住了。

因此，这里整理出一份清单来梳理所有这些架构。其中大部分是人工神经网络，也有一些完全不同的怪物。尽管所有这

些架构都各不相同、功能独特，当我在画它们的节点图时……其中潜在的关系开始逐渐清晰起来。

把这些架构做成节点图，会存在一个问题：它无法展示神经网络架构内部的工作原理。举例来说，变分自编码机

（VAE：variational autoencoders ）看起来跟自编码机（AE：autoencoders）差不多，但它们的训练过程却大不相同。

训练后的模型在使用场景上差别更大：VAE是生成器，通过插入噪音数据来获取新样本；而AE仅仅是把他们所收到的任

何信息作为输入，映射到“记忆中”最相似的训练样本上。

在介绍不同模型的神经元和神经细胞层之间的连接方式前，我们一步一步来，先来了解不同的神经元节点内部是如何工

作的。

1.1 神经元神经元

对不同类型的神经元标记不同的颜色，可以更好地在各种网络架构之间进行区分。但是，这些神经元的工作方式却是大

同小异。在下图的基本神经元结构后面，你会看到详细的讲解：

基本的人工神经网络神经元（basic neural network cell）相当简单，这种简单的类型可以在常规的前馈人工神经网络架

构里面找到。这种神经元与其它神经元之间的连接具有权重，也就是说，它可以和前一层神经网络层中的所有神经元有

连接。

每一个连接都有各自的权重，通常情况下是一些随机值（关于如何对人工神经网络的权重进行初始化是一个非常重要的

话题，这将会直接影响到之后的训练过程，以及最终整个模型的性能）。这个权重可以是负值，正值，非常小，或者非

常大，也可以是零。和这个神经元连接的所有神经元的值都会乘以各自对应的权重。然后，把这些值都求和。

在这个基础上，会额外加上一个bias，它可以用来避免输出为零的情况，并且能够加速某些操作，这让解决某个问题所

需要的神经元数量也有所减少。这个bias也是一个数字，有些时候是一个常量（经常是-1或者1），有些时候会有所变

化。这个总和最终被输入到一个激活函数，这个激活函数的输出最终就成为这个神经元的输出。

1.2卷积神经元（卷积神经元（Convolutional cells））

和前馈神经元非常相似，除了它们只跟前一神经细胞层的部分神经元有连接。因为它们不是和某些神经元随机连接的，

而是与特定范围内的神经元相连接，通常用来保存空间信息。这让它们对于那些拥有大量局部信息，比如图像数据、语

音数据（但多数情况下是图像数据），会非常实用。

1.3 解卷积神经元解卷积神经元

恰好相反：它们是通过跟下一神经细胞层的连接来解码空间信息。这两种神经元都有很多副本，它们都是独立训练的；

每个副本都有自己的权重，但连接方式却完全相同。可以认为，这些副本是被放在了具备相同结构的不同的神经网络

中。这两种神经元本质上都是一般意义上的神经元，但是，它们的使用方式却不同。

1.4 池化神经元和插值神经元（池化神经元和插值神经元（Pooling and interpolating cells））

经常和卷积神经元结合起来使用。它们不是真正意义上的神经元，只能进行一些简单的操作。

池化神经元接受到来自其它神经元的输出过后，决定哪些值可以通过，哪些值不能通过。在图像领域，可以理解成是把

一个图像缩小了（在查看图片的时候，一般软件都有一个放大、缩小的功能；这里的图像缩小，就相当于软件上的缩小

图像；也就是说我们能看到图像的内容更加少了；在这个池化的过程当中，图像的大小也会相应地减少）。这样，你就

再也不能看到所有的像素了，池化函数会知道什么像素该保留，什么像素该舍弃。

插值神经元恰好是相反的操作：它们获取一些信息，然后映射出更多的信息。额外的信息都是按照某种方式制造出来

的，这就好像在一张小分辨率的图片上面进行放大。插值神经元不仅仅是池化神经元的反向操作，而且，它们也是很常

见，因为它们运行非常快，同时，实现起来也很简单。池化神经元和插值神经元之间的关系，就像卷积神经元和解卷积

神经元之间的关系。

1.5均值神经元和标准方差神经元（均值神经元和标准方差神经元（Mean and standard deviation cells）（作为概率神经元）（作为概率神经元

它们总是成对地出现）它们总是成对地出现）

是一类用来描述数据概率分布的神经元。均值就是所有值的平均值，而标准方差描述的是这些数据偏离（两个方向）均

值有多远。比如：一个用于图像处理的概率神经元可以包含一些信息，比如：在某个特定的像素里面有多少红色。举个

例来说，均值可能是0.5，同时标准方差是0.2。当要从这些概率神经元取样的时候，你可以把这些值输入到一个高斯随

机数生成器，这样就会生成一些分布在0.4和0.6之间的值；值离0.5越远，对应生成的概率也就越小。它们一般和前一神

经元层或者下一神经元层是全连接，而且，它们没有偏差（bias）。

1.6 循环神经元（循环神经元（Recurrent cells ））

不仅仅在神经细胞层之间有连接，而且在时间轴上也有相应的连接。每一个神经元内部都会保存它先前的值。它们跟一

般的神经元一样更新，但是，具有额外的权重：与当前神经元之前值之间的权重，还有大多数情况下，与同一神经细胞

层各个神经元之间的权重。当前值和存储的先前值之间权重的工作机制，与非永久性存储器（比如RAM）的工作机制很

相似，继承了两个性质：

第一，维持一个特定的状态；

第二：如果不对其持续进行更新（输入），这个状态就会消失。

由于先前的值是通过激活函数得到的，而在每一次的更新时，都会把这个值和其它权重一起输入到激活函数，因此，信

息会不断地流失。实际上，信息的保存率非常的低，以至于仅仅四次或者五次迭代更新过后，几乎之前所有的信息都会

流失掉。

1.7 长短期记忆神经元（长短期记忆神经元（Long short term memory cells））

用于克服循环神经元中信息快速流失的问题。

LSTM是一个逻辑回路，其设计受到了计算机内存单元设计的启发。与只存储两个状态的循环神经元相比，LSTM可以存

储四个状态：输出值的当前和先前值，记忆神经元状态的当前值和先前值。它们都有三个门：输入门，输出门，遗忘

门，同时，它们也还有常规的输入。

这些门它们都有各自的权重，也就是说，与这种类型的神经元细胞连接需要设置四个权重（而不是一个）。这些门的工

作机制与流门（flow gates）很相似，而不是栅栏门（fence gates）：它们可以让所有的信息都通过，或者只是通过部

分，也可以什么都不让通过，或者通过某个区间的信息。

这种运行机制的实现是通过把输入信息和一个在0到1之间的系数相乘，这个系数存储在当前门中。这样，输入门决定输

入的信息有多少可以被叠加到当前门值。输出门决定有多少输出信息是可以传递到后面的神经网络中。遗忘门并不是和

输出神经元的先前值相连接，而是，和前一记忆神经元相连接。它决定了保留多少记忆神经元最新的状态信息。因为没

有和输出相连接，以及没有激活函数在这个循环中，因此只会有更少的信息流失。

1.8 门控循环神经元（门控循环神经元（Gated recurrent units (cells)））

是LSTM的变体。它们同样使用门来抑制信息的流失，但是只用两个门：更新门和重置门。这使得构建它们付出的代价

没有那么高，而且运行速度更加快了，因为它们在所有的地方使用了更少的连接。

从本质上来说LSTM和GRU有两个不同的地方：

第一：GRU神经元没有被输出门保护的隐神经元；

第二：GRU把输出门和遗忘门整合在了一起，形成了更新门。核心的思想就是如果你想要一些新的信息，那么你就

可以遗忘掉一些陈旧的信息（反过来也可以）。

1.9 神经细胞层神经细胞层(Layers)

形成一个神经网络，最简单的连接神经元方式是——把所有的神经元与其它所有的神经元相连接。这就好像Hopfield神

经网络和玻尔兹曼机（Boltzmann machines）的连接方式。当然，这也就意味着连接数量会随着神经元个数的增加呈指

数级地增加，但是，对应的函数表达力也会越来越强。这就是所谓的全连接（completely (or fully) connected）。

经历了一段时间的发展，发现把神经网络分解成不同的神经细胞层会非常有效。神经细胞层的定义是一群彼此之间互不

连接的神经元，它们仅跟其它神经细胞层有连接。这一概念在受限玻尔兹曼机（Restricted Boltzmann Machines）中有

所体现。现在，使用神经网络就意味着使用神经细胞层，并且是任意数量的神经细胞层。其中一个比较令人困惑的概念

是全连接（fully connected or completely connected），也就是某一层的每个神经元跟另一层的所有神经元都有连接，但

真正的全连接神经网络相当罕见。

1.10 卷积连接层（卷积连接层（Convolutionally connected layers））

相对于全连接层要有更多的限制：在卷积连接层中的每一个神经元只与相邻的神经元层连接。图像和声音蕴含了大量的

信息，如果一对一地输入到神经网络（比如，一个神经元对应一个像素）。卷积连接的形成，受益于保留空间信息更为

重要的观察。实践证明这是一个非常好的猜测，因为现在大多数基于人工神经网络的图像和语音应用都使用了这种连接

方式。然而，这种连接方式所需的代价远远低于全连接层的形式。从本质上来讲，卷积连接方式起到重要性过滤的作

用，决定哪些紧紧联系在一起的信息包是重要的；卷积连接对于数据降维非常有用。

剩余22页未读，继续阅读

评论收藏

内容反馈

芊暖

2023-07-27

这份文件适合作为入门级材料，阐述的内容既简明又不失深度。
食色也

2023-07-27

读完这份文件后我对神经网络模型有了更深刻的认识，非常值得一读。
五月Eliy

2023-07-27

这份文件简洁明了地介绍了25个常用的神经网络模型，对初学者来说非常友好。
东郊椰林放猪散仙

2023-07-27

作者对这25个神经网络模型进行了系统整理和总结，内容丰富，容易理解。
方2郭

2023-07-27

这份文件概括了25个神经网络模型的核心思想，对于快速了解它们非常有帮助。

快乐无限出发

粉丝: 1211
资源: 7395

一文看懂25个神经网络模型.pdf

一文看懂RPA的技术架构及原理知识讲解.pdf

一文读懂卷积神经网络CNN.doc

一文看懂微电网技术发展现状.pdf

AI基础：一文看懂BERT.pdf

一文看懂通信新基建.pdf

X射线成像质量的BP神经网络预测.pdf

半导体行业专题系列：一文看懂FPGA芯片投资框架.pdf

【深度学习】一文搞懂卷积神经网络（CNN）的原理（超详细）_卷积神经网络原理-CSDN博客.pdf

一文总结集成学习与模型融合.pdf

一般零售：一文看懂春节零售、旅游新趋势.pdf

一文看懂keil4和keil5最大区别.pdf

一文看懂“车联网”的前世今生.pdf

汉字识别的并行神经网络方法.pdf

20200317-中信建投-通信行业深度研究：一文看懂通信新基建.pdf

TWS耳机行业深度报告：一文看懂TWS耳机产业链奥秘.pdf

一文看懂悬挑式卸料平台(经典).pdf

(完整版)一文读懂卷积神经网络CNN.pdf

一文读懂卷积神经网络CNN.pdf

20210614-国泰君安-社服行业：一文读懂BOSS直聘（BZ.O）招股书，开创全新模式，直面招聘难题.pdf

一文看懂赛维时代招股书：跨境电商快速增长，全链条品牌运营可圈可点.pdf

超大规模图神经网络实践.pdf

露天矿边坡变形监测中BP神经网络模型优化设计.pdf

博客中聚类算法（K-means、FCM、DBSCAN、DPC）的数据集（免积分）

机器学习期末复习题及答案

神经网络回归预测--气温数据集

最新资源