【免费】深度学习思维导图1_深度学习思维导图资源-CSDN文库

需积分: 0 116 浏览量更新于2022-08-03 1 收藏 5.47MB PDF 举报

深度学习是一种人工智能领域的核心技术，它通过构建复杂的神经网络模型来模拟人脑的学习方式，从而实现对数据的高效处理和分析。本篇文章将基于标题“深度学习思维导图1”和描述，深入探讨深度学习的多个核心概念、理论与应用。深度学习理论部分包括泛化误差界、Rademacher复杂度、随机标签问题以及对抗样本的研究。泛化误差界是衡量模型在未见数据上的表现的理论工具，它与模型的复杂度和训练数据的质量密切相关。Rademacher复杂度则是评估一个函数类在随机标签下的表现，对于理解深度学习在面对噪声数据时的性能有重要意义。随机标签问题中，训练越快，网络效果可能越好，这涉及到算法稳定性理论，表明深度学习模型在一定程度上能够自我纠正错误的标签信息。对抗样本是指那些被设计用来欺骗模型的输入，它们揭示了模型的脆弱性，对抗样本的生成和防御是深度学习安全性研究的重要方面。深度学习的基础流程包括前向传播、激活函数（如ReLU、sigmoid等）、softmax用于分类、损失函数（如交叉熵、均方误差等）以及反向传播作为权重更新的手段。此外，优化算法如随机梯度下降（SGD）、动量法、Adam等，以及正则化技术如dropout、权重衰减（L2正则化）和各种归一化方法（如Batch Normalization、Layer Normalization）都是提升模型性能的关键。在具体网络结构上，多层感知机（MLP）、卷积神经网络（CNN）和循环神经网络（RNN）及其变种占据了重要地位。CNN以其在图像处理中的优异性能而闻名，包括卷积层、池化层、步长和填充的运用，以及AlexNet、VGG、Inception、ResNet等经典架构。在CNN的优化上，如剪枝、压缩和分组卷积等技术用于模型压缩，提高计算效率。此外，CNN还应用于人脸识别、图像分割和物体检测等领域，如RPN、Faster R-CNN、YOLO、SSD和FPN等方法。 RNN因其在序列数据处理中的优势，广泛应用于自然语言处理和语音识别。基本的RNN单元包括LSTM和GRU，它们解决了梯度消失问题。RNN的结构多样，如多层、双向、Encoder-Decoder等，而Attention机制的引入，如Self Attention和Temporal Attention，显著提升了模型的理解和表达能力，Transformer模型则进一步革新了序列建模，其Multi-Head Attention和Layer Normalization成为现代NLP模型的标准组件。生成对抗网络（GAN）是深度学习中的创新应用，它由生成器和判别器两部分构成，用于生成逼真的新样本。GAN的基本流程、DCGAN、Wasserstein距离、IS和FID等评估指标，以及模式坍塌的解决方案如SN-GAN和Gradient Penalty等，都是GAN研究的核心内容。同时，条件GAN（Conditional GAN）和有标签、有配对的解决方案扩展了GAN的应用范围。强化学习（RL）是深度学习的另一重要分支，它基于马尔科夫决策过程（MDP）。Q-learning和策略梯度是RL的两大方法，其中Actor-Critic结合了两者的优势，广泛应用于游戏AI、机器人控制等领域。AlphaGo和AlphaGo Zero是RL在围棋领域的杰出成果，展示了深度学习在复杂决策问题上的潜力。深度学习涵盖了丰富的理论和技术，从模型架构到优化算法，再到具体应用，它不断推动着人工智能的发展，并在诸多领域取得了突破性进展。然而，面对挑战如过拟合、梯度消失、模型解释性等问题，研究人员仍需不断探索和完善。在实践中，深度学习模型的设计往往遵循“简单即好”的原则，同时，参数共享、模型压缩和正则化等策略也是提升模型泛化能力和计算效率的有效手段。

深度学习笔记总结

本repo是清华大学软件学院研究生课程《深度学习》的笔记和总结

知识点

深度学习理论：

泛化误差界

Rademacher复杂度

随机标签问题---Margin泛化误差理论

随机标签问题中，训练越快，网络效果越好---算法稳定性理论

过参数优化网络性能--过参数理论

对抗样本：对抗样本是什么，怎么生成对抗样本，对抗样本可迁移，怎么防御对抗样本

深度学习基础：

深度学习流程：前向传播，激活函数，softmax，损失函数，反向传播

深度学习技巧：初始化，各种Normalization，dropout，weight decay，学习率策略

优化算法：随机化的SGD+Momentum，自适应的Adam

MLP网络

CNN：

CNN基础：卷积层，池化层，stride/padding等，反向传播（转置卷积）

复杂CNN结构：3D卷积，图卷积

CNN网络架构：AlexNet--VGG--Inception--Resnet

CNN网络压缩：剪枝，压缩，分组卷积

CNN思考：平移不变性，局部连接性，数据增广

CNN应用：

人脸识别：人脸识别（封闭集，开放集---改进loss高内聚低耦合），人脸确认（三元组）

图像分割：encoder-decoder，特征融合

物体检测：RPN候选框生成，R-CNN识别+回归，ROIAlign进一步对齐，YOLO/SSD一步到位，

FPN多尺度融合

风格迁移：风格图片（Crammer损失）+内容图片（Instance Norm），用encoder-decoder加

速训练

视频：图片+光流，fast-slow融合

3D：View，Volumetric，点云。点云：PointNet（变换不变性，旋转不变性），点云重建的

chamfer distance

RNN：

RNN基本单元：原版，LSTM, GRU

RNN基本结构：多层，双向，one to many，many to one，同构many to many，异构many

to many（encoder-decoder）

RNN反向传播：BPTT，梯度爆炸--Gradient Clipping，梯度消失--LSTM/GRU，技巧

（weight/layer norm）

Attention：Self Attention，Temporal Attention，Attention在图片的应用（temporal

attention图片描述，图片self attention，channel attention等）

Transformer：Transformer本体（MultiView Attention，Feed Forward，位置编码，直连，

Layer Norm），GPT,BERT

RNN与时空建模：RNN+CNN，Zigzag与GHU，Eidetic RNN（memory pool），RNN图灵机

（内存机制，LSTM门结构控制）

RNN应用：

核心：embedding+网络特征学习

自然语言处理：embedding（Wordvec，NCE正负例，Hierarchical Softmax），文本分类，摘

要，问题回答，词标签

图：图embedding（deepwalk，unbiased deepwalk），图神经网络

推荐系统：传统方法，DNN，Tree-Based DNN

GAN：

GAN基础：基本流程，DCGAN，损失函数改进（Wassenstein Distance），评价（IS,FID)

模式坍塌：主要解决方法（SN-GAN，Gradient Penalty），带标签解决（Conditional），有配对解

决

GAN高级网络：self attention，BigGAN

RL：

RL定义：马尔科夫决策过程MDP

基于Q-value的方法-DQN：Monte Carlo方法，Temporal Diﬀerence方法，Q-value改进（记

忆重放，double网络，拆分）

基于策略的方法-Policy Gradient：基本流程，Actor-Critic改进，比DQN的优势

AlphaGo，AlphaGo Zero：AlphaGo=MCTS（蒙特卡洛树搜索）+策略网络（监督学习+强化学

习）+值网络，AlphaGo Zero一个网络，全靠生成数据，大幅改进

RL的局限性还很大

思路总结

大力出奇迹：网络越深越好（只要你不梯度消失，不过拟合），越宽越好，batch越大越好（只要你有

卡），但是最好还是simpler is better

参数共享：减小参数量，提高泛化性，利用局部相关性等。

CNN在图片各个区域参数共享; RNN在所有时间参数共享；图卷积网络同一层都参数共享；

损失函数：分类的cross-entrophy，回归的L2，要限制网络为某种性质（比如正交矩阵）||WW^T-

I||,encoder-decoder重建有重建损失函数||重建的-需要的||_1(cycle loss是特殊形式)。无监督的NCE

损失函数（正负例，用于各种embedding），Hierarchical Softmax等，度量分布相似性的推土机距离

等。其余具体任务设置具体损失函数，比如点云重建，度量两个点云相关性的chamfer distance等。

各种Norm：目的基本都是让网络更smooth，训练更快，防止过拟合等。

BatchNorm对batch平均，layer norm对channel平均，weight norm直接修改参数网络范数。

Instance Norm对图片平均，目的是白化，消除内容图片的对比度影响。spectral norm是网络除以最

大|特征值|，控制lipchitz系数来防止模式坍塌

随机化：目的都是引入随机性，避免陷入贪心的局部最优解。

优化中SGD引入随机性，改进SGLD引入随机的noise。RL中Policy Gradient引入随机性以实现E-

greedy，探索利用的均衡。

融合：将多尺度的数据融合在一起，便于学习/利用多个层次的特征，网络拓宽。

Inception网络不同感受野/尺度特征融合，Resnext也是类似的思路。RNN图像分割需要低级特征（细

节）和高级特征（骨架）的融合。CNN目标检测需要不同尺度特征融合（FPN,SSD）（高级特征检测大

物体，低级特征检测小物体）。视频识别中fast-slow融合，slow为主fast为辅。

剩余10页未读，继续阅读

资源推荐

资源评论

daidaiyijiu

粉丝: 20
资源: 322

深度学习 思维导图1

深度学习之思维导图

深度学习思维导图

深度学习-详细思维导图

深度学习基础知识思维导图

学习的思维导图（思维导图）

深度学习基础概念思维导图

深度学习入门——深度学习基础概念思维导图-附件资源

概述深度学习概念的思维导图。-Python开发

机器学习和深度学习思维导图

深度学习思维导图分享.rar

机器学习和深度学习的关系-思维导图.vsdx

利用思维导图引领小学语文走向深度学习.pdf

思维导图撬动课堂深度学习.pdf

activiti学习思维导图

面向对象的学习思维导图

前端学习思维导图

机器学习思维导图

machine-learning-mindmap：概述了从数据分析到深度学习的机器学习概念的思维导图

大数据学习思维导图day_01

深度学习知识图谱

深度学习--TensorFlow思维导图.xmind

基于深度学习的图像隐写方法研究 思维导图

例谈思维导图助力初中地理深度学习的策略.pdf

思维导图：促进深度学习的教学路径——以四年级下册《母鸡》为例.pdf

DASOU原创深度学习从零入门思维导图.xmind

巧借思维导图 实现深度学习——以统编教材四年级下册《母鸡》为例.pdf

深度学习基础内容整理思维导图——可下载编辑

最新资源

深度学习思维导图1

基于深度学习的图像隐写方法研究思维导图

巧借思维导图实现深度学习——以统编教材四年级下册《母鸡》为例.pdf