上次分享了ppt及ppt文案,没有通过,可能是不能分享原ppt,具体的ppt在http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML19.html 中的第十五周,有ppt格式和pdf合适,这个资源仅是这个ppt的文案,李教授授课过程中,一句一句摘抄的,仅用来学习、授课用途。 【GAN是什么】 GAN,全称为Generative Adversarial Networks(生成对抗网络),是一种深度学习模型,由Ian Goodfellow在2014年提出。GAN的核心思想是通过两个神经网络,即Generator(生成器)和Discriminator(判别器)之间的博弈来训练模型。Generator的任务是生成与训练数据相似的新样本,而Discriminator则负责判断输入样本的真实性。这两个网络在训练过程中相互竞争、共同进步。 【Generator的结构和功能】 Generator通常接收一个随机向量作为输入,这个向量通常具有较低的维度,如7维或10维。Generator作为一个映射函数,将这个低维向量转换为高维表示,例如生成一张96×96像素,包含RGB三个颜色通道的图片,其输出的维度为96×96×3。Generator的架构可以根据任务需求选择,例如对于图像生成任务,它通常包含卷积层(de-convolution layers)。 【Discriminator的结构和功能】 Discriminator接收Generator生成的图像或真实图像作为输入,并输出一个介于0和1之间的分数,表示输入样本与目标分布的相似度。分数越高,表示更接近真实样本;反之,分数越低,表示更像虚假样本。Discriminator的构建也会依据任务类型,如对于图像任务,可能包含卷积层,对于文本生成任务,可能使用循环神经网络(RNN)。 【GAN的训练过程】 训练GAN时,首先固定Generator,只训练Discriminator。Discriminator的训练目标是区分真实图像(来自数据库)和Generator产生的假图像。真实图像赋予高分(接近1),假图像赋予低分(接近0)。训练方法类似于标准的神经网络,但标签由Generator和Discriminator的交互生成。 接着,固定Discriminator,训练Generator。Generator的目标是使Discriminator无法区分其生成的图像与真实图像,即欺骗Discriminator。Generator通过反向传播(back-propagation)优化其参数,使其输出的图像能够获得Discriminator更高的评分。 在训练过程中,可以观察Generator和Discriminator的中间层(hidden layer)来获取生成的图像,以评估生成效果。整体上,GAN的训练是一个动态的、迭代的过程,两个网络互相影响,共同提升性能。 总结来说,李宏毅教授2019年的GAN网络课程讲解了GAN的基本原理、构成组件以及训练机制。通过Generator和Discriminator的互动,GAN能够学习并生成高质量的数据,如图像或文本,这一技术在计算机视觉、自然语言处理等领域有着广泛的应用。理解GAN的工作方式对于深入研究深度学习和人工智能至关重要。
剩余7页未读,继续阅读
- 粉丝: 198
- 资源: 8
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助