【免费】chap-深度生成模型1资源-CSDN文库

需积分: 0 104 浏览量更新于2022-08-04 收藏 866KB PDF 举报

深度生成模型概率生成模型概率统计和机器学习中的一类重要模型指一系列用于随机生成可观测数据的模型。概率生成模型是根据一些可观测的样本来学习一个参数化的模型pθ(x)来近似未知分布Pr(X)，并可以用这个模型来生成一些样本，使得“生成”的样本和“真实”的样本尽可能地相似。生成模型的应用十分广泛，可以用来不同的数据进行建模，比如图像、文本、声音等。深度生成模型就是利用深层神经网络可以近似任意函数的能力来建模一个复杂的分布 pr(x)。深度生成模型可以用来图像生成、文本生成、声音生成等。概率生成模型一般具有两个基本功能：密度估计和生成样本。密度估计是根据数据集来估计其概率密度函数 pθ(x)。生成样本就是给定一个概率密度函数为 pmoel(x) 的分布，生成一些服从这个分布的样本。变分自动编码器是一种深度生成模型，它可以用来学习一个潜在的分布p(z)和一个生成模型p(x|z)，以便生成新的样本。变分自动编码器的优点是可以学习到一个连续的潜在空间，从而生成更加多样化的样本。对抗生成式网络是一种深度生成模型，它可以用来学习一个生成模型p(x)和一个判别模型p(y|x)，以便生成新的样本。对抗生成式网络的优点是可以生成更加逼真的样本，并且可以学习到一个判别模型，从而提高生成模型的性能。概率生成模型可以应用于监督学习和无监督学习。在监督学习中，概率生成模型可以用来建模输出标签的条件概率密度函数 p(y|x)。在无监督学习中，概率生成模型可以用来学习一个概率密度函数 pθ(x)，以便生成新的样本。判别模型和生成模型是两种不同的监督学习模型。判别模型直接建模条件概率密度函数p(y|x)，并不建模其联合概率密度函数 p(x, y)。生成模型可以用来学习一个概率密度函数 pθ(x)，以便生成新的样本，并且可以用来学习一个判别模型。在机器学习中，密度估计是一种非常典型的无监督学习问题。如果要建模密度估计，可以使用EM算法来进行密度估计。EM 算法可以用来学习一个概率密度函数 pθ(x)，以便生成新的样本。概率生成模型是一种非常重要的机器学习模型，它可以用来学习一个概率密度函数 pθ(x)，以便生成新的样本，并且可以应用于监督学习和无监督学习。

第 13 章深度生成模型

我不能创造的东西，我就不了解。

— 理查德·菲利普·费曼

概率生成模型，简称生成模型（Generative Model），是概率统计和机器学

习中的一类重要模型，指一系列用于随机生成可观测数据的模型。假设在一个

连续的或离散的高维空间 X 中，存在一个随机向量 X 服从一个未知的数据分布

(x), x ∈ X。生成模型是根据一些可观测的样本 x

(1)

, x

(2)

, ··· , x

(N)

来学习一

个参数化的模型 p

(x) 来近似未知分布P

(X)，并可以用这个模型来生成一些样

本，使得“生成”的样本和“真实”的样本尽可能地相似。

生成模型的应用十分广泛，可以用来不同的数据进行建模，比如图像、文

本、声音等。比如图像生成，我们将图像表示为一个随机向量 X，其中每一维

都表示一个像素值。假设自然场景的图像都服从一个未知的分布p

(x)，希望通

过一些观测样本来估计其分布。高维随机向量一般比较难以直接建模，需要通

过一些条件独立性来简化模型。但是，自然图像中不同像素之间的存在复杂的

依赖关系（比如相邻像素的颜色一般是相似的），很难用一个明确的图模型来描

述其依赖关系，因此直接建模 p

(x) 比较困难。

深度生成模型就是利用深层神经网络可以近似任意函数的能力来建模一个

复杂的分布 p

(x)。假设一个随机向量 Z 服从一个简单的分布 p(z), z ∈ Z（比

如标准正态分布），我们使用一个深层神经网络 g : Z → X，并使得 g(z) 服从

(x)。

本章介绍两种深度生成模型：变分自动编码器 [Kingma and Welling, 2013,

Rezende et al., 2014] 和对抗生成式网络 [Goodfellow et al., 2014]。

13.2 变分自编码器 2018 年 6 月 13 日 259

p(x, z|θ) = p(x|z, θ)p(z|θ), (13.2)

其中 p(z|θ) 为隐变量 z 先验分布的概率密度函数，p(x|z, θ) 为已知 z 时观测变量

x 的条件概率密度函数，θ 表示两个密度函数的参数。一般情况下，我们可以假

设 p(z|θ) 和 p(x|z, θ) 为某种参数化的分布族，比如正态分布。这些分布的形式

已知，只是参数 θ 未知，可以通过最大化似然来进行估计。

给定一个样本 x，其对数边际似然 log p(x|θ) 可以分解为

log p(x|θ) = ELBO(q, x|θ, ϕ) + D

(q(z|ϕ)∥p(z|x, θ)), (13.3)

其中 q(z|ϕ) 是额外引入的变分密度函数，其参数为 ϕ，ELBO(q, x|θ, ϕ) 为证据

参见公式 (11.96)。

下界，

ELBO(q, x|θ, ϕ) = E

z∼q (z|ϕ)

[

log

p(x, z|θ)

q(z|ϕ)

]

. (13.4)

最大化对数边际似然 log p(x|θ) 可以用 EM 算法来求解，具体可以分为两步：

EM 算法参见第??节。

• E-step: 寻找一个密度函数q(z|ϕ)使其等于或接近于后验密度函数 p(z|x, θ)；

• M-step: 保持 q(z|ϕ) 固定，寻找 θ 来最大化 ELBO(q, x|θ, ϕ)。

这样个步骤不断重复，直到收敛。

在 EM 算法的每次迭代中，理论上最优的 q(z|ϕ) 为隐变量的后验概率密度

函数 p(z|x, θ)，

p(z|x, θ) =

(

, θ

)

(

)

∫

p(x|z, θ)p(z|θ)dz

. (13.5)

后验密度函数 p(z|x, θ ) 的计算是一个统计推断问题，涉及到积分计算。当隐变

量 z 是有限的一维离散变量，则计算起来比较容易。在一般情况下，这个后验概

率密度函数是很难计算的。此外，概率密度函数 p(x|z, θ) 一般也比较复杂，很

难直接用已知的分布族函数进行建模。

变分自编码器（variational autoencoder，VAE）是一种深度生成模型，其

思想是利用神经网络来分别建模两个复杂的条件概率密度函数。

1. 用神经网络来产生变分分布 q(z|ϕ)，称为推断网络。理论上 q(z|ϕ) 可以不

依赖 x。但由于 q(z|ϕ) 的目标是近似后验分布 p(z|x, θ)，其和 x 相关，因

邱锡鹏：《神经网络与深度学习》 https://nndl.github.io/

剩余22页未读，继续阅读

身份认证购VIP最低享 7 折!

30元优惠券

资源推荐

资源评论

曹多鱼

粉丝: 29
资源: 314

chap-深度生成模型1

chap-深度生成模型.pdf

chap-深度生成模型.pptx

chap13-深度生成模型.pdf

chap15-序列生成模型1

chap-深度信念网络1

chap-语言模型与词嵌入1

chap-绪论.pptx

chap1-绪论1

chap1-high-dim-space.pdf

Image Based Rendering -- Chap 1

细说PyTorch深度学习：理论、算法、模型与编程实现 01

细说PyTorch深度学习：理论、算法、模型与编程实现 03

opengl.rar_opengl

雷达系统设计matlab仿真Chap1

机器学习的doc

DirectX_RPG_Chap02_05_Light

chap6 真实感图形光照处理.PPT

Borland_C++_Builder.zip_C++ Builder_borland c++例程

chap17_visualfortran_

着色器的应用实例，编译应用

tensorflow2.0 quick start

用Java语言写的JPEG图象生成器程序

计算机图形图像算法教程课件（1-4章）

车牌定位系统程序

算法导论3th及课后习题答案 introduction to algorithm

员工绩效管理系统

随波逐流CTF编码工具 V6.5 20250115

最新版ISO/IEC 27001:2022、ISO 27002:2022中英文合集

最新资源