没有合适的资源?快使用搜索试试~ 我知道了~
扩散模型在医学图像分割的应用综述翻译
需积分: 0 2 下载量 69 浏览量
2024-02-22
19:44:39
上传
评论 2
收藏 2.07MB PDF 举报
温馨提示
试读
22页
扩散模型在医学图像分割的应用综述翻译
资源推荐
资源详情
资源评论
医学图像分析
88 (2023)102846
Amirhossein Kazerouni a, Ehsan Khodapanah Aghdam b, Moein Heidari a, Reza Azad c,
Mohsen Fayyaz d, Ilker Hacihaliloglu e,f, Dorit Merhof g,h,
∗
a null
伊朗科技大学电气工程学院,伊朗德黑兰
b Shahid Beheshti
大学电气工程系,伊朗德黑兰
c null
亚琛工业大学电气工程与信息技术学院,德国亚琛
;
微软公司,德国柏林
e null
加拿大温哥华英属哥伦比亚大学放射学系
f null
加拿大温哥华英属哥伦比亚大学医学系
g null
德国雷根斯堡大学信息学与数据科学学院
h null
弗劳恩霍夫数字医学研究所
MEVIS
,德国不莱梅
条信息
硕士
:
41 a05
41 a10
65
年
d05
65
年
d17
关键词
:
生成模型扩散模型去噪扩散模型噪
声条件评分网络基于分数的模型医
学成像医学应用调查
null
摘要。
去噪扩散模型是一类生成模型,最近在各种深度学习问题中引起了极大的兴趣。扩散概率模型定义了一个
正向扩散阶段,其中输入数据通过添加高斯噪声在几个步骤中逐渐受到扰动,然后学习逆转扩散过程,从
有噪声的数据样本中检索所需的无噪声数据。尽管已知的计算负担很大,但扩散模型因其强大的模式覆盖
率和生成样本的质量而受到广泛赞赏。利用计算机视觉的进步,医学成像领域也观察到对扩散模型的兴趣
日益增长。为了帮助研究人员浏览这一丰富的内容,本调查旨在提供医学成像学科中扩散模型的全面概述。
具体来说,我们首先介绍扩散模型背后的坚实理论基础和基本概念,以及三种通用的扩散建模框架,即扩
散概率模型、噪声条件评分网络和随机微分方程。然后,我们提供了医学领域扩散模型的系统分类,并根
据它们的应用、成像方式、感兴趣的器官和算法提出了一个多视角的分类。为此,我们涵盖了扩散模型在
医学领域的广泛应用,包括图像到图像的转换、重建、配准、分类、分割、去噪、
2/3D
生成、异常检测以
及其他与医学相关的挑战。此外,我们强调了一些选定方法的实际用例,然后讨论了扩散模型在医学领域
的局限性,并提出了满足该领域需求的几个方向。最后,我们在我们的
GitHub
上收集了概述的研究及其可
用的开源实现。
1 null
我们的目标是定期更新其中的相关最新论文。
1.
介绍
在过去十年中,使用神经网络的生成建模一直是深度学习的主导
力量。自其出现以来,生成模型在图像等各个领域产生了巨大的影响
(Bao et al.
,
2017;Razavi et al.
,
2019)
、音频
(Kong et al.
,
2021;van
den Oord
等人,
2016)
,到文本
(Li
等人,
2022a)
,以及点云
(Yang
等
人,
2019)
。从概率建模的角度来看,生成模型的关键定义特征是,
它以这样一种方式进行训练,使其样本
𝒙
𝜃
null
(
𝒙
)
来自与训练数据分布
相同的分布,
𝒙
~
𝑝
𝑑
null
(
𝒙
)
。的
null
基于能量的模型
(EBMs)
通过定义状态空间上的非规范化概率密
度来实现这一点
;
然而,这些方法在训练和推理期间都需要马尔可夫链
蒙特卡罗
(MCMC)
采样,这是一个缓慢的迭代过程
(Bond-Taylor et al.
,
2021)
。在过去的几年里,由于一般深度学习架构的进步,人们对生成
模型的兴趣重新燃起,揭示了视觉保真度和采样速度的提高。具体来
说,已经出现了生成对抗网络
(GANs) (Goodfellow
等人,
2020)
、变分
自动编码器
(VAEs) (Rezende
等人,
2014)
和归一化流
(Dinh
等人,
2017)
。
除了这些,生成式
https://doi.org/10.1016/j.media.2023.102846
2022
年
11
月
16
日收到
;2023
年
5
月
12
日收到修订后的表格
;2023
年
5
月
16
日接受,
2023
年
5
月
23
日在线开放
1361-8415/
©
2023 Elsevier B.V.
版权所有。
通讯作者:德国雷根斯堡大学信息与数据科学学院,雷根斯堡。
E-mail: dorit.merhof@ur.de (D. Merhof)
。
1 https://github.com/amirhossein-kz/Awesome-Diffusion-Models-in-Medical-Imaging
调查报告
医学影像学中的扩散模型
:
综合调查
图
1
所示。
图
(a)
显示了根据其应用和
(b)
根据其成像方式分类的已发表论文的相对比例。
(c)
表示在医学领域发表的基于扩散的研究论文的数量。
每年的增长率揭示了扩散模型对未
来工作的重要性。值得一提的是,论文总数为
103
篇。
基于扩散过程的模型为现有的
VAEs
、
EBMs
、
GANs
和归一化流提
供了一种替代方案,这些模型不需要分别对后验分布进行对齐、估
计难以处理的配分函数、引入额外的判别器网络或放置网络约束。
迄今为止,已经发现扩散模型在各种领域都很有用,从生成建模任
务
(
如图像生成
(Dhariwal
和
Nichol, 2021)
、图像超分辨率
(Li
等人,
2022b)
、图像绘制
(Lugmayr
等人,
2022)
到判别任务
(
如图像分割
(Amit
等 人,
2021)
、分类
(Zimmermann
等人,
2021)
和 异常检 测
(Wolleb
等人,
2022a)
。最近,医学成像界见证了基于扩散的技术数
量呈指数级增长
(
见图
1)
。如图
1
所示,大量的研究致力于扩散模型
在不同医学成像场景中的应用。由于扩散模型最近受到了研究界的
极大关注,因此在这一方向上,文献正在大量涌入贡献。因此,对
现有文献进行调查对学界是有益的,也是及时的。为此,本调查旨
在对最近取得的进展进行全面概述,并对医学成像中的这类模型进
行全面概述。对相关文献的彻底搜索表明,我们是第一个涵盖医学
领域中利用的基于扩散的模型的人。我们希望这项工作能够指出新
的路径,为研究人员提供路线图,并激发视觉界进一步的兴趣,以
利用扩散模型在医学领域的潜力。我们的主要贡献包括
:
∙
这是第一篇全面涵盖扩散模型在医学成像领域应用的调查论文。
具体而言,我们全面概述了所有可用的相关论文
(
直到
2022
年
10
月
)
,
并展示了
2023
年
4
月之前的一些最新技术。
∙
我们设计了医学界扩散模型的多视角分类,为扩散模型及其应
用的研究提供了系统的分类。我们将现有的扩散模型分为两类
:
基
于变分的模型和基于分数的模型。此外,我们将扩散模型的应用分
为九类
:
图像到图像的翻译、重建、配准、分类、分割、去噪、图
像生成、异常检测和其他应用。
∙
我们没有将注意力限制在应用上,并提供了一种新的分类法(见图
5),其中每篇论文分别根据所提出的算法以及相关器官和成像方式进
行了广泛的分类。
∙
最后,我们讨论了挑战和开放的问题,并确定了在算法和应用
中对医学领域扩散模型的未来发展提出开放问题的新趋势。
本调查的动机和独特性。
生成方法在医学成像领域取得了重大
进展
null
过去几十年。因此,关于医学成像的深度生成模型发表了大量调
查 论 文
(AlAmir
和
AlGhamdi, 2022;Ali
等人,
2022a;Chen et al.
,
2022b)
。其中一些论文只关注特定的应用,而另一些则专注于特定的
图像模态。最近也有一些关于扩散模型表面化的综述文章用于计算机
视觉任务
(Cao et al.
,
2022c;Yang et al.
,
2022;Croitoru et al.
,
2022)
。
虽然在这一领域得到充分发展之前就已经发布了评论,但从那时起,
医学领域的许多进展已经出来了。另一方面,这些调查都没有关注扩
散模型在医学成像中的应用,而这正是推动这一研究方向向前发展的
核心方面。因此,这些调查留下了一个明显的开放差距。此外,我们
相信医学界可以通过回顾我们调查中提供的扩散模型过去和未来的研
究方向,来利用视觉中扩散模型成功产品的见解。此外,扩散模型已
经证明了它们在生成合成数据方面的潜力,可以作为现有真实数据的
有效补充,也可以作为生物医学逆成像问题的生成先验
(
如第
3
节所
述
)
。最后,我们认为我们的调查可以帮助医学研究人员
(
例如放射科
医生
)
并指导他们在各自的领域中利用最新的方法。为此,在本调查中,
我们设计了扩散模型的多视角,其中我们根据其在医学领域的应用讨
论了现有文献。尽管如此,我们并没有将我们的兴趣限制在应用上,
而是描述了所提出方法的基本工作原理、器官和成像方式。我们进一
步讨论了这些额外的信息如何帮助研究人员试图巩固跨谱的文献。我
们论文的简要展望如图
5
所示。
搜索策略。
我们使用定制搜索查询搜索
DBLP
、
Google Scholar
和
Arxiv Sanity Preserver
,因为它们允许定制搜索查询,并提供所
有学术出版物的列表
:
同行评议的期刊论文或在会议或研讨会论文
集中发表的论文、非同行评议的论文和预印本。我们的搜索查询是
(diffusion* deep | medical | imaging*)(
去噪
| medical*) (diffusion* |
medical* | probability * | model*) (score* | diffusion* | model* |
medical*)
。我们对搜索结果进行了过滤以去除假阳性,并且只收录
了与扩散概率模型相关的论文
(
例如,我们有许多关于扩散磁共振
成像
(MRI)
模型的假阳性搜索结果
)
。值得注意的是,我们选择论文
进行详细检查是基于对其新颖性、贡献、意义的仔细评估,以及是
否为医学成像领域的第一篇介绍论文。在应用这些标准之后,我们
选择了两到三篇排名最高的论文进行更详细的检查。我们承认,该
领域可能还有其他重要的论文没有在我们的综述中讨论,但我们的
目的是提供最重要和最有影响力的论文的全面概述。
论文的组织。
在第
2
节中,我们详细概述了扩散模型背后的概念
和理论基础,
2
医学图像分析
88 (2023)102846
A. Kazerouni
等
人。
图
2
所示。
该图展示了不同的生成模型,并概述了它们的基本原理。
(a)
通用对抗网络
(GAN) (Goodfellow
等人,
2020)
是端到端管道,以对抗方式训练生成器生成判别器能够与
真实数据样本区分的样本。
(b)
基于能量的模型
(EBM) (LeCun et al.
,
2006)
,也称为非归一化概率模型,以与
gan
相同的方式进行训练,但有两个主要修改。首先,鉴别器学习
一个适当的基于能量的函数,该函数将数据样本映射到一个分布空间。其次,生成器利用先验输入来增强样本生成性能。
(c)
变分自动编码器
(VAE) (Kingma and Welling, 2013)
是一个独立的网络,它遵循编码器从数据样本到低维潜在空间的投影,并通过解码器路径从中采样产生。
(d)
归一化流
(Normalizing flow, NF) (Papamakarios
等人,
2021)
利用可
逆流函数将输入转换为潜在空间,并生成具有逆流函数的样本。
(e)
扩散模型在连续步骤中将噪声与输入混合,直到它成为噪声分布,然后应用反向过程来中和采样过程中每个
步骤中的噪声添加。
涵盖了扩散模型的两个视角。在第
3
节中,我们将深入研究在临床
环境中使用生成模型,特别是扩散模型的意义,并讨论它们提供的
好处。第
4
节全面介绍了扩散模型在几种医学成像任务中的应用,
如图
5
所示,最后对不同的文献工作提供了特定任务的比较概述。
我们通过在第
5
节中指出扩散模型在医学成像领域的未来方向和面
临的开放挑战来总结这次调查。
2.
理论
扩散模型是一类前沿的生成模型,已被证明在学习复杂数据分布
方面非常有效。它们是生成学习领域的一个相对较新的补充,但已被
证明在各种应用中都很有用。在本节中,我们将深入研究扩散模型的
理论。我们首先讨论扩散模型在更广泛的生成学习领域中的地位,并
就它们与其他生成模型的比较提供一个新的视角。我们进一步将扩散
模型分为两个主要视角
:
变分视角和分数视角。我们深入研究了它们
的细节,并强调了属于它们的特定模型,例如变分视角中的
ddpm
和
分数视角中的
ncsn
和
sde
。最终,我们提供了对这些方法背后的基础
理论的全面理解。
2.1.
扩散模型在哪里适合生成式学习
?
随着可用数据集的显著激增,以及一般深度学习架构的进步,生
成建模出现了革命性的范式转变。具体来说,三种主流生成框架包
括
:gan (Goodfellow
等人,
2020)
、
VAEs (Rezende
等人,
2014;Kingma
and Welling, 2013);
null
图
3
所示。
生成式学习三难困境
(Xiao
等人,
2022)
。尽管
gan
具有快速生成高保真样
本的能力,但其模式覆盖范围有限。此外,研究还发现
VAEs
和正态流具有很大的多
样性
;
但是,它们的采样质量普遍较差。扩散模型的出现弥补了
VAEs
和
gan
的不足,
显示出足够的模式覆盖和高质量的采样。然而,由于它们的迭代性质,导致采样过
程缓慢,它们实际上是昂贵的,需要更多的改进。
和规范化流程
(Dinh
等人,
2017)(
见图
2)
。生成式模型通常需要在现
实问题中采用的关键要求。这些要求包括
(i)
高质量采样,
(ii)
模式覆
盖和样本多样性,以及
(iii)
快速执行时间和计算成本低廉的采样
(Xiao
等人,
2022)(
见图
3)
。
生成式模型经常在这些标准之间做出调整。具体而言,
gan
能够
快速生成高质量的样本,但它们的模式覆盖率较差,并且容易缺乏
采样多样性。相反,尽管在覆盖数据模式中见证了
VAEs
和归一化
流,但它们仍受到低样本质量的固有特性的影响。
gan
由两个模型组
成
:
生成器和鉴别器,它们相互竞争
3
医学图像分析
88 (2023)102846
A. Kazerouni
等
人。
同时让彼此变得更强大。生成器试图捕获真实样本的分布,而鉴别
器
(
通常是二元分类器
)
则估计给定样本来自真实数据集的概率。它作
为一个批评家,并被优化以识别来自真实样本的合成样本。
gan
的一
个共同问题是它们的训练动态被认为是不稳定的,导致模式崩溃、
梯度消失和收敛等缺陷
(Wiatrak
等人,
2019)
。因此,巨大的兴趣也
影响了
gan
的研 究 方 向 ,以提 出 更有 效的 变 体
(Miyato et al.
,
2018;Motwani and Parmar, 2020)
。
VAEs
通过最大化证据下界
(ELBO)
来优化数据的对数似然。尽管取得了显著的成就,但由于平衡问题
(Davidson et al.
,
2018)
和变量崩溃现象
(Asperti, 2019)
等一些理论和
实践挑战,
VAEs
的行为仍然远远不能令人满意。一个基于流的生成
模型是由一系列可逆变换构建的。具体来说,归一化流通过应用一
系列可逆变换函数将简单分布转换为复杂分布,其中可以使用变量
变换定理获得最终目标变量的期望概率分布。与
gan
和
VAEs
不同,
这些模型明确地学习数据分布
;
因此,它们的损失函数只是负对数似
然
(Weng, 2018)
。尽管设计可行,但这些生成模型有其特定的缺点。
由于基于可能性的方法必须构造一个归一化的概率模型,因此必须
使用特定类型的体系结构
(
自回归模型,流模型
)
,或者在
VAE
的情
况下,不直接为生成的概率分布计算
ELBO
等替代损失。相比之下,
由于
GAN
的对抗性损失性质,
gan
的学习过程本质上是不稳定的。
最近,扩散模型
(Sohl-Dickstein
等,
2015;Ho et al.
,
2020)
已经成为强
大的生成模型,展示了计算机视觉领域的一个主要主题,因此研究
人员和从业人员都可能会发现跟上创新速度是一项挑战。
扩散模型是一类强大的概率生成模型,用于学习复杂的数据分布。
这些模型通过利用两个关键阶段来实现这一点
:
正向扩散过程和反向
扩散过程。前向扩散过程在输入数据中加入噪声,逐渐提高噪声水
平,直到数据转化为纯高斯噪声。这个过程系统地扰动了数据分布
的结构。然后应用反向扩散过程,也称为去噪,从被扰动的数据分
布中恢复数据的原始结构。这个过程有效地消除了由正向扩散过程
引起的退化。结果是一个高度灵活和易于处理的生成模型,可以准
确地模拟随机噪声中的复杂数据分布。
2.2.
变分透视
变分透视包括使用变分推理来近似目标分布的模型,通常是通过
最小化近似分布和目标分布之间的
Kullback-Leibler
散度来实现的。
去噪扩散概率模型
(ddpm) (Sohl-Dickstein
等,
2015;Ho et al.
,
2020)
是这类模型的一个例子,因为它们使用变分推理方法来估计扩散过
程的参数。
2.2.1.
去噪扩散概率模型
(ddpm)
前进的过程。
DDPM
将前向扩散过程定义为一个马尔可夫链,在连
续的步骤中加入高斯噪声
()
,得到一组带噪声的样本。考虑
𝑞𝑥
0
为
(
未
损坏的
)(
原始的
)
数据分布。给定一个数据样本
0 null
∼𝑞𝑥
0 null
,前向噪声
处理
𝑝
which
会产生潜在的噪点
1 null
通过
𝑥
𝑇
null
在时间
𝑡
is
加高斯斯噪声,
定义如下
:
null 其中𝑇and 时延
1null
,…,时延
𝑇null
∈[0,1)分别表示扩散步数和跨
扩散步数的方差调度。
𝐈
is 单位矩阵和 (s1;
的正态分布
∏
𝑡
均值
𝜇
and
协方差。考虑到 ρ
= 1
−
ρ
=
𝑡
and
ρ
=
𝑡
=
𝑠
=0
ρ
=
𝑠
,可以直接对输
入条件下的含噪潜在条件的任意步长进行采样
0 null
如下
:
反向的过程。
利用上面的定义,
()
我们可以近似一个反向过程,从
𝑞𝑥
0()
得 到 一 个 样 本 。 为 此 ,
(
我们
)
可以从
𝑝
()
开 始 参 数 化 这 个 反 向 过 程
𝑇
null
=
𝐱
𝑇
null
;
<e:1>,𝐈as 如下:
()
(To)
训练这个模型,使
𝑝𝑥
0
学习真实的数据分布
𝑞
0 null
,我们可以在负
对数似然上优化以下变分界
:
()
Ho et al.(2020)发现最好不要直接参数化()𝑡,𝑡作为神经网络,而是训
练一个模型<e:1>
𝜃null
𝑥
𝑡null
,𝑡
to predict
。
因此,通过重新参数化 Eq.(6),
他们提出了一个简化的目标如下:
其中作者将
Eq.(6)
中的损失与
Song
和
Ermon(2019)
的生成分数网络
联系起来。
2.3.
分数透视
分数透视模型依赖于基于最大似然的估计方法,使用数据的对数
似然的得分函数来估计扩散过程的参数。噪声条件分数网络
(ncns)
(Song
和
Ermon, 2019)
和随机微分方程
(SDEs) (Song et al.
,
2021b)
都
是属于这一类的子类别。
ncns
侧重于估计不同噪声水平下扰动数据分
布的对数密度函数的导数,而
SDEs
是先前方法的推广,包括
ddpm
和
ncns
的特征。下面我们将详细阐述每一个子类别的细节。
2.3.1.
噪声条件评分网络
(ncns)
某些数据分布
𝑝
(s1)
的分数函数定义为对数密度相对于输入
∇
的梯度
𝑥
null
日志
𝑝
(
𝑥
)
。为了估计这个分数函数,我们可以训练一个具有分数匹配的共
享神经网络。具体来说,分数网络
𝐬
𝜽
null
是一个神经网络的参数化,通过训
练来近似
𝑝
(
分得
)(
𝑠
𝜃
null
(
𝑥
)
≈
∇
𝑥
null
Log
𝑝
(xs))
通过最小化以下目标
:
然而,由于计算∇的计算负担
𝑥null
Log𝑝(≥),分数匹配不能扩展到深
度网络和高维数据。为了缓解这个问题,Song 和 Ermon(2019)的作者提
出利用去噪分数匹配(Vincent, 2011)和切片
4
医学图像分析
88 (2023)102846
A. Kazerouni
等
人。
分数匹配
(Song et al.
,
2020b)
。此外,
Song
和
Ermon(2019)
强调了阻碍
在真实数据中幼稚地应用基于分数的生成建模的主要挑战。关键的挑
战是,估计的分数函数在低密度区域是不准确的,因为现实世界中的
数据往往集中在嵌入高维空间的低维流形上
(
流形假设
)
。作者证明,这
些问题可以通过在不同尺度上用高斯噪声扰动数据来解决,因为它使
数据分布更适合基于分数的生成建模。他们提出通过训练一个
(
单一
)
噪
声条件
(
分数
)
网络
(NCSN)
来估计所有噪声级别对应的分数。他们获得
∇𝑥
log
𝑝𝜎𝑡
(
𝑥
)
∇𝑥𝑡
log
𝑝𝜎𝑡𝑥𝑡
∣
𝑥
=−
𝑥𝑡𝜎
−
𝑥
通过选择
() (
2 null
)
𝑡
噪声分布为
𝑝
𝜎
null
𝑡
null
𝑥
𝑡
null
∣
𝑥
=
𝑥
𝑡
null
;
𝑥
,
𝜎
𝑡
null
⋅
𝐈
where
𝑥
𝑡
null
是噪点版的粽。因此,
对于给定的高斯噪声尺度序列
𝜎
1 <
𝜎
2 <
⋯
<
φ
𝑇
,
Eq.(8)
可表示为
:
()
在
𝜆𝜎
𝑡
null
是加权函数。推理是使用称为“朗格万动力学”的迭代过程完成
的
(Parisi, 1981;Grenander and Miller, 1994)
。朗格万动力学设计了一个
MCMC
程序,仅使用分数函数
∇
从分布
𝑝
()
中抽样
𝐱
null
日志
𝑝
(
𝐱
)
。具体来说,
就是从一个随机样本中移出
0 null
∼
()向
𝑝
()的样本移动,它迭代以下内容:
在𝜔
𝑖null
∼ (0,𝐈),和∈{1,…,}。当<s:1>→0 和→∞时
𝑖 null
从这个过
程得到的样本收敛到一个来自𝑝()的样本。Song 和 Ermon(2019)的作者
提出了对该算法命名法的修改,将其命名为自噪声尺度的退火朗格万动
态算法
𝑖null
随着时间的推移逐渐减少(退火),以减轻分数匹配的一些缺
陷和失效模式(Song 和 Ermon, 2020)。
2.3.2.
随机微分方程
(SDEs)
与上述两种方法类似,基于分数的生成
(
模型
)(SGMs) (Song et al.
,
2021b)
对数据分布进行了变换
𝑞
≥
0 null
为噪音。然而,通过将噪声尺度
的数量推广到无穷大,可以将之前的概率模型视为
SGM
的离散化。
我们知道,许多随机过程,如扩散过程,都是随机微分方程
(SDE)
的
解,其形式如下
:
𝐟
(
。
(
𝑡
)
为
SDE
漂移系数,
g(t)
为扩散系数,
w
为标准布朗运动。
让
𝐱
0
null
为未损坏的数据样本,并且为
𝑇
null
表示近似于标准高斯分布的扰动
数据。对于给定的正向
SDE
,存在反向时间
SDE
反向运行,其中,
从
𝑝
的样本开始
𝑇
null
逆转这个扩散
SDE
,我们可以从我们的数据分布
𝑝
中获得样本
0null
。逆时
SDE
为
:
其中𝑑𝑡is 是无穷小的负时间步长,𝑤是向后运行的布朗运动。为了在数值
上求解逆时 SDE,可以通过分数匹配训练神经网络来近似实际分数函数
(Song and Ermon, 2019;Song et al., 2021b)进行估算
𝜃null
(𝒙,𝑡)≃∇
𝒙
null
日志
𝑝
𝑡null
(𝒙)(式(12)中用红色表示)。这个分数模型使用以下目标进行训练:
null
其中
𝜆
is
为权重函数,和
𝑡
~ ([0
,
𝑇
])
。值得注意的是
,
∇
𝒙
null
日志
𝑝
𝑡
null
(
𝒙
)
被替
换为
∇
𝒙
null
日志
𝑝
0null
𝑡
null
(
𝒙
(
𝑡
)
∣
𝒙
(0))
规避技术难题。
sde
的采样过程可以通过对
Eq.(12)
应用任意数值方法来完成。下面
将详细讨论三种常用的技术。
1.
Euler-Maruyama (EM)
方法
:
使用一种简单的离散化技术,将𝑑𝑡
is
替换为含
有高斯噪声的𝛥𝑡
and
𝑑𝑤
(
≤
(0
,𝛥𝑡⋅𝐼
))
,即可求解
Eq.(12)
。
2.
预测
-
校正
(PC)
法
:
在这种方法中,预测和校正过程在一个嵌套循环中
进行,先对先验数据进行预测,然后分几个步骤进行校正。
预测
器可以使用
EM
求解。由于校正器可以是任何基于分数的马
尔可夫链蒙特卡罗
(MCMC)
方法,包括退火朗格万动力学,因
此可以利用
Eq.(10)
中的朗格万动力学求解。
3.
概率流
ODE (ODE)
法
:Eq.(11)
中的
SDE
方程可写成
ODE
方程如下
:
因此,通过求解 ODE 问题
0 null
可以找到。然而,虽然 ODE 是一
个快速求解器,但它缺乏一个随机项来纠正错误,导致性能略有
下降。
3.
临床重要性
生成模型对医学成像领域产生了重大影响,该领域迫切需要工具
来改善临床医生和患者的常规工作。具体而言,数据收集程序的复
杂性、专家的缺乏、隐私问题以及患者授权的强制性要求,都造成
了医学成像中标注过程的主要瓶颈。这就是生成模型发挥优势的地
方
(Liu et al.
,
2022b)
。有几个观点促使我们对医学成像的生成扩散
模型产生了兴趣。在医学领域,由于某些病理的罕见性,许多数据
集遭受严重的类别不平衡。扩散模型可以通过生成各种逼真的图像
来缓解这种限制,以便在医疗领域中加以利用。此外,生成合成医
学图像具有实质性的教育价值。由于扩散模型能够产生无限来源的
不同医学成像模式的独特实例,因此可以通过构建用于教学和实践
的不同合成样本来满足教育需求。此外,这些人工图像可以减轻与
在公共环境中使用患者数据相关的数据安全问题。这些人工图像还
可以解决用于医疗应用的深度神经网络训练中的一个特别重大的困
难。一般来说,医学图像的注释是一个漫长而昂贵的过程,需要专
家的协助。因此,使用扩散模型生成合成样本可以在很大程度上缓
解医疗数据稀缺的问题。图
4
描述了使用
Moghadam
等人
(2023)
生成
具有罕见癌症亚型的组织病理学图像的案例研究。
虽然生成模型生成的合成数据的独立使用仍处于早期阶段,但研
究表明,在实际场景中利用它们取得了可喜的结果。
Goncalves
等人
(2020)
等研究已经评估了用于创建合成电子健康记录的不同生成方法,
并发现其中一些方法在实践中可能有用,因为它们生成的合成样本
具有与真实数据相似的统计特性,而不会损害患者隐私。在另一项
研究中,
Chen
等人
(2021a)
发现,与仅使用真实数据相比,同时使用
合成数据和真实数据来训练组织学图像的分类器可以提高性能。此
外,
Akrout
等人
(2023)
进行的研究表明,利用扩散模型生成的合成图
像可以提高皮肤分类器的准确性,并且使用合成和真实数据组合训
练的模型的性能优于这些模型
5
医学图像分析
88 (2023)102846
A. Kazerouni
等
人。
剩余21页未读,继续阅读
资源评论
医学分割哇哇哇哇哇哇哇哇哇
- 粉丝: 360
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功