SR3-ImageSuper-ResolutionviaIterativeRefinement.pdf_generativeadversarialnetwork资源-CSDN文库

需积分: 38 99 浏览量 2021-10-16 14:29:47 上传评论收藏 19.97MB PDF 举报

【SR3 - 图像超分辨率迭代精炼】 SR3（Super-Resolution via Repeated Refinement）是一种基于迭代精炼的图像超分辨率技术，由Google Research的Brain Team的研究人员提出。该方法利用去噪扩散概率模型（denoising diffusion probabilistic models），特别是借鉴了[17, 48]中的思想，将这些模型应用于条件图像生成，通过一个随机的迭代去噪过程实现超分辨率。SR3的核心在于，它从纯高斯噪声开始生成输出，并利用在不同噪声水平下训练的U-Net模型逐步对噪声输出进行精炼。传统的超分辨率方法，如基于回归的卷积神经网络（feedforward convolutional nets），可能在低放大倍数下工作良好，但在处理高放大倍数时往往无法生成具有高保真度细节的图像，因为输入图像与多个高分辨率图像可能存在一致性，而条件输出图像分布通常不符合简单的参数分布。SR3正是为了解决这一问题，它采用了一种迭代策略，使得模型能够逐次提升生成图像的质量。在SR3中，U-Net模型被训练来执行不同噪声水平下的去噪任务。在超分辨率过程中，初始输出是纯高斯噪声，随后在每一轮迭代中，U-Net会根据当前的噪声图像进行预测，逐渐减少噪声并增加细节，直至达到期望的高分辨率图像。这一过程可以视为逐步逼近真实高分辨率图像的过程。在实验部分，SR3在人脸和自然图像的超分辨率任务上表现出色，无论放大倍数如何。在标准的8×人脸超分辨率任务上，针对CelebA-HQ数据集进行了人类评估，与当前最先进的生成对抗网络（GAN）方法相比，SR3的欺骗率接近50%，意味着其生成的图像逼真度极高，而GAN方法的欺骗率不超过34%。这进一步证明了SR3在生成逼真图像方面的优势。此外，SR3还展示了在级联图像生成中的有效性。在这种设置中，生成模型与超分辨率模型串联，形成一个流程，可以得到具有竞争力的Fréchet Inception Distance (FID)分数11.3，在ImageNet数据集上表现优异。FID分数是衡量生成图像质量与真实图像分布接近程度的一个指标，低的FID分数意味着生成图像更接近于真实的高分辨率图像。 SR3通过迭代精炼的方法克服了传统超分辨率技术的局限性，能够在不同放大倍数下生成高质量的高分辨率图像，尤其是在生成逼真度和细节丰富的图像方面显示出显著优势。这一创新技术对于图像处理、计算机视觉和机器学习等领域具有重要的研究价值和应用前景。

资源推荐

资源评论