SR3 - Image Super-Resolution via Iterative Refinement.pdf
【SR3 - 图像超分辨率迭代精炼】 SR3(Super-Resolution via Repeated Refinement)是一种基于迭代精炼的图像超分辨率技术,由Google Research的Brain Team的研究人员提出。该方法利用去噪扩散概率模型(denoising diffusion probabilistic models),特别是借鉴了[17, 48]中的思想,将这些模型应用于条件图像生成,通过一个随机的迭代去噪过程实现超分辨率。SR3的核心在于,它从纯高斯噪声开始生成输出,并利用在不同噪声水平下训练的U-Net模型逐步对噪声输出进行精炼。 传统的超分辨率方法,如基于回归的卷积神经网络(feedforward convolutional nets),可能在低放大倍数下工作良好,但在处理高放大倍数时往往无法生成具有高保真度细节的图像,因为输入图像与多个高分辨率图像可能存在一致性,而条件输出图像分布通常不符合简单的参数分布。SR3正是为了解决这一问题,它采用了一种迭代策略,使得模型能够逐次提升生成图像的质量。 在SR3中,U-Net模型被训练来执行不同噪声水平下的去噪任务。在超分辨率过程中,初始输出是纯高斯噪声,随后在每一轮迭代中,U-Net会根据当前的噪声图像进行预测,逐渐减少噪声并增加细节,直至达到期望的高分辨率图像。这一过程可以视为逐步逼近真实高分辨率图像的过程。 在实验部分,SR3在人脸和自然图像的超分辨率任务上表现出色,无论放大倍数如何。在标准的8×人脸超分辨率任务上,针对CelebA-HQ数据集进行了人类评估,与当前最先进的生成对抗网络(GAN)方法相比,SR3的欺骗率接近50%,意味着其生成的图像逼真度极高,而GAN方法的欺骗率不超过34%。这进一步证明了SR3在生成逼真图像方面的优势。 此外,SR3还展示了在级联图像生成中的有效性。在这种设置中,生成模型与超分辨率模型串联,形成一个流程,可以得到具有竞争力的Fréchet Inception Distance (FID)分数11.3,在ImageNet数据集上表现优异。FID分数是衡量生成图像质量与真实图像分布接近程度的一个指标,低的FID分数意味着生成图像更接近于真实的高分辨率图像。 SR3通过迭代精炼的方法克服了传统超分辨率技术的局限性,能够在不同放大倍数下生成高质量的高分辨率图像,尤其是在生成逼真度和细节丰富的图像方面显示出显著优势。这一创新技术对于图像处理、计算机视觉和机器学习等领域具有重要的研究价值和应用前景。
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083646.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![application/postscript](https://img-home.csdnimg.cn/images/20210720083646.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083646.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![application/pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083646.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083646.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![avatar-default](https://csdnimg.cn/release/downloadcmsfe/public/img/lazyLogo2.1882d7f4.png)
![avatar](https://profile-avatar.csdnimg.cn/571fe8c1d3ea43c280f08cf47e7248d4_tracelessle.jpg!1)
- 粉丝: 5w+
- 资源: 467
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![voice](https://csdnimg.cn/release/downloadcmsfe/public/img/voice.245cc511.png)
![center-task](https://csdnimg.cn/release/downloadcmsfe/public/img/center-task.c2eda91a.png)
最新资源
- 打包和分发Rust工具.pdf
- SQL中的CREATE LOGFILE GROUP 语句.pdf
- C语言-leetcode题解之第172题阶乘后的零.zip
- C语言-leetcode题解之第171题Excel列表序号.zip
- C语言-leetcode题解之第169题多数元素.zip
- ocr-图像识别资源ocr-图像识别资源
- 图像识别:基于Resnet50 + VGG16模型融合的人体细胞癌症分类模型实现-图像识别资源
- C语言-leetcode题解之第168题Excel列表名称.zip
- C语言-leetcode题解之第167题两数之和II-输入有序数组.zip
- C语言-leetcode题解之第166题分数到小数.zip
![feedback](https://img-home.csdnimg.cn/images/20220527035711.png)
![feedback-tip](https://img-home.csdnimg.cn/images/20220527035111.png)
![dialog-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/green-success.6a4acb44.png)