一种基于双层框架的仿射类图像抠像方法.docx资源-CSDN文库

版权申诉

68 浏览量 2023-02-23 20:15:30 上传评论收藏 1.09MB DOCX 举报

资源推荐

资源详情

资源评论

数字图像的抠像与合成问题是在虚拟现实中图像处理领域的两种经典问题, 目的是从

一幅合成图像中将前景物体从背景中分离出来, 并合成到一幅新背景图像中.对于合成问题,

对于在数字图像 II 中的某个位置 i=(x,y)i=(x,y), 给定前景图像的颜色 FiFi、背景图像颜色

BiBi 以及一个透明度标量 αi∈[0,1]αi∈[0,1], 其观察到的颜色 IiIi 能够用如下抠像公式表示

为

Ii=αiFi+(1−αi)BiIi=αiFi+(1−αi)Bi

(1)

如果 αi=0αi=0 或 αi=1αi=1, 将点 ii 称作绝对前景或者绝对背景, 并统称为绝对像素.

对于其余 0<αi<10<αi<1 的点, 称为混合像素.

抠像问题为合成问题的逆问题, 同时也是欠约束问题:给出各点的合成像素 IiIi, 需要求

出未知量 FiFi、BiBi 与 αiαi.很多一般背景抠像问题都需要用户提供手工输入的辅助三分图

Trimap, 如图 1(a)和(b)所示, 它包括已知绝对前景区域 ΩFΩF 和已知绝对背景区域 ΩBΩB,

剩余部分为未知区域.于是, 依据已知像素, 并根据抠像公式及某些先验条件, 可以估计未知

区域内的每个像素的{F,α}{F,α}值.基于 Trimap 的图像抠像算法通常分为如下 2 种方式: 1)基

于仿射的抠像方法

[1-7]

.该方法并不孤立地计算每个点, 而是考虑像素间的相关性, 利用间

接、迭代的方式递归地求出未知区域中各个点的 αα 值. 2)基于采样的抠像方法

[8-17]

.该方法

对每个未知点独立从已知区域中选取样本, 并采用逐对样本的计算方式, 而并不考虑各个像

素之间的联系.

图 1 图像抠像问题的基本输入输出和本文的双层次抠像结构

Fig. 1 Input and output of image matting and the hierarchical framework of our method

下载: 全尺寸图片幻灯片

本文主要讨论仿射类方法

[18]

.虽然相比仿射类方法, 采样类方法的采样位置和采样方式

变化较多, 而且获取样本方式非常直接, 然而, 仿射类方法具有以下优势. 1)仿射类方法充

分强调了像素间的相关性, 该方式也可视为由已知区域向未知区域缓慢、渐进的计算, 因此

在最终 αα 结果的平滑性以及带给或用户的视觉感受上要明显好于采样类方法. 2)采用远距

离搜索的仿射类方法对绝对点的计算效果较好, 而在事实上, 未知区域内的大多数点为绝对

像素, 因此该类方总体准确率上有较为明显的优势.本文在第 1 节首先阐述了仿射类方法的

2 种分类方式以及它们优点和缺点, 在第 2 节中针对 KNN 类的特点讨论了绝对像素划分(即

预处理)方式, 在第 3 节中针对 Matting Laplacian 类的特点讨论了剩余混合像素的计算, 并

在第 4 节中讨论了这 2 类方法各自的实验结果.最后第 5、6 节讨论了仿射方法目前存在的

问题并得出本文的结论.本文基于仿射方法的双层次抠像框架如图 1 所示.需要说明的是, 由

于仿射类方法与采样类方法、乃至其他类如特殊类

[19]

、深度学习类

[20-22]

等方法采用完全不

同的计算机制, 而且本文主要研究前者, 因此无论在理论研究和实验数据上, 本文并未引入

任何其他类方法, 而且也不将结果传至 αα 评估系统

[23]

中, 以保持仿射类方法的整体一致性.

1. 仿射类抠像方法概述

假设每个未知像素的 αα 值是它的 KK 邻域像素 αα 值 α1α1, α2,⋯,αKα2,⋯,αK 的线性组

合, 表示为

αi=w1α1+⋯+wjαj+⋯+wKαKαi=w1α1+⋯+wjαj+⋯+wKαK

(2)

实际求解中, 所有未知点 ii 的 αiαi 可通过求解如下大型稀疏线性方程得到

(L+θD)α=θb(L+θD)α=θb

(3)

其中, LL 为长与宽均为图像像素总数的稀疏方阵, 未知点 ii 所在行对应 KK 邻域的系

数记为 wjwj, j=1,⋯,Kj=1,⋯,K, DD 为对角阵, 在已知点所对应的对角线元素的位置为 1, 未

知点为 0, θθ 为某个较大的数. bb 为长度等于像素总数的列向量, 前景 ΩFΩF 处位置为 1,

背景未知区域 ΩUΩU 位置为 0.上式可采用共轭梯度法求解.

1.1 仿射类方法的分类

各仿射类方法、亦即稀疏矩阵 LL 的构造方式之间的主要区别是每个未知点 ii 的若干

近邻像素位置的远近以及相应权值 wjwj 的构造方式.按是否采用抠像公式以及在抠像中的

实际效果, 仿射类方法可分为不采用抠像公式的简单权重类方法以及采用抠像公式的

Matting Laplacian 类方法.

1.1.1 简单权重类方法

该类方法如图 2 左栏所示, 其特点是不采用抠像公式, 直接采用颜色差异的方法确定

权重.具体的, 当前点 ii 与各近邻点 jj 颜色差异的某个负函数即为各个权重, 即与 jj 的颜色

越接近, 权值越大, 二者的 αα 越相似.起初的 Random Walk 算法

[6]

仅采用 8 邻域处最近的搜

索范围, 但无论在绝对像素还是混合像素, 其计算效果均很不理想. Nonlocal 算法

[3]

对邻域

空间进行了扩展, 采用以每个未知点为中心、半径为 rr 的方形搜索寻找 KK 个颜色最相近

的点.为减少计算量, 采样半径 rr 通常不大. KNN 算法

[4]

的搜索距离则更远, 需要寻找每个

点在颜色约束和空间距离约束的特征下最近的 KK 个点.

骤, 使其区别于普通的混合像素计算步骤, 而简单权重类方法则完全符合这种绝对像素计算

准则.目前, 绝对像素的计算的算法仅出现在采样类计算方式中, 但局部类方法

[13-16, 19]

容易遗

漏较远处的样本, 误划分率偏高, 而全局类方法

[17]

易受全局前景和背景颜色重叠影响, 误划

分率较高.由此可以看出, 目前的绝对像素划分方法仍然受到全局与局部采样方式相互平衡

的困扰.

1.1.2 Matting Laplacian 类方法

该类方法如图 2 右栏所示, 它假设在某"局部集合"SS 内, 任何点 ii 的前景和背景颜色

FiFi 和 BiBi 都是两个固定颜色{F1,F2}{F1,F2}和{B1,B2}{B1,B2}的线性组合, 称为颜色线性

模型(Color line model).结合抠像公式并经推导, 结论为在某个集合 SS 内的(i,j)∈S(i,j)∈S,

点 ii 与 jj 产生的权重为

−1|S|(1+(xi−μS)T(ΣS+ε|S|X3)−1(xj−μS))−1|S|(1+(xi−μS)T(ΣS+ε|S|X3)−1(xj−μS))

(4)

其中, xixi 与 xjxj 分别为点 ii 与 jj 的三维颜色向量, X3X3 为 3×33×3 单位阵, ΣSΣS、

μSμS 分别为 SS 内的 3×33×3 协方差矩阵与 3×13×1 的均值向量, εε 为一个较小的数.未知点

ii 与 jj 的权重为所有包含二者的集合 SS 所产生的权重之和.显然, 由于采用了抠像公式, 该

类方法非常适合于混合点的计算, 也是目前为止, 仿射类方法中对混合点最重要的计算方

式.

该类方法的关键问题是相关集合 SS 如何选择. Closed-Form 算法

[1]

提出将集合 SS 定义

为较小的局部窗口, 对于宽度较窄的前景硬边界效果较好, 然而该类小窗口无法充分涵盖较

宽的混合区域或前景空洞等实例的颜色信息. Large Kernel 算法

[2]

改进了基于空间局部窗口

的思想, 提出了核宽度 rr 与不同未知局部区域的宽度成比例的方式.然而事实上, 核宽度很

大程度上依赖于真实混合区域的宽度信息, 而未知区域仅为用户的粗略手工输入, 尤其输入

为稀疏的线条不能充分表达混合区域的实际信息, 现实中还会存在很多偏差. CCM 算法

[5]

采

用了 KNN 方式中的颜色近似的方法选取集合 SS, 取代了空间方式的局部窗口.由于该方法

搜索范围过大并引入大量已知样本, 在实际中, 它对绝对像素计算的效果较好, 但对于混合

像素的计算也受到全局绝对样本影响, 出现过于二值化的现象.

CNN Matting 方法

[20]

提到, KNN 算法与 Closed Form 算法之间的区别并不直接, 由此采

用基于深度学习方式对二者进行融合.然而经本文讨论至此, 它们的区别已经非常明朗, 即

KNN 类方法适用于绝对像素的划分, 而 Matting Laplacian 类(即 Closed Form 类)适用于混合

像素的计算.本文从仿射类方法自身入手, 据各类方法自身的优点和缺点做出相互的补充,

避免了大量训练数据以及长时间训练等问题.

图 3 显示了 5 种典型算法在 αα 评价系统

[23]

的 52 幅训练图像上(27 幅训练图像中的

大、小 Trimap 且不包含 GT16), 各 αtrueαtrue 区间的平均 MSE 比较(不包含 Random Walk),

显然, KNN 在 0∼0.250∼0.25 与 0.95∼10.95∼1 区间较好, 印证了它非常擅长于绝对像素划

分, 而较为平滑的背景使得在绝对背景划分上更加优秀. CCM 仅在 0∼0.050∼0.05 区间较

好, 说明它受前景和背景重叠的影响非常大. Closed Form 与 Large Kernel 大致

剩余24页未读，继续阅读

评论收藏

内容反馈

版权申诉

罗伯特之技术屋

粉丝: 3548
资源: 1万+

一种基于双层框架的仿射类图像抠像方法.docx

基于尺度聚类仿射过滤的图像拼接算法.docx

基于并行运算的双层图像锐化方法 (2013年)

论文研究-一种具有双层信息损失优化结构的遥感图像检索方法.pdf

论文研究-基于仿射CPD的股骨医学图像配准方法.pdf

一种非仿射高超声速飞行器输出反馈控制方法.docx

仿射密码加密解密算法.docx

多分支网络联合的倾斜影像仿射不变特征匹配.docx

MATLAB技术图像仿射变换.docx

基于仿射变换的地磁匹配定位算法.docx

网络游戏-一种基于节点重要度评价矩阵的网络重构双层优化方法.zip

网络游戏-一种基于双层协同进化的航路网络拓扑设计方法.zip

一种基于双层活动板房的消防逃生装置的制作方法.docx

基于双层规划的应急物资邮政运输模型优化方法研究.docx

一种基于双层人工神经网络的多时间尺度区域光伏功率预测方法.pdf

插值前置的仿射变换FPGA实现方法.pdf

论文研究-一种新的仿射变换参数估计方法 .pdf

基于仿射不变闭合区域和SURF的图像匹配算法.docx

非高斯噪声下基于Wilcoxon范数的变步长符号扩散式仿射投影算法.docx

基于仿射理论的配电网供电能力的研究 .docx

基于简化描述符的仿射不变图像匹配算法.pdf

一类非仿射系统的执行依赖启发式在线跟踪控制.docx

OpenCV-Python图像处理：仿射变换详解及案例.rar

论文研究-基于分块和仿射不变性的SIFT图像匹配算法.pdf

archive_C++ 仿射密码源码.zip.zip

论文研究-基于改进自仿射映射系统与参数活动轮廓的医学图像分割算法.pdf

论文研究-基于Hadoop的仿射传播大数据聚类分析方法.pdf

相关实用应用程序（Windows可用）

免费可用的ChatGPT网页版.zip

ChatGPT使用总结：150个ChatGPT提示词模板（完整版）

最新资源