讲解的非常清楚的sift中文文档

4星(超过85%的资源)
所需积分/C币:17 2013-08-26 13:25:42 1.71MB PDF
155
收藏 收藏
举报

讲解的非常清楚的sift中文文档,这个文档应该是经典中的经典了吧,个人收藏的。
2.2提出解决办法 2.2.1多尺度表示 为了使图像中的信息由只有人类可感知的隐式信息,成为计算机可表示的显式信息,可以 采用“多尺度表示”( Multi- scale representation)的图像表示法来解决。在进行图像处理和图像 理解时,从图像中提取何种信息,对图像进行何种操作,都是要考虑的基本问题。为了有效的 回答这些基本问题,可以对图像分阶段处理,前一阶段处理得到的信息可供后续的处理使用。 对于第一阶段的处理,有个基本的约束——处理之前并不知道在图像的场景中到底要提取什么 内容;而且,处理所得的特征相对于各种变换(例如光照的变化,图像的尺寸以及视角的变化) 要具有鲁棒性。 多尺度表示事先并不知道到底要使用哪些尺度,所以要计算得出所有的尺度以供后面的步 骤使用。一个多尺度表示的示意图如图1所示 increasing t coarser levels of sca de original signal 图1.一个多尺度表示的示意图。多尺度表示是用一个有序的信号序列来表示原始图像,序列中 的每个信号都在不同尺度上[5] 多尺度表小的思想是,将原始信号“嵌入”到采用一个单参数变换得到的一系列信号中去 变换得到的每个信号对应于单参数族中的一个参数(例如图1中t)。一个重要的要求是,多尺 度表示中的较粗尺度应该是较细尺度的简化,而且较粗尺度是通过某种固定的方式,由较细尺 度图像经过平滑得到。要满足这个性质,可以有多种实现方式。但是一点不变,那就是高斯函 数是唯一可用的平滑函数。 实现多尺度表示有多种方式,比如,早期会采用四分树或者八分树,以及图像金字塔。金 字塔是结合降采样操作和平滑操作的一种图像表示方式。它的一个很大的好处是,自下而上每 层的像素数都不断减少,这会大大减少计算量;而缺点是自下而上金字塔的量化变得越来越 粗糙,而且速度很快ε(需要强调的是,这里的金字塔构造方法和小波金字塔的构造方法是类似 的,对某·层的图像进行平滑之后,再做降采样,平滑目的是为了降采样后的像素点能更好的 代表原图像的像素点,与多尺度表示中的平滑完全不是一个目的)。图2是金字塔表示法的一个 示例。 图2.金宇塔表示法[5] 2.2.2尺度空间 上面提到的四分树或者八分树以及金字塔表示法,在获得多尺度时所采取的步骤是相当粗 略的,尺度与尺度之间的“间隔”太大。而这里要提到的“尺度空间”( Scale- Space)表示法是 多尺度表示的另外一种有效方法,它的尺度参数是连续的,并且所有尺度上空间采样点个数是 相同的(实际上,一个尺度上得到的就是一幅图像,尺度空间采样点也就是该尺度上图像的像 素点。也就是说,尺度空间表示法在各个尺度上图像的分辨率都是一样的)。尺度空间表示的主 要思想是,由原始信号(例如一幅图像)生成一系列信号,并用这些信号米表示原始信号,这 个过程中,精细尺度的信息被逐步的平滑掉(可以认为是细节信息被丢弃),如图3所示。作为 对比,图4显示了尺度空间表示法与金字塔表示法直观上的比较。 八 图3.左边的一维信号自下而上被逐步平滑,细节信息逐渐丢失。(1983, Witkin)。 尺度空间表示 金字塔表示 图4.尺度空间表示和金字塔表示的对比]。由此也可以形象的看出多尺度和多分辨率的区别。 多尺度在所有尺度上像素数是相同的,细节通过平滑逐步丢失。 要注意的是,并不是所有的尺度函数都可以用于牛成尺度空间。因为一个很重要的问题是, 从精细尺度到较粗糙的尺度的变換过程中,信息被逐渐的简化和削弱。也就是说,较粗尺度不 可能产生较细尺度中没有的特征。 Koenderink[7](1984)和 Lindeberg8](1994)已经证明,在 些合理的约束之下,高斯函数是唯的尺度空间的平滑核函数[7],而且是唯的线性平滑核 函数8] 产生尺度空间的公式可以表示如下 L(, y; t) 7=- 2xre-(5+7)/2t f(a-s,y-n)dedn 公式(1)表示,以t作为尺度参数,在整个定义域上用二维高斯核与输入图像做卷积,得 到与t对应的尺度(即在该尺度上的一副图像)。也可以采用与之等价的操作: aL 1/a2L a2L ot 2\ ar2 Oyy (2) 公式(2)采用了物理学中著名的热扩散公式,热扩散公式描述了在均匀介质中,热量是如 何向各个方向均匀传导的。注意到(2)式右边是拉普拉斯算子的形式,拉普拉斯算子是各向同 性的,这恰好符合热传导的特性。 3S|FT方法介绍 SIFT特征的优点在前面已经做了说明,下面将对SIFT方法做详细的介绍。SIFT算法有以 下几个步骤: 1.检测尺度空问的极值点。 2.抽取稳定的关键点。 3.为每个关键点指定一个或者多个方向。 4.生成特征点描述」。 3.1相关工作 采用特征点进行图像匹配可以追溯到1981年, Moravec9]采用角点检测做立体匹配。1988 年, Harris和 Stephens[1改进了 Moravec的检测器,使检测到的特征更加稳定。1992年, Harris[1 显示了他的角点检测器在运动跟踪和3维重构方面的优势,从此之后,角点检测方法破广泛的 使用。但是角点检测有两个问题,一是不但可以检测出角点,而且对边缘也十分敏感;二是′ 不是尺度无关的方法。焦点检测最初的应用多在于运动跟踪和立体匹配方面,后来 Zhang等人 [12]在1995年实现了图像角点的匹配。他们使用了角点邻域的关联窗来寻找可能的匹配。 1997年 Schmid和Mohr13]做出了开创性的工作,他们采用图像的局部特征进行图像匹配, 使得一个特征可以和一个大的图像库中的图像做匹配。他们同样采用 Harris角点,但不同的是, 他们开创性的使用了旋转不变的、图像局部区域的描述子。 Harris角点检测对尺度变化十分敏感,Lowe在1999年实现了局部特征的尺度无关性,并 且他提出了新的局部描述子,这种描述子更具独特性和鲁棒性、 最近,有很多工作致力于使局部特征对仿射变换具有不变性: Baumberg,2000[14] Tuytelaars and Van Gool, 2000[15]; Mikolajczyk and Schmid, 2002[16]: Schaffalitzky and Zisserman, 2002[17]; Brown and Lowe, 2002[18] 3.2尺度空间的极值检测 提取尺度不变的特征点,其主要思想是提取的特征点出现在仟何一个尺度上。这样不论图 像的尺度如何变化,总能够提取出这种特征点。检测尺度无关的特征点可以通过搜索所有可能 的尺度,这可以基于尺度空间理论来解决 前面已经提到,在一些合理的假设之下,高斯函数是得到图像尺度空间唯一可用的核函数。 将图像(,)的尺度定义为一个函数(,,O),它由高斯函数(,,a)和图像(,)卷积 得到 为了在尺度空间中高效的检测稳定关键点的位置,[1][2]提出在高斯差分函数与图像卷积得到的 空间(,,σ)中寻找极值点, (3) 其中,相邻两个尺度由一个常数k分开 选择这个公式有两个原因。一是这个公式的计算是省时的,因为要描述尺度空间中的特征 点,就必须计算输入图像的尺度,而这里计算时,仅需要计算相邻尺度函数的差值。另外 个原因是函数的性质与尺度归一化的拉普拉斯高斯函数—即∞2V2很相近[8]。而 Mikolajczyk在实验中表明,o2V2的极大值和极小值能够产生比其他函数(包括梯度, Hessian Harris角点函数)更加稳定的特征。 和a2V2的关系可由以下公式说明, aVAG 该公式是热扩散公式的另一种表小形式,公式左边的项可以用近似的方法计算 VAG aG G(r, y, ka)-G(a, y, a 所以可得 G(a, g, ka )-G(, g,a)A(k-1)o VG 从公式可以看出,和a2V2的形式是类似的。由于拉普拉斯函数是尺度无关的,因而高斯 差分函数也是尺度无关的。对于所有尺度而言,k都是一个常数,所以使用不会影响极值的 选取。当k趋向于1的时候,误差会越来越小。但是实验表明,即使k值不接近1(例如k取√2), 对极值的选取也没有多大影响。 3.2.1计算高斯差分图像 前面已经论述,为了求尺度无关的特征点,首先需要计算相邻尺度图像的差分,得到一系 列图像并在该图像空间中求极值点。采用金字塔可以高效的计算高斯差分图像,如图5所示: Scale octave) first octave) Difference of Gaussian Gaussian(DOGI 图5.构造金子塔,计算高斯图像的差分 金了塔自下而上分为多层,在第层中,对原始图像不断用高斯函数卷积,得到·系列逐 渐平滑的图像。在这层中,相邻的高斯图像差分得到高斯差分图像。这·组进行完毕后,从 中抽取一幅图像A进行降采样,得到图像B的面积变为A的14,并将B作为下一层的初始图 像,重复第一层的过程。选取A的原则是,得到A所用的尺度空间参数σ为初始尺度空间参数 的2倍。设k=2,在s个尺度中寻找极值点,则每层要有s+3幅图像,生成s+2幅高斯差 分图像。如图6所示: (2) 图6.(1)为图像金字塔,(2)为生成的高斯差分图像 通过实验,得到s、的经验值分别为3和1.6*23(*为乘号)。也就是说,k取23。 3.2.2计算极值点 上一步中已经生成了高斯差分图像,这一步中要计算该空间中的板值点。如图7所示: Scale 图7.计算极值点。每一幅髙斯差分图像中的一个像素点,要和它所在图像的八邻域像素比较, 而且要和它所在图像的上一层和下一层的各九个邻近的像素点比较。 有·个问题是到底要在多少个尺度中寻找极值点,即如何确定s值。实验表明,s取3是较 好的选择。如果s=3,则需要5幅高斯差分图像才可以。这里的计算是高效的,因为大多数情 况下,只需要几步比较,就可以排除一个像素点,认为它不是极值。 3.3抽取稳定的关键点 上一步已经求出了极值点,现在要对这些极值点进行筛选,去除不稳定的点,以增强特征 点匹配时的稳定性、提高抗噪声能力。不稳定的点包括低对比度的点和边缘上的点。同时,由 于在金子塔中存在降采样的图像,在这些图像中提取的极值点在原始输入图像中到底在什么位 置,也是一个问题。下面将提出上面两个问题的解决方案。 对于某一个尺度上求取的极值点,采用一个3维的2次函数求该极值点在原图像上的位置, 并去除低对比度的极值点。首先在某极值点A对(,,σ)进行泰勒展开 D(x)=D aDZ 94D (4) 其中,=(,,σ)是到点A的偏移量。对(4)式求的偏导数,并令偏导为零,得到 aDaD 力x2bx (5) 如果大于0.5,也就意味着这个极值点和另一个采样点(图像中的另一个像素)离得更近。采 用插值法求得极值点位置的估计值

...展开详情
试读 20P 讲解的非常清楚的sift中文文档
立即下载 身份认证后 购VIP低至7折
一个资源只可评论一次,评论内容不能少于5个字
acceptit8 比较全面,谢谢楼主
2014-12-09
回复
您会向同学/朋友/同事推荐我们的CSDN下载吗?
谢谢参与!您的真实评价是我们改进的动力~
  • 分享达人

关注 私信
上传资源赚钱or赚积分
最新推荐
讲解的非常清楚的sift中文文档 17积分/C币 立即下载
1/20
讲解的非常清楚的sift中文文档第1页
讲解的非常清楚的sift中文文档第2页
讲解的非常清楚的sift中文文档第3页
讲解的非常清楚的sift中文文档第4页

试读结束, 可继续读2页

17积分/C币 立即下载