没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
Computer Vision Models,Learning and Inference13章图像预 处理与特征提取翻译。逐像素变换(白化,直方图均衡化,滤波,二值),边缘、角点和兴趣点(canny,harris,SIFT)描述子(SIFT,方向梯度直方图,词袋,形状内容)降维(单数值近似,主成分分析,二元主成分分析,K均值)
资源推荐
资源详情
资源评论
第四部分 预处理 《计算机视觉:模型、学习和推理》 第 13 章 图像预处理与特征提取
|第四部分|
Computer Vision:Models, Learning, and Inference
预处理
本书的重点在于计算机视觉中的统计模型;前面章节涉及一些模型,这些模型将视觉测
量值与全局状态关联。然而,有关测量矢量的生成却很少被讨论,并且它通常被默认包
含连续的 RGB 像素值。在最新的视觉系统中,图像像素数据几乎总需要进行预处理以得到
测量矢量。
我们将预处理定义为在构建数据联系的模型之前,针对像素数据的任何变换。这些变换
通常特别具有启发性:它们的参数并非由训练数据学习获得,而是从已经非常有效的经验中
进行选取。图像预处理背后的哲学思想非常容易理解,图像数据取决于不属于手头任务的真
实世界中的许多方面。例如,在一个目标检测任务中,RGB 值将会随着相机增益、照明、目
标姿势以及目标的特定实例而改变。图像预处理的目的是要在保持图像中对最终决策起关键
作用的方面的前提下,尽可能多地去除不必要变化。
在某种意义上,预处理的需要代表着一种失败,我们承认无法对 RGB 值与全局状态之
间的关系进行直接建模。不可避免地,我们必须为此付出代价。尽管源于外来因素的变化是
可以放弃的,但同时有可能也会将一些与任务相关的信息丟弃了。幸运的是,在计算机视觉
诞生的这些年,这很少成为能够决定总体表现的限制因素。
在这部分中,我们将利用独立的一章讨论多种预处理方法。尽管这里的处理涉及不广,
但需要强调的是预处理是非常重要的,实际中预处理方法的选择能够对视觉系统的表现产生
影响,该影响最少也与模型的选择相当。
第四部分 预处理 《计算机视觉:模型、学习和推理》 第 13 章 图像预处理与特征提取
目录
|第四部分| ................................................................................................................................. 1
|第 13 章| ................................................................................................................................... 1
13. 1 逐像素变换 ............................................................................................................. 1
13.1.1 白化 ............................................................................................................... 1
13.1.2 直方图均衡化 ............................................................................................... 2
13.1.3 线性滤波 ....................................................................................................... 3
13.1.4 局部二值模式 ............................................................................................... 7
13.1.5 纹理基元映射 ............................................................................................... 8
13.2 边缘、角点和兴趣点 ............................................................................................. 10
13.2.1 Canny 边缘检测器 ...................................................................................... 10
13.2.2 Harris 角点检测器 ....................................................................................... 11
13.2.3 SIFT 检测器................................................................................................. 12
13.3 描述子 .................................................................................................................... 14
13.3.1 直方图 ......................................................................................................... 14
13.3.2 SIFT 描述子................................................................................................. 15
13.3.3 方向梯度直方图 ......................................................................................... 15
13.3.4 词袋描述子 ................................................................................................. 16
13.3.5 形状内容描述子 ......................................................................................... 17
13.4 降维 ........................................................................................................................ 17
13.4.1 单数值近似 ................................................................................................. 18
13.4.2 主成分分析 ................................................................................................. 19
13.4.3 二元主成分分析 ......................................................................................... 20
13.4.4 K 均值算法 .................................................................................................. 20
第四部分 预处理 《计算机视觉:模型、学习和推理》 第 13 章 图像预处理与特征提取
1
|第 13 章|
Computer Vision:Models, Learning, and Inference
图像预处理与特征提取
本章对计算机视觉中的现代预处理方法进行简要的回顾。在 13.1 节中,我们引入一些
方法,在这些方法中我们将图像中每个像素用一个新的数值来替代。在 13.2 节中,对图像
中边缘、角点以及兴趣点的发现等问题展开研究。在 13.3 节中,我们对视觉描述子进行讨
论,这些描述子是一些尝试以一种简洁方式对图像区域中感兴趣部分进行描述的低维矢量。
最后在 13.4 节中,我们对降维方法进行了讨论。
13. 1 逐像素变换
我们以逐像素运算开始对预处理问题的讨论:这些方法返回一个单一数值,该数值与输
入图像中的每个像素相对应。我们将原始二维像素数据数组记作,其中
是位于 数组
中第行与第列的元素。元素
是一个表示灰度值的标量。逐像素运算返回一个与具有相
同尺寸的新的二维数组,含有元素
。
13.1.1 白化
白化的目的(如图 13.1 所示)是要为图像的平均亮度水平和对比度提供波动的恒定性。
这一变化可能来自周围光照强度的变化、物体反射率的变化或者相机增益的变化。为了对这
些因素进行补偿,图像需要进行变换,使得结果像素值具有零均值和单位方差。为此,我们
需要对原始灰度图像的均值和方差
进行计算:
(13.1)
批注 [徐樱笑1]: 本质:去相关
由于原始图像相邻像素值具有高度相关性,所以图像数
据信息冗余,对于白化的作用的描述主要有两个方面:
1,减少特征之间的相关性,从而简化后续独立分量的提
取过程;
2,特征具有相同的方差(协方差阵为 1);
第四部分 预处理 《计算机视觉:模型、学习和推理》 第 13 章 图像预处理与特征提取
2
图 13.1 白化和直方图均衡化。a)通过改变对比度和均值水平而获得的大量人脸图像。b)白化处理
后,图像具有同样的均值和方差。c)直方图均衡化处理后,图像的所有矩几乎完全一致。这两种变
换由于改变了对比度和亮度导致了变化量的减少
这些统计被用于对每个像素值进行变换,使得:
(13.2)
对于彩色图像,该工作可以通过对所有来自于三通道数据的和
进行计算,或者基于
三通道各自的统计将 RGB 通道中的每一个分别进行变换来实现。
注意,即使这一简单的变换,也有对后续场景推理造成妨碍的隐患。根据任务的不同,
绝对亮度中可能包含也可能不包含关键信息。所以即使是最简单的预处理方法也必须慎重使
用。
13.1.2 直方图均衡化
直方图均衡化的目标(如图 13.lc 所示)在于对亮度值数据进行修正,使得它们的所有
矩均有预设值。为此,使用一种非线性变换以强行将像素亮度分布变为平缓的。
我们首先要对原始亮度值的直方图进行计算,其中 K 个项中的第项可以定义为:
(13.3)
其中增益为 0 时,算子
返回 1,否则算子
返回 0。我们对该直方图做累加求和,
平按照像素的总数进行归一化,从而计算少于或者等于每一个亮度级的像素所占的累加比例
:
(13.4)
最后,我们使用累加直方图作为一个查找表来计算变换值,使得:
(13.5)
例如,在图 13.2 中,数值 90 将会被映射为 ,其中 K 是最大亮度值(通常为 255)。
结果是一个连续值而不是一个离散的像素亮度值,但是与原始数据具有相同的区间。如果后
续处理需要的话,可以将结果舍入到最近的整数。
批注 [徐樱笑2]: 通常情况下,数据进行白化处理与不对
数据进行白化处理相比,算法的收敛性较好。
批注 [徐樱笑3]: 1、提高图像的对比度;
2、把图像变换成像素值是几乎均匀分布的图像。
批注 [徐樱笑4]: 均衡化后的直方图一般不是均匀分布
(不平坦的),但由于可以使像素扩展至 0-255,所以一
般可以图像的视觉效果更好;
解释:
以 uint8 类灰度图像为例,灰度级共有 256 个,均衡化之
后,假定每个灰度级都可以取到,则说明原始图像和均
衡化后的图像完全一样,所以如果 uint8 类的灰度图像的
直方图不是平坦的,则均衡化后的图像的直方图也不是
均衡化的;另一方面,如果均衡后某些灰度级不可以取
到,则这个像素级的像素个数为 0,所以也不可能是平坦
的。
此外,如果原始图像的某个灰度级个数很多,均衡化之
后对应像素级的像素个数也是很多,于是也会造成不平
坦的。
剩余23页未读,继续阅读
资源评论
零件儿
- 粉丝: 20
- 资源: 13
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- C++新年烟花代码示例
- MATLAB实现WOA-CNN-BiGRU-Attention时间序列预测(SE注意力机制)(含完整的程序,GUI设计和代码详解)
- 生成对抗网络的创新应用与未来.pptx
- Matlab实现基于PSO-SDAE粒子群优化算法优化堆叠去噪自编码器的数据分类预测(含完整的程序,GUI设计和代码详解)
- 烟花代码,网页烟花效果展示页面
- ppt12 111111111111111
- 浏览器插件:沉浸式翻译
- 基于STM32C8T6、XM1605实现二维码的扫描与信息读取 .zip
- 班主任助理系统的设计与实现+jsp(源码+开题报告).rar
- Python基于神经网络算法LSTM模型对股票指数进行预测项目源码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功