没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
聚类分析及其在图像处理上的应用
1 绪论
1.1 基于聚类的图像处理的研究现状
聚类 分析 在图 像处理中 应 用 广
泛,其中一项重要的应用就是图像分
割。图像分割多年来一直受到人们的
高度重视,各种类型的分割算法相继
被提出。虽然人们在图像分割方面做
了许多工作,但是至今仍没有通用的
分割算法,也不存在一个客观的评价
准则。大多数分割算法都是针对一种
具体类型的图像提出的很难适用于所
有图像。实际上由于各个领域的图像
千差万别,也很难提出万能的分割算
法。基于聚类的图像分割方法是图像
分割领域中一类非常重要且应用广泛
的算法。
2 聚类分析概述
2.1 聚类的定义
聚类的目的是将有限个无标注数
据划分到有限个离散的组或类中 , 发
现数据
隐藏的内部结构。 Backer 和 Jain
[1]
指
出数据的划分是依赖于所选择的相似
性度量的 , 通过主观地选择相似性度
量来达到有的的划分。至今 , 人们并没
有对聚类给出一个统一的定义。多数
研究者都是从内部同质性和外部可分
性对聚类簇进行描述 , 即同类内数据
对象间应该彼此相似 , 不同类间的数
据对象应该不相似
[3
。在给出聚类的数
学描述之前 , 首先介绍与聚类有关的
一辟术语和数学表达方法。
样本 : 指要进行聚类的数据集中的单
个数据。样本一般是一个多维向量 , 向
量的每个分量可以是数值型或者名词
型的数据 , 一般称为特征或者属性。
样本集 : 或称数据集 , 是由单个样本所
组成的集合 , 即是需要聚类操作的数
据整体 , 通常表示为一个矩阵。
相异度矩阵 : 该矩阵中的每个元素表
$样本集中的每对样本之间的相异程
度, 一般是非负值。
相似度矩阵 : 该矩阵中的每个元素表
小 ?样本集中的每对样本之间的相似
程度 , 一般是非负值。
类: 或称簇 , 指通过聚类而形成的一组 ,
同一类中的样本具有相似的特征。通
常用 C或 K表示类的个数。
类原型 : 能够代表某个类性质的数据
兀, 可以是某类样本中的一个样本 , 或
者是某类样本的一个加权值 , 也可以
是能描述一个类特征的向量。
划分矩阵 [U] n*K: 矩阵中的每个元素表
示每个样本属于各个类的模糊隶属度
, 且 , 在此
〖表 ?样本标号 ,k 表类标标号。
1.2 聚类的数据类型
通常获得的数据类型有两种 : 一是数
据矩阵 , 二是相异度矩阵 ( 相似度矩
阵) 。
假 定 数 据 集 中 有 n 个 样 本 :
i
x
,i=1,2,....,n, 每个样本有 p 个变
量( 特征属性 ), 则这 n 个样本可表示成
n*p(n 个样本 xp 个变量 ) 的数据矩阵。
(2-1)
其中每个对象对应为一个 p 维向量 :
(2-2)
相异度矩阵存储的是 n 个样本两两之
问的相界度 , 表现形式足一个 n*n 维的
矩阵。
(2-3)
在这里 d(i,j) 是样本 i 和样本 j 之间
相异性的量化表示 , 通常是一个非负
的数值 , 当样本 i 和样本 j 越相似,
d(i,j) 的值就越接近 0;反之 , 两个样
本越不相似 , 的
值就越大。d(i,j) = d(j, i), 且 d(i,j)
= 0, 因此得到形如 (2-3) 的矩阵。
图像数据的表示
日常应用中得到的图像一般分为两
类:灰度图像和彩色图像。灰度图像
的数值表示为一个二维矩阵 [I] m*n 图像
一共包含 m*n个像素。在此,m和 n 分
别代表图像的高和宽, (ij) 表示位于
第 i 行和第 j 列的像素, I ij 表示其灰
度值。彩色图像的数值表示为一个三
维矩阵 [I]
m*n*3
,像素的个数仍为 m×n,
3 表示三个颜色通道, 每一层的二维矩
阵表示该图像在某一个颜色通道的数
值。位于位置 (i,j) 的像素对应的 颜
色 特 征 向 量 表 示 为
[I(i,j,1),I(i,j,2),I(i,j,3)] 。
在许多情况下 , 色彩是描述一幅图像
最简单有效的特征 , 而且人眼对色彩
的分辨率大大高于对灰度图像的分辨
率 , 因此彩色图像所携带的信息远远
大于灰度图像。一般的图像处理技术
最先应用于灰度图像 , 然后发展到彩
色图像 , 图像分割也不列外。颜色特征
可以来自于不同的颜色空间 , 不同的
颜色空间以不同的方式对图像颜色进
行描述。一共有四种不同的颜色空间:
RGB颜色空间、 XYZ颜色空间、 HIS 颜
色空间、 Lab 颜色空间。 RGB颜色空间
是基本的颜色空间 ,RGB对应于红 (R) 、
绿(G) 、蓝(B) 三种基色 , 其余所有颜色
空间都可由 RGB颜色空间经过线性或
非线性变换得出的。
给定一幅待分割的图像 , 我们可
以直接获得像素的位置信息 , 灰度值
( 灰度图像 ) 或者 RGB颜色特征值 ( 彩色
图像 ), 这些特征也是图像分割中最常
用的特征属性。但是对于一些复杂图
像 , 单纯依赖这些底层特征不能得到
满意的分割结果。基于这些底层特征 ,
人们提取了更多有效的特征 , 其中常
用的有描述物体表面灰度变化的纹理
特征和根据特定对象的先验信息加入
的形状特征。最近 , 人们开始借助一辟
先进的电子产品提取深度信息 , 通过
加入这辟高层特征来改善对特定类图
像的分割结果。
在提取特征之后 , 就可以得到每
个像素点的一个向量表小 , 也就可以
看成是高维空间中的一个数据点。但
是 , 像素点又和传统的数据不同 , 每个
像素点在阁像中的位置是固定的 , 每
个像素点的邻域像素点都可以直接通
过位置信息获得 , 这一特性也在图像
数据的相似度计算上得以体现。
2.3 聚类算法
近些年来 , 聚类分析一直是研究
热点问题。基于相似度矩阵的聚类算
法指的足给定相似度矩阵的情况下即
可进行聚类处理的算法。只要给定相
似度计算模型 , 则基于相似度矩阵的
聚类算法也可以处理数据矩阵 , 即首
先根据数据矩阵计算出相似度矩阵 ,
然后利用基于相似度矩阵的聚类算法
进行聚类。
2.3.1 基于数据矩阵的聚类算法
基于数据矩阵的聚类算法只能处
理数据矩阵对象 , 其中很多经典的类
原型聚类算法都可以划分到这一类聚
类算法中 , 如 K均值型聚类算法 , 模糊 C
均值型聚类算法 (FCM), EM型聚类算法
等。这辟算法之所以称为类原型聚类
算法 , 是因为每个类可以由类原型来
剩余10页未读,继续阅读
资源评论
weixin_40895192
- 粉丝: 17
- 资源: 21万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功