论文研究-基于蜂群[k]-means算法的遥感图像聚类应用研究.pdf

所需积分/C币:19 2019-09-12 00:11:31 1.06MB .PDF
308
收藏 收藏
举报

在遥感领域,获取用于训练的标记数据耗费巨大且困难,因此许多非监督技术逐渐被发展和应用于标记样本有限的遥感图像。将[k]均值和蜂群算法相结合,提出一种新的非监督聚类算法。使用灰度共生矩阵和小波变换提取遥感图像特征,对特征数据集进行蜂群[k]-means聚类。整个聚类过程首先使用最大最小距离积邻域均值法产生初始聚类中心,将蜂群算法和[k]-means算法交替执行,实现遥感图像的聚类。通过UCI数据集和凉水国家级自然保护区的遥感数据的实验结果表明,该算法具有较高的聚类准确率,满足遥感图像聚类的应用需求。
李艳娟,等:基于蜂群k 算法的遥感图像聚类应用研究 个点的平均值,该平均值作为一个新的聚类中心加入到的性能优子 S屮 该传统适应度函数只考虑聚类内部信息而聚类性 ()返回步骤()重复执行,直到S中元素个数达能的优劣需要通过紧凑度和分离度来评价。紧凑度 到K 为类内数据到其聚类中心的距离和,分离度为聚类中心 根据该方法的基本思想和步骤可以看出该方法使之间的离和。聚类内部的离越小,可以保证聚类数 用最大值和最小值乘积能选取到密度较大的点可以稀据与中心的偏离程度低,内部相似性较大,聚类之间的 疏初始点的分布,并且可以避免最大距离积法中出现两距离越大,可以保证不同聚类之间的相异性较大即较 个距离积相等而它们所在区城的点密度却相差很大的优的聚类效果要求较小的紧凑度,较大的分离度。而传 情况,同时通过邻域均值的处理,可以有效地降低孤立统适应度函数只考虑聚类内部信息,保证了较小的紧 点对聚类的影响 凑度,而没有考虑类间距离即较大的分离度,评价效果 算法时问复杂度分析:算法第()步需要计算D中 不具有整体性 每个元素到指定元素之间的距离,时间复杂度为O(m) 新的适应度函数 其中m为D中元索个数;算法第()步需要计算D中 每个元素与S中每个元素的距离,S中元素最多为k 为了克服传统适应度函数的不足,本文提出了一个 个,时间复杂度为Oxm);算法第(步D中每个元素 新的适应度函数,该新适应度函数的定义为: 对应的1em9数组有k个值需要在为个值中查找最大 fitnessneue( CN CK 值和最小值,时间复杂度为O)xm);算法第()步的时其中,(N和/的含义同公式()一样,(K表示类间 间复杂度为Om)步骤()到步骤()循环执行k次,距,M表示类的个数。 因此整个算法的时问复杂度为O(k2×m)。 通过公式()可以看出,新适应度函数既考虑了紧 适应度函数 凑度又考虑了分离度,从整体上评价了聚类性能。 本节首先介绍只考虑类内数据个数和类內距的传 图给出了相同数据点集下,蜂群k 算法分 统适应度函数,然后引入新的适应度函数。 别采用传统适应度凼数和新适应度函数作为评价指标 传统适应度函数 的聚类结果。图()给出的是采用传统适应度函数的 适应度函数将引导群体进化的方向,直接决定了群聚类结果,聚类中心分别为图中较大的星号,相同颜色 体的进化行为迭代的次数及解的质量,不同的适应度的点属于同一类,从图中可以看出类中样本点到类中心 函数会得出不同优劣程度的解。蜂群聚类算法的每个的距离较小,此时实现∫较好的类内紧凑度,但类与类 蜜源代表一个聚类中心,蜜源的适应度函数用来评价相之间分离度却不是很明显。图()给出的是采用新适 应的聚类中心的质量。目前,绝大多数蜂群聚类算法的应度函数的聚类结果,和图()儿比较可以看出,该聚类 蜜源的适应度函数都是基于与该蜜源同类数据,具体公 结果既具有较好的紧凑度又具有铰好分离度,整体性能 式如下 优于图()。 /itnessclassicul(l,) () 其中,l表示第个蜜源,也就是第个聚类中心;CN 表示第i类中数据的个数,也就是与蜜源l2同类的数据 的个数;J表示第i类的类内对象到中心点I的距离之 和,也就是第类的类内距。 某个聚类中心(蜜源)的适应度函数 iinessclassica ()传统适应度函数 )新适应度函数 仅由类内数据个数和类内距的比值决定,没有考虑该聚 图相同数据集下,两种不同遹应度函数聚类结果图 类屮心对整体聚类效果的影响。某个聚类屮心不同,整 显然,新的适应度函数能够克服传统适应度函数的 体聚类的类间距就不同,整体聚类效果也不同。该适应不足,从整体角度评价聚类中心的性能。 度函数的不足在于不能区分两个具有相同类内数据个 数与类内距比值的聚类中心(蜜源),例如两个蜜源l和 堪于蜂群k 的遥感图像聚类算法实现 l2,以l为聚类中心的类内元素个数为,也就是l1的 本文提出的算法是采用蜂群k聚类算法 CN值为;I1的J值为:与其他聚类中心的类间()对特征数据集进行聚类,建立特征数据集聚类 距为。Ⅰ2对应的CN2值为;Ⅰ2对应的值为 模型,其中特征数据集T是出通过灰度共生矩阵 l2与其他聚类中心的类间距为依据适应度函数计算能量、对比度、逆差矩、熵、同质、相关个特征,及 fitnessclassicau,1和2的适应度是相同的,实际上 2通过小波变换求得的图像的纹理特征个构成 () 计算机工程与应用 特征提取 对于较细的纹理,选取(,),(,),(,)等这样的值 本文的特征数据集包括个特征提取方法是:灰是有必要的b取值较小对应于变化缓慢的纹理图 度共生矩阵 和小波变换。 像,其灰度共生矩阵对角线上的数值较大。纹理的变化 灰度共生矩阵 越快,则对角线上的数值趑小,而对角线两侧的值增大。 灰度共生知阵被定义为从灰度为的像素点出发,本文选取能量对比度逆方差熵同质相关个 离开某个固定位置的点上灰度值为的概率,即所有估计特祉。其中:能量变换反映了图像灰度分布均匀程度和 的值可以表示成一个矩阵的形式,因此被称为灰度共生纹理粗细度;对比度反映了图像的清晰度和纹理的沟纹 矩阵。具体可描述如下: 深浅;逆方差反映了图像纹理局部变化的大小;熵反映 图中()为原图像,最大灰度级为。为表示方了图像灰度分布的复杂程度同质反映了图像纹理的同 便,这里将灰度级数减小为级,图中()变为图中()质性,度量像纹理局部变化的多少;相关性川来度量 的形式。(取值范围为,取不同的间隔,将图像的灰度级在行或列方向上的相似程度。 (n,2)各种组合出现的次数排列起来,就可得到图中 小波变换 ()()所示的灰度共生矩阵。 小波变换的基本思想是通过一个母函数在时间上 的平移和尺度上的伸缩,获得一种能自动适应各种频率 成分的有效信号分析手段,经常用于提取图像纹理特 征。小波变换提取特征步骤描述如下: 将遥感图像转化为灰度图像。 ()对灰度图像进行四层小波分解。 )原图像的灰度值图 ()求分解后每个子带小波系数的均值和标准差。 得到特征向量T:将各个子带小波系数的均值 和标准差作为图像的纹理特性向量中的各个分量。 特征归一化:由以上特征相量的物理意义和 取值范围不同,为了防止检索时产生很大的偏差,所以 需要进行归一化。 ()降低灰度纵的()降低灰度级的()降低灰度级的 基丁蜂群k 的遥感图像聚类算法实现 灰度值图 灰度值图 灰度值图 通过灰度共生矩阵和小波变换,即可得到特征数据 集T,当将其代入到 算法的整体循环迭代过程 中,则基于 的遥感聚类算法步骤如卜 输入:聚类数目k,邻域均值参数m,遥感图像特 a=2,b=0) 征数据集合T。 ()灰度矩阵 ()灰度矩阵()灰度矩阵 输出:k个聚类中心 图灰度共生矩阵示意图 初始化参数。定初始参数类别数目C,邻域均 图中()表示图()中(,y)与偏离它的(x+1,值参数x=10,聚类模型最大迭代次数MCN=20;最 y+0)构成点对时,(n1,2)取值的情况(填充黄色部分大循环次数mit-100 为取,取时的情况,由图()填充易知共 )采用最大最小距离积邻城均值法初始化蜂群。 根据公式()计算每个蜜源的适应度,并按照适 种)。同理,图()、()分别表示图()、()中x,y)应度大小进行排序,前半部分为雇佣蜂,后半部分为跟 分别丁点(+1,y+1)、(x+2,y+0)构成的点对(/1,/2) 随蜂 出现的情况(图()填充黄色部分表示几取,P取 ()雇佣蜂依据式()对其邻域进行搜索,得到新的 时,对角线点对(,)出现的情况,共种:图()填充位置。若新位置的适应度大于原来位置的适应度,则用 黄色部分表示几取,/2取时水平点对(·)出现的新位置替代原位置,否则保持不变。当所有雇佣蜂搜索 情况,共种)。例如,对于a=1,b=0,点对中(,)的完毕后,根据式()计算概率P 组合共出现了次。对比可以看出,(,),(,),(,) Vi=X+r: (X -Xh)+(Xhesi-Xi i 和(,)均有较高的出现频数。图()表明,图像中存 ft 在明显的左上右下方向的纹理。 聞离(a,b)的取值不同,灰度共生矩阵中的值不 fit, 同。a和b的取值要根据纹理周期分布的特征来选择,其屮,V表示在X附近产生的个新位置,k,p,是 李艳娟,等:基于蜂群k 算法的遥感图像聚类应用研究 随机数,k,p∈1,2,…,Nkp≠,∈[-1,1X,表本数,也就是总体分类精度 示最优蜜源,ft为适应度函数值。 、公共数据集紫类有效性 ()跟随蜂根据求得的概率P采用轮盘赌方式选 为了说明本文提出的 算法的真实有效性 择雇佣蜂,并在雇佣蜂附近进行邻域搜索新位置,并选首先对机器学习领域著名的数据集的 择适应度较高的位置。 的四个数据集进行了分析和比较。 ()将截止目前蜂群算法得到的蜜源位置你为 表描述了数据集包含的类别数目、每个数据只有的属 聚类的初始聚类中心,进行 次迭代聚性个数和样本集的样本总数,而且每类样本的样本数目 类,得到个新的聚类中心。用这个新的聚类中心更都是相等的。并将提出的算法与模糊均值聚 新蜂群 类 算法、猫群算法()、粒子群算 ()如果某引领蜂在m次迭代后结果都没有改法(●)的聚类效果进行比较,为了定量比较聚类结 变,则山引领变为侦家蛑,并随机产生一个新的位置O果用系数作为评判准则并将四个数据集求得各 取代原位置。 加果当前送代次数大于最大次数MCN则送 算法的平均值记作Ave,比较结果如表所示 表数据集擂述表 代结束算法结束;否则转向步骤(),=Y+1 名称数据集大小属性个数类划数 ()最后得到每个类别所属于相应地物的样本集 合,然后对于每类别进行不同的颜色匹配,并显示出聚 类之后的遥感图像,算法结東 时间复杂度分析:算法第()步的时间复杂度为 O(k2×m),具体见初始种群部分的复杂度分析;算法 表算法系数对比结果表 第()步计算k个蜜源的适应度并排序,时间复杂度为 数据集 (k×bk);算法第()和()步的时间复杂度为((1):算 法第()步进行k 聚类的时间复杂度为Okxm) 算法第()步和第()步的时问复杂度为O1);算法第() 步到第()需要迭代MCN次,因此整体算法时间复杂 度为O(k2xm+MCN×k×m)。其中k2×m主要是初始 聚类中心开销,MCN×kxm是k 聚类算法开 表显示了不同算法的系数。从表可以看 销,迭代引入蜂群算法不会影响该聚类算法的时间性出,算法的系数明显低于 能。在实际应用中MCN的值大于k的值,因此本文提 及 算法,其系数值最大差值大于,对于 出的聚类算法的时间复杂度与k 算法相当。 数据集, 及 算法的 系数非常相近,另外,如表所示, 算法的 仿真结果与讨论 值对于所有公共数据集是最大的特别是对于 为验证本文 算法的聚类效果,采用数 数据集,使用 算法的效果明显优于 据集和凉水实验林场遥感数据集进行伤真实验,并与其他算法,而且五个数据集的 平均值为 其他几种聚类算法的聚类效果进行比较。本文实验主总体而言,所提出的算法具有较好的聚类效果。 要包括两部分:()使用来自机器学习库的四个公 为了清楚显示聚类的最终结果,给出模拟数据聚类 共数据集进行聚类有效性验证;()对五张遥感图像结果的三维空间分布图。因为所用公共数据集的属性 分别进行聚类有效性验证:本次所有仿真实验是在个数及属性值的分布情况,数据集 及 操作系统卜,内存下 运数据集的属性为四维,在模拟三维空间分布图时,若舍 行环境下运行。 弃一维,根据数据值,图示化效果情况较差,因此这里只 选择评价指标 给出 和数据集的聚类结果示意图。分别如 本文选择系数作为聚类效果的和衡量指标。图和图所示。 计算结果为-1~1,值越高表示聚类效果越好。其计算 数据集的属性是三维,分为两个类别。然 公式如公式()所示: 而因为数据点值的问题,在给出聚类结果图的时候,会 Po-po )存在视觉上的重合问题,所以图屮会存在颜色误差, 但聚类结果基本可以显示出来。图中,在对 其中,p是每一类正确分类的样本数量之和除以总样数据集聚类时,和 的聚类图红色更重的主 () 计算机工程与应用 ※ 一 ()标准数据集的聚类图 S HOTD O RET < 好 聚类图 聚类图 聚类图 图公共数据集 聚类结果 花萼长度 长B ()标准数据集的聚类图 聚类图 聚类图 花萼长度 戈 ()聚类图 ()聚类图 聚类图 图公共数据集聚类结果 要原因是被错分成红色的点较多。 和个类别,其中对“蓝色”代表类的聚类错误较多。从图 被错分为绿色的较多因为错误点较多。相比之下,可得,本文算法、 和都实现了较好的聚 本文算法的聚类结果图更接近于图()的标准数据集类,虽然()的图示化结昊更贴近于(),但也不能忽略 聚类结果图。 被省掉的第四维数据的影响。并且结合求得的 数据集属性是四维,分为三个类别,在模拟图示值,也证明了本文算法聚类的有效性。 化结果时,只取了属性的前三维,所以聚类结果图的显 表为五种算法的聚类收敛运行时间表。从表中 示聚类结果只能一定程度上显示聚类分布情况。图本文算法和其他四种对比算法可得,与智能算法优化的 屮,在对效据集聚类时,五种算法对于以¨红色”代表算法(粒子群算法和猫群算法)相比,本文提出算法的收 类的聚类正确率较高,较多的聚类锖误主要在另外的两敛时间相对较好,同时又实现较好的聚类效果;与传统 李艳娟,等:基于蜂群k 算法的遥感图像聚类应用研究 表算法收敛时间对比结果表 数据集 ++4++4++4++ 萍×*半丰:丰*丰*来丰丰*示 的聚类算法(模糊均值聚类和 算法)相比, 本文算法的收敛运行时间虽然较长,但实现了较高的聚 类正确率。 本文算法在表所示数据集上迭代,其中为分析 迭代次数 蜂群算法进行代对当次A聚类结果的影响,给 图本文算法在五幅遥感数据集上适应度值情况 出迭代前次的适应度数变化曲线图。如图(所 示。从图可得,随着迭代,适应度函数值呈逐渐递增 由图可见,随着迭代,适应度函数值呈逐渐递增 的趋势并遂渐趋于平缓。本文算法在执行的过程中 的趋势,并逐渐趋于平缓,可见蜂群算法的迭代可以优 是交替迭代蜂群算法和k算法,递增趁势也说明化 聚类结果。而且在第次迭代之后,聚类的 了聚类效果的优化过程。 适应度值大致趋于平稳,因此选取第次与第次为 例,对聚类的结果进行说明 迭代第次,图像的聚类结果图如图所 迭代次的聚类结果图分别如图所示,其中 原始图像为图中的(),由五种算法聚类的图像结 输制 果分别为图中的()(),其中()表示本文算法迭 迭代次数 图本文算法在四组数据集上适应度值情况 遥感图像聚类有效性 本文以涼水国家级自然保护区 的航空影像 为研究对象,其位丁黑龙江省伊春市带岭区的中心,地 理坐标为东经地理坐标为东经 北纬 ,总面积为 总蓄 积量为 森林覆盖率被誉为“红松故 乡”和“天然牛物实验室”。保护区属于中国—一日本森林 图遥感数据图第二次迭代聚类结果 植物亚区东北区,长白植物亚区小兴安岭南部区,植物 区系组成比较卡富,种属分布广泛,保存了比较完整而 典型的小兴安岭地带性顶级植被——阔叶红松混交林, 囊括了原始潏叶红松混交林、经过择伐的阔叶红松混交 林以及红松、落叶松等人工林。 实验首先截取其中 大小的五幅图像 ()始图像 )聚类图() 聚类图 然后通过对图像进行人工解译,共分为针叶林、阔叶林 水休、房屋、裸地、草地。本文算法以提取的图像特征作 为数据集,五幅遥感影像分别用 和所提出的方法 进行聚类。为了定量比较 聚类结果,用系数作为评判准则,平均值记 作。算法迭代次,迭代次数与适应度收敛情况如 ()聚类图( 聚类图() 聚类图 图所示。 图遥感数据图聚类结果 () 计算机工程与应用 代次的聚类结果图。迭代次及次的聚类评价 系数如表所示,运行时间如表所示。 ()原始图像 )聚类图() 聚类图 ()原始图像 )聚类图 聚类图 0)聚类图()聚类图() 聚类图 图遥感数据图聚类结果 聚类图()聚类图 聚类图 表实验结果数值表 图遥感数据图聚类结果 图像 ()原始图像()聚类图 聚类图 表算法收敛时间刈比结果表 图像 ()聚类图( 聚类图( 聚类图 图遥感数据图聚类结果 较高精度地识别了每个像素.虽然其他四种算法可以在 定稈度上识别目标,但不够精确。具体而言,对于图 和图的()和(),错误分类是显而易见的。在图和 图的()中,识别部分几乎与相应区域重合,边缘部分 ()原始图像 )聚类图() 与原始图像基本一致 值大于,结果令人满 聚类图 意,可以满足遥感图像处理的需求。随着测试图像复杂 度的增加,和 方法的聚类结果并不令人 满意,因为它们无法对各种目标进行明确的聚类,而对 于 算法 值达到了,聚类效果明显高 于其他算法。虽然对于图,提出的算法 值低于算法,但相比两者仅相差 ()聚类图()聚类图() ,尽 聚类图 管目标有一定的误差,但整体聚类效果令人满意,从而 图遥感数据图聚类结果 证明了所提出的 算法的有效性。 图中,典型迭代时刻的聚类结果图,五幅遥感图 从表中木文算法和其他四种对比算法可得 像都存在被误分的样本像素点,但相较于图中() 及的运行时间最低,但聚类准确度较 的结果比较, 的相差较少,的聚类相差低。本文算法在算法收敛时间上总体上优于算法 较大,但与最终的结果图对比,的聚类效果也随着迭而且聚类效果整体上优于其他四种算法。虽然本文算 代次数的增加效果变好 法增加了·定的收敛时间,但实现了较好的聚类效果 在图聚类图像分析得到,所提出的方法 而∏随着迭代次数的增加,算法运行时间也变长。可见 李艳娟,等:基于蜂群k 算法的遥感图像聚类应用研究 改进算法的运行效率是下一步的上作重点。 主晗幼土明威等改进以群锌法及其在高光谱 结论 影像分类中的研究计算机工程与应用 本文提出了一种基于k 和蜂群算法的遥感 像聚类技术并以机器学习的典型数据 刘旋,王国胤,罗小波基于高斯云变换的遥感图像多粒 集和涼水实验林场遥感数据为例进行了实验分析。 度聚类计算机科学,,(): 刘亮亮,谢菲,孟鸣两种改进的遥感影像地物分类方法 算法通过对初始聚类中心方法的改进及结合聚类 对比研究《计算机技术与发展, 知识对适应度函数的改进,提高了聚类结果系数, 于文博基于峰值密度聚类的高光谱图像分析方法研究 而且在一定程度上避免k 聚类陷入局部最小,从 而可得到全局最优解。通过与其他算法的仿真聚类实郑州:郑州大 张景柯基丁改进的遥感图像聚类算法的研究与应 验,逃·步说明了本文方法不仅具有较高的聚类精度 川南京:南京信息T程大学, 而且在实际的遥感图像聚类的处理过程中得到∫很好 的实际应用。此外对丁遥感图像的多特征性,如何收善 特征提取算法,将其与提出算法更好地结合及提高聚类 过程的效率是下一步工作的重点 参勞文献 裔阳,周绍光,赵鹏飞,等基于正样本和未标记样本的遥感 图像分类方法计算机工程与应用, 魏锋涛,岳明娟,郑建眀基于多策略融合的改进人工蜂 群算法计算机工程与应用,,(): 喻金平,郑杰,梅宏标基丁改进人工蜂群算法的均值 罗述谦,唐宇基于有偏场的适配模糊聚类分割算法中 聚类算法计算机应用 (): 图象图形学报,() 周本金,陶以政,纪斌,等最小化误差平方和 初始 刘势,屈静,蔡政英基于 云平台的模糊聚类算法 聚类中心优化方法计算机L程与应用 研究信息通信,() 谢娟英,王艳娥最小方差优化初始聚类中心的 算法计算机T程,,() 蒋丽,薛善良优化初始聚类中心及确定值的 算法计算机与数字工程,,() 周开乐,杨善林,丁帅,等聚类有效性研究综述系统 工程理论与实践 () 朴尚哲,超木日力格.于剑模糊均值算法的聚类有效 詹曙,姚尧,高贺基于随机森林的脑磁共振图像分类 性评价模式识別与人工智能,,() 电子测量与仪器学报 () 李润青,谢明鸿,黄冰一种基于初娢点密度最大的改 进型 聚类算法软件导刊,

...展开详情
试读 9P 论文研究-基于蜂群[k]-means算法的遥感图像聚类应用研究.pdf
立即下载 身份认证后 购VIP低至7折
一个资源只可评论一次,评论内容不能少于5个字
您会向同学/朋友/同事推荐我们的CSDN下载吗?
谢谢参与!您的真实评价是我们改进的动力~
  • 至尊王者

关注 私信
上传资源赚钱or赚积分
最新推荐
论文研究-基于蜂群[k]-means算法的遥感图像聚类应用研究.pdf 19积分/C币 立即下载
1/9
论文研究-基于蜂群[k]-means算法的遥感图像聚类应用研究.pdf第1页
论文研究-基于蜂群[k]-means算法的遥感图像聚类应用研究.pdf第2页

试读结束, 可继续读1页

19积分/C币 立即下载