下载  >  开发技术  >  其它  > 论文研究-基于K-means算法的改进色彩分割算法 .pdf

论文研究-基于K-means算法的改进色彩分割算法 .pdf 评分

基于K-means算法的改进色彩分割算法,何江龙,双锴,基于色彩空间的图像分割被称为色彩分割。在常用的色彩分割方法中,K-means聚类算法由于其简单快捷、聚类效果好、易于实现等诸多优��
国科技论文在线 http://www.paper.edu.cn 算法步骤如卜 (1)给定数量为n的样本集,令=1,确定聚类个数为k,任意选取k个样本作为初始 聚类中心C(),j=12…k (2)计算个样本对象与聚类中心的欧氏距离D(x,C()其中=1,2,…n,=1,2,…,k 如果满足D(x,2O)=mim{D(xC()/=12…m1则xEW (3)计算聚类准则函数 E=)=1211x-C(D (4)若E()-E(I-1)<δ,则算法结束;否则I=I+1,计算k个新的聚类中心 Ci n∑x9J=12- 返回第2步。 传统算法缺点 然而,K- means聚类算法在实现时有以下几个缺点: (1)需要指定聚类的数量。 K- Imeans聚类算法在使用时必须指定聚类的数量,但在使用时我们往往并不清楚具体的 聚类数量为多少比较合适,更希望聚类算法自身可以确定出·个合坦的聚类数量,所以大多 数时候初始的k值难以预先估计并给定。 (2)聚类数量的不同对聚类分析的结果和效率有较大影响 在K- means聚类算法中,由于初始的k个聚类中心点是随权选定的,并且在后面的持 续迭代中不断进行重算,直至收敛,所以从算法的步骙便可以看出,这样计算所得到的结果 在很大程度上是由一开始k个中心点的位置决定的。因此,这样计算推导出来的结果随机性 95 较强,因为每次计算推导出的结果都会由于初始随机选择的聚类中心点的不同而导致结果不 同。此外初始聚类中心点的不同将影响迭代次数,所以往往形成局部最优解的情况 (3)更适用于球状分布的数据。 因为K- mcans聚类算法中,同一个类别中的样本相似度较高,而不同类别中的样本相 似度较低。而聚类相似度是采用欧氏距离进行计算的各点到中心点的距离,所以更适用于球 100 状分布的数据。 (4)无法主动合弃异常点 K- means聚类算法较为简单,没有对异常点的主动判断与舍弃。 (5)算法时间开销大 K- mcans聚类算法需要对对象进行持续的分类调整,持续的计算调整新的聚类中心点。 05 因此当样本数据量越人,算法的时间开销也越人,算法效率也就越低。 改进的色彩分割算法 改进思路 K-π neans算法是经典的聚类算法,具有良好的聚类效果,同时算法简洁、运行效率高、 国科技论文在线 http://www.paper.edu.cn 收敛效果好,基于K- means的色彩分割算法图像分割领域占有-席之地。但K- means聚类 110 算法存在一定的缺陷,最主要的缺点是聚类中心确定问题,包括聚类中心的K个数和位置 本文基于K- means聚类算法,结合AP聚类算法,同时优化最大最小距离算法,创新了色彩 分割算法,并以轮廓系数( Silhoucttc Coefficient,Si)指标评价聚类效果。具体思路如下: (1)采用AP算法计算聚类中心个数,并作为色彩分割中聚类中心的个数k的上限,并 确定k取值范围[kmi,kma],其中kmin=2,kmax=kap 115 (2)采用针对色彩空冋的改进最大最小距离算法,计算k的具体数值,同时确定出初始 样本中心的位置。 如下图(橙色部分为改进部分) 样本集N AP算法去 FE kmin, kep 最大最小距离算法 的值,初始 聚类中 欧氏距离 样本相似 度 样本重新 均值 新聚类中 聚美中心 是 是否有变化 否 输出结果 冬1改进算法流程 l20 Fig. I The flow chart of the improved algorithm 改进算法 算法确定取值范围 AP算法即紧邻传播聚类算法阿,是一种基于样本点间"信息传递"的一种聚类算法,由 Frey和 Dueck与2007年提出。算法的目的是找到最优的类代表点集合,从而令待处理图像 125 中的所有样本点到距离最近的类代表点的相似度之和是最大的。为了避免在其他算法中出现 的关于中心的初始选择问题,该算法同时将所有的样本点均选作为潜在的聚类中心点,从而 使结果的可靠度有了极大的提高。 AP算法与K- means算法不同,不需要提前确定聚类的个数。而是在聚类过程中不断更 4 国科技论文在线 http://www.paper.edu.cn 新每个样本点的两种信息的值,直到产生若干高质量的聚类中心点,将剩余的样本点分别 130 划分到其相应的聚类中。对样本点之间的相似度聚类时,相似度既可以是不对称的,也有可 能是对称的。假设有N个样本点,则他们相互的相似度就组成了一个N×N的相似度矩阵s 矩阵s的对角线上的数值s(k,k)称作偏向参数p( prcfcrcncc),p作为聚类中心的评判标准值 越大,那么该点就有越大的可能性戍为聚类中心。同时,p也会影响到聚类的数量,若p取 相同的数值,则每一个样本点都将成为聚类中心,若取相似度的均值,则得到的聚类数量将 135 是中等的。 AP算法中包含两种类型的信息,分别为归属度( availability)及吸引度( re-sponsibility) (1)吸引度r(k)表示从点i发送到备选的聚类中心k的信息,从而反映出点k对i的 适合程度。 (2)归属度a〔k)表示从备选的聚类中心k发送到i的信息,从而反映出i对k的依赖 140 程度。 (3)r(ik)与a(ik)共同反映了k点作为聚类中心以及i点归属于k点作为聚类中心的 类的可能性,两者成正相关。r(,k)与a(,k)之和越大,则k点作为聚类中心的可能 性越人,且i点属于以k点为聚类中心的类别的可能性越人 (4)通过连续的循环与迭代,最终待到固定的各个样本点的归属度,从而达到收敛的状 145 态。聚类中心为r(i,k)与a(i,k)相加之和最大的样本点 AP算法步骤如下 (1)计算初始相似度矩阵s s(i,k)是样本点i和k之间的相似度矩阵.一般采用欧氏距离进行计算,并取负值,所以 s(k)越大表小两个点距离越短,相似度越高。此外取欧氏距离的负值,相似度为对称的 150 若采用其他算法计算相似度,则结果可能为非对称的。 lx1-xk|t≠k (k),=k (2)选取p的值 参考度p(也称为偏向参数)表示样本点被选作聚类中心的倾向性,而值的增人或是 减小都会影响到AP算法输岀的类别。所以在AP算法中,值在未指定的情况下,一般选 定为中值。 155 (3)计算样本点间的吸引度和归属度 AP算法的核心内谷,就在这两个消息反复传递的过程。吸引度r(,k)示样本点k适 合作为样本点i的类代表的吸引程度,rt+1(k)表示新的r(k),r(k)表示旧的r(,k);归 属度a(ak)表示样本点i选择点k作为它的类代表的归属程度,at+1(k)表示新的a(,k), a2(表示旧的a(E,k);μ为阻尼系数,∈[0.5,1)。 160 吸引度迭代公式 rt+1(,k)=(1-μ)·r+1(i,k)+·rt(i,k) s(,k)-max=kar()+r(),若≠k (1 s(i, k)-maxizkIs(i,jb, i=k 归属度迭代公式: at+1(1,k)=(1-4)·at+1(i,k)+·a1(i,k) 山国利技论文在线 http://www.paper.edu.cn 165 a+100)/min107t+t(k,.)+D()max0t+10,k)若≠k ∑≠kmgx{0,rt+(,)},若i=k (4)确定聚类中心 k=a dali, k)+r(i, k)j 公式中若i=k,则i是聚类中心;若i≠k,则k是i的聚类中心。 (5)重复迭代 重复迭代3、4步骤操作,直至聚类中心不在发生变化,或迭代次数超出设定的迭代次 数上限。迭代次数过多会影响迭代运行效率,所以针对不同样本集可以设定不同的迭代次数 上限,或不设定上限。 (6)输出k值 输出最终结果k值,作为最大最小距离算法的k值上限,即k1max=kapn 175 优化最大最小距离算法确定值与初始样本中心 最大最小距离算法是现在常用于模式识别领域的一种算法,通过最大距离原则确定相 对较远的对象为新的聚类中心,避免初始聚类中心距离过近而导致聚类效果较差。通过最小 距离原则进行模式归类。通过此算法可以更加智能的确定聚类中心的个数,同时也确定∫聚 类中心的位置,提升」样本划分效率。设待分类的样本集Sn为{x1,x2,…,xn},选定比例系数 180 λ,其算法步骤如下: (1)从Sn中随机选取个样本点作为第个聚类中心z1。 (2)从Sn中选取与z1之间距离最大的样本点作为第个聚类中心Z2 (3)从Sn中继续选取新的样本点x2,计算x与z1、z2之间的距离,并选取其中的最小值 为d2,即 185 d;=‖x:-zlj=12 d:=min(d1,dt2),i=1,2,…,n (4)选取所有最小值d2中的最大值D4,若满足Dt=max(d1}>θ|z1-z2l,则相应的样 木x作为第三个聚类中心z3 (5)如果已有m个聚类中心,则选取并计算未被作为聚类中心的样本点x:到各聚类中 190 心的距离d1,并算出 Dr= maximin(dil, diz,.,dik 3, 若满足 Z 则相应的样本x作为第m+1个聚类中心zm+1 195 (6)重复(5)的处理方式,直至再也无法选出符合条件的新聚类中心 (7)将各样本点通过最小距离原则分到各类中去,完成分类。 (8)输出聚类中心,及聚类个数。 通过最大最小距离确定聚类中心的个数和完成基于最小值原则的聚类,可以有效的运 用到K- means聚类算法中,帮助确定的值和初始聚类中心的选择,这样选岀来的聚类中心 200 更加分散,分类效果更加明显,聚类的稳定性更想,可以有效的弥补K- means聚类算法的 不足。 山国利技论文在线 http://www.paper.edu.cn 但由于最大最小距离算法的聚类数是重复达代计算得到的,达代停止的关键在于参考系 数λ,而λ值过髙则迭代极易停止。λ值过低则迭代次数过多,降低运行效率。本文针对色 彩空间提出一种新的迭代限制条件。 205 当前的迭代限制条什为 D,>A‖ 其中以参考系数λ,和第一第:聚类中心之间的距离为约束条件。在色彩空间中,由于 色彩范围是有限的,以RGB色彩空间来看,RGB取值在0-25之间,并非无限延伸,距离 最大的样本点为白色(00,0)与黑色(255,255,255),其距离是有限的。所以可以选择间距 210 最大的两个样本点之间的距离,以聚类数平分最为限制条件,所以新的迭代条件为 max 同时的取值区间限定为[kmin,kma],其kmin=2,kmax通过AP算法计算得到 kmax=ka,以最终的值来确定聚类数 此外在最大最小距离算法中,第一个聚类中心随机选取对于整个聚类效果有一定影响, 215 冋时可能会增加迭代次数,所以选择以均值来确定第一个聚类中心,即选择离均值点最近的 样本点为聚类中心 改进色彩分割算法测试 测试指标 轮廓系数( Silhouette Coefficient),是评价聚类效果的一种指标例。轮廓系数评价内 220 容主要包括内聚度和分离度两个方面,内聚度是指类别内样本点与其他样本点间的相似度 (不相似度),分离度指不同类别间的相似度(不相似度)。轮廓系数因为其简洁髙效、效 果好等优点,常被拿来评价不同算法或算法的不同运行方式所产生聚类效果的差别 具体计算步骤如下 (1)计算样本点i到同类C的其他样本的平均距离a(),a()表示样本点的不相似度, 225 α()值越高则不相似度越高,讠不属于该类可能性更高;aωυ)值越低,不相似度越低, a(i)属于该类可能性更高。 (2)计算该类别所有样本不相似度的平均值,表示该类别的不相似度。 (3)计算样本点i到其他某一关C所有样本点的平均距离b(),表示样本点i与C的不 相似度 230 (4)计算样本点i到其他所有的类的不相似度的平均值b(),表示类别间的不相似度。 b(i)=min b(i1), b(i2),,b(ik)) (5)根据a()和b(l),定义样本点的轮廓系数为 maxa(),b(j b(i ()<b(i) S a()=b(i) 1,a()>b() (6)s()取值范围为[-1,1,根据s()具休数值判定: 7 国科技论文在线 httpiiwww.paper.edu.cn 235 s()趋近于1,则说明样本点i所在的类C聚类效果好; s()趋近于-1,则说明样本点i不属于类C; s()约等于0,则说明样本点i位于两个类中间。 改进色彩分割算法测试结果 指标测试 以优化创新的色彩分割算法与传统的K- means聚类算法对相同的两组数据(0-255间的 三维数据〕进行实验,以Si指标为评价标准,比较两种算法对于相同数据的聚类效果。为 减少误差,对两种算法各重复运行20次,Si指标取最大值 表1两种算法的Sil指标比较 Tab. I Comparison of Sil Index between Two Algorithms 数据正确 传统 K-mcans聚类算法 改进算法 集米kap K1 Salman k2 Siln max Sil 0.7632 6 0.7234 0.7865 9 0.7703 0.7312 0.7901 245 传统的 K-means聚类算法k值是提前设定的,而优化算法的k值是计算得到的k为采 用AP算法获得的k值上限。 从上表中可看岀,在同一数据集中,优化算法的k值更为准确,其Sⅱ最大指标数值更 趋近于1,在S1中为0.7865,S2中为0.901,其聚类效果更好,说明优化算法相对传统K- Ineans 250 亵类算法更为有效。 色彩分割效果 采用传统K- means聚类算法和采用优化算法的色彩分割效果如下: 表2两种算法的色彩分割效果比较 Tab 2 Comparison of Color Segmentation Effects between Two Algorithms 传统 K-means聚类算法 优化算法 8 山国科技论文在线 httpiiwww.paper.edu.cn k=5 可以看得出来,传统K- mcans算法由于需要提前确定k的值,所以效果较差,而改进 算法的k值取值较为合理,能够较好地将图像以色彩差别进行分割。 结语 本文基于K- means聚类算法,结合AP聚类算法和优化创新的最大最小距离算法,提出 了一种改进色彩分割算法。主要从聚类中心的个数和初始聚类中心的选取两个方面进行优化 260 创新,通过AP算法确定k值的上限,提岀以色彩空间的数佰有限性来限定算法迭代次数, 进而优化实现在k的取值范围内确定k的值和初始聚类中心的位置。采用Si指标来评定聚 类分割效果,并进行实睑证明新算法的有效性。同吋通过两种不同算法进行具体色彩分割测 试,通过测试图像的具体效果进步证明算法的优化效果。 参考文献 265 L」尹宝勇吴斌,刘建生.一种改进的K- means算法山小江西理1大学学报,2018,3905:97-102 YIN BY, WU B, LIU JS. An improved K-means algorithm[J] Journal of Jiangxi University of Science and Technology, 2018, 39(05): 97-102. (in Chinese [2]周世兵,徐振源,唐旭清 K-means算法最佳聚类数确定方法计机应用,2010.30(08):1995-198 ZHOU S B, XU Z Y,TANG X QMcthod for dctcrmining optimal numbcr of clustcrs inK-mcans clustcring 270 algorithm]. Journal of Computer Applications, 2010,30(08): 1995-1998.(in Chinese) 「3]王勇,唐靖饶勤菲,袁巢燕高效率的K- means最佳聚类数确定算法「J计算机应用,2014-,34(05-:131-135 WANG Y, TANG J, RAOQ F et al. High efficient K-means algorithm for determining optimal number of clusters[J] Journal of Computer Applications, 2014, 34(05): 1331-1335. (in Chinese) 4]徐健锐,詹永照.基于 Spark的改进 K-means快速聚类算法叮.江苏大学学报(自然科学 275 版),2018,39(03):316-323 XU J Y, JAN Y Z. Improved K-means fast clustering algorithm based on Spark[J]. Journal of Jiangsu Lnivcrsity(Natural Scicncc Edition), 2018, 39(03): 316-323 (in Chinesc) [5]周世兵徐振源,唐旭清新的K-均值算法最佳聚类数确定方法叭计算机工程与应用,2010,46(16):27-31 ZHOU SB, XU ZY, TANG X Q. New method for determining optimal number of clusters in K-means clustering 280 algorithm[J]. Computer Engineering and Applications, 2010, 46(16): 27-31. (in Chinese 6杨凡稳,曾志高,刘强,刘丽红,易胜秋,钟智彦.基于AP聚类算法的图像分割应用与研究「J.计算技术与自动 化,2015,34(03):88-91 YANG F W. ZENG ZG, LIU Q et al. Research and Application Of Image Segmentation Based on AP Clustering Algorithm[J]. Computing Technology and Automation, 2015, 34(03): 88-91.(in Chinese) 285 []刘燕基于拙样和最人最小距离法的并行 K-means聚类算法[智能计算机与应用,2018,8(06):3739+43 LU Y Parallel K-means clustering algorithm based on sampling and maximum minimum distance method[J] Intelligent Computer and Applications, 2018, 8(06): 37-39+43.(in Chinese) 8]王学贺.一种基于改进黴粒群和轮廓糸数的划分聚类方法[厶南民族大学学报(自然科学 版),2016,25(04)367-37 290 WANG XH. An automatic approach to solving clustering problems with the number of clusters unknown based on the particle swarm optimization and silhouette coefficient[]. Journal of Yunnan Minzu University(Natural Sciences edition), 2016, 25(04): 367-371(in Chinese [9]李双虎,张风海.一个新的聚类有效性分析指标[J计算机工程与设计,2007(081772-1774 9 国科技论文在线 http://www.paper.edu.cn LI S H, ZHANG F H. New index for clustering validation[J]. Computer Engineering and Design, 295 2007(08):1772-1774.( in Chinese) 10

...展开详情
所需积分/C币:6 上传时间:2019-08-26 资源大小:505KB
举报 举报 收藏 收藏
分享 分享
论文研究-基于k-means聚类算法的研究 .pdf

基于k-means聚类算法的研究,黄韬,刘胜辉,本文首先分析研究聚类分析方法,对多种聚类分析算法进行分析比较,讨论各自的优点和不足,同时针对原k-means算法的聚类结果受随机��

立即下载
论文研究-基于K-近邻算法的人体步态识别 .pdf

基于K-近邻算法的人体步态识别,张腾腾,赵桐,针对步态特征提取时涉及到的维数高、变换复杂等问题,提出一种新的步态特征提取方法,即利用加速度传感器采集人体侧向、垂直方向

立即下载
论文研究-基于K-means的有限增量聚类算法及k值研究 .pdf

基于K-means的有限增量聚类算法及k值研究,姚文心,卢志国,聚类算法被广泛的应用在数据挖掘、模式识别、信息抽取等领域。随着互联网技术的不断发展,许多数据存在着动态增长的特性。怎样聚

立即下载
论文研究-基于K-近邻树的离群检测算法.pdf

为适应数据集分布形状多样性以及克服数据集密度问题,针对已有算法对离群簇检测效果欠佳的现状,提出了一种基于K-近邻树的离群检测算法KNMOD(outlier detection based on K-nearest neighborhood MST)。算法结合密度与方向因素,提出一种基于K-近邻的不相似性度量,然后带约束切割基于此度量构建的最小生成树从而获得离群点。算法可以有效地检测出局部离群点以及局部离群簇,与LOF、COF、KNN及INFLO算法的对比结果也证实了算法的优越性能。

立即下载
论文研究-基于K_DOPs快速连续碰撞检测算法 .pdf

基于K_DOPs快速连续碰撞检测算法,杜广龙,张平,为了实现快速精确的刚体碰撞检测,本文提出了基于间隔插值和静态K_DOPs检测技术的连续碰撞检测算法。该算法通过间隔插值技术得到逼

立即下载
论文研究-基于K-means特征的复杂环境下道路识别算法.pdf

基于视觉的智能车辆导航技术是通过对各种道路环境进行感知和理解,从而确定智能车辆的可行驶区域。针对实际道路环境的复杂性与多样性问题,提出了能够适应复杂环境的道路识别算法。首先,使用SLIC(simple linear iterative clustering)超像素分割算法对原始道路图像进行超像素分割,得到性质相同、尺寸均匀的超像素块;其次,基于超像素块使用K-means聚类算法提取出图像中道路区域与非道路区域的K维特征数据,并将提取的特征数据组成训练数据集;然后,针对经典双支持向量机(TSVM)训练时间久、无法求解逆矩阵的问题进行适当矫正,使用训练数据集训练矫正后的双支持向量机;最后,使用训练

立即下载
论文研究-基于K-means的数据流离群点检测算法.pdf

针对数据流中离群点挖掘问题,在K-means聚类算法基础上,提出了基于距离的准则进行数据间离群点判断的离群点检测DOKM算法。根据数据流概念漂移检测结果来自适应地调整滑动窗口大小,从而实现对数据流的离群点检测,与其他离群点算法的一系列实验验证和对比结果表明,DOKM算法在人工数据集和真实数据集中均可以实现对离群点的有效检测。

立即下载
论文研究-基于K-均值聚类的无监督的特征选择方法.pdf

模式识别方法首先要解决的一个问题就是特征选择,目前许多方法考虑了有监督学习的特征选择问题,对无监督学习的特征选择问题却涉及得很少。依据特征对分类结果的影响和特征之间相关性分析两个方面提出了一种基于K-均值聚类方法的特征选择算法,用于无监督学习的特征选择问题。

立即下载
论文研究-基于K-L变换(PCA)的特征脸人脸识别方法综述 .pdf

基于K-L变换(PCA)的特征脸人脸识别方法综述,程自龙,雷秀玉,首先阐述了基于特征脸人脸识别算法的具体过程及特点,然后论述了影响该方法的主要因素,列举了特征脸改进方法,最后进行了总结和

立即下载
论文研究-基于K叉树的优先队列.pdf

论文研究-基于K叉树的优先队列.pdf,  本文提出一种基于K叉树的优先队列的算法,通过建立K叉树堆的数据结构,从n个元素中得到m个元素的优先队列,其算法的最坏时间复杂度为$O(2mlog_2+n)$.本算法是基于二叉树堆的优先队列算法的推广,并具有较高的运算效率.

立即下载
论文研究-基于K-SVD超声渡越时间获取方法研究.pdf

针对信号稀疏分解中常用匹配追踪分解不够准确的问题,提出基于K-SVD奇异值分解的超声渡越时间获取方法。利用K-SVD训练得到超声回波信号的过完备字典,结合正交匹配追踪进行局部搜索适配原子,以提高信号稀疏分解的速度和准确度。基于Comsol Multipysics仿真软件建立充液污垢管道三维有限元模型,研究了超声回波传播特性规律。将K-SVD算法应用于超声回波仿真信号和换热污垢管道回波检测信号的处理,并与原始小波训练字典进行对比。结果表明,改进的K-SVD字典学习算法能够在提高信号稀疏分解的同时,获得较好的降噪结果和污垢特征信息提取,对超声检测信号的处理具有实际意义。

立即下载
论文研究-基于K-means算法的Android权限检测机制研究.pdf

为了能够有效保护用户的个人隐私,设计了一种针对Android权限的检测机制。该机制采用静态分析技术研究不同类别应用程序的权限特征,首先根据权限的使用频度设置权限组,并借鉴TF-IDF思想为权限赋予权值;然后建立相应的数据库,计算应用程序的敏感值;最后使用K-means算法进行聚类分析,将应用程序进行分类。实验结果表明,该机制能够有效地检测出未知应用程序的危险程度。

立即下载
论文研究-基于K-L信息距离的证据冲突特征识别与应用.pdf

论文研究-基于K-L信息距离的证据冲突特征识别与应用.pdf,  证据冲突是多证据融合中各种合成方法的主要制约问题,本文引入K-L信息距离函数描述证据间的冲突特征,通过构造距离矩阵定义独立证据在整个系统的冲突程度,实现对证据冲突的系统化识别.模拟实验表明:K-L信息距离的有效冲突识别,能完善D-S理论合成规则的应用约束,对正常冲突证据合成得到优化收敛结果,对高度冲突隔离证据的特征分析提取价值

立即下载
论文研究-基于K-means的印刷品图像前景提取算法研究 .pdf

基于K-means的印刷品图像前景提取算法研究,陆金鑫,周亚建,前景提取是印刷品检测系统模板图像生成的关键技术。考虑到印刷品图像特性和其所处环境的颜色特性,在HSV彩色模式下将K-means聚类用��

立即下载
论文研究-基于K-means算法的改进色彩分割算法 .pdf

基于K-means算法的改进色彩分割算法,何江龙,双锴,基于色彩空间的图像分割被称为色彩分割。在常用的色彩分割方法中,K-means聚类算法由于其简单快捷、聚类效果好、易于实现等诸多优��

立即下载
论文研究-基于K-means的无线传感网分簇算法研究.pdf

针对传统分层路由算法存在的分簇不均匀、簇头选举不合理以及数据传输形式单一等问题,提出基于K-means 的无线传感网改进分簇算法LEACH-KPP。首先在成簇阶段采用K-means 算法实现均匀分簇,随后在簇头选举阶段使用改进簇头选举函数选取簇头,最后在融合数据传输阶段根据簇头与基站、簇头与簇头之间距离动态选择单跳与多跳的混合传输方式传输数据。OMNet 仿真结果与时间复杂度推导表明,LEACH-KPP延长了网络的生存周期,在节点剩余能量与后期存活数目上都优于传统分层路由算法。

立即下载
论文研究-基于K-匿名的快递信息隐私保护应用.pdf

针对快递单号被盗取和快递单信息保护不当造成的隐私泄露问题进行了研究,提出了一种新型K-匿名模型对快递信息进行匿名处理。该方法通过随机打破记录中属性值之间的关系来匿名数据,相比于其他传统方法,克服了数据间统计关系丢失的问题和先验知识攻击。实验结果表明,新型K-匿名方法能够加强隐私保护和提高知识保护的准确性。

立即下载
论文研究-基于K近邻隶属度的聚类算法研究.pdf

经典模糊C均值聚类算法(FCM)基于欧氏距离,存在不同规模类簇不能正确聚类问题,针对此问题提出一种基于[K]近邻隶属度的模糊C均值聚类算法(KNN_FCM)。讨论了基于[K]近邻隶属度的粗糙C均值聚类算法(KNN_RCM)和粗糙模糊C均值聚类算法(KNN_RFCM),此方法避免了传统粗糙C均值聚类算法(RCM)和粗糙模糊C均值聚类算法(RFCM)中阈值选择问题。将KNN_FCM、KNN_RCM、KNN_RFCM分别与FCM、RFM、RFCM在UCI数据集上进行仿真比较,结果表明新方法是可行、有效的。

立即下载
论文研究-基于K2树的大图存储优化研究.pdf

针对大图数据的一种表达方法——K2树,提出了相应的压缩优化算法。该算法利用带有启发式规则的DFS编码对图中所有节点进行重新编码,并通过自适应调整参数K,使得K2树能够充分利用网络中的社团结构特性,从而降低空间代价。给出了K2树的优化算法描述,并针对一系列真实网络和模拟网络进行了实验,验证了优化算法具有较好的压缩效果。

立即下载
论文研究-基于K-means聚类的数字半色调算法.pdf

数字半色调是在二值设备或多色二值设备上实现图像再现的一门技术, 提出将K-means 聚类法应用在数字半色调技术中。算法中应用人类视觉系统模型HVS和印刷模型最大限度减少原始灰度连续调图像和半色调图像之间的视觉误差; 利用K-means聚类法将灰度图像划分成聚类分区, 在每个聚类分区应用最小平方法least-squares最小化二值半色调图像和原始灰度级图像之间的平方误差, 所构造的半色调算法与基于模型的最小平方法LSMB算法相比, 随着聚类分区的增加, 图像平滑且边缘清晰度增加, 尤其是在图像细节部位。与LSMB算法比较, 该算法的均方误差值有所降低, 而权重信噪比和峰值信噪比提高了0. 2

立即下载