下载  >  开发技术  >  其它  > 论文研究-K-means 算法中的k 值优化问题研究.pdf

论文研究-K-means 算法中的k 值优化问题研究.pdf 评分

论文研究-K-means 算法中的k 值优化问题研究.pdf,
6 2 1 10 最优k值 F(S, k)

...展开详情
所需积分/C币:6 上传时间:2019-09-20 资源大小:118KB
举报 举报 收藏 收藏
分享 分享
论文研究-K-means 算法中的k 值优化问题研究.pdf

论文研究-K-means 算法中的k 值优化问题研究.pdf,

立即下载
论文研究-基于K-means的有限增量聚类算法及k值研究 .pdf

基于K-means的有限增量聚类算法及k值研究,姚文心,卢志国,聚类算法被广泛的应用在数据挖掘、模式识别、信息抽取等领域。随着互联网技术的不断发展,许多数据存在着动态增长的特性。怎样聚

立即下载
论文研究-改进的K-means聚类k值选择算法.pdf

空间聚类算法中,聚类的效果在很大程度上受制于最佳[k]值的选择。典型的[K]-均值算法中,聚类数[k]需要事先确定,但在实际情况中[k]的取值很难确定。针对手肘法在确定[k]值的过程中存在的“肘点”位置不明确问题,基于指数函数性质、权重调节、偏执项和手肘法基本思想,提出了一种改进的[k]值选择算法ET-SSE算法。通过多个UCI数据集和[K]-means聚类算法对该算法进行实验,结果表明,使用该[k]值选择算法相比于手肘法能更加快速且准确地确定[k]值。

立即下载
论文研究-最大距离法选取初始簇中心的K-means文本聚类算法的研究.pdf

由于初始簇中心的随机选择,K-means算法在聚类时容易出现聚类结果局部最优、聚类结果不稳定、总迭代次数较多等问题。为了解决K-means算法所存在的以上问题,提出了最大距离法选取初始簇中心的K-means文本聚类算法。该算法基于这样的事实:距离最远的样本点最不可能分到同一个簇中。为使该算法能应用于文本聚类,构造了一种将文本相似度转换为文本距离的方法,同时也重新构造了迭代中的簇中心计算公式和测度函数。在实例验证中,对分属于五个类别的1 500篇文本组成的文本集进行了文本聚类分析,其结果表明,与原始的K-means聚类算法以及其他的两种改进的K-means聚类算法相比,新提出的文本聚类算法在降低

立即下载
论文研究-一种改进K-means聚类的FCMM算法.pdf

针对K-means算法易受初始聚类中心影响而陷入局部最优的问题,提出一种基于萤火虫智能优化和混沌理论的FCMM算法。利用最大最小距离算法确定聚类类别值<i>K</i>和初始聚类中心位置,以各聚类中心为基准点,利用Tent映射构建混沌空间,通过混沌搜索更新聚类中心,以降低初始聚类中心过于临近的影响,并改善算法易陷入局部最优的问题。仿真结果表明,FCMM算法的平均聚类精度相较于经典K-means算法和FA算法分别提高了7.51%和2.2%,成功避免算法陷入局部最优解,提高了划分初始数据集的效率和寻优精度。

立即下载
论文研究-改进K-means算法在入侵检测中的应用研究.pdf

为了弥补传统K-means聚类算法在K值确定和初始中心选择难等方面的不足,基于“合并与分裂”思想,提出一种改进的K-means聚类算法。将数据独立程度概念引入实验数据子集构造理论中,利用独立程度评价属性的重要性;根据点密度将数据集合并为若干类,结合最小支撑树聚类算法与传统K-means聚类算法实现分裂;使用KDD Cup99数据集对改进算法在入侵检测中的应用进行仿真实验。结果表明,改进算法在检测率和误报率方面均优于传统K-means算法。

立即下载
论文研究-基于K-means算法的Android权限检测机制研究.pdf

为了能够有效保护用户的个人隐私,设计了一种针对Android权限的检测机制。该机制采用静态分析技术研究不同类别应用程序的权限特征,首先根据权限的使用频度设置权限组,并借鉴TF-IDF思想为权限赋予权值;然后建立相应的数据库,计算应用程序的敏感值;最后使用K-means算法进行聚类分析,将应用程序进行分类。实验结果表明,该机制能够有效地检测出未知应用程序的危险程度。

立即下载
论文研究-基于引导采样的Kinect深度图修补算法.pdf

针对Kinect采集到带有大量的结构性缺失的深度图,提出了一种基于引导采样的深度图空洞噪声修补算法。算法首先将深度图所对应的彩色图片转换为灰度图,然后用K-means算法将彩色图转换而来的灰度图进行聚类处理,将生成的聚类图作为引导图。联合引导图对深度图空洞噪声边缘深度值采样,采集多个深度值并计算深度均值,最后使用深度均值来作为空洞的深度估计值。通过与基于蒙特卡罗不确定度评价的深度图修补算法(MC-UE)相比较,由于有引导图的矫正作用,边缘细节更加清晰准确。对于处理较小面积的空洞噪声,处理结果相较于MC-UE算法,均方误差降低4%左右。对于处理较大面积的空洞噪声,均方误差较MC-UE算法降低了9

立即下载
论文研究-用于驾驶疲劳检测的人眼定位及状态判别算法.pdf

主动学习已被证明是提升基于内容图像检索性能的一种重要技术。而相关反馈技术可以有效地减少用户标注。提出一种主动学习算法,带权Co-ASVM,用于改进相关反馈中样本选择的性能。颜色和纹理可以认为是一张图片的两个充分不相关的视图,分别计算颜色和纹理两种特征空间的权值,并在两种特征空间上分别进行SVM学习,对未标注样本进行分类;为了减少反馈样本的冗余,提出一种K-means聚类的主动反馈策略,将未标注样本返回给用户标注。实验表明,该图像检索方法有较高的准确性,并且有不错的检索效果。

立即下载
论文研究-改进K-means的空间聚类算法.pdf

提出了基于K-means的四叉树与R-link树的混合结构树,提高了R-link树的查询性能,在K-means中采用均值—标准差确定初始聚类中心,提高了收敛速度,通过距离准则函数来优化K值,避免K值的盲目选取。与R-link相比空间开销代价有时略大,但换取了更高的性能,且数据量越多,此种结构的整体性能越好,适合于海量数据。

立即下载
论文研究-基于K-means聚类的数字半色调算法.pdf

数字半色调是在二值设备或多色二值设备上实现图像再现的一门技术, 提出将K-means 聚类法应用在数字半色调技术中。算法中应用人类视觉系统模型HVS和印刷模型最大限度减少原始灰度连续调图像和半色调图像之间的视觉误差; 利用K-means聚类法将灰度图像划分成聚类分区, 在每个聚类分区应用最小平方法least-squares最小化二值半色调图像和原始灰度级图像之间的平方误差, 所构造的半色调算法与基于模型的最小平方法LSMB算法相比, 随着聚类分区的增加, 图像平滑且边缘清晰度增加, 尤其是在图像细节部位。与LSMB算法比较, 该算法的均方误差值有所降低, 而权重信噪比和峰值信噪比提高了0. 2

立即下载
论文研究-基于KECA和FWA-SVM的间歇过程分时段故障诊断方法.pdf

针对间歇过程的高度复杂性、强非线性、强时段性等特点,提出一种基于核熵成分分析(KECA)特征变量降维,利用烟花算法(FWA)优化支持向量机(SVM)参数的间歇过程分时段故障诊断方法。首先,通过多向核主元分析(MKPCA)进行在线故障监测,输出故障数据;其次,利用K-means分类方法将间歇过程划分为若干个子时段,对故障数据进行KECA特征变量处理,按熵值贡献率来确定选取主元的个数,深层提取特征信息;最后,在各子时段内分别构建FWA优化SVM参数故障诊断模型,将降维处理后的故障数据代入各自所属子时段FWA-SVM诊断模型内进行故障诊断。通过对青霉素仿真实验数据进行各种对比实验研究,验证了该方法的

立即下载
论文研究-LSHBMRPK-means算法及其应用.pdf

针对传统的k-means聚类算法在处理大数据时算法时间复杂度极高和聚类效果不佳的问题,提出了LSHBMRPK-means算法,即基于局部敏感哈希函数的MapReduce并行化的k-means聚类算法;针对推荐系统的可扩展性问题,将LSHBMRPK-means应用于基于聚类的协同过滤算法。此外,针对评分数据的稀疏性问题,使用LFM,即隐语义模型,对缺失值进行填充,进而提出了基于LFM的LSHBMRPK-means聚类算法。实验结果表明,LSHBMRPK-means聚类算法提高了聚类效率和质量,基于LFM的LSHBMRPK-means协同过滤算法具有较好的可扩展性,同时解决了因评分数据稀疏导致聚类

立即下载
论文研究-基于spark平台的K-means改进算法 .pdf

基于spark平台的K-means改进算法,闫萌,邹俊伟,K-means算法是较为经典的聚类算法。针对经典的K-means算法存在的K值个数和初始聚类中心需要人为指定的缺陷,以及经典的串行K-means算法��

立即下载
论文研究-K-means聚类与SVDD结合的新的分类算法.pdf

为了提高支持向量数据描述(SVDD)的分类精度,引入局部疏密度提出了改进的SVDD算法。该算法提高了分类精度,但增加了计算复杂度。为此,先用K-means聚类将整个数据集划分为k个簇,再用改进的SVDD算法并行训练k个簇,最后再对获得的k个局部支持向量集训练,即得到最终的全局决策边界。由于采用了分而治之并行计算的方法,提高了算法的效率。对合成数据(200个)和实际数据的实验结果表明,所提算法较SVDD算法,训练时间降低为原来的10%,分类错误率较原来的降低了近一半。因此,所提算法提高了分类精度和算法效率。

立即下载
论文研究-一种多径信道直扩信号伪码序列盲估计方法.pdf

针对多径信道下直接序列扩频信号伪码序列盲估计的难题,拓展了基于加性高斯白噪声信道提出的子空间法,提出了一种基于子空间法和三阶相关函数法相结合的多径信道直扩信号伪码序列盲估计的新算法,进行了理论推导。该算法对接收到的多径直扩信号按照伪码周期的两倍进行分段形成数据向量,构造自相关矩阵并进行特征值分解得到不同增益伪码序列的延迟叠加,运用m序列的三阶相关特性估计生成多项式进而估计伪码序列。计算机仿真结果验证了该算法的有效性。

立即下载
论文研究-一种基于密度的K-means算法研究.pdf

针对传统K-means算法必须事先确定聚类数目以及对初始聚类中心的选取比较敏感的缺陷,采用基于密度的思想,通过设定Eps邻域以及Eps邻域内至少包含的对象数minpts来排除孤立点,并将不重复的核心点作为初始聚类中心;采用类内距离和类间距离的比值作为准则评价函数,将准则函数取得最小值时的聚类数作为最佳聚类数,这些改进有效地克服了K-means算法的不足。最后通过几个实例介绍了改进后算法的具体应用,实例表明改进后的算法比原算法有更高的聚类准确性,更能实现类内紧密类间远离的聚类效果。

立即下载
论文研究-基于Kmeans聚类算法的复杂网络社团发现新方法.pdf

提出了一种基于Kmeans 聚类算法的复杂网络社团结构划分方法。算法基于Fortunato等人提出的边的信息中心度,定义了节点的关联度,并通过节点关联度矩阵来进行聚类中心的选择和节点聚类,从而将复杂网络划分成k个社团,然后通过模块度来确定网络理想的社团结构。该算法有效地避免了Kmeans 聚类算法对初始化选值敏感性的问题。通过Zachary Karate Club和College Football Network两个经典模型验证了该算法的可行性。

立即下载
论文研究-Initializing K-means Clustering Using Affinity Propagation.pdf

借助近邻传播算法改进K-means初始化方法,朱岩,于剑,K-means聚类方法因为具有快速的收敛速度而被广泛应用,但是该算法对初始值的敏感性却是人们所不期望的。很多学者都提出了不同的初��

立即下载
论文研究-结合双粒子群和K-means的混合文本聚类算法.pdf

传统K-means算法对初始聚类中心选择较敏感,结果有可能收敛于一般次优解,为些提出一种结合双粒子群和K-means的混合文本聚类算法。设计了自调整惯性权值策略,根据最优适应度值的变化率动态调整惯性权值。两子群分别采用基于不同惯性权值策略的粒子群算法进化,子代间及子代与父代信息交流,共享最优粒子,替换最劣粒子,完成进化,该算法命名为双粒子群算法。将能平衡全局与局部搜索能力的双粒子群算法与高效的K-means算法结合,每个粒子是一组聚类中心,类内离散度之和的倒数是适应度函数,用K-means算法优化新生粒子,即为结合双粒子群和K-means的混合文本聚类算法。实验结果表明,该算法相对于K-mea

立即下载