没有合适的资源？快使用搜索试试~ 我知道了~

文库首页数据库其它数据挖掘kmeams算法实现聚类分析

数据挖掘kmeams算法实现聚类分析

数据挖掘

kmeans

5星 · 超过95%的资源需积分: 42 34 下载量 188 浏览量 2012-01-11 15:20:55 上传评论收藏 159KB DOC 举报

温馨提示

试读

12页

数据挖掘kmeams算法实现聚类分析，数据源使用sythetic_control_chart.data。实验报告，包含全部代码

资源推荐

资源详情

资源评论

数据挖掘实验报告

班级：姓名：学号：

1. 数据来源描述

本次数据挖掘实验的数据源来自加州大学计算机与信息院，是

用于合成控制图时间序列聚类分析的一组数据。数据集中一共包含

600 组数据，每一组数据都有 60 个分量，也就是数据是 60 维的。数

据一共可以分成 6 个聚类，分别是：

1-100 Normal （正常）

101-200 Cyclic （循环）

201-300 Increasing trend （增加趋势）

301-400 Decreasing trend （减少趋势）

401-500 Upward shift （上升变化）

501-600 Downward shift （下降变化）

2. 数据预处理

由于本数据集的数据维数较多，所以本实验采用了结构体来存

储 60 维的数据，并使用指针来进行对数据的操作，以提高速度。

在数据预处理过程中，首先将数据从 data 文件中读出，后依次存入

结构体数组 dataset[600]中。

3. k-means 聚类算法

　 k-means 算法接受参数 k ；然后将事先输入的 n 个数据对象

划分为 k 个聚类以便使得所获得的聚类满足：同一聚类中的对象

相似度较高；而不同聚类中的对象相似度较小。聚类相似度是利

用各聚类中对象的均值所获得一个“中心对象”（引力中心）来进行

计算的。

　　K-means 算法是最为经典的基于划分的聚类方法，是十大经

典数据挖掘算法之一。K-means 算法的基本思想是：以空间中 k

个点为中心进行聚类，对最靠近他们的对象归类。通过迭代的方

法，逐次更新各聚类中心的值，直至得到最好的聚类结果。

（1）算法思路：

首先从 n 个数据对象任意选择 k 个对象作为初始聚类中心；

而对于所剩下其它对象，则根据它们与这些聚类中心的相似度

（距离），分别将它们分配给与其最相似的（聚类中心所代表

的）聚类；然后再计算每个所获新聚类的聚类中心（该聚类中所

有对象的均值）；不断重复这一过程直到标准测度函数开始收敛

为止。一般都采用均方差作为标准测度函数. k 个聚类具有以下特

点：各聚类本身尽可能的紧凑，而各聚类之间尽可能的分开。

该算法的最大优势在于简洁和快速。算法的关键在于初始中

心的选择和距离公式。

（2）算法步骤：

step.1---初始化距离 K 个聚类的质心（随机产生）

step.2---计算所有数据样本与每个质心的欧氏距离，将数据

样本加入与其欧氏距离最短的那个质心的簇中（记录其数据样本

的编号）

step.3---计算现在每个簇的质心，进行更新，判断新质心是

否与原质心相等，若相等，则迭代结束，若不相等，回到 step2

继续迭代。

4. 数据挖掘实现的源代码

//111060850.cpp KMeans 聚类算法

#include "stdafx.h"

#include<iostream>

#include<math.h>

#include<stdlib.h>

#include<string>

#include<fstream>

#include<time.h>

using namespace std;

const int N=36000; //数据个数

const int D=60; //数据维度

struct DataSet{ //用来存储数据的结构体

double arg[D];

};

const int K=6; //集合个数

int *CenterIndex; //质心索引集合

//struct DataSet *Center; //质心集合

//struct DataSet *CenterCopy[];

DataSet Center[K]; //保存现在的质心

DataSet CenterCopy[K]; //保存上一次迭代中的质心

//double *DataSet;

int Cluster[6][N/D]; //保存每个簇包含的数据的索引值

剩余11页未读，继续阅读

评论收藏

内容反馈

资源评论

资源反馈

评论星级较低，若资源使用遇到问题可联系上传者，3个工作日内问题未解决可申请退款~

zyx05

2014-09-30

的确是可以运行,值得学习
wuyou111

2014-06-12

的确是可以运行，代码也算容易懂
caoyun9006

2013-08-28

可以运行，代码易懂，不错的参考。
bfsgsh

2013-07-02

非常不错，很有参考价值，提供了分析的方法，并有比对的参考方案！

麦麦大

粉丝: 163
资源: 15

上传资源快速赚钱

我的内容管理展开

我的资源快来上传第一个资源

我的收益

登录查看自己的收益

我的积分登录查看自己的积分

我的C币登录后查看C币余额

我的收藏

我的下载

下载帮助

前往需求广场，查看用户热搜

数据挖掘kmeams算法实现聚类分析

数据挖掘算法之聚类分析

数据挖掘中几种聚类算法的分析比较.pdf

基于遗传算法的聚类分析论文

kmeams及svm算法（含数据及实验报告）

k-means-Clustering-Hierarchical-Clustering-:电影分级的k均值聚类和分层聚类

数据挖掘聚类分析算法

数据挖掘中聚类分析的算法研究.pdf

Java实现k_means算法进行聚类分析

数据挖掘之聚类分析算法综述.pdf

K-Means聚类分析算法C语言实现

遗传算法数据聚类遗传算法数据聚类

基于数据挖掘的一种聚类分析方法在PDM系统中的应用研究.pdf

大数据技术分享 数据挖掘算法之聚类算法-层次聚类算法 共34页.ppt

常用数据挖掘的聚类算法

数据挖掘中聚类分析算法及应用研究.pdf

数据挖掘中聚类分析算法性能分析.pdf

一个模糊聚类分析算法的研究与实现

聚类分析算法实现clustering-algorithms-master

数据挖掘导论-ch11 聚类分析 - 其他算法1

基于划分的数据挖掘K-means聚类算法分析.pdf

数据挖掘中的聚类分析研究

k - means聚类分析算法

数据挖掘概念与技术原书第2版第7章 数据挖掘算法之聚类分析算法 共38页.ppt

聚类分析常用数据集

聚类分析OPTICS算法python实现

聚类分析ISODATA算法VC++实现

聚类分析C均值算法VC++实现

聚类分析经典算法讲解及实现.docx

DBSCAN_matlab:Matlab中DBSCAN聚类分析算法的实现

最新资源

大数据技术分享数据挖掘算法之聚类算法-层次聚类算法共34页.ppt

数据挖掘概念与技术原书第2版第7章数据挖掘算法之聚类分析算法共38页.ppt