###DataMining-KMeans Guide:
--系统结构图:
![image](http://git.oschina.net/wangcong/datamining-kmeans/raw/master/figure/QQ20130712-2.png)
* 第一步配置好数据库SQL Server 2008:配置sa用户的密码为wangcong9188.
(注:数据库文件在项目的根目录database文件夹里面.)
![image](http://git.oschina.net/wangcong/datamining-kmeans/raw/master/figure/QQ20130712-5.png)
* 第二步将数据库文件导入到数据库里面.
![image](http://git.oschina.net/wangcong/datamining-kmeans/raw/master/figure/QQ20130712-6.png)
* 第三步就是将项目文件夹import到Eclipse里面Run.
![image](http://git.oschina.net/wangcong/datamining-kmeans/raw/master/figure/QQ20130712-3.png)
* Run后,聚类的结果保存在项目的根目录下面:cluster1~4.txt.
---
**Mario Wang's 主页** ---> [geekmario.com](http://geekmario.com)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
聚类 主要思想: 聚类算法要把M个数据点按照分布分成K类(很多算法的K是人为提前设定的)。我们希望通过聚类算法得到 K个中心点,以及每个数据点属于哪个中心点的划分。 中心点可以通过迭代算法来找到,满足条件:所有的数据点到聚类中心的距离【L2距离】之和是最小的。 中心点确定后,每个数据点属于离它最近的中心点。 如何寻找中心点? 采用 EM算法 迭代确定中心点。流程分两步: ① 更新中心点:初始化的时候以随机取点作为起始点;迭代过程中,取同一类的所有数据点的重心(或质心)作为新中心点② 分配数据点:把所有的数据点分配到离它最近的中心点。 重复上面的两个步骤,一直到中心点不再改变为止。 优点: 简单易用 缺点: 1:中心点是所有同一类数据点的质心,所以聚类中心点可能不属于数据集的样本点。 2:计算距离时我们用的是L2距离的平方。对离群点很敏感,噪声(Noisy Data)和离群点(Outlier)会把中心点拉偏,甚至改变分割线的位置。 3:对初始化敏感,初始化点是随机点
资源推荐
资源详情
资源评论
收起资源包目录
数据挖掘K-Means聚类算法Java实现.zip (39个子文件)
新建文本文档.txt 1KB
datamining-kmeans-master
insertStatement.txt 167KB
.classpath 538B
discreteCluster3.txt 7KB
discreteCluster4.txt 18KB
.settings
org.eclipse.jdt.core.prefs 598B
src
com
datamining
ObjectFromDB.java 2KB
KMeansMain.java 6KB
ConnectDB.java 1KB
KMeans.java 11KB
Tool.java 3KB
Farmland.java 1KB
Cluster.java 2KB
getObjFromDB.txt 53KB
jfreechart-1.0.13.jar 1.36MB
discreteCluster1.txt 663B
jcommon-1.0.16.jar 302KB
figure
QQ20130712-5.png 24KB
QQ20130712-6.png 17KB
QQ20130712-2.png 42KB
QQ20130712-3.png 164KB
cluster3.txt 22KB
database
DataMining_log.ldf 6.75MB
DataMining.mdf 28MB
discreteCluster2.txt 2KB
bin
com
datamining
KMeansMain.class 7KB
KMeansMain$1.class 1KB
ObjectFromDB.class 3KB
Farmland.class 2KB
KMeans.class 8KB
Cluster.class 2KB
ConnectDB.class 2KB
Tool.class 3KB
cluster1.txt 2KB
sqljdbc4.jar 525KB
.project 388B
README.md 884B
cluster2.txt 7KB
cluster4.txt 55KB
共 39 条
- 1
资源评论
野生的狒狒
- 粉丝: 2421
- 资源: 2118
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功