没有合适的资源?快使用搜索试试~ 我知道了~
Affinity_Propagation_(AP)_AP聚类聚类算法介绍
需积分: 50 28 下载量 137 浏览量
2016-03-28
16:37:15
上传
评论
收藏 272KB DOC 举报
温馨提示
试读
13页
Affinity_Propagation_(AP)_AP聚类聚类算法介绍
资源推荐
资源详情
资源评论
AP 聚类算法
1.分类与聚类
1.1 分类算法简介
分类(classication )是找出描述并区分数据类或概念的模型(或函数),以便
能够使用模型预测类标记未知的对象类。
在分类算法中输入的数据,或称训练集(Training Set),是一条条的数据
库记录(Record)组成的。每一条记录包含若干条属性(Attribute),组成一
个特征向量。训练集的每条记录还有一个特定的类标签(Class Label)与之对
应。该类标签是系统的输入,通常是以往的一些经验数据。一个具体样本的形式
可为样本向量:(v
1
, v
2
, ... , v
n
; c)。在这里 v
i
表示字段值,c 表示类别。
分类的目的是:分析输入的数据,通过--在训练集中的数据表现出来的特性,
为每一个类找到一种准确的描述或者模型。这种描述常常用谓词表示。由此生成
的类描述用来对未来的测试数据进行分类。尽管这些未来的测试数据的类标签是
未知的,我们仍可以由此预测这些新数据所属的类。注意是预测,而不能肯定。
我们也可以由此对数据中的每一个类有更好的理解。也就是说:我们获得了对这
个类的知识。
下面对分类流程作个简要描述:
训练:训练集——>特征选取——>训练——>分类器
分类:新样本——>特征选取——>分类——>判决
常见的分类算法有:决策树、 KNN 法(K-Nearest Neighbor) 、SVM 法、
VSM 法、Bayes 法、神经网络等。
1.2 聚类算法简介
聚类(clustering)是指根据“物以类聚”的原理,将本身没有类别的样本聚集成
不同的组,这样的一组数据对象的集合叫做簇,并且对每一个这样的簇进行描述
的过程。
与分类规则不同,进行聚类前并不知道将要划分成几个组和什么样的组,也
不知道根据哪些空间区分规则来定义组。
它的目的是使得属于同一个簇的样本之间应该彼此相似,而不同簇的样本
应该足够不相似。
聚类分析的算法可以分为:划分法(Partitioning Methods)、层次法
( Hierarchical Methods ) 、 基 于 密 度 的 方 法 ( density-based
methods)、基于网格的方法( grid-based methods)、基于模型的方法
(Model-Based Methods)。
经典的 K-means 和 K-centers 都是划分法。
分类与聚类的区别
聚类分析也称无监督学习或无指导学习,聚类的样本没有标记,需要由聚类
学习算法来自动确定; 在分类中,对于目标数据库中存在哪些类是知道的,要做
的就是将每一条记录分别属于哪一类标记出来。聚类学习是观察式学习,而不是
示例式学习。
可以说聚类分析可以作为分类分析的一个预处理步骤。
2.K-MEANS 算法
k-means 算法接受输入量 k ;然后将 n 个数据对象划分为 k 个聚类以便
使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象
相似度较低。簇的相似度是关于簇中对象的均值度量,可以看作簇的质心
(centriod)或重心(center of gravity)。
k-means 算法的工作过程说明如下:首先从 n 个数据对象任意选择 k 个
对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心
的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚
类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不
断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准
测度函数.,其定义如下:
(1)
其中,E 是数据集中所有对象的平方误差和,p 是空间中的点,表示给定对
象, 是簇 的均值(p 和 都是多维的)。换句话说,对于每个簇中的每个
对象,求对象到其簇中心距离的平方,然后求和。这个准则试图使生成的 k 个结
果簇尽可能的紧凑和独立。
例 1:我们在二维空间中随机的生成 20 个数据点,将聚类数目指定为 5 个,
并随机生成一个聚类中心(用“×”来标注),根据对象与簇中心的距离,每个对象
分成于最近的簇。初始示例图如下:
***
剩余12页未读,继续阅读
资源评论
artemisrj
- 粉丝: 78
- 资源: 19
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功