AP聚类算法介绍.docx资源-CSDN文库

版权申诉

197 浏览量 2023-03-11 21:24:14 上传评论收藏 642KB DOCX 举报

资源推荐

资源详情

资源评论

AP 聚类算法

1.分类与聚类

1.1 分类算法简介

分类(classification )是找出描述并区分数据类或概念的模型(或函数)，以

便能够使用模型预测类标记未知的对象类。

在分类算法中输入的数据，或称训练集（ Training Set），是一条条的数据

库记录（Record）组成的。每一条记录包含若干条属性（Attribute），组成一个

特征向量。训练集的每条记录还有一个特定的类标签（Class Label）与之对应。

该类标签是系统的输入，通常是以往的一些经验数据。一个具体样本的形式可为

样本向量:(v , v , ... , v ; c)。在这里 v 表示字段值,c 表示类别。

1

2

n

i

分类的目的是：分析输入的数据，通过--在训练集中的数据表现出来的特性，

为每一个类找到一种准确的描述或者模型。这种描述常常用谓词表示。由此生成

的类描述用来对未来的测试数据进行分类。尽管这些未来的测试数据的类标签是

未知的，我们仍可以由此预测这些新数据所属的类。注意是预测，而不能肯定。

我们也可以由此对数据中的每一个类有更好的理解。也就是说：我们获得了对这

个类的知识。

下面对分类流程作个简要描述：

训练：训练集——>特征选取——>训练——>分类器

分类：新样本——>特征选取——>分类——>判决

常见的分类算法有：决策树、KNN 法(K-Nearest Neighbor)、SVM 法、VSM 法、

Bayes 法、神经网络等。

剩余11页未读，继续阅读

内容反馈

版权申诉

若♡

粉丝: 6186
资源: 1万+

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip