没有合适的资源?快使用搜索试试~ 我知道了~
数据挖掘聚类PPT学习教案.pptx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 178 浏览量
2021-10-05
08:02:51
上传
评论
收藏 1.14MB PPTX 举报
温馨提示
试读
64页
数据挖掘聚类PPT学习教案.pptx
资源推荐
资源详情
资源评论
数据挖掘聚类
23:21 2
什么是聚类
聚类 (clustering) 也称为聚类
分析 , 指将样本分到不同的组
中使得同一组中的样本差异尽
可能的小,而不同组中的样本
差异尽可能的大。
聚类得到的不同的组称为簇
(cluster) 。
一个好的聚类方法将产生以下
的聚类
最大化类中的相似性
最小化类间的相似性
第 1 页 / 共 115 页
23:21 3
聚类与分类的差别
聚类与分类最主要的差别是聚
类的样本不具有类别标号,而
分类的样本具有类别标号。
聚类是无监督学习
(unsupervised learning) ,而
分类是有监督学习
(supervised learning) 。因
此,分类里有训练和测试,而
聚类没有训练。
尽管分类是识别对象组类别的
有效手段,但需要高昂的代价
收集和标记训练样本集。因
此,聚类提供了一种新的处理
模式:先把数据集划分为组,
然后给有限的组指定类别标
号。
第 2 页 / 共 115 页
23:21 4
对聚类方法的一些
要求
可伸缩性
处理不同类型属性的能力
发现任意形状的聚类
用于决定输入参数的领域知识
最小化
处理噪声数据和孤立点的能力
对于输入纪录的顺序不敏感
高维性
基于约束的聚类
可解释性和可用性
第 3 页 / 共 115 页
23:21 5
聚类分析中的数据
类型
数据矩阵
相异度矩阵
第 4 页 / 共 115 页
npnnn
i piii
p
xxxx
xxxx
xxxx
,......,,,
........................
,......,,,
........................
,......,,,
321
321
1131211
0 ............ ),2( ),1(
..............................
0 )3,2( )3,1(
0 )2,1(
0
ndnd
dd
d
剩余63页未读,继续阅读
资源评论
加油学习加油进步
- 粉丝: 1400
- 资源: 52万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功