没有合适的资源?快使用搜索试试~ 我知道了~
聚类分析基础PPT学习教案.pptx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 138 浏览量
2021-10-06
00:18:38
上传
评论
收藏 1.11MB PPTX 举报
温馨提示
试读
64页
聚类分析基础PPT学习教案.pptx
资源推荐
资源详情
资源评论
会计学 1
聚类分析基础
什么是聚类分析?
聚类分析
聚类分析 (cluster analysis) 简称聚类 (clustering ) ,是一个把数据对象 ( 或
观测 ) 集划分成子集的过程。每个子集是一个簇 (cluster) ,使得簇中的对象彼
此相似,但与其他簇中的对象不相似。
相异性和相似性根据描述对象的属性值评估。
由于簇是数据对象的集合,簇内的对象彼此相似,而与其他簇的对象不
相似,因此数据对象的簇可以看做隐含的类。在这种意义下,聚类有时
又称自动分类。
第 1 页 / 共 65 页
什么是聚类分析?
在机器学习领域,分类称做监督学习,因为给定了类标号
信息,即学习算法是监督的,因为它被告知每个训练元组
的类隶属关系。
聚类被称做无监督学习 (unsupervised learning ) ,因
为没有提供类标号信息。
数据对象的簇可以看做隐含的类。与分类的区别是,聚类
可以自动地发现这些分组,这是聚类分析的突出优点。
聚类分析的数据挖掘功能
作为一个独立的工具来获得数据分布的情况
作为其他算法(如:特征化、属性子集选择和分类)的预处理
步骤
第 2 页 / 共 65 页
聚类分析在数据挖掘中的应用分
析
聚类在数据挖掘中的典型应用有:
聚类分析可以作为其它算法的预处理步骤:利用聚类进
行数据预处理,可以获得数据的基本概况,在此基础上
进行特征抽取或分类就可以提高精确度和挖掘效率。也
可将聚类结果用于进一步关联分析,以获得进一步的有
用信息。
可以作为一个独立的工具来获得数据的分布情况:聚类
分析是获得数据分布情况的有效方法。通过观察聚类得
到的每个簇的特点,可以集中对特定的某些簇作进一步
分析。这在诸如市场细分、目标顾客定位、业绩估评、
生物种群划分等方面具有广阔的应用前景。
聚类分析可以完成孤立点挖掘:许多数据挖掘算法试图
使孤立点影响最小化,或者排除它们。然而孤立点本身
可能是非常有用的。如在欺诈探测中,孤立点可能预示
着欺诈行为的存在。
第 3 页 / 共 65 页
聚类分析的典型应用
聚类分析已经广泛地用于许多应用领域,包括商务智能、图像模式识别、
Web 搜索、生物学和安全等。
商务应用中,帮市场分析人员发现不同的顾客群
模式识别
Web 搜索
对 WEB 上的文档进行聚类
对 WEB 日志的数据进行聚类,以发现相同的用户访问模式
第 4 页 / 共 65 页
剩余63页未读,继续阅读
资源评论
woshifafuge
- 粉丝: 6
- 资源: 58万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功