# Clustering-Algorithms
  在“无监督学习”(unsupervised learning)中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础。此类学习任务中研究最多、应用最广的是“聚类”(Clustering)。
  聚类试图将数据集中的样本划分为若干个通常是不相交的子集,每个子集称为一个“簇”(Cluster)。通过这样的划分,每个簇可能对应于一些潜在概念(类别),这些概念对聚类算法而言事先是未知的,聚类过程仅能自动形成簇结构,簇所对应的概念语义需由使用者来把握和命名。
  聚类既能作为一个单独过程,用于寻找数据内在的分布结构,也可以作为分类等其他学习任务的前驱过程。例如,在一些商业应用中需对新用户的类型进行判别,但定义“用户类型”对商家来说却不太容易,此时往往可以先对用户数据进行聚类,根据聚类结果将每个簇定义为一个类,然后再基于这些类来训练分类模型,用于判别新用户的类型。
  基于不同的学习策略,人们设计出多种类型的聚类算法。这里我们用Python实现了四种较为常见的聚类算法,具体包括:以K-Means、GMM为代表的原型聚类算法、以DBSCAN为代表的密度聚类算法、以AGNES为代表的层次聚类算法。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
在“无监督学习”(unsupervised learning)中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础。此类学习任务中研究最多、应用最广的是“聚类”(Clustering)。 聚类试图将数据集中的样本划分为若干个通常是不相交的子集,每个子集称为一个“簇”(Cluster)。通过这样的划分,每个簇可能对应于一些潜在概念(类别),这些概念对聚类算法而言事先是未知的,聚类过程仅能自动形成簇结构,簇所对应的概念语义需由使用者来把握和命名。 聚类既能作为一个单独过程,用于寻找数据内在的分布结构,也可以作为分类等其他学习任务的前驱过程。例如,在一些商业应用中需对新用户的类型进行判别,但定义“用户类型”对商家来说却不太容易,此时往往可以先对用户数据进行聚类,根据聚类结果将每个簇定义为一个类,然后再基于这些类来训练分类模型,用于判别新用户的类型。 基于不同的学习策略,人们设计出多种类型的聚类算法。这里我们用Python实现了四种较为常见的聚类算法,具体包括:以K-Means、GMM为代表的原型聚类算法、以DBSC
资源推荐
资源详情
资源评论
收起资源包目录
基于Python实现了K-Means GMM DBSCAN AGNES等四种常见的聚类算法源码.zip (8个子文件)
code
K-Means
dataSet.csv 2KB
k-means.py 5KB
DBSCAN
dbscan.py 4KB
GMM
sample.data 5KB
gmm.py 6KB
README.md 1KB
AGNES
agnes.py 5KB
git_test.md 12B
共 8 条
- 1
资源评论
FL1768317420
- 粉丝: 4306
- 资源: 4728
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于51单片机+共阴极数码管设计00-99计数器Proteus仿真+软件程序C源代码.zip
- 基于STM32的单片机动态加载函数库设计源码 - dynamic_loader
- 基于51单片机设计可预置可逆4位计数器Proteus仿真+软件程序C源代码.zip
- xiaomi10青春版完好机备份基带qcn.qcn
- 基于51单片机的汉字点阵显示Proteus仿真+软件程序C源码.zip
- 甘晴void:一位多才多艺的编程新星.zip
- 基于C++的App图标资源库设计源码 - libicon
- 基于Java的日记本应用程序设计源码 - Diary
- 基于C#的.NET模板引擎设计源码 - jntemplate
- 基于51单片机+AC24C04+LCD1602显示的电子密码锁程序源代码及电路仿真.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功