# Clustering-Algorithms
  在“无监督学习”(unsupervised learning)中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础。此类学习任务中研究最多、应用最广的是“聚类”(Clustering)。
  聚类试图将数据集中的样本划分为若干个通常是不相交的子集,每个子集称为一个“簇”(Cluster)。通过这样的划分,每个簇可能对应于一些潜在概念(类别),这些概念对聚类算法而言事先是未知的,聚类过程仅能自动形成簇结构,簇所对应的概念语义需由使用者来把握和命名。
  聚类既能作为一个单独过程,用于寻找数据内在的分布结构,也可以作为分类等其他学习任务的前驱过程。例如,在一些商业应用中需对新用户的类型进行判别,但定义“用户类型”对商家来说却不太容易,此时往往可以先对用户数据进行聚类,根据聚类结果将每个簇定义为一个类,然后再基于这些类来训练分类模型,用于判别新用户的类型。
  基于不同的学习策略,人们设计出多种类型的聚类算法。这里我们用Python实现了四种较为常见的聚类算法,具体包括:以K-Means、GMM为代表的原型聚类算法、以DBSCAN为代表的密度聚类算法、以AGNES为代表的层次聚类算法。

程序媛小y
- 粉丝: 5632
最新资源
- 计算机病毒及预防课件知识分享.ppt
- Excel在会计凭证中的应用培训讲义ppt课件.ppt
- 自动化专业求职信.docx
- 小学语文《落花生》信息化教学设计教材课程.doc
- Canny边缘检测算法总结.pdf
- 电子商务解决方案.doc
- 2022互联网创新创业计划书.docx
- 基于时间反演技术的超宽带无线通信电磁仿真研究的开题报告.docx
- 配网自动化主站系统研究的开题报告.docx
- 2023年程序设计基础离线作业.doc
- 第八章-项目管理.pptx
- IT新技术云计算.doc
- 中职德育课信息化教学设计案例.docx
- 国家地名数据库管理系统版功能和应用讲课资料.ppt
- MATLAB的离散傅里叶变换的仿真设计.doc
- 基于大数据平台的电力营销信息化建设-1.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈


