没有合适的资源?快使用搜索试试~ 我知道了~
聚类算法与代码实践.
资源推荐
资源详情
资源评论
聚类算法与代码实践
Dezeming Family
Dezeming
Copyright © 2021-09-06 Dezeming Family
Copying prohibited
All rights reserved. No part of this publication may be reproduced or transmitted in any form
or by any means, electronic or mechanical, including photocopying and recording, or by any
information storage or retrieval system, without the prior written permission of the publisher.
Art. No 0
ISBN 000–00–0000–00–0
Edition 0.0
Cover design by Dezeming Family
Published by Dezeming
Printed in China
目录
0.1 本书前言 5
1 K-Means 聚类方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1 算法原理 6
1.2 算法优缺点以及改进 8
1.3 用于聚类的数据集 9
1.4 K-means++Python 代码 10
2 均值漂移聚类法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.1 算法原理 16
2.2 代码实践 17
3 DBSCAN——基于密度的算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.1 算法原理 18
3.2 代码实战 18
4 基于 GMM 的 EM 聚类 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4.1 算法原理 22
4.2 算法数学细节 23
4.3 代码实战 25
3
5 凝聚层次聚类 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.1 算法原理 29
5.2 代码实战 30
6 CFSFDP 聚类算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
6.1 算法基本原理 31
6.2 算法流程描述 33
6.3 代码实战 35
Literature . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
前言及简介
DezemingFamily 系列书和小册子因为是电子书,所以可以很方便地进行修改和重新发布。如果您
获得了 DezemingFamily 的系列书,可以从我们的网站 [https://dezeming.top/] 找到最新版。对
书的内容建议和出现的错误欢迎在网站留言。
0.1
本书前言
聚类算法已经广泛应用于多种学科,尤其是信号分析、模式识别等领域。在很多情况下,我
们并不知道样本的类别,但是可以通过一些聚类方法,将样本进行划分,然后对划分好的每个类
别单独进行分析。
聚类的方法有很多种,例如通过阈值进行一刀切的方法、根据离种子点的距离分类的方法等,
我们可以大致区分为“很容易想到的方法”以及“不太容易想到的方法”。这些方法并不会有明显
的好坏之分,对应不同的场景我们可以选择不同的方法。
为了更容易理解,聚类中的“簇(cluster)”我们一般会描述为“类”,即分类为几个“簇”。
本书会介绍常用的聚类算法,并分析算法的优劣,以及给出 Python 代码示例。
第一版我会给出 K-Means++、DBSCAN 以及 GMM-EM 聚类算法的详细代码构建过程。K-
Means++ 作为最经典和基础的聚类算法,一般是一定要掌握的;DBSCAN 算法因为可以对一些
比较复杂的数据分布进行聚类(例如同心圆、弧线),因此也会详细介绍代码实现过程;基于期望
最大化的高斯混合模型因为具有一定的理论意义,尤其是涉及概率模型,所以也进行详细的代码
构建讲解。
其余算法因为功能和流程的相似性,读者对照已有代码自行构建也会比较容易;CFSFDP 算
法虽然比较麻烦,但伪代码描述非常详细,因此构建也不会非常困难。等日后有需要,或者根据
读者反映的情况来对其他算法的代码实践部分进行补充。
本书的数据和源码会发布在 DezemingFamily 的网站上,需要将.pdf 文件改为.zip 方可解压
并使用。尽管提供了源码,这里还是希望读者能够自己动手敲一遍代码,多加几个调试语句,来
分析输出结果以及各个环节的数据类型和格式,这样才能更好地理解各种聚类算法。
5
剩余35页未读,继续阅读
资源评论
July工作室
- 粉丝: 1618
- 资源: 503
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功