SAS 中的聚类分析方法总结(1)——聚类分析概述
说起聚类分析,相信很多人并不陌生。这篇原创博客我想简单说一下我所理解的聚类分析,
欢迎各位高手不吝赐教和拍砖。
按照正常的思路,我大概会说如下几个问题:
1. 什么是聚类分析?
2. 聚类分析有什么用?
3. 聚类分析怎么做?
下面我将分聚类分析概述、聚类分析算法及 sas 实现、案例三部分来系统的回答这些问题。
聚类分析概述
1. 聚类分析的定义
中国有句俗语叫“物以类聚,人以群分”——剔除这句话的贬义色彩。说白了就是物品根据物
品的特征和功用可以分门别类,人和人会根据性格、偏好甚至利益结成不同的群体。分门别
类和结成群体之后,同类(同群)之间的物品(人)的特征尽可能相似,不同类(同群)之
间的物品(人)的特征尽可能不同。这个过程实际上就是聚类分析。从这个过程我们可以知
道如下几点:
1) 聚类分析的对象是物(人),说的理论一点就是样本
2) 聚类分析是根据物或者人的特征来进行聚集的,这里的特征说的理论一点就是变量。
当然特征选的不一样,聚类的结果也会不一样;
3) 聚类分析中评判相似的标准非常关键。说的理论一点也就是相似性的度量非常关键;
4) 聚类分析结果的好坏没有统一的评判标准;
2. 聚类分析到底有什么用?
1) 说的官腔一点就是为了更好的认识事物和事情,比如我们可以把人按照地域划分为南
方人和北方人,你会发现这种分法有时候也蛮有道理。一般来说南方人习惯吃米饭,北方习
惯吃面食;
2) 说的实用一点,可以有效对用户进行细分,提供有针对性的产品和服务。比如银行会
将用户分成金卡用户、银卡用户和普通卡用户。这种分法一方面能很好的节约银行的资源,
另外一方面也能很好针对不同的用户实习分级服务,提高彼此的满意度。
再比如移动会开发全球通、神州行和动感地带三个套餐或者品牌,实际就是根据移动用户的
行为习惯做了很好的用户细分——聚类分析;
3) 上升到理论层面,聚类分析是用户细分里面最为重要的工具,而用户细分则是整个精
准营销里面的基础。精准营销是目前普遍接纳而且被采用的一种营销手段和方式。
3. 聚类分析的流程是怎样的?
比较简单的聚类分析往往只根据一个维度来进行,比如讲用户按照付费情况分成高端用户、
中端用户和低端用户。这 个只需要根据商业目的统计一下相关数据指定一个高端、中端和
低端的分界点标准就可以。
如果是比较复杂的聚类分析,比如移动里面经常会基于用户的多种行为(通话、短信、gprs