·
低价值客户五类。
(2)考虑到商用航空行业与一般商业形态的不同,国内外航空公司在
RFM 模型的基础上,还加上了 L 客户关系时长以及 C 客户所享受的平
均折扣率这两个特征用于客户分群与价值分析,得到航空行业的 LRFMC
模型:
Length of Relationship: 客户关系时长,反映可能的活跃时长。
Recency: 最近消费时间间隔,反映当前的活跃状态。
Frequency: 客户消费频率,反映客户的忠诚度。
Mileage: 客户总飞行里程,反映客户对乘机的依赖性。
Coe*cient of Discount: 客户所享受的平均折扣率,侧面反映客户价
值高 低。
LRFMC 对应到数据集的字段为:
L = LOAD_TIME - FFP_DATE
R = LAST_TO_END
F = FLIGHT_COUNT
M = SEG_KM_SUM
C = avg_discount
我们可以移除我们不关心的属性(列),即只保留 LRFMC 模型需要的
属 性。
(3)对特征进行标准化,使得各特征的均值为 0、方差为 1,方便之后
对数据的处理。
三、模型训练与对数据的预测阶段。
(1)因为我们的目的是想要将客户群体细分为重要保持客户、重要发
展 客户、重要挽留客户、一般客户、低价值客户五类,于是我们可以用
k-means 聚类算法进行聚类,类别的数量可以人为控制。而且前面我们已
经通过数据处理得到了我们 LRFMC 模型需要的特征,接下来就使用 k-
means 聚类算法来分析数据。在这一过程中我们可以使用机器学习库
scikit-learn 中现有的 kmeans 函数来实现。
(2)对于 k-means 聚类算法,其目标是把 n 个观测样本划分成 k 个群
体 (cluster),每个群体都有一个中心(mean)。每个样本仅属于其中
一个群 体,即与这个样本距离最近的中心的群体。
四、分析与决策。
(1)利用雷达图对模型学习出的 5 个群体的特征进行可视化分析。
三、具体实现(60%)
一. 模型建模
对于 LRFMC 模型的创建
3
- 1
- 2
- 3
- 4
前往页