客户分类:项目概述
对英国企业的客户进行了分析,以了解客户行为并提供准确的目标市场。
使用了来自541909客户的数据,并使用python进行了分析。
根据客户的消费习惯和消费金额创建客户群。
优化的朴素贝叶斯,逻辑回归,支持向量分类器和XGBoost以达到最佳模型。
使用的代码和资源
Python版本3.7
包装:熊猫,numpy,sklearn,matplotlib,seaborn
资料清理
我进行了以下更改并创建了以下变量:
删除了具有空值的变量CustomerID
在客户总支出的新列中创建了一个列
向量化的说明列,以准备要分析的文本
集群形成
形成三个集群
建筑模型
为了选择模型,我使用百分位数将顾客根据购买频率对顾客进行分类。我尝试了4种不同的模型:
朴素贝叶斯
逻辑回归
支持向量分类器
XGBoost
模型表现
XGboost模型的性能稍逊于逻辑回归模型,其中朴素贝叶斯和支持向