论文研究-基于经验分解技术的流动客户识别与细分研究 .pdf

所需积分/C币:9 2019-08-15 13:01:07 339KB .PDF
15
收藏 收藏
举报

基于经验分解技术的流动客户识别与细分研究,蓝茹,徐蔚然,近几年,随着国内电信企业的不断发展,电信行业的竞争也日趋白热化,电信企业之间对客户的争夺越来越激烈。电信企业需要通过细分
国武技论文在线 初始化 提起第个本征模函数 初始化: 获得的局部极大值和极小值 利用二次样条对 的极大值和极小值 进行插值求其上下包络线 根据上下包络线的均值求平均包络线 否 满足本征模函数标准 是 极值点数少于2个 合 是 是 趋势 图 算法平稳化流程图 降维处(时间序列的分段与其序列转化)。 该过程分为分段与齐序列转化两步。 可以采用提出的基于自底向上分段方法,对趋势系列进行分段并将每一段表示 国武技论文在线 为 的形式。 接下来可以将现在的分段结果转化为由 构成的齐序列。只体算法如下 找出分段序列的每一段的最右端数据点得橫坐标,并从小到大进行排序成序列 对于分段序列的每一段,如果中小于或者等于该段的最右端数据点的横坐标 大于最左端数据点樻舉标的个数是,该段航被继续分为段。 重新用 表示分段。 把上述分段表示成 齐序列。 设序列表示为 且 则 () 基于 的数据挖掘算法 是一种数据预处理技术。我们可以将与数据挖掘算法相结合 从技术上的定义,数据挖掘 是从大量的、随机的、不完全的、有噪声的、 模糊的数据中提取隐含的、有潜在用处的信息和知识的过程。目标是从数据库中发现隐含的 有意义的知识。 数据挖掘有神经网络,遗侒算法,决策树等几种方式,我们选择最通用的决策树算法来 完成流动客广识别的建模。 基于 的 聚类算法 聚类算法是由 提出的一种基于划分的聚类算法。该算法既简单又具 有收敛速度快的特氐,非常适用于大规模数据集合聚类。 给定一个数据集合 以及要生成的簇的数目, 聚类算法能在 线性时间内给出具有的外形的聚类结果。 聚类算法流程 对于给定的数据集合 从集合中选择个对象作为初始簇中心 将中所有的点分配到最近的簇 重新计算每个簇的中心 重复该过程直至簇中心不再发生变化。 本文是将技术与 聚类算法相结合,应用与流动客户的细分过程中 国武技论文在线 基于 技术的模型的实现 数据准备 客户选择 从数据仓库中获取名客户群体清单,将明确为流动的客户作为目标客户,标记为 分类模型中的“”;同时对比具有明确本地身份的移动客户标记为分类模型中的“”,流 动群体识别模型就是找到一定的规则来最好地区分“”和“”,也即通过决策树模型,发 现某些规则,在这些规则下找到可能是流动客户的可能性最高。 数据整理 将所有数摭整理成张报表,分别为:客户基本信息表(对所有正常用户统计月上月月 底的数据)、用户基木包对应及说明表(对所有正常用户显示最新信息)、用户账单 信息衣(对所有正常用户统计月前三个月的薮据,再将三个月数据按下述说明汇总)、 用户语音消费明细(对所有止常用户计月前三个月月底的数据)、用户使用基站列衣 (对所有正常用户统计月前三个月的 数据,再将三个月数据按下述说明汇总)、用户 交往圈表(对所有正常用户统计月前三个月的 数据,再将三个月数据按下述说明汇 总)、用户交费眀细表(对所有正常用户统计月前三个月的 数据) 建模衍生变量(挖掘信息宽表) 根摭以上基础变量信息,我们构造了反映流动客户行为模式的可能的衍生变量,衍生变 量共计个左右,覆盖了客户的属性信息,通话行为,交往圈行为和缴费行为,能够全面 的措述流动客户的所有可能特征。 利用技术进行数据预处理 利用中的的算法将挖掘信息宽表中的通话行为等时间序列数据进行预处理。将所有 时间序列转化为齐序列 流动客户识别模型 识别模型变量筛选 模型变量奅选即属性选择的过程,木文选用包装的方法直接将所冇变量直接输入算 法,由算法选岀具有最佳挖掘结果的·组变量。利用决策树,最终从总计约个衍生变量 中°选出最能区分流动客户和本地人的四个变量;其余变量由于区分度不高或与这四个变量 相关因而没有入选最终规则。所选的四个变量则可以完全地准确地找出流动客户,所以最后 只保留以下四个变量。(见表) 表最终变量选择表 变量名 变量描述 本地交往圈中流动客户个数占比 流动客户即具有明确外地身份的移动客户 本地交往圈中本地客户个数占比 本地客广即具有明确本地身份的 移动客户 过去三个月长途通话均时长 长途通话半均时长/半均通话总时长 占平均通话总时长之比 所属地市 客户所属地市代码 国武技论文在线 识别模型建立 根据上述过程,从决策树中提取出分类规则,并以流动客户可能性标准进行分类(见表 表分类规刀 分类斧选规则 流动客户 概率 交往圈屮流动客户个数占比 过去三个月长途 通话平均时长占平均总时长之比 交往圈中本地客户个数占比 所属地市 交往圈中流动客户个数占比 过去三个月长途通话半均时长占半均总时长之比交往圈中本 地客户个数占比 交往圈中本地客户个数占比 过去三个月长途通话平均时长占平均总时长之比 交往圈中流 动客户个数占比 交往圈屮流动客户个数占比 过去三个月长途通话平均时长 山平均总时长之比 交往圈屮本地客户个数古比 交往圈中本地客户个数占比 过去三个月长 途通话平均时长占平均总时长之比 交往圈中流动客户个数占 所属地市 交往圈中流动客户个数占比 过去三个月长途通话平均时长占平均总时长之比交往圈中本 地客户个数占比 过去三个月长途通话半均时长占半均总时长之比 交往图中流动客户个数占比 交往圈中本地客 户个数占比 (续表) 分类筛选规则 流动客户 概率 交往圈中流动客户个数占比 过去三个月长途通话平均时长 占平均总时长之比 交往圈中本地客户个数占比 交往圈中流动客户个数比 交往圈中本地 客户个数占比 模型结果分析 流动客户的长途通话较多,所以长途通话时长占比越高,其为流动客户的可能性越高。 流动客户较多地与流动客户交往,所以交往圈中与流动客户交往个数占比越高,其为流 动客户的可能性越高 流动客户与本地人交往较少,而本地人与本地人交往较多,所以交往圈中的本地客户占 比越晑,其为沇动客户的可能性越低 经验上,某些地市的流动客户占比较髙,其它地市较少统计数据和模型结果证实了以上 判断。 模型应用 利用流动客户识别模型给所有当市移动客户打分,分值代表其是流动客户的可能性,分 值越高代表是流动客户的可能性越人。 流动客户细分模型 沇动市场作为移动重要市场之“,其沇动客户在移动通信行为上衣现出差异化的消费 国武技论文在线 特征,这些特征与其真实需求是紧密相关的。流动客广细分模型是在流动客户识别模型的基 础上分析并计算流动客户的消费特征,将流动客户细分为多客户群,以达到精细化营销的目 模型建立的原理 通过模型细分不同需求的流动客户群体,是建立客户细分模型的现实目标。也是本文研 究的重点。为实现细分日标,本文引入了基于 聚炎算法建立细分模型。 移动流动客户细分模型如图: 步骤 步骤二 群体标识 与指标探索 模型初步构建与修正 外来工客户群体 无营销 意义的结果 指标体系的选取 变量数据处理 模型运算模型中间结果→得有效的 调整参数 分组结果 ■结合认別模型与业务名单选定入模的外来工客尸 的初步模型运算 群体 对获得的口问结果进行业务判断 ■从业务角度与建模经验出发获得待选变量,然后 对无意义的分组结果进行参数调整,直至获得稳定可解释 根据现有薮据情况,经过数据处坦获得最终变量 的分组结果 图2某省移动流动客户细分模犁 原理是针对业务关注的流动客户营销点,通过距离度量客户之间的相似程度,获得只有 各种需求特征的细分组。 模型建立 建模流程描述为: )利用算法对识别模型识别出的流动客户进行全部的属性数据平稳化处理 )将趋势序列进行分段处理 )把分段序列转化成由 构成的齐序列 用 聚类算法进行聚类 模型结果展示 根摭上述模型对这个流动客户进行细分,得到了就有不同特征的客户群 国武技论文在线 表流动客户细分群 类型名称 细分指标规则 人数所占比例 本地长途型 非漫游长途通话时长占比总的非漫游长途通话时长占比 省内漫游型 省内漫游通话时长人均省内漫游通话时长 省内漫游通话时长省际漫游通话时长 省际漫游型 省际漫汸通话时长人均省际通话时长 省内漫游通话时长省际漫游通话时长 本地繁忙型 未包含在本地长途、省内漫游、省际漫游分组的客户 新业务型 新业务费用占比总体平均水平 新业务开通数个值根据各省情况而定 信息需求型手机报等 娱乐需求型 手机等 模型应用 根据上述细分的结果我们可以找到每个客户群所对应的客户并对不同的客户群推出不 同的优惠方案,保证用户在网时长减少用户离网率 结束语 本文给出了识別和细分流动客户的模型建立流程。力求在数据挖掘技术,机器学习的基 础上结合目前移动通信行业激烈竞争的现状,对流动客户进行深入的硏究,将动态数据挖掘 技术应用于移动通信市场分析中,找出其内在的关联规则,以为不同用户组提供不同的业务, 达到匹配营销。 本文创新之处在于将进入了流动客户的识别与细分模型中,在一定程度上保证了 动态时间序列的顶处理效果 参考文献 电信业客户流失管理肖橹北京:人民邮电出版社 倪志伟、倪丽萍、刘慧婷等动态数据挖掘北京:科学出版社, 郭斯羽动态数据中的数据挖掘研究浙江浙江人学 杨善林倪志伟机器学习与智能决策攴持系统北京:中国科学出版社, 经营分析系统中国移动,

...展开详情
试读 8P 论文研究-基于经验分解技术的流动客户识别与细分研究 .pdf
立即下载
限时抽奖 低至0.43元/次
身份认证后 购VIP低至7折
一个资源只可评论一次,评论内容不能少于5个字
您会向同学/朋友/同事推荐我们的CSDN下载吗?
谢谢参与!您的真实评价是我们改进的动力~
  • 至尊王者

关注 私信
上传资源赚钱or赚积分
最新推荐
论文研究-基于经验分解技术的流动客户识别与细分研究 .pdf 9积分/C币 立即下载
1/8
论文研究-基于经验分解技术的流动客户识别与细分研究 .pdf第1页
论文研究-基于经验分解技术的流动客户识别与细分研究 .pdf第2页

试读结束, 可继续读1页

9积分/C币 立即下载