目 录
一.解决方案概述 ........................................................................................................................... 1
1.1 问题描述与数据概览 ........................................................................................................ 1
1.2 算法整体思路概述 ............................................................................................................ 1
二.数据预处理 ............................................................................................................................... 2
2.1 缺失值的填充 .................................................................................................................... 2
2.2 数据类型的转换 ................................................................................................................ 2
2.3 折扣率转换 ........................................................................................................................ 2
三.数据划分与打标 ....................................................................................................................... 3
3.1 训练集打标原则 ................................................................................................................ 3
3.2 训练集与预测集构建 ........................................................................................................ 3
3.2.1 方案一 ..................................................................................................................... 4
3.2.2 方案二 ..................................................................................................................... 4
3.2.3 方案三 ..................................................................................................................... 5
四.特征工程 ................................................................................................................................... 6
4.1 属性类型划分 .................................................................................................................... 6
4.2 特征群划分 ........................................................................................................................ 6
4.3 相关特征离散化 ................................................................................................................ 6
4.3.1 distance 距离特征离散化 ........................................................................................ 6
4.3.2 时间信息处理 ......................................................................................................... 6
4.4 单个属性可提取特征 ........................................................................................................ 7
4.5 子特征群简介 .................................................................................................................... 8
4.6 消费日期行为特征 ............................................................................................................ 9
4.7 打标当月排序特征 .......................................................................................................... 10
4.8 行为比率特征 .................................................................................................................. 10
五.特征选择 ................................................................................................................................. 11
5.1 传统的特征选择方案 ...................................................................................................... 11
5.2 基于视图的特征选择方案 .............................................................................................. 11
六.类别不平衡处理 ..................................................................................................................... 13
七.模型设计与融合 ..................................................................................................................... 13
7.1 模型设计 .......................................................................................................................... 13
7.2 多模型融合 ...................................................................................................................... 13
7.2.1 异构模型的实现 ................................................................................................... 13
7.2.2 多模型融合方案简介 ........................................................................................... 14
评论0