## 赛题回顾
赛题提供用户在2016年1月1日至2016年6月30日之间真实线上线下消费行为,预测用户在2016年7月领取优惠券后15天以内是否核销。评测指标采用AUC,先对每个优惠券单独计算核销预测的AUC值,再对所有优惠券的AUC值求平均作为最终的评价标准。
## 主要工作
- **特征工程**
- 采用SW方式对数据集进行特征提取,解决测试集特征缺失问题
- 题目数据所给特征非常少,对比多种特征提取方法,最终采用人工特征提取效果最优
- 后续对特征进行缺失值处理、二值化、One-Hot、数据变换、特征选择等
- **模型参数优化**
- 对比LR、SVM、RF、GBDT、XGBoost等多模型后,最终选择XGBoost
- 采用CV+GridSearch进行参数调优
- **模型融合**
- 对比加权Average和两层Stacking两种融合方式,AUC略微提升
- 最后采用多个过拟合、欠拟合模型(不同模型)融合,得到最优结果
- **循环调优**
- 根据提交结果,重新筛选特征、调整模型参数、调整融合方式
## 文档目录
- intruduction.pdf:详细介绍(配有图文)
- code:特征工程、模型
- result:模型及预测结果
- 成绩.bmp:最终提交成绩
## 项目链接
https://github.com/xy2333/O2O
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的课程设计、期末大作业和毕设项目,作为参考资料学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能,需要能看懂代码,并且热爱钻研,自行调试。 天池大赛-O2O优惠券使用预测算法源码+项目说明(前1%,AUC:0.7948)(Top1:0.8116).zip
资源推荐
资源详情
资源评论
收起资源包目录
天池大赛-O2O优惠券使用预测算法源码+项目说明(前1%,AUC:0.7948)(Top1:0.8116).zip (12个子文件)
code_20105
成绩.bmp 1.92MB
readme.md 1KB
introduction.pdf 1.04MB
code
ofoFeature.py 35KB
model_xgboost.py 18KB
result
ProcessDataSet3.csv 25.29MB
sample_submission.csv 350B
ProcessDataSet1.csv 25.76MB
ProcessDataSet3_norm.csv 46.96MB
ProcessDataSet2.csv 50.4MB
ProcessDataSet1_norm.csv 48.96MB
ProcessDataSet2_norm.csv 96.5MB
共 12 条
- 1
资源评论
- Kylin-_-2024-02-10资源是宝藏资源,实用也是真的实用,感谢大佬分享~
- 2301_807332582024-03-07资源不错,对我启发很大,获得了新的灵感,受益匪浅。
土豆片片
- 粉丝: 1516
- 资源: 5642
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功