# Tencen2017_Fianl_Coda_Allegro
腾讯2017广告大赛的代码。可惜只排名到了23名,很是可惜。模型很少,融合效果较差。跪在了最后阶段。
本人机器只有16G内存。因此本套代码可以保证运行不会出现要挂通宵的情况(stacking部分除外,这个大概要几小时)。速度相对可观。
最后使用的特征一共50维左右。
具体的参赛过程,特征提取思路请参照我写的博客:http://blog.csdn.net/haphapyear/article/details/75057407
----------------------------
1.特征我们是一个个版本生成的。代码中标有生成步骤。要V1-V9一步步生成。部分文件需要先生成才能进行特征提取。例如用户点击记录等。
2.原始数据放在data/origin下,其余的中间数据按照目录保存
3.第30天的数据,特征生成步骤一样,是后面加上去的。最终模型用上了,原始模型只用了28,29两天来训练。代码在day30目录下。
*第30天的代码有个BUG我已标出。但是我比赛时是带着它调模型的,因此改正后效果比改正前要差点。也许改正BUG后通过调整模型可以得到比原来更好的结果,可以自行尝试。
4.最终模型说明。
用28,29,20天数据生成lgb模型(模型1)
用xgb生成stacking作为特征加上原始特征训练lgb模型(模型2)
用lgb生成stacking作为特征加上原始特征训练xgb模型(模型3)
融合模型:(0.25*模型一结果+0.25*模型二结果+0.5*模型3)
最终模型:讲融合模型的均值按比例提高到0.0273
原始数据下载地址:http://pan.baidu.com/s/1gflA8T1
附:2018届腾讯社交赛决赛代码:https://github.com/BladeCoda/Tencent2018_Final_Phrase_Presto
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的课程设计、期末大作业和毕设项目,作为参考资料学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能,需要能看懂代码,并且热爱钻研,自行调试。 腾讯2017社交广告竞赛参赛源码+项目说明.zip
资源推荐
资源详情
资源评论
收起资源包目录
腾讯2017社交广告竞赛参赛源码+项目说明.zip (28个子文件)
code_20105
stacking_xgb.py 7KB
lastDig.py 3KB
preProcess.py 6KB
data
feature
about 22B
stacking
about 21B
first_merge
about 28B
origin
about 19B
cutData
about 19B
clickDig.py 4KB
stacking_lgbm.py 7KB
cutTrainData.py 6KB
day30
about 33B
lastDig.py 3KB
data
about 27B
clickDig.py 3KB
cutTrainData.py 2KB
timeDig.py 9KB
installDig.py 5KB
ZHLsmooth.py 1KB
timeDig.py 10KB
blending.py 2KB
installDig.py 6KB
ZHLsmooth.py 9KB
merge.py 4KB
XGBoostTest.py 6KB
countInstall.py 3KB
LightGBMExam.py 4KB
README.md 2KB
共 28 条
- 1
资源评论
土豆片片
- 粉丝: 1564
- 资源: 5642
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功