单模型应该能拿复赛B榜第二。融合没融好
paddle开源:https://aistudio.baidu.com/aistudio/projectdetail/2536106?contributionType=1
其他Top开源:
Kaggle Jane Street Market Prediction Rank1:
* https://zhuanlan.zhihu.com/p/355606168
* https://www.kaggle.com/c/jane-street-market-prediction/discussion/224348
比赛期间读了数百篇文章,从只会用MLP的初学者阶段开始慢慢学习,最后算是有一点收获进步,欢迎相关领域的大佬交流工作(wx:zhouyz9452)。比赛建模只是工程中的一小部分,没必要神话某个模型。
* 队友的模型、建模方式比较独到,更有学习价值
* 几乎无手工特征
* DCNv1,从keras官网找的baseline (https://keras.io/examples/structured_data/wide_deep_cross_networks/)
* 模型没调参过,精调参可能有进一步提升
* 加入初赛数据有一定提升
* 加测试集数据有提升
* no trick,不盲目崇拜高级模型,好好做好基础就行,数据为本
* end2end向量比预训练向量的效果更好
* 结合end2end和预训练向量有一定提升
* embedding layer 比 generator 更好用
和其他队伍重合的实验结果:
* sigmoid作为gate效果更好
* MMoE与线上分数更接近,DCN分数线下虚高
* 完播率直接等权重加进去没用,因为这里预估的是CTR,目标不一致。
![image](https://user-images.githubusercontent.com/39345674/134325467-69659b15-9ffe-46ec-b2df-93469693b005.png)
微信大数据挑战赛参赛源码+项目说明.zip
版权申诉
66 浏览量
2024-01-29
21:08:25
上传
评论
收藏 7.99MB ZIP 举报
土豆片片
- 粉丝: 1529
- 资源: 5641
最新资源
- SW3518S全协议快充USB Type-c接口电源模块硬件参考设计评估版硬件(原理图 +pcb)+封装库文件.zip
- 基于深度强化学习算法实现多星对区域目标观测的规划python源码+数据集+模型+超详细注释.zip
- RT1052+SDRAM(IS42S16160) +SIM7600CE(PCIE接口封装)控制板硬件(原理图+PCB)+封装库
- 2017大学英语四级词汇-excel-列表版(精品文档).xls
- 2017版国家医保药品目录(excel版)完整版.xls
- 基于STM32F103单片机设计的无刷电机控制板硬件(原理图+PCB+BOM)+MCU软件控制源码+文档资料.zip
- 肺结节检测数据集VOC+YOLO格式1186张1类别.zip
- Faster-RCNN基于知识蒸馏的目标检测模型增量深度学习方法python源码+项目运行说明.zip
- 2018年考勤表——excel版.xls
- 基于Labview的转子动平衡测控系统源码+系统软件说明书.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈