## 代码
2018年腾讯广告算法大赛Rank10代码:深度部分。
## 环境说明
- 系统环境:
- 操作系统:Ubuntu16.04 LTS
- 硬件:CPU 40核,128GB内存
- 显卡: TITAN Xp, 显存:12G
- 软件环境:
- Python: 3.6.4(conda 4.5.4)
- Tensorflow: GPU版本1.7(源码编译), NVIDIA-SMI 390.48, cuda_9.1.85_387.26
- 其他包: pandas(0.22.0), numpy(1.14.0), scipy(1.0.0), scikit-leartn(0.19.1), tqdm(4.23.3)
## 运行步骤
- 预处理
- 载入userFeature数据:`python3 load_vowpal.py `
- 生成特征
- 生成uid/aid全局统计特征: `python3 make_feature.py`
- 运行模型
- 运行NFFM模型: `python3 train.py`
## 特征工程
### 特征使用
- 基础特征:user、ad的所有基本特征
- 统计特征:uid_aid_nunique(每个uid下的aid数目,等频离散化), aid_uid_nunique(每个aid下的uid数目,等频离散化), campaignId_aid_nunique(每个campaignId下的aid数目, 等频离散化),pos_aid(每个用户的训练集正aid), neg_aid(每个用户的训练集负aid),user_convert(用户转化率)
### 特征生成
- 全局统计特征:
- 使用groupby提取,如`ad_Feature.groupby(['campaignId']).aid.nunique()`
- 离散化:按百分比:[0, 20, 35, 50, 65, 85, 100]进行离散化
- 转化率特征: 用户在训练集上的转化率,为防止过拟合,在移除当前行的label基础上进行统计
- 正负aid特征:
- 在训练集中构建uid:aid-label字典
- 整理上述字典uid:[aid-pos, aid-neg], 其中aid-pos为label为1的aid列表, aid-neg为label为-1的aid列表
- 构建测试集中的特征:直接将上述uid拼接到测试集的uid中
- 构建训练集中的特征:将上述uid拼接到训练集的uid中,并移除aid-pos、aid-neg中每行出现的aid
- 最终生成多值正负aid特征
## 模型结构
模型使用郭达雅同学在群里的开源代码:`nffm-v3`, 即深度FFM模型。
### 结构定义
- FFM部分:线性部分+二阶隐式交叉
- 深度部分:两个隐藏层
### 参数
- 批大小:4096
- 迭代次数: 1
- 隐藏层: 256, 128
- 优化器: adam
- 学习率: 0.0002
- L2正则: 0.000002
- 嵌入大小: 8
- 随机种子:2018
## 感谢
感谢郭达雅大佬的[开源模型](https://github.com/guoday/Tencent2018_Lookalike_Rank7th)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的竞赛项目学习资料,作为参考学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能,需要能看懂代码,并且热爱钻研,自行调试。 腾讯广告算法大赛Rank10深度部分源码+学习说明.zip
资源推荐
资源详情
资源评论
收起资源包目录
腾讯广告算法大赛Rank10深度部分源码+学习说明.zip (10个子文件)
code_20105
run_nn.sh 1KB
src
utils.py 6KB
nffm.py 19KB
make_dataset.py 6KB
input
README.md 140B
load_vowpal.py 1KB
make_feature.py 6KB
train.py 2KB
__pycache__
nffm.cpython-35.pyc 14KB
README.md 2KB
共 10 条
- 1
资源评论
土豆片片
- 粉丝: 1557
- 资源: 5641
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于ATLAB + Psychtoolbox 心理学实验,情绪词汇效价判断
- 美赛数学建模算法-使用Matlab实现神经网络NeuralNetwork-包括BP+LVQ-国赛-题解.zip
- hb-mapper-makertbin.log
- dfcf_silence_upgrade_cfw_10.15.3_20240318163518_64.apk
- 美赛数学建模算法-使用Matlab实现多元分析MultivariteAnalysis-包括聚类分析+主成分分析-国赛-题解
- 构成学1.psd
- 美赛数学建模算法-使用Matlab实现线性规划LinearProgramming-国赛-题解.zip
- npp-7.2.2-Installer-语言修改器
- FY4B AGRI先进的静止轨道辐射成像仪波段响应函数
- 学习Demo影视推荐、音乐播放、地图
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功