# README
+ `config.py`:模型配置文件,参数在该文件中进行改动。
+ `train.py`:模型训练、训练预测在该文件中。
+ `dataloader.py`:数据的读取、特征合并、数据预处理、产生特征列表在该文件中。
+ `model/`:模型文件存在该文件夹下。
+ `result/`:预测的结果文件保存在该文件夹下。
+ `source/models/`:训练后的模型文件保存在该文件夹下。
+ `source/transformer/`:数据处理过程的LabelEncoder和MinmaxScaler二进制文件。
## 模型输入
+ 模型输入包含以下几个模块
+ 读取模型文件:该代码在`conf.train=True`模式下只会读取训练集,不会读取测试集。在`conf.train=False`模式下会读取训练集和测试集,并统一编码和归一化。
+ 特征合并:如果还使用face特征以及title特征,那么会在训练集和测试集中添加特征列,这些特征列的值与`item_id`一一对应。
+ 预处理:预处理包括两部分,对sparse feature的空值填充-1,对dense feature的空值填充0。还有对sparse feature进行统计并转化成index,对dense feature进行归一化到(0,1)之间。
+ 产生sparse/dense_feature_list:列表元素为SingleFeat实例,SingleFeat为namedtuple,用于之后输入模型来构建模型(模型构建需要知道sparse feature有多少种值)。
+ 模型输入格式
+ 模型的输入为`np.array`的`list`,每一个`np.array`表示一种特征。
+ 输入`list`中sparse feature的输入在前,dense feature输入在后。两者的feature输入顺序要和模型构建时传递进去的sparse feature和dense feature列表的顺序一致。
## 模型训练预测
+ 模型训练包括两步
+ 构建模型:通过sparse feature和dense feature的个数,embedding维度等构建模型。
+ 训练模型:baseline使用`tf.keras.Model()`来训练预测模型,也可以自定义模型放在`model/`文件夹下。
+ 模型预测
+ 在`conf.train=False`模式下模型训练完之后会自动地进行预测,并保存`result_(TimeStamp).csv`文件到`result/`文件夹下。
## 模型训练预测记录表
+ 所有模型训练、预测和提交之后填写模型训练预测记录表,方便进行模型比较和改进。
+ 模型训练预测记录表见`RECORD.md`。
没有合适的资源?快使用搜索试试~ 我知道了~
字节跳动短视频理解比赛,代码带详细注释.zip
共22个文件
py:12个
pdf:3个
md:3个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 11 浏览量
2023-11-08
16:10:33
上传
评论
收藏 1.58MB ZIP 举报
温馨提示
+ 模型输入包含以下几个模块 + 读取模型文件:该代码在`conf.train=True`模式下只会读取训练集,不会读取测试集。在`conf.train=False`模式下会读取训练集和测试集,并统一编码和归一化。 + 特征合并:如果还使用face特征以及title特征,那么会在训练集和测试集中添加特征列,这些特征列的值与`item_id`一一对应。 + 预处理:预处理包括两部分,对sparse feature的空值填充-1,对dense feature的空值填充0。还有对sparse feature进行统计并转化成index,对dense feature进行归一化到(0,1)之间。 + 产生sparse/dense_feature_list:列表元素为SingleFeat实例,SingleFeat为namedtuple,用于之后输入模型来构建模型(模型构建需要知道sparse feature有多少种值)。 + 模型输入格式 + 模型的输入为`np.array`的`list`,每一个`np.array`表示一种特征。 + 输入`list`中sparse feat
资源推荐
资源详情
资源评论
收起资源包目录
字节跳动短视频理解比赛,代码带详细注释.zip (22个子文件)
ori_code
utils.py 24KB
trainFM.py 2KB
git
xlearn
others
xdeepfm.pdf 1.45MB
文件说明_Read me.pdf 81KB
Training set download URL.pdf 148KB
tranformfile.py 929B
predict.py 1KB
train.ipynb 16KB
dataloader.py 4KB
DataAnalysis.ipynb 8KB
model
__init__.py 0B
xDeepFM_MTL.py 3KB
FM.py 4KB
__pycache__
__init__.cpython-35.pyc 126B
xDeepFM_MTL.cpython-35.pyc 2KB
logger.py 401B
RECORD.md 3KB
Reading.md 5KB
train.py 4KB
README.md 2KB
title_tfidf.py 2KB
config.py 2KB
共 22 条
- 1
资源评论
白话机器学习
- 粉丝: 8910
- 资源: 7681
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功