### 团队:Unreal
### Rank:10
### 代码说明
#### data_pre_process
1.origin_part1_part2_row2col:进行原始数据转换,包括行转列,去重等;
2. get_num_features,生成数值特征的表;
3. get_word_features,生成文字特征的表;
4. data_merge_split,合并数值、文字以及snp数据。
#### feature_selection
1. 分别针对sys, dia, tl, hdl, ldl 运行snp_drop_one_hot, 得出五个对应特征的数据集,这一步骤主要是删去gbdt预训练中不重要的snp特征,然后进行one_hot编码;
2. 分别针对sys, dia, tl, hdl, ldl 运行get_best_rounds, 得出a步骤五个数据对应的五折最优迭代次数。
#### every_prediction_model
运行所有文件,得出sys,dia,tl,hdl,ldl在测试集上的预测结果。
#### xgb_model
1. add_prefix_for_xgb_model,得出带有前缀的特征数据集;
2. split_5_fold_data_xgb,分割五折训练的数据;
3. baseline_xgboost_jz,训练xgb模型;
4. calc_xgb_test_loss_and_save, 将c步骤中的五个tl的预测结果融合并取均值。
#### submit_result
提交最终结果,最终结果是sys,dia,hdl,ldl为gbdt单模型,tl为gbdt和xgb的加权融合,比例为0.7和0.35。
A榜单模型GBDT最优得分为0.0318,B榜单模型GBDT最优0.0321,tl加权融合后最优成绩0.0319。
### 队友Github
zhuifeng414: https://github.com/Zhuifeng414
wzm : https://github.com/w-zm
没有合适的资源?快使用搜索试试~ 我知道了~
TianChi-Meinian-master.zip
共29个文件
py:22个
txt:3个
md:3个
需积分: 5 0 下载量 20 浏览量
2024-05-04
18:46:37
上传
评论
收藏 47KB ZIP 举报
温馨提示
文件夹说明: data:数据文件夹 features: 手动整理好的数值型和文字型特征,分别为num_label.txt和word_label.txt,数据清洗过程中需要使用这两个文件 code: 主运行代码,我的数据融合了zhuifeng414的数据,可直接运行main.py team: 队友特征工程代码以及我的Mongodb操作代码 submit: 提交结果文件夹
资源推荐
资源详情
资源评论
收起资源包目录
TianChi_Meinian-master.zip (29个子文件)
TianChi_Meinian-master
round1_rank2
features
num_label.txt 932B
word_label.txt 268B
team
data_process_by_Mongo.py 4KB
team_feature_work.py 24KB
version.txt 372B
README.md 2KB
code
main.py 29KB
round2_rank10
data_pre_process
get_num_features.py 10KB
origin_part1_part2_row2col.py 2KB
get_word_features.py 11KB
data_merge_split.py 2KB
xgb_model
split_5_fold_data_xgb.py 655B
add_prefix_for_xgb_model.py 1KB
xgb_in_odps.sql 51KB
calc_xgb_test_loss_and_save.py 2KB
submit_result.py 1KB
feature_selection
snp_drop_one_hot.py 3KB
classification_tl.py 5KB
select_features_by_model.py 2KB
gbdt_log_model.py 6KB
get_best_rounds.py 6KB
predict_value_tl_gt_4.py 5KB
README.md 2KB
every_predict_model
hdl_gbdt_best_rounds.py 6KB
dia_gbdt_best_rounds.py 6KB
sys_gbdt_best_rounds.py 6KB
ldl_gbdt_best_rounds.py 6KB
tl_gbdt_best_rounds.py 6KB
README.md 155B
共 29 条
- 1
资源评论
逆风微笑的大雪生
- 粉丝: 36
- 资源: 196
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功