### 团队:Unreal
### Rank:10
### 代码说明
#### data_pre_process
1.origin_part1_part2_row2col:进行原始数据转换,包括行转列,去重等;
2. get_num_features,生成数值特征的表;
3. get_word_features,生成文字特征的表;
4. data_merge_split,合并数值、文字以及snp数据。
#### feature_selection
1. 分别针对sys, dia, tl, hdl, ldl 运行snp_drop_one_hot, 得出五个对应特征的数据集,这一步骤主要是删去gbdt预训练中不重要的snp特征,然后进行one_hot编码;
2. 分别针对sys, dia, tl, hdl, ldl 运行get_best_rounds, 得出a步骤五个数据对应的五折最优迭代次数。
#### every_prediction_model
运行所有文件,得出sys,dia,tl,hdl,ldl在测试集上的预测结果。
#### xgb_model
1. add_prefix_for_xgb_model,得出带有前缀的特征数据集;
2. split_5_fold_data_xgb,分割五折训练的数据;
3. baseline_xgboost_jz,训练xgb模型;
4. calc_xgb_test_loss_and_save, 将c步骤中的五个tl的预测结果融合并取均值。
#### submit_result
提交最终结果,最终结果是sys,dia,hdl,ldl为gbdt单模型,tl为gbdt和xgb的加权融合,比例为0.7和0.35。
A榜单模型GBDT最优得分为0.0318,B榜单模型GBDT最优0.0321,tl加权融合后最优成绩0.0319。
### 队友Github
zhuifeng414: https://github.com/Zhuifeng414
wzm : https://github.com/w-zm
没有合适的资源?快使用搜索试试~ 我知道了~
美年健康AI大赛—双高疾病风险预测.zip
共29个文件
py:22个
txt:3个
md:3个
2 下载量 54 浏览量
2023-11-09
10:55:42
上传
评论
收藏 44KB ZIP 举报
温馨提示
美赛竞赛资源,竞赛解决方案,包含完整源码解决方案内容,可用于参赛学习、参考 美赛竞赛资源,竞赛解决方案,包含完整源码解决方案内容,可用于参赛学习、参考 美赛竞赛资源,竞赛解决方案,包含完整源码解决方案内容,可用于参赛学习、参考 美赛竞赛资源,竞赛解决方案,包含完整源码解决方案内容,可用于参赛学习、参考 美赛竞赛资源,竞赛解决方案,包含完整源码解决方案内容,可用于参赛学习、参考 美赛竞赛资源,竞赛解决方案,包含完整源码解决方案内容,可用于参赛学习、参考 美赛竞赛资源,竞赛解决方案,包含完整源码解决方案内容,可用于参赛学习、参考 美赛竞赛资源,竞赛解决方案,包含完整源码解决方案内容,可用于参赛学习、参考 美赛竞赛资源,竞赛解决方案,包含完整源码解决方案内容,可用于参赛学习、参考美赛竞赛资源,竞赛解决方案,包含完整源码解决方案内容,可用于参赛学习、参考美赛竞赛资源,竞赛解决方案,包含完整源码解决方案内容,可用于参赛学习、参考美赛竞赛资源,竞赛解决方案,包含完整源码解决方案内容,可用于参赛学习、参考
资源推荐
资源详情
资源评论
收起资源包目录
美年健康AI大赛—双高疾病风险预测.zip (29个子文件)
competition
round1_rank2
features
num_label.txt 932B
word_label.txt 268B
team
data_process_by_Mongo.py 4KB
team_feature_work.py 24KB
version.txt 372B
README.md 2KB
code
main.py 29KB
round2_rank10
data_pre_process
get_num_features.py 10KB
origin_part1_part2_row2col.py 2KB
get_word_features.py 11KB
data_merge_split.py 2KB
xgb_model
split_5_fold_data_xgb.py 655B
add_prefix_for_xgb_model.py 1KB
xgb_in_odps.sql 51KB
calc_xgb_test_loss_and_save.py 2KB
submit_result.py 1KB
feature_selection
snp_drop_one_hot.py 3KB
classification_tl.py 5KB
select_features_by_model.py 2KB
gbdt_log_model.py 6KB
get_best_rounds.py 6KB
predict_value_tl_gt_4.py 5KB
README.md 2KB
every_predict_model
hdl_gbdt_best_rounds.py 6KB
dia_gbdt_best_rounds.py 6KB
sys_gbdt_best_rounds.py 6KB
ldl_gbdt_best_rounds.py 6KB
tl_gbdt_best_rounds.py 6KB
README.md 155B
共 29 条
- 1
资源评论
白话机器学习
- 粉丝: 1w+
- 资源: 7650
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 【人员录用】05-用人部门入职通知邮件.docx
- 08-新员工入职流程.xlsx
- 11-新员工入职流程图.xlsx
- 09-新员工入职流程及程序doc.docx
- 17-新员工入职关怀跟踪反馈表.docx
- 20-员工重新入职管理制度.docx
- 01-新员工入职指引管理办法.docx
- 基恩士KV-N60,KV-N14程序 基恩士KV-N60主站,KV-N14从站,松下触摸屏 KV-N11L(RS422A 485通信插件)主从站485串行PLC链路站通信功能 全自动端子焊锡机
- 09-新员工入职引导确认表.doc
- 05-新员工入职引导作业指导书.xls
- 11-新员工入职指引.docx
- 12-新员工入职指南.xlsx
- 13-新员工入职指引流程.xlsx
- 15-新员工入职服务操作细则.xls
- 14-新员工管理流程-各角色职责说明.xls
- 06-新员工入职须知.doc.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功