# 融360算法大赛——拒绝推断
[比赛网址](https://openresearch.rong360.com/#/question)
[比赛新闻](https://www.rong360.com/gl/2018/12/07/173769.html)
[比赛数据](https://pan.baidu.com/s/1N5-8AJWUcItfENkK9_Q2Yg) 提取码:v77a
2016年1月,机构A通过自建风控模型开始放贷,初期获得了良好的收益。随着时间的推移,机构A发现在样本通过率5%不变的前提下,机构逾期率由2016年1月的5%逐步升至2017年7月的15%,大量坏账导致机构A由盈利陷入亏损境地。公司模型人员仔细检查模型,发现其在训练集和测试集上都表现很好,并没有任何异常,百思不得其解。
在金融信贷场景中,放款机构会通过模型评分筛选用户,评分较好的用户可以获得放款,评分较差的用户直接被拒绝,机构只能获得放款用户样本的好坏标签,对于大量拒绝用户的还款情况无法获得。随着时间的推移,机构手中的训练样本都是“评分较好”的通过用户,而没有“评分较差”的拒绝用户,由此训练的模型在“评分较好”用户中表现越来越好,在“评分较差”用户中却无法得到任何验证。
但是,金融风控模型真实面对的客群却包括了“评分较差”的用户,模型在“评分较差”用户中无法得到验证,导致训练的模型越来越偏离实际情况,甚至通过了大量应该被拒绝的坏用户,致使大量坏账出现,直接带来巨大经济损失。因此,在只有最优质的放款用户好坏标签的情况下,如何保证建模对所有放款用户和拒绝用户都有良好的排序能力,是金融风控模型需要解决的重要问题。解决该问题可以是传统的拒绝推断技术,也可以尝试其他机器学习技术,参赛者可自行选择。
1.具体内容
训练样本:从2018.1.1到2018.5.1放款用户样本,信用评分top30%的样本给出每个样本是否逾期,后70%样本只有3000个给是否逾期。(约10万样本)
验证样本:从2018.1.1到2018.5.1放款用户样本,验证集不提供样本是否逾期,参赛选手自行完成是否逾期预测后,可以提交至比赛平台评估结果。(约2万样本)
测试样本:与验证样本来源相同且同分布。测试集不提供样本是否逾期,参赛选手只能在比赛最后的评比阶段将预测结果提交至比赛平台评估,且只能提交一次。(约2万样本)
2.我们需要你们完成
对用户各类信用相关数据进行分析处理,挖掘数据价值。
根据验证样本和测试样本的样本特点,从训练样本中选取合适的训练集,完成建模,保证模型在验证样本和测试样本上的效果。
# 文件结构
**0.auto_sklearn**
使用auto sklearn 框架,对原始数据直接进行训。自动化的机器学习在数据处理和特征构建方面仍然无法代替人工的地位。但是现在自动化机器学习已经是机器学习领域又一研究热点,它将会降低机器学习的使用者的门槛。
**1.preprocess_data**
预处理数据
**2.explore_data**
数据探索
Tip:小小的经验之谈,数据预处理和数据探索是交替进行的,比如时间这个特征,它是string类型,不是我们数据处理需要数值类型,我们需要把原始时间格式转化为数值类型的变量,然后保存。这样我们就完成了数据预处理部分的工作。然后我们探索时间和标签之间的关系,发现了不同月份的转化率(逾期率)不一样。基于这个发现,我们在返回到数据预处理阶段,对数据做相应特征的提取工作。
**3.feature_explore**
我们在**2.explore_data**中尽可能多的提取特征,但是并不是所有的特征都是那么的重要。我们在本节中,通过本地交叉验证的方式来评价不同特征组合的效果。
**4.demo**
多种模型的尝试
**5.predict_test**
预测测试集
**6.scrum_phase**
复赛代码
没有合适的资源?快使用搜索试试~ 我知道了~
融360智能金融算法大赛-拒绝推断算法源码+项目说明.zip
共223个文件
ipynb:186个
txt:18个
md:7个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 25 浏览量
2024-01-27
23:25:21
上传
评论
收藏 7.06MB ZIP 举报
温馨提示
【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的课程设计、期末大作业和毕设项目,作为参考资料学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能,需要能看懂代码,并且热爱钻研,自行调试。 融360智能金融算法大赛-拒绝推断算法源码+项目说明.zip融360智能金融算法大赛-拒绝推断算法源码+项目说明.zip融360智能金融算法大赛-拒绝推断算法源码+项目说明.zip融360智能金融算法大赛-拒绝推断算法源码+项目说明.zip融360智能金融算法大赛-拒绝推断算法源码+项目说明.zip融360智能金融算法大赛-拒绝推断算法源码+项目说明.zip融360智能金融算法大赛-拒绝推断算法源码+项目说明.zip融360智能金融算法大赛-拒绝推断算法源码+项目说明.zip融360智能金融算法大赛-拒绝推断算法源码+项目说明.zip融360智能金融算法大赛-拒绝推断算法源码+项目说明.zip融360智能金融算法大赛-拒绝推断算法源码+项目说明.zip融360智能金融算法大赛-拒绝推断算法源码+项目说明.zip
资源推荐
资源详情
资源评论
收起资源包目录
融360智能金融算法大赛-拒绝推断算法源码+项目说明.zip (223个子文件)
lgb_pred_en_8079.csv 569KB
gbc_pred0819.csv 532KB
avg_preds-checkpoint.csv 520KB
xgb_pred0829.csv 516KB
rank_d_feature_score-checkpoint.csv 30KB
融360-推断拒绝报告.docx 924KB
use_raw_feature.ipynb 1.19MB
use_all_feature.ipynb 790KB
use_float_rank_feature_d.ipynb 786KB
main.ipynb 529KB
main-checkpoint.ipynb 529KB
show_basic_mic.ipynb 450KB
1.model_int_feature.ipynb 436KB
1.model_int_feature-checkpoint.ipynb 436KB
1.train_tag_model-checkpoint.ipynb 379KB
1_gen_new_data.ipynb 362KB
1_gen_new_data-checkpoint.ipynb 362KB
main-checkpoint.ipynb 357KB
main1.ipynb 262KB
main.ipynb 193KB
1.train_tag_model.ipynb 192KB
show_basic_mic.ipynb 153KB
blending.ipynb 151KB
main.ipynb 125KB
PCAandLDA-checkpoint.ipynb 125KB
use_all_feature-checkpoint.ipynb 124KB
get_thres-checkpoint.ipynb 120KB
4.explore_time-checkpoint.ipynb 120KB
4.explore_time.ipynb 120KB
PCAandLDA.ipynb 119KB
2.explore_null.ipynb 112KB
2.explore_null-checkpoint.ipynb 112KB
show_pred_mic.ipynb 111KB
get_thres.ipynb 108KB
use_all_feature.ipynb 107KB
4.gen_fine_eval.ipynb 86KB
4.gen_fine_eval-checkpoint.ipynb 86KB
show.ipynb 68KB
show-checkpoint.ipynb 68KB
3.gen_rough_eval.ipynb 58KB
3.gen_rough_eval-checkpoint.ipynb 58KB
search_thre.ipynb 51KB
search_thre-checkpoint.ipynb 51KB
get_thres_new-checkpoint.ipynb 47KB
get_thres_new.ipynb 47KB
derived-checkpoint.ipynb 47KB
derived.ipynb 47KB
main.ipynb 40KB
main-checkpoint.ipynb 40KB
base.ipynb 39KB
base-checkpoint.ipynb 39KB
use_float_rank_feature_d.ipynb 37KB
2.lgb-checkpoint.ipynb 32KB
2.lgb.ipynb 32KB
1.preprocess_data.ipynb 30KB
1.preprocess_data-checkpoint.ipynb 30KB
train_use_unlabel.ipynb 28KB
train_use_unlabel-checkpoint.ipynb 28KB
xgb.ipynb 22KB
main1.ipynb 21KB
compare_models.ipynb 20KB
compare_models-checkpoint.ipynb 20KB
1_gen_null_sign.ipynb 19KB
1_gen_null_sign-checkpoint.ipynb 19KB
2.show_pred.ipynb 19KB
2.show_pred-checkpoint.ipynb 19KB
main-checkpoint.ipynb 17KB
1.gen_data.ipynb 17KB
main-checkpoint.ipynb 17KB
main.ipynb 17KB
rfc.ipynb 17KB
main.ipynb 17KB
rfc-checkpoint.ipynb 16KB
cal_score_com.ipynb 16KB
cal_score_com-checkpoint.ipynb 16KB
本地特征组合.ipynb 15KB
3.preprocess_data_new.ipynb 14KB
3.preprocess_data_new-checkpoint.ipynb 14KB
1.stacking-checkpoint.ipynb 12KB
xgb.ipynb 12KB
1.stacking.ipynb 12KB
bagging.ipynb 12KB
xgb-checkpoint.ipynb 12KB
blending.ipynb 11KB
blending-checkpoint.ipynb 11KB
main.ipynb 11KB
main-checkpoint.ipynb 11KB
1.train_36xgb.ipynb 11KB
main.ipynb 9KB
main-checkpoint.ipynb 9KB
3.gen_valid_feature.ipynb 9KB
xgb-checkpoint.ipynb 9KB
3.gen_valid_feature-checkpoint.ipynb 8KB
1_train_30465.ipynb 8KB
1_train_30465-checkpoint.ipynb 8KB
1_train_3000.ipynb 8KB
1_train_3000-checkpoint.ipynb 8KB
main1-checkpoint.ipynb 7KB
1.gen_cross_features.ipynb 6KB
1.gen_cross_features-checkpoint.ipynb 6KB
共 223 条
- 1
- 2
- 3
资源评论
土豆片片
- 粉丝: 1852
- 资源: 5869
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功