# 个贷违约预测--中国科学院大学2021秋季学习机器学习大作业
## 1. 评测指标
经典预测任务:使用ROC曲线下面积(Area Under Curve, AUC)作为评价指标。AUC值越大,预测越准确。
描述性聚类-->软聚类
## 2. 训练数据说明
#### 训练数据train_public.csv
| 字段 | 字段描述 |
| :----------------------: | :------------------------------------------------: |
| loan_id | 贷款记录唯一标识 |
| user_id | 借款人唯一标识 |
| total_loan | 贷款数额 |
| year_of_loan | 贷款年份 |
| interest | 当前贷款利率 |
| monthly_payment | 分期付款金额 |
| grade | 贷款级别 |
| employment_type | 所在公司类型(世界五百强、国有企业、普通企业…) |
| industry | 工作领域(传统工业、商业、互联网、金融…) |
| work_year | 工作年限 |
| home_exist | 是否有房 |
| censor_status | 审核情况 |
| issue_month | 贷款发放的月份 |
| use | 贷款用途类别 |
| post_code | 贷款人申请时邮政编码 |
| region | 地区编码 |
| debt_loan_ratio | 债务收入比 |
| del_in_18month | 借款人过去18个月逾期30天以上的违约事件数 |
| scoring_low | 借款人在贷款评分中所属的下限范围 |
| scoring_high | 借款人在贷款评分中所属的上限范围 |
| known_outstanding_loan | 借款人档案中未结信用额度的数量 |
| known_dero | 贬损公共记录的数量 |
| pub_dero_bankrup | 公开记录清除的数量 |
| recircle_bal | 信贷周转余额合计 |
| recircle_util | 循环额度利用率 |
| initial_list_status | 贷款的初始列表状态 |
| app_type | 是否个人申请 |
| earlies_credit_mon | 借款人最早报告的信用额度开立的月份 |
| title | 借款人提供的贷款名称 |
| policy_code | 公开可用的策略_代码=1新产品不公开可用的策略_代码=2 |
| f系列匿名特征 | 匿名特征f0-f4,为一些贷款人行为计数特征的处理 |
| early_return | 借款人提前还款次数 |
| early_return_amount | 贷款人提前还款累积金额 |
| early_return_amount_3mon | 近3个月内提前还款金额 |
#### 训练数据train_internet.csv
| 字段 | 字段描述 |
| :----------------------: | :----------------------------------------------------------: |
| loan_id | 网络贷款记录唯一标识 |
| user_id | 用户唯一标识 |
| total_loan | 网络贷款金额 |
| year_of_loan | 网络贷款期限(year) |
| interest | 网络贷款利率 |
| monthly_payment | 分期付款金额 |
| class | 网络贷款等级 |
| sub_class | 网络贷款等级之子级 |
| work_type | 工作类型(公务员、企业白领、创业…) |
| employment_type | 所在公司类型(世界五百强、国有企业、普通企业…) |
| industry | 工作领域(传统工业、商业、互联网、金融…) |
| work_year | 就业年限(年) |
| house_ownership | 是否有房 |
| house_loan_status | 房屋贷款状况(无房贷、正在还房贷、已经还完房贷) |
| censor_status | 验证状态 |
| marriage | 婚姻状态(未婚、已婚、离异、丧偶) |
| offsprings | 子女状态(无子女、学前、小学、中学、大学、工作) |
| issue_date | 网络贷款发放的月份 |
| use | 贷款用途 |
| post_code | 借款人邮政编码的前3位 |
| region | 地区编码 |
| debt_loan_ratio | 债务收入比 |
| del_in_18month | 借款人过去18个月信用档案中逾期60天内的违约事件数 |
| scoring_low | 借款人在信用评分系统所属的下限范围 |
| scoring_high | 借款人在信用评分系统所属的上限范围 |
| pub_dero_bankrup | 公开记录清除的数量 |
| early_return | 提前还款次数 |
| early_return_amount | 提前还款累积金额 |
| early_return_amount_3mon | 近3个月内提前还款金额 |
| recircle_bal | 信贷周转余额合计 |
| recircle_util | 循环额度利用率,或借款人使用的相对于所有可用循环信贷的信贷金额 |
| initial_list_status | 网络贷款的初始列表状态 |
| earlies_credit_line | 网络贷款信用额度开立的月份 |
| title | 借款人提供的网络贷款名称 |
| policy_code | 公开策略=1不公开策略=2 |
| f系列匿名特征 | 匿名特征f0-f5,为一些网络贷款人行为计数特征的处理 |
#### 提交数据submission.csv
| 字段 | 字段描述 |
| :-------: | :-----------------: |
| id | 贷款记录ID(int) |
| isDefault | 是否违约(int/float) |
## 3. 使用的三种模型
多层感知机,决策树(概率树),自定义模型(距离-概率转换方法)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
基于机器学习的个人信贷违约预测识别项目源码+训练测试数据集(高分项目).zip该项目是个人毕设项目源码,评审分达到97分,都经过严格调试,确保可以运行!放心下载使用。该项目资源主要针对计算机相关专业的学生或从业者下载使用,也可作为期末课程设计、课程大作业、毕业设计等。 基于机器学习的个人信贷违约预测识别项目源码+训练测试数据集(高分项目).zip该项目是个人毕设项目源码,评审分达到97分,都经过严格调试,确保可以运行!放心下载使用。该项目资源主要针对计算机相关专业的学生或从业者下载使用,也可作为期末课程设计、课程大作业、毕业设计等。 基于机器学习的个人信贷违约预测识别项目源码+训练测试数据集(高分项目).zip该项目是个人毕设项目源码,评审分达到97分,都经过严格调试,确保可以运行!放心下载使用。该项目资源主要针对计算机相关专业的学生或从业者下载使用,也可作为期末课程设计、课程大作业、毕业设计等。 基于机器学习的个人信贷违约预测识别项目源码+训练测试数据集(高分项目).zip该项目是个人毕设项目源码,评审分达到97分,都经过严格调试,确保可以运行!放心下载使用。该项目资源主要针对
资源推荐
资源详情
资源评论
收起资源包目录
基于机器学习的个人信贷违约预测识别项目源码 (1).zip (59个子文件)
基于机器学习的个人信贷违约预测识别项目源码+训练测试数据集
.DS_Store 8KB
Model_DicisionTree
raw_data
test_public.csv 997KB
nw_train_public.csv 3.08MB
train_internet.csv 155.33MB
submit_example.csv 83KB
train_public.csv 1.94MB
nn2.csv 138KB
main.py 17KB
result.csv 140KB
决策树成绩.png 10KB
.keep 0B
README.md 40B
.gitee
ISSUE_TEMPLATE.zh-CN.md 79B
report
.DS_Store 6KB
photos
chip.png 5KB
pytorch.png 6KB
python.png 5KB
OS.png 5KB
个贷违约预测_报告.docx 386KB
slides
report_pdf.pdf 6.85MB
report_ppt.pptx 14.15MB
~$违约预测_报告.docx 162B
tex
report.pdf 509KB
report.log 88KB
report.tex 48KB
Model_MLP
src
__init__.py 21B
networks
__init__.py 20B
mlp.py 683B
dataloader
__init__.py 60B
preprocess.py 3KB
dataset.py 520B
tools.py 3KB
train.py 2KB
test.py 772B
data
test_public.csv 997KB
train_internet.csv 155.33MB
submission.csv 91KB
train_public.csv 1.94MB
requirements.txt 50B
models
mlp.pth 31KB
.gitignore 20B
.keep 0B
README.md 92B
README.md 8KB
Model_Distance2Probability
tools
tools.go 7KB
train
train.go 3KB
verification
verification.go 2KB
data
test_public.csv 997KB
ver_public.csv 1.94MB
train_internet.csv 155.33MB
submit_example.csv 83KB
train_public.csv 1.94MB
tree.txt 708B
main.exe 2.29MB
test
test.go 897B
.keep 0B
README.md 91B
poi
poi.go 3KB
main.go 600B
共 59 条
- 1
资源评论
猰貐的新时代
- 粉丝: 1w+
- 资源: 2554
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功