1
实验名称:贷款记录分析
一、实验环境:
1.Python 版本:3.7.9
2.pandas 版本:0.23.4
3.numpy 版本:1.15.1
4.matplotlib 版本:2.2.3
二、实验目的:
本实验主要任务是运用本学期所学数据挖掘方法分析金融机构的贷款记录,并对
每项贷款进行违约可能性的预测。数据集见附件,该数据来自某信贷平台的贷款
记录,总数据量超过 120w,包含 47 列变量信息,其中 15 列为匿名变量。数据
集详细字段表如下:(本数据集 y 值为 isdufault 字段,1 代表发生违约行为)