没有合适的资源?快使用搜索试试~ 我知道了~
本文分析了台湾某银行客户的违约支付情况,提出了基于数据挖掘技术的预测客户违约可能性。从风险管理的角度来看,预测的违约概率的准确性可以用来对可信的或不可信的客户进行分类。 本文首先对数据集进行了初步处理,将数据拆分为2000个训练集与1000个测试集。每个客户信息中有23个自变量,根据其各个因素的相关性进行了调整然后使用了5挖掘方法,包括KNN,分类树,随机森林,Logistic回归,神经网络进行建模,比较这5种方法中违约概率的预测准确性。其中神经网络的预测效果最好,预测准确率达到了83.3%;其次,分类树(81.8%)和随机森林(80.1%),然后是Logistic回归(78.3%)。KNN的预测结果最不理想(75.8%)。 关键词: 信用卡违约预测、数据分类、Logistic回归、分类树、KNN、神经网络、随机森林。
资源推荐
资源详情
资源评论











MACAU UNIVERSITY OF SCIENCE AND TECHNOLOGY
Tittle: 基于数据挖掘的信用卡违约预测
Team : ChicKen Dinner
Student Name :
Nov 2017 12

Abstract
信用卡自 20 世纪 60 年代,在欧美发达国家出现至今已经成为了主流支付
手段之一。在改革开放后,信用卡也进入中国,且得到了跨越式的长足发展。
但是由于信用卡持有人的极大的不确定性,信用卡发行银行的应收账款很可能
最终不能及时或者无法全部收回或者,即可能发生部分或者全部的违约或者坏
账。针对这些问题,本文分析了台湾某银行客户的违约支付情况,提出了基于
数据挖掘技术的预测客户违约可能性。从风险管理的角度来看,预测的违约概
率的准确性可以用来对可信的或不可信的客户进行分类。
本文首先对数据集进行了初步处理,将数据拆分为 2000 个训练集与 1000
个测试集。每个客户信息中有 23 个自变量,根据其各个因素的相关性进行了调
整然后使用了 5 挖掘方法,包括 KNN,分类树,随机森林,Logistic 回归,神经
网络进行建模,比较这 5 种方法中违约概率的预测准确性。其中神经网络的预
测效果最好,预测准确率达到了 83.3%;其次,分类树(81.8%)和随机森林
( 80.1% ) , 然 后是 Logistic 回 归 ( 78.3% ) 。 KNN 的预 测 结 果 最 不 理 想
(75.8%)。

关键词: 信用卡违约预测、数据分类、Logistic 回归、分类树、KNN、神
经网络、随机森林。
目录
1.介绍.....................................................................................................................4
1.1 背景...........................................................................................................4
1.2 研究内容...................................................................................................8
1.3 数据来源...................................................................................................9
1.4 本文的主要工作.....................................................................................10
2.常用数据挖掘方法理论概述...........................................................................10
2.1 分类回归树.............................................................................................10
2.2 Logistic 分类...........................................................................................13
2.3 KNN........................................................................................................19

2.4 随机森林模型.........................................................................................22
2.5 神经网络模型.........................................................................................24
3.客户分类建模...................................................................................................30
3.1 数据处理与基本分析.............................................................................30
3.1.5.1 统计量................................................................................................................36
3.1.5.2 赤池信息量准则.................................................................................................37
3.1.5.3 贝叶斯信息准则.................................................................................................37
3.1.5.4 调整....................................................................................................................38
3.2 建模......................................................................................................39
4.结果比较分析...................................................................................................61
4.1 问题分析与策略.....................................................................................62
4.2 数据整形变换.........................................................................................63
4.3 数据离散化和分层.................................................................................64
5.总结和展望.......................................................................................................66
参考文献..............................................................................................................69
1.介绍
1.1 背景

1.1.1 信用卡
信用卡(Credit Card),又叫贷记卡。是一种非现金交易付款的方式,是
简单的信贷服务。
20 世纪 60 年代,信用卡在美国、加拿大和英国等欧美发达国家出现并迅速
发展,经过 50 多年的发展,信用卡已广泛应用在全球 95%以上的国家。20 世
纪 80 年代,随着改革开放和市场经济的发展,信用卡作为电子化和现代化的消
费金融支付工具开始进入中国,并在后十年里飞速发展。
在经历了金融危机以及国内经济的起伏后,我国信用卡市场在 2010 年有所
回暖。截至 2010 年底,国内信用卡总量已突破 2 亿张。2010 年全国信用卡跨行
交易金额达到 5.11 万亿元,消费金额达到 2.7 万亿元,迄今信用卡消费成为了
主流消费方式之一。
中国信用卡市场依然是中国个人金融服务市场中成长最快的产品线之一,
虽然行业经济效益充满挑战,但受规模效益以及消费者支出增长的推动,今后
10 年间中国信用卡发卡量的年均增速将保持在 14%左右,盈利状况也将趋向好
转,预计到 2020 年,中国信用卡的累计发卡量将超过 8 亿张。
剩余63页未读,继续阅读
资源评论

weixin_42317094
- 粉丝: 0
- 资源: 1

上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助

会员权益专享
最新资源
- 零基础到精通保姆级Python教程
- 基于Java的模拟写字板的设计与实现(单文件小型项目)(源码+lun文+视频)
- 使用word邮件合并功能提取Excel表格中字段数据制作座位卡.pdf
- javaEE-SSM-MySql基于BS架构微博系统(源码+数据库sql+lun文+视频)
- SCE 11.0x-WMM-Capture Weight-Serial Nbr-Data
- cs架构swing-awt-sqlserver陶瓷工厂进销存管理系统的设计与实现(源码+数据库sql+lun文+视频)
- java实现邮件发送html
- 基于瞬时无功功率ip-iq的谐波信号检测MATLAB仿真
- 二端网络的等效概念.pdf
- 手机APP的研发和设计流程.pdf
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制
