报告人:张荣卓
基于机器学习的发债主体
违约风险预测
目录
问题提出
1
数据获取与预处理
2
模型初步选择
3
特征工程
4
最终模型与结论
5
改革开放后,随着市场经济的蓬勃发展,我国债券市场经历了从无到
有再到发展壮大的过程。在债券市场中,企业债的规模和占比都不断上
升。债券在帮助企业融资、促进实体经济发展的同时也在客观上带来了
违约风险,为投资者乃至整个金融市场增加不确定性。
在这样的现实问题面前,对企业债券市场进行研究,识别发债主体的
违约风险就具备了重要的现实意义,可以对市场在债券的买入、评级、
定价等环节发挥帮助作用。具体来说,本文尝试以发债企业作为研究对
象,基于债券发行主体是否发生违约行为作为企业违约风险变量,同时
利用财务逻辑和相关系数、Lasso等技术手段对特征指标进行有效筛选,
并构建基于多种机器学习算法的发债企业违约风险预测模型。
3
问题提出
目录
问题提出
1
数据获取与预处理
2
模型初步选择
3
特征工程
4
最终模型与结论
5
5
数据获取与预处理
数据来源
发债企业2019-2020年之间的违约数据与2018-2020年的财务指标数据与企业基本信息数据
数据概述
原始数据为一个62700*178的矩阵,包含了企业所有的财务数据和基本信息数据。一共有
62700条数据,178类特征。其中766条数据被标注为违约数据。