了解机器学习模型的性能以预测信用违约：一种新型的监督评估方法-研究论文

machine

learning

credit

risk

prediction

需积分: 18 4 下载量 20 浏览量 2021-05-20 17:05:38 上传评论收藏 1.76MB PDF 举报

温馨提示

试读

44页

在本文中，我们研究了几种用于信用违约预测的机器学习（ML）模型的性能。为此，我们使用了一家西班牙大型银行的独特且匿名的数据库。我们比较了简单的传统模型（如Logistic回归（Logit））的统计性能，以及更高级的模型（如Lasso惩罚式Logistic回归，分类和回归树（CART），随机森林，XGBoost和深度神经网络）。按照用于内部基于评级（IRB）系统的监督验证所部署的过程，我们从分类和校准的预测能力方面研究了使用ML的好处。通过针对不同样本数量和特征数量进行模拟练习，我们能够隔离与访问大量数据相关的信息优势，并衡量ML模型的优势。尽管ML模型在分类和校准方面均胜过Logit，但更复杂的ML算法不一定能预测得更好。然后，我们将这种统计效果转化为经济影响。通过使用ML模型而不是像Lasso这样的简单模型来计算风险加权资产时，我们可以估算出监管资本的节省。我们的基准结果表明，根据IRB的监管资本要求，实施XGBoost可以节省12.4％到17％的费用。这使我们得出以下结论：这些机构在经济方面的潜在利益将是巨大的，这有理由进行进一步的研究以更好地理解ML模型中嵌入的所有风险。

资源推荐

资源评论