在本文中,我们研究了几种用于信用违约预测的机器学习(ML)模型的性能。 为此,我们使用了一家西班牙大型银行的独特且匿名的数据库。 我们比较了简单的传统模型(如Logistic回归(Logit))的统计性能,以及更高级的模型(如Lasso惩罚式Logistic回归,分类和回归树(CART),随机森林,XGBoost和深度神经网络)。 按照用于内部基于评级(IRB)系统的监督验证所部署的过程,我们从分类和校准的预测能力方面研究了使用ML的好处。 通过针对不同样本数量和特征数量进行模拟练习,我们能够隔离与访问大量数据相关的信息优势,并衡量ML模型的优势。 尽管ML模型在分类和校准方面均胜过Logit,但更复杂的ML算法不一定能预测得更好。 然后,我们将这种统计效果转化为经济影响。 通过使用ML模型而不是像Lasso这样的简单模型来计算风险加权资产时,我们可以估算出监管资本的节省。 我们的基准结果表明,根据IRB的监管资本要求,实施XGBoost可以节省12.4%到17%的费用。 这使我们得出以下结论:这些机构在经济方面的潜在利益将是巨大的,这有理由进行进一步的研究以更好地理解ML模型中嵌入的所有风险。