人寿保险中使用向后消除算法的风险计算
此处的python代码包含用于降维的向后消除算法的实现,以提高人寿保险行业中风险计算的性能。 尽管此实验是在kaggle.com上公开提供的人寿保险数据集上进行的,但该方法对于降低各个域的维数也非常有用。
向后消除是多元线性回归的方法,此处与调整后的R平方一起使用。 如果调整后的R平方值开始减小,则应停止构建模型,因为自变量的最大可能组合与作为单个因变量的风险之间失去显着关系的可能性更高。
同样,根据多个线性回归模型的替代假设,风险因变量(数据集中的最后一列)与自变量(除了提供的数据集中的最后一列之外的所有列)之间存在显着的关系。 因此,根据替代假设,如果我们能够找出自变量与最大可能组合之间的重要相关性,我们将接受该假设并尝试建立一个模型,以拒绝原假设,即风险因变量与单一/独立变量的组合。
对于此分析,我检查了所有独立变量的统计分析的p值。 如果