没有合适的资源?快使用搜索试试~ 我知道了~
2022第七届数维杯国赛优秀论文-A2022050411453.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 97 浏览量
2024-03-23
18:16:04
上传
评论
收藏 1.37MB PDF 举报
温馨提示
![preview](https://dl-preview.csdnimg.cn/89019029/0001-4f04219036840b226faf00d361caaf6d_thumbnail.jpeg)
![preview-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/scale.ab9e0183.png)
试读
23页
数维杯,论文,历届,内容丰富,大学生数学,数学竞赛,参考资料
资源推荐
资源详情
资源评论
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/release/download_crawler_static/89019029/bg1.jpg)
Team # 2022050411453
2022 年第七届“数维杯”大学生
数学建模挑战赛论文
题 目 银行效率评价与破产成因分析
摘 要
银行在国家经济社会发展过程中扮演者重要的决策,银行的破产会对企业和个人造
成众多不利的影响。因此国际银行倒闭原因的分析与预测受到众多管理者与学术研究者
的广泛关注。本文主要设计一个银行效率评价与破产成因分析模型,在研究其投入产出
的情况下,分析银行效率,然后,选取银行最重要的 5 项倒闭因素,基于此,建立一个
倒闭风险预测模型,通过此模型挑选出代表银行并具体应用到其他银行,最后,分析各
数据是否来自同一家银行,结合时间序列数据预测倒闭趋势。
针对问题一,首先设定投入产出变量,对存在特殊异常和缺失的数据进行预处理,
删除存在异常较多的指标,用平均数填充,然后用负向指标正向化归一化补充缺失的数
据,达到初步去除不相关变量,之后为达到指标统一性,对所有年份指标合并进行预处
理。之后用数据包络分析(
DEA
)评价将投入与产出进行比较,通过产出不足分析(超
额变数分析)与投入冗余分析(差额变数分析),从而实现效率分析评价。之后用机器
学习的决策树分类算法给出银行倒闭效率的分界线。
针对问题二,在第一题的决策树模型上,使用其特征重要度评价得分来计算权重,
运用 spsspro 所示的决策树分类模型,展示了各特征(自变量)的重要性比例,提取出
排序前五的指标,根据其值给出权重。
针对问题三,构建一个分类模型,首先处理样本不均衡问题,即分类任务中不同类
别的训练样例数目差别很大的情况,之后对比几个分类模型,选取最优模型通过启发式
算法中的遗传算法对模型进行调优,最终提出一个精确的倒闭风险预测模型。
针对问题四,首先对
class
进行分组,做出现存银行和倒闭银行
2
个数据,之后使
用熵权法进行评价,选取综合排序前 20 的银行作为样本,最后做出分类模型。
针对问题五,运用余弦相似度算法,直接通过相关性进行求解,分析出 2017 年至
2021 年的银行数据中部分数据可能来自同一家银行。
关键词 数据包络分析(DEA);决策树分类;熵权法;KNN 分类;余弦相似度
![](https://csdnimg.cn/release/download_crawler_static/89019029/bg2.jpg)
Team # 2022050411453
目录
一 问题重述 ...............................................................1
1.1 问题背景 .......................................................... 1
1.2 相关数据 .......................................................... 1
二 问题分析 ...............................................................2
三 模型假设 ...............................................................3
四 名词解释和符号说明 .....................................................3
4.1 名词解释 ...........................................................3
4.2 符号说明 ...........................................................3
五、模型的建立与求解 ......................................................4
5.1 问题 1 的模型建立与求解 .............................................4
5.1.1 数据包络分析(DEA) ..........................................4
5.1.2 决策树 .......................................................6
5.1.3 模型的求解结果及分析 .........................................8
5.2 问题 2 的模型建立与求解 ............................................11
5.2.1 决策树分类模型 ..............................................11
5.2.2 模型的求解结果及分析 ........................................12
5.3 问题 3 的模型建立与求解 ............................................13
5.3.1 启发式算法 ..................................................13
5.3.2 遗传算法 ....................................................14
5.3.3 模型的求解结果及分析 ........................................15
5.4 问题 4 的模型建立与求解 ............................................15
5.4.1 熵权法 ......................................................15
5.4.2 KNN 分类 .................................................... 17
5.4.3 模型的求解结果及分析 ........................................17
图 模型参数 .......................................................17
5.5 问题 5 的模型建立与求解 ............................................17
5.5.1 相似度算法 ..................................................17
5.5.2 余弦相似度算法 ..............................................18
5.5.3 模型的求解结果及分析 ........................................19
六、 模型评价及未来展望 ..................................................19
6.1 模型评价 ..........................................................19
6.2 未来展望 ..........................................................20
参考文献 .................................................................21
![](https://csdnimg.cn/release/download_crawler_static/89019029/bg3.jpg)
Team # 2022050411453
1
一 问题重述
1.1 问题背景
银行在国家经济社会发展过程中扮演者重要的决策,银行的破产会对企业和个人造
成众多不利的影响。相比国内的银行,国际银行的倒闭频次更高,因此国际银行倒闭原
因的分析与预测受到众多管理者与学术研究者的广泛关注。
近一 个 世 纪 以 来,破 产 预 测 一直 是 人 们 感 兴趣 的 话 题 ,预测财务 困 境 的 目
的是 开 发 一 个 预测 模 型 ,结 合 各种 计 量 经 济 措施 ,并 允 许预 见 一 个 银 行的 财 务
状况 。在该领域中,提出了基于统 计 假 设 测 试、统计建模和最 近 的 人 工 智能 中
的支 持 向 量 机 等各 种 方 法 。预测在经 济 决 策 中 具有 重 要 意 义 。因此,倒闭 原 因
引起 了 研 究 者 的关 注 ,预测的目的是 评 估 其 财 务状 况 及 其 未 来前 景 。通常,通
过描 述 其 业 务 状况 的 众 多 指 标进 行 量 化 ,这些 指 标 进 一 步用 于 利 用 过 去的 观 察
结果 归 纳 出 一 个数 学 模 型 。
1.2 相关数据
1.数据集信息
该 数 据 集 是 关 于 波 兰 公 司 的 破 产 预 测 。 这 些 数 据 是 从 新 兴 市 场 信 息 服 务
( EMIS, [Web Link]) 收 集 的 , 这 是 一 个 包 含 全 球 新 兴 市 场 信 息 的 数 据 库 。
对 2010-2020 年期间的 破 产 公 司 进行 分 析 ,对 2017-2021 年期间仍 在 运 营 的 公
司进 行 评 估 。
根据 收 集 的 数 据, 根 据 预 测 期区 分 了 五 种 分类 案 例 :
第 1 年 :数据包含 预 测 期 第 1 年 的 财 务 利率 和 表 明 5 年后 破 产 状 态 的相 应
类 别 标 签 。 数 据 包 含 7027 个 实 例 ( 财 务 报 表 ) , 271 个 代 表 破 产 公 司 , 6756
个公 司 在 预 测 期内 没 有 破 产 。
第 2 年 :数据包含 预 测 期 第 2 年 的 财 务 费率 和 表 明 4 年后 破 产 状 态 的相 应
类别 标 签 。数据包含 10173 个实 例(财务报表 ),400 个 代 表破 产 公 司 ,9773
个公 司 在 预 测 期内 没 有 破 产 。
第 3 年 :数据包含 预 测 期 第 3 年 的 财 务 利率 和 表 明 3 年后 破 产 状 态 的相 应
类别 标 签 。数据包含 10503 个 实 例( 财 务 报表),495 个代 表 破 产公司,10008
个在 预 测 期 内 未破 产 的 公 司 。
![](https://csdnimg.cn/release/download_crawler_static/89019029/bg4.jpg)
Team # 2022050411453
2
第 4 年 :数据包含 预 测 期 第 4 年 的 财 务 利率 和 表 明 2 年后 破 产 状 态 的相 应
类 别 标 签 。 数 据 包 含 9792 个 实 例 ( 财 务 报 表 ) , 515 个 代 表 破 产 公 司 , 9277
个公 司 在 预 测 期内 没 有 破 产 。
第 5 年 :数据包含 预 测 期 第 5 年 的 财 务 费率 和 表 明 1 年后 破 产 状 态 的相 应
类别 标 签 。数 据 包 含 5910 个 实 例( 财 务 报表 ),410 个代 表 破 产公司,5500
个在 预 测 期 内 未破 产 的 公 司 。
二 问题分析
问 题 一 : 请 你 从 这 64 项 数 据 中 整 理 出 适 合 的 投 入 产 出 数 据 , 并 对 各 银
行的 效 率 展 开 对应 评 价 , 同 时提 供 银 行 倒 闭效 率 的 分 界 线。
分析 :首先 设 定 投 入 产出 变 量 ,对 存 在特 殊 异 常 和 缺失 的 数 据 进 行预 处 理 ,
删除 存 在 异 常 较多 的 指 标 ,用平均数 填 充 ,然后用负 向 指 标 正 向化 归 一 化 补 充
缺失 的 数 据 ,达到初步 去 除 不 相 关变 量 ,之后为达 到 指 标 统 一性 ,对所有年 份
指 标 合 并的 数 据 进 行 预 处 理 。 之 后 用 数 据 包 络 分 析( DEA)评价 将 投 入 与 产 出
进行 比 较 ,通 过 分 析 产出 不 足 分 析( 超 额 变数 分 析 )与 投 入 冗 余分 析( 差额 变
数分 析 ),即分 析 各 变 量 需要 增 加 多 少 产出 时 达 目 标 效率 ,或者分析各变 量 需
要减 少 多 少 投 入时 才 能 达 目 标效 率 ,从 而 实现 效 率 分 析 评价 。之 后 用机 器 学 习
的 决 策 树 分 类 算 法 给 出 银 行 倒 闭 效率 的 分 界 线 。 常 见 的 投 入 指 标 有 总 负 债 /总
资 产 (X2)、 营 运 资 金 /总 资 产 (X3)、 总 资 产 /总 负 债 (X17)、 营 业 费 用 /总 负 债
(X34)。产 出 指 标 有 净利 润 /总资 产 (X1)、经 营 活 动 利 润 / 总资 产 (X22)。
问 题 二 : 请 利 用 该 64 项 指 标 对 银 行 倒 闭 的 原 因 进 行 挖 掘 , 并 提 供 最 为
重要 的 5 项 指 标数 据 及 其 对 应的 权 重 。
分析 :在第 一 题 的 决 策树 模 型 上 ,使用 其 特 征 重 要度 评 价 得 分 来计 算 权 重 ,
运用 spsspro 所示 的 决 策树分类 模 型 ,展示了各特征( 自 变 量)的重要性 比 例 ,
提取 出 排 序 前 五的 指 标 , 根 据其 值 给 出 权 重。
问题 三 :对 任 务 1 和 任 务 2 中的 银 行 倒 闭 分析 结 果 展 开 比对 分 析 ,同时提
出一 个 精 确 的 倒闭 风 险 预 测 模型 。
分析 :构建 一个 分 类 模 型 ,首 先 处 理 样本 不 均 衡 问 题 ,即分类任务 中 不 同
类别 的 训 练 样 例数 目 差 别 很 大的 情 况 ,之 后 对比 几 个 分 类 模型 ,选 取 最优 模 型
通过 启 发 式 算 法中 的 遗 传 算 法 对模 型 进 行 调 优 ,最终提出 一 个 精 确 的倒 闭 风 险
预测 模 型 。
剩余22页未读,继续阅读
资源评论
![avatar-default](https://csdnimg.cn/release/downloadcmsfe/public/img/lazyLogo2.1882d7f4.png)
![avatar](https://profile-avatar.csdnimg.cn/fcd62adb0120465d9af280215b0ff722_snowtshan.jpg!1)
阿拉伯梳子
- 粉丝: 1758
- 资源: 5737
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![voice](https://csdnimg.cn/release/downloadcmsfe/public/img/voice.245cc511.png)
![center-task](https://csdnimg.cn/release/downloadcmsfe/public/img/center-task.c2eda91a.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![dialog-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/green-success.6a4acb44.png)