没有合适的资源?快使用搜索试试~ 我知道了~
2022年华数杯数学建模竞赛C题二等奖论文
1星 需积分: 34 68 下载量 52 浏览量
2022-08-21
19:54:29
上传
评论 12
收藏 1.07MB PDF 举报
温馨提示
试读
24页
熔喷非织造材料是口罩生产的重要原材料,具有诸多优点。但是,这种材料非常细,在使用过程中经常因为压缩回弹性差而导致其性能得不到保障。因此,科学家对其进行了更新,制备出新型材料。新型材料工艺参数较多,并且不同参数还存在相互影响。基于以上可知,如果能建立工艺参数与产品性能之间的关系模型,将有助于疫情防控与产业发展。 本文针对插层熔喷非织造材料的性能控制展开深入研究,通过典型相关、XGBoost、皮尔逊person相关性、BP神经网络等方法,使用 MATLAB、Python、SPSS、EXCEL等软件编程进行处理,得出了题目中结构变量、产品性能的变化规律;建立了工艺参数与结构变量之间的预测模型;建立了皮尔逊相关性判定模型,分析了结构变量与产品性能以及各自之间的关系等。最终结合研究成果得出了实际产品生产中能够使得过滤效率尽量的高的同时力求过滤阻力尽量的小的工艺参数。工艺参数接收距离为19.1cm;热风速度为1386.4r/min时,产品的过滤效率将会达到最高。 本次论文解决了2022华数杯C题问题,取得了华数杯C题二等奖,包含详细课运行代码包与程序附录,代码包请看作者其他资源。
资源推荐
资源详情
资源评论
1
所属类别
2022 年“华数杯”全国大学生数学建模竞赛
参赛编号
本科
CM2204721
插层熔喷非织造材料的性能控制研究
摘要
本文针对插层熔喷非织造材料的性能控制展开深入研究,通过典型相关、XGBoost、
皮尔逊 person 相关性、BP 神经网络等方法,使用 MATLAB、Python、SPSS、EXCEL 等软
件编程进行处理,得出了题目中结构变量、产品性能的变化规律;建立了工艺参数与结
构变量之间的预测模型;建立了皮尔逊相关性判定模型,分析了结构变量与产品性能以
及各自之间的关系等。最终结合研究成果得出了实际产品生产中能够使得过滤效率尽量
的高的同时力求过滤阻力尽量的小的工艺参数。
针对问题一,首先对附件一中数据进行预处理,先分析是否有不符合实际的极值数
据。然后对插层前后的产品结构变量、产品性能利用 SPSS26.0 对清洗后数据做描述性
统计。通过对比分析,插层后结构变量方面,厚度加厚,孔隙率和压缩回弹性降低等。
然后我们对插层率与结构变量与产品性能的变化进行单因素方差分析和皮尔逊相关性
分析。各个指标相关性存在显著差距,插层率与孔隙率变化和压缩回弹性率变化等因子
都具有显著的相关性,并且孔隙率变化还达到了高度相关,基本判断出插层率对结构变
量、产品性能变化规律有显著的影响。
针对问题二,预测类问题,首先对附件的数据进行筛选训练样本的预处理。基于表
1 与预处理结果构建了机器学习回归预测模型,根据结合附件中筛选后的工艺参数与结
构变量数据,分别在逻辑回归、决策树、随机森林和 XGBoost 进行不同的机器学习算法
上进行测试。经过与其他算法的对比与测试得到 XGBoost 预测为较好的预测方法。最后
通过 XGBoost 回归预测,给出了表 1 中各个工艺参数对应的结构变量的预测情况。
针对问题三,首先对结构变量与产品性能之间建立典型相关分析模型,发现两组多
元随机变量之间存在线性正相关关系,并通过 SPSS26.0 软件求解并进行分析。然后对
决定结构变量(厚度、孔隙率、压缩回弹性)和产品性能(过滤阻力、过滤效率、透气
性)之间分别进行皮尔逊相关性分析,发现不同结构变量之间和不同之间均存在具有显
著的相关性,其中厚度与孔隙率达到了高强度相关。然后对本题第三小问按照神经网络
深度学习所需环境对数据进行处理,把处理后的数据以数值矩阵的形式导入 MATLAB,以
“影响因子”作为输入,产品过滤效率作为输出进行训练,避免了拟合函数的选择,得
出相应工艺“黑匣子”函数,从而求出最优解:工艺参数接收距离为 19.1cm;热风速度
为 1386.4r/min 时,产品的过滤效率将会达到最高。
针对问题四,规划问题求解最优解。对实际产品生产进行进一步考虑,加入对实际
生产的各个指标实际情况考虑,同时过滤效率尽量的高,过滤阻力尽量的小,首先利用
熵权法求解过滤阻力与过滤效率之间的权重,然后根据权重大小构建两指标间的多目标
规划模型,以实际情况的限制作为限制条件,考虑到规划模型存在的欠缺,我们引入工
程优化的思想,利用粒子群算法对规划模型寻找全局最优解的过程进行优化,经过优化
后的模型更加高效与准确。经过灵敏度分析后发现,粒子群优化后模型稳定性较高。最
终对优化后的模型进行求解,从而得出研究结论。
关键词:皮尔逊 person 相关性 XGBoost BP 神经网络 多目标规划 粒子群优化
2
一、问题重述
1.1 背景分析
2019 年 12 月湖北武汉爆发了新型冠状病毒肺炎,这是新中国成立以来传播速度快、
感染范围广、防控难度大的一次重大突发公共卫生事件,对全国的社会经济生活造成了
严重影响。这一突发情况也让口罩的作用凸显出来。熔喷非织造材料是口罩生产的重要
原材料,具有诸多优点。但是,这种材料非常细,在使用过程中经常因为压缩回弹性差
而导致其性能得不到保障。因此,科学家对其进行了更新,制备出新型材料。新型材料
工艺参数较多,并且不同参数还存在相互影响。
基于以上可知,如果能建立工艺参数与产品性能之间的关系模型,将有助于疫情防
控与产业发展。
1.2 问题重述
问题一:首先对所给数据进行清洗,挑选出异常值和缺失数据。然后将插层前后的
结构变量、产品性能分别进行统计性描述来得到其变化规律。然后通过对比不同插层率
来研究插层率对于这些变化的影响。
问题二:通过检验其显著性来研究工艺参数与结构变量之间是否存在关系。同时通
过所给数据,用数学方法预测结构变量的部分数据。
问题三:结合问题二,首先检验结构变量与产品性能的显著性,通过显著性来判断
其受否存在相关性。以产品过滤效率为自变量,以工艺参数(接收距离和热空气速度)
为因变量,研究当工艺参数取何值时,其产品过滤效率最高。
问题四:在实际生产中,产品需要兼顾多方面的条件和要求。不能只考虑单方面的
性能。当熔喷非织造过滤材料过滤阻力过大时,会导致颗粒堵塞孔隙,从而间接导致过
滤效率急速下降,而口罩是需要同时以过滤效率高和过滤阻力小的目标的。因此我们要
研究当请问工艺参数取何值时,才能够使得过滤效率尽量的高的同时力求过滤阻力尽量
的小。
二、问题分析
2.1 对于问题一的分析
问题一要求研究插层后结构变量、产品性能的变化规律,并分析插层率对于这些变
化是否有影响;我们首先对数据进行清洗,剔除了异常值和缺失数据,我们使用 Excel
和 Python 等编程工具进行筛选处理。通过对插层前后进行描述统计来研究插层后结构
变量、产品性能的变化规律。为了更直观得到变化规律,将结果进行可视化。之后将处
理好的数据通过 SPSS 软件进行插层率与各个指标间的相关性分析,并结合单因素方差
共同分析。
2.2 对于问题二的分析
问题二需要构建机器学习预测模型,首先对附件中的数据进行预处理,结合表 1 的
结构变量与工艺参数进行筛选指标,利用机器学习算法对筛选的数据进行学习,分别在
不同的机器学习算法上进行测试对比,最后根据筛选的属性建立部分属性的 XGBoost 分
类器模型进行分类预测,结合工艺参数大小,给出对应的结构变量数据的预测结果。
2.3 对于问题三的分析
问题三分为三个问题,第一问要求分析结构变量与产品性能的关系,第二问要求求
3
解结构变量之间、产品性能之间的关系。其中结构变量和产品性能均包括不同变量。多
元研究变量较为复杂。因此我们可以采用典型相关分析模型来揭示结构变量和产品性能
两组多元随机变量之间的线性相关关系。对于结构变量之间和产品性能之间的关系,我
们对这两组多元变量组内分别进行相关性分析,通过相关性系数表来判断不同变量之间
的关系。第三问要求研究当工艺参数为多少时,产品的过滤效率将会达到最高;这是通
过问题数学模型化,并和已知有限数据量去求未知函数极值问题。由于问题三所给数据
是非线性关系,且离散程度大数据量少,如果采用直接拟合的方式会出现过拟合的现象。
所以,我们在这里用 BP 神经网络深度学习的算法,通过对已知数据的深度学习,利用
其中的部分数据对工艺参数进行预测,用相对应的真实数据与预测数据进行拟合分析,
得出未知函数来求解。
2.4 对于问题四的分析
实际工程中,产品生产需要兼顾各方面的条件和要求,接收距离不大可能大于 100cm,
压缩回弹性率尽量不要低于 85%等。同时为了防止熔喷非织造过滤材料因过滤阻力大使
得大量颗粒堵塞孔隙而致使过滤效率迅速下降的现象发生,产品是需要同时追求过滤效
率高和过滤阻力小的目标的。因此该题整体上是一个多目标规划问题,需要建立目标函
数和约束条件,为其建立规划模型,我们需要考虑上述限制条件,并构建整体目标函数。
采用传统的规划模型,无法准确得出结果,故我们可以对其采用粒子群算法进行工程优
化,加速目标函数的求解。在确定模型后通过改变初始输入值得大小,对整体模型进行
灵敏度分析,观察模型是否会因为变量微小变化导致整体预测情况不稳定。
三、模型假设
(1) 假设题目变量关系仅与题目所给影响因素相关;
(2) 假设题目所给数据及所查阅到的资料均真实可靠;
(3) 优化后的规划结果允许有一定量的误差,忽略对于构建模型的最终结果的影响;
(4) 假设理想状态下,产品的过滤效率最高可以达到 100%。
四、符号说明
符号
含义
()L Φ
XGBoost 损失函数
()
t
fx
基学习器
ij
X
表示第 i 个样本的第 j 个指标的值
e
j
表示第 j 个指标的信息熵
j
W
表示第 j 个指标的权重
4
ij
y
表示第 i 个样本的第 j 个指标的比重
A
+
表示最优值向量
A
−
表示最劣值向量
𝐷
𝑖
+
表示第 i 个样本与最优值之间的距离
𝐷
𝑖
−
表示第 i 个样本与最劣值之间的距离
pbest
当前较优位置
gbest
全局较优位置
五、模型的建立与求解
5.1 问题一模型的建立与求解
5.1.1 问题一数据处理与模型建立
首先我们对于所给数据进行清洗,在数据分析过程中,数据的质量决定了成败,直
接关系到模型效果和模型结论。为了提升数据质量,我们需要对附件中数据进行异常值
和缺失数据进行处理,从数据合法性和数据完整性角度考虑,配合 Excel 与 Python 等
编程工具进一步处理,按照先异常后缺失的方式进行清洗。我们主要需要先分析附件中
给出的多组数据查找出数据的异常值和缺失的数据,进行异常的处理。
通过处理后的数据进行下一步的分析。确定题目所给的方面的与之相关的变量,用
SPSS 对数据进行相关性分析:先对不同变量之间是否存在统计上的显著关系进行检验,
然后分析相关系数为的正负向以及相关性程度。
剩余23页未读,继续阅读
资源评论
- 不会数分的屑2022-09-04第四问的偏差很大。。。
保驾护航团队
- 粉丝: 40
- 资源: 11
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功