没有合适的资源?快使用搜索试试~ 我知道了~
2022年数学建模C题:古代玻璃制品的成分分析与鉴定(国二论文)
24 下载量 178 浏览量
2023-07-17
17:16:47
上传
评论 5
收藏 2.04MB PDF 举报
温馨提示
试读
27页
本资源仅含一篇PDF格式的论文。本论文是2022年我们组打数学建模时写的论文,最后得了全国二等奖,现放在这里仅供参考!
资源推荐
资源详情
资源评论
1
古代玻璃制品的成分分析与鉴定
摘 要
贸易与交换作为考古学中的重要研究领域,主要研究方法是通过人工制造品的材料
追溯其产地来源。玻璃材料的生产工艺具有特殊性,同时此类材料基体中的玻璃在化学
成分上颇为均一,因而受到社会的关注。但玻璃风化前后化学成分有显著变化,对玻璃
种类的确定会产生较大影响,所以对玻璃中化学成分的分析和工艺的探讨对以后玻璃文
物的鉴别具有重要的现实意义。
对于问题一,首先对数据进行预处理,剔除无效数据和异常数据,补全缺值。然后
利用卡方检验证明表面风化与玻璃类型、纹饰和颜色存在显著相关性,其中表面风化与
其玻璃类型具有很强的相关性,我们根据此关系进行分类;再将化学成分含量与表面风
化进行灰色关联度分析,得出不同化学成分对于不同玻璃类型与风化表面的关系。我们
结合玻璃的类型,再对数据进行分析,然后分别对高钾玻璃和铅钡玻璃的所有化学成分
含量做均值,并通过折线图对其化学成分含量进行定性分析得出了化学成分含量的统计
规律;我们选区具有讨论意义的某些化学成分含量,利用风化前后的均值数据做差得到
理想差值,后将实际风化后的化学成分含量减理想差值即得风化前各化学成分含量。
对于问题二,首先从宏观角度来看,根据纹饰和颜色分别对铅钡和高钾玻璃进行分
类。然后从微观角度来看,我们先通过典型相关性分析,得到玻璃类型和各化学成分含
量间的关系,选取具有体现玻璃类型的化学成分含量分析得到玻璃类型判断因子,通
过定义范围来确定玻璃类型;接着利用主成分分析法对 14 个数据进行因子分析得到高
钾玻璃的主成分为
,铅钡玻璃的主成分
和,然后利用聚类分析得到高钾玻
璃的 3 种亚分类为
,
,
和铅钡玻璃的 6 种亚分类为
,
(,,),;再利用
ROC 曲线对上述亚分类进行合理性和敏感性分析,得到相关的 AUC 均为 1,敏感性和合
理性极高。
对于问题三,我们分析得出利用多元线性回归模型对表单 3 的玻璃类型进行分类,
然后分析
和共线性关系,发现该多元回归方程拟合度较好。接着分析得出 A1、A6、A7
为高钾类,A2、A3、A4、A5、A8 为铅钡类;再利用决策树学习问题二得到的亚分类结果,
对得到的玻璃类型再进行亚分类,得到最终的玻璃类型为 A1 高钾类,A6 和 A7 为高钾
类,A2 和 A3 为铅钡(4)类,A4 为铅钡(2)类,A5、A8 为铅钡类,再利用
对机器学习模型进行灵敏度检验,求得灵敏度为 1,则所构建模型准确。
对于问题四,我们首先运用灰色关联度分析对高钾玻璃和铅钡玻璃之间的化学成分
进行分析,得出了高钾玻璃对于
、
具有极强的关联性;铅钡玻璃对于
和
具有极强的关联性。然后将
和分别作为高钾玻璃和铅钡玻璃的母序列,分
别进行相关性分析,得出:高钾玻璃内部化学成分的关联度最高;铅钡玻璃内部化
学成分的关联度最高。最后利用卡方检验和方差检验对
和进行差异性检验,
均得出较为明显的差异性。
关键词:卡方检验;灰色关联度;聚类分析;多元线性回归;决策树
2
一、问题重述
对于古代玻璃成分的研究目前还处于冷门问题,但对于玻璃的成分分析,可以推断
其所属时代,对早期贸易范围的划定以及具体年代的确定具有重要意义。由于古玻璃受
埋藏位置的影响其成分比例发生了变化,对其分类造成影响,界定化学成分及玻璃种类
成为亟待解决的需求,本文将解决以下几个问题:
(1)利用表单一对玻璃文物的表面风化与其玻璃类型、纹饰和颜色的关系进行分析;
结合玻璃的类型,分析文物样品表面有无风化化学成分含量的统计规律,并根据风化点
检测数据,预测其风化前的化学成分含量。
(2)依据附件数据分析高钾玻璃、铅钡玻璃的分类规律;对于每个类别选择合适的
化学成分对其进行亚类划分,给出具体的划分方法及划分结果,并对分类结果的合理性
和敏感性进行分析。
(3)对附件表单 3 中未知类别玻璃文物的化学成分进行分析,鉴别其所属类型,并
对分类结果的敏感性进行分析。
(4)针对不同类别的玻璃文物样品,分析其化学成分之间的关联关系,并比较不同
类别之间的化学成分关联关系的差异性。
二、问题的分析
2.1 问题一的分析
对于问题一,将数据进行预处理完后我们首先利用卡方检验模型判断玻璃文物的表
面风化与其玻璃类型、纹饰和颜色之间的关系,然后根据得出来的结论将表面风化进行
合理的分类;我们先分析了灰色关联度分析各化学成分含量与表面风化之间的关系;然
后按照玻璃类型以及表面风化大致分成高钾风化、高钾未风化、铅钡风化和铅钡未风化
四类后,我们对这四类分别求取平均值,再结合折线图就可以清楚得到其统计规律,为:
铅钡玻璃风化后较风化前除了
含量降低,、和
含量均增加,其余含量
无明显变化;高钾玻璃风化后较风化前
含量增加,其余含量均减少,减少最明显的
则是
和
;将上述变化较为显著的化学成分含量进行分析:玻璃类型一致的情况
下,分别对风化前后的值做差得到理想差值,再根据风化后的实际数据,经过减法运算
就可以得到其风化前的这些化学成分含量。
2.2 问题二的分析
针对问题二,我们从宏观和微观角度分别分析了高钾玻璃和铅钡玻璃的分类规律:
从宏观角度,即利用纹饰和颜色来对其进行分类。微观角度,即分析化学成分对其进行
分类,我们先通过典型相关性分析得出影响高钾玻璃和铅钡玻璃最大的化学成分,对这
些化学成分在结合实际分析,我们便引入玻璃类型判断因子,通过确定的范围就可以
分析出高钾玻璃和铅钡玻璃的分类规律;接着我们在玻璃类型固定的情况下分别用主成
分分析法降维得出最主要的主成分,后根据该主成分进行聚类分析,分析系谱图就可以
得出如下分类:利用
含量将高钾玻璃亚分类为
,
,
三
类,利用
的含量将铅
钡玻璃亚分类为
,
,
三类,再对类利用分类为四类;随后我们根据所分类别分
别筛选其中的最大值和最小值,经过升序排列后,利用 ROC 曲线进行两两分析,得出
的亚分类结果具有很好的合理性。
2.3 问题三的分析
针对问题三,我们先对数据进行分析后,对某些化学元素的平方建立多元线性回归
模型,并通过
和共线性分析,可以判断出在不同的玻璃类型条件下,以
作为因变
量,其余的化学成分含量作为自变量,这样构建的线性回归方程具有较高的拟合度,随
后将实际值和预测值分别作比较,便可以预测出表单 3 中所属的玻璃类型;然后我们再
利用决策树模型对表单 3 中玻璃类型进行亚分类,发现和问题二中的亚分类结果一致。
3
2.4 问题四的分析
对于问题四,我们首先运用灰色关联度分析对高钾玻璃和铅钡玻璃之间的化学成分
进行分析,得出了高钾玻璃对于
、
具有极强的关联性;铅钡玻璃对于
和
具有极强的关联性。然后将
和分别作为高钾玻璃和铅钡玻璃的母序列,分
别进行相关性分析,得出:高钾玻璃内部化学成分的关联度最高;铅钡玻璃内部化
学成分的关联度最高。最后利用卡方检验和方差检验对
和进行差异性检验,
均得出较为明显的差异性。
三、模型假设
假设一:严重风化点和风化点对模型的影响不相同;
假设二:样本数据足够支撑模型的建立与求解;
假设三:玻璃的化学成分种类只含有附件中所给 14 个;
假设四:表中空白处一定是未检测到该成分,并且值为 0。
四、符号及变量说明
变量符号
变量说明
、
二氧化硅(
)含量(高钾
含量、铅钡
含量)
、
氧化钠(
)含量(高钾
含量、铅钡
含量)
、
氧化钾(
)含量(高钾
含量、铅钡
含量)
、
氧化钙()含量(高钾含量、铅钡含量)
、
氧化镁()含量(高钾含量、铅钡含量)
、
氧化铝(
)含量(高钾
含量、铅钡
含量)
、
氧化铁(
)含量(高钾
)含量、铅钡
)含量)
、
氧化铜()含量(高钾含量、铅钡含量)
、
氧化铅()含量(高钾含量、铅钡含量)
、
氧化钡()含量(高钾含量、铅钡含量)
、
五氧化二磷(
)含量(高钾
含量、铅钡
含量)
、
氧化锶()含量(高钾含量、铅钡含量)
玻璃类型判断因子
4
五、模型的建立与求解
5. 1 问题一模型的建立与求解
5. 1. 0 数据预处理
(一)删除异常值
由于题目中已经给出对于表单 2 表单 3 中各成分比例累加和介于之间的
数据视为有效数据,故用 Excel 对表单 2 和表单 3 中的各成分进行累加求和,得出的部
分结果如图所示:
表 1 表单 2 中部分表格(红色为异常值)
文物采样点
SiO
2
Na
2
O
K
2
O
CaO
MgO
Al
2
O
3
PbO
P
2
O
5
SrO
求和
13
59.01
2.86
12.53
6.16
2.88
4.73
1.27
98.14
14
62.47
3.38
12.28
0.66
9.23
0.5
0.47
1.62
0.16
99
15
61.87
3.21
7.44
1.02
3.15
1.04
1.29
0.19
0.26
79.47
16
65.18
2.1
14.52
0.52
6.18
0.42
1.07
0.11
98.41
17
60.71
2.12
5.71
0.85
1.04
1.09
0.19
0.18
71.89
18
79.46
9.42
1.53
3.05
1.36
97.25
19
29.64
0.59
3.57
1.33
3.51
42.82
8.83
98.76
表 2 表单 3 中部分数据累加结果
文物采样点
SiO
2
Na
2
O
K
2
O
CaO
MgO
Al
2
O
3
PbO
P
2
O
5
SrO
求和
A1
无风化
6.08
1.86
7.23
2.15
1.06
0.03
99.48
A2
风化
7.63
2.33
34.3
14.27
96.28
A3
无风化
1.36
7.19
0.81
2.93
7.06
39.58
2.68
0.52
98.98
A4
无风化
0.79
2.89
1.05
7.07
6.45
24.28
8.45
0.28
96
由表中可以得出表单 2 中文物采样点编号为 15 和 17 的各成分累加求和为 79.47%和
71.89%,其累加和小于 85%,故视为异常数据;而表单三中的数据则没有问题。
(二)删除无效值
在处理和颜色有关的问题中,例如在处理问题一第一小问时,结合表单 1 需要研究
表面风化和颜色的关系,但由于环境因素影响导致文物风化严重致使表单 1 中存在部分
文物编号没有对应的颜色,如图所示:
表 3 表单 1 文物编号无颜色部分表格
39
C
铅钡
深绿
风化
40
C
铅钡
风化
41
C
铅钡
浅绿
风化
42
A
铅钡
浅蓝
风化
43
C
铅钡
浅蓝
风化
44
A
铅钡
浅蓝
风化
46
A
铅钡
浅蓝
无风化
47
A
铅钡
浅蓝
无风化
48
A
铅钡
风化
表单 1 中无颜色的文物编号有:19、40、48、58。故我们认为在处理问题一第一小
问时,视这些数据为无效数据。
(三)表中空值数据处理
由题中已知可得,该空值元素为现有阶段方法无法测量的数据,通过查阅相关文献
我们将空值数据更改为‘0’。
5
表 4 空值数据处理部分展示
11
33.59
0
0.21
3.51
0.71
19
29.64
0
0
2.93
0.59
20
37.36
0
0.71
0
0
23 未风化点
53.79
7.92
0
0.5
0.71
5.1.1 利用卡方检验玻璃文物的表面风化与其玻璃类型、纹饰和颜色的关系
由于需要对变量进行相关分析,并进行分类,故建立卡方检验模型。则我们用
SPSS Pro 软件中卡方检验分别对玻璃文物与其玻璃类型、纹饰和颜色进行相关性分析,
得出如图所示的结果:
表 5 表面风化与玻璃类型、纹饰和颜色的关系
题目
名称
表面风化
总计
X²
校正 X²
P
无风化
风化
nan
纹饰
A
11
11
0
22
18.802
18.802
0.005***
B
0
6
0
6
C
13
17
0
30
类型
铅钡
13
36
0
49
13.700
13.700
0.001***
高钾
12
6
2
20
浅绿
0
2
1
3
浅蓝
0
8
12
20
深绿
0
3
4
7
深蓝
0
2
0
2
紫
0
2
2
4
绿
0
1
0
1
蓝绿
0
6
9
15
黑
0
0
2
2
注:***、**、*分别代表 1%、5%、10%的显著性水平
由图可知对于表面风化,显著性 P 值为 0.005,水平上呈现显著性,拒绝原假设,
因此对于表面风化和纹饰数据存在显著性差异;对于表面风化,显著性 P 值为 0.001,
水平上呈现显著性,拒绝原假设,因此对于表面风化和类型数据存在显著性差异;对于
表面风化,显著性 P 值为 0.229,水平上不呈现显著性,接受原假设,因此对于表面风
化和颜色数据不存在显著性差异。
为此,我们通过 Excel 以玻璃类型为前提来分析表面风化,得出了如下表格:
表 6 表面风化与其玻璃类型、纹饰和颜色分类表
类型
纹饰
颜色
表面有无风
化
高钾
无关
风化
、
无关
无风化
铅钡
浅蓝
无风化
、
黑、蓝绿、深蓝、绿
风化
浅蓝(A)、浅绿、深绿、紫
二者都有
注:“浅蓝(A)”表示纹饰为 A 且颜色为浅蓝。
剩余26页未读,继续阅读
资源评论
.求
- 粉丝: 42
- 资源: 22
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功