睡眠质量影响因素分类研究
摘要:由于睡眠质量的低下,这使得中国成年人失眠率高达 38.2%。所以研究睡
眠的本征数据,找出睡眠质量的影响因素刻不容缓。利用 2017 年亚太数学建模
提供的数据,通过分析各诊断结果的比例情况将诊断结果分为 8 类,并给予标签。
利用聚类的方法对数据进行预处理,剔除异常数据,针对非线性分类情况,将原
输入空间的样本映射到高维的特征空间,利用 Largrange 对偶理论解出分类超平
面,其次引入核函数,降低运算难度。最后通过数据的归一化处理以及核函数的
处理方法来对模型进行优化,使得预测准确率达到 90%。
关键词:特征空间;SVM 分类模型;分类超平面;核函数
1.SVM 分类模型的建立
1.1 SVM 分类问题分析
对于睡眠质量的影响因素的关系问题,采用 SVM 对不同疾病进行分类。有
八类疾病占 82%,所以将疾病分为 8 类,其余疾病归为一类进行分析。选每一类
疾病的 80%作为训练集,20%作为测试集。最后将数据标准化处理,避免量纲对
训练集的影响,选用不同的核函数对模型进行优化,使得测试的准确率达到最优,
找到诊断结果对睡眠的具体关系。依据问题描述中的要求,分析诊断结果对睡眠
的具体影响,大体上可分为以下几个步骤[1],生成培训集/测试集、创建/训练
SVM 分类模型、模拟试验、性能评价。
1.2 SVM 分类模型的建立和求解
1.2.1 产生训练集/测试集
(1)数据预处理
在产生训练集及测试集时,对一些异常点进行剔除。采用聚类的方法剔除异
常数据,例如抑郁症、焦虑性障碍、睡眠障碍、双相情感障碍等诊断结论的异常
数据。
(2)设置标签
A--焦虑障碍 B--睡眠障碍 C--焦虑 D--抑郁 E--混合性焦虑抑郁障
碍 F--双相情感障碍 G--非有机性失眠 H--复发性抑郁障碍 I--其他
(3)选择训练集与测试集
选取每种诊断结果的所有数据的 80%(剔除后)为训练集集,20%为测试集。
1.3 创建/训练 SVM(RBF 核函数)
1.3.1 二分类 SVM 模型
由题所给的数据可知,将本文所划分的八种诊断结果进行分类,是属于线性
不可分 SVM 问题对于该问题,采用非线性映射 ,将原输入空间的样本印射到高
维的特征空间[2]H 中,再在高维特征空间 H 中构造最优分类超平面。
1.3.2 最优超平面求法
定义超平面:若存在分类超平面
由于计算的复杂性,利用 Largrange 对偶理论将式(5)转化为对偶问题。
2.结果分析
选取不同的核函数,预测结果的准确率分别为线性核函数 0.65,d 阶多项式
评论0
最新资源