论文研究-稀疏降噪自编码结合支持向量机的近红外光谱药品鉴别方法 .pdf

所需积分/C币:9 2019-08-15 16:06:44 529KB .PDF
0
收藏 收藏
举报

稀疏降噪自编码结合支持向量机的近红外光谱药品鉴别方法,周洁茜,郑安兵,本文提出一种稀疏降噪自编码网络结合支持向量机的近红外光谱药品鉴别方法。该方法首先用稀疏降噪自编码(SDAE)网络提取光谱特征,�
国技论文在线 http:/www.paper.edu.cn 非线性支持向量机就是将线性不可分数据通过核函数哄射到高维空冋,在高位空间使得 数据线性可分,并对数据进行分类 核函数能简化映射空间中的内积运算,SVM里需要计算的地方数据向量总是以内积的 形式出现的,其分类判别函数的为: ∑=:Wk(xx)+b (3) 此时分类间隔等于:,使得分类间隔最大,等价于使w最小、原理如图所示 中。) 中。) () ca)φ) 中。) 中(■ 中a 中m)4a)中) 中m) 中口) Input space Feature space 图2非线性支持向量机 Fig 2 Non-linear SVM 10 2稀疏自编码网络 自编码刈终是一种尢监督的特征学习的算法,通过逐层的预训练来获得內络初始化权 值。自编码网络构造了一种使输入层与输岀层具有相同节点数的神经网络,并用反冋传播算 法来训练。使输入数据与输岀数据尽可能相等,从而学丬到数据内部特征ε Encoder Decoder 1 h di 3 n input layer hidden layer 15 output layer 图3单层自编码网络 Fig 3 Single-layer Autoencoder 如图3所示,一·个单层的自编码网络只有一·个隐藏层,输入和输出层有相同神经元。自 编码网络可分为编码层和解码层。第一阶段为编码过程,设x∈ h()=fwx+b1) 团技论文在线 http:/www.paper.edu.cn 1+x一2 是非线性激活函数,h(x∈B是隐藏层节点的激活值,∈mXn是连接权值 矩阵。b∈B是偏置值。自编码网络的输出为解码过稈, f(w2h+b2) ∈R是网终的输出向量,V∈nxm是隐藏层到输出层的连接权重。 给定p个输入L=1,mp权重矩阵、踢和偏置向量b、b2通过BP算法最小化重构误 差E1(x一G)2学得到 进一步限制隐藏层单元的激活值的稀疏性,损失函数添加惩罚因子,惩罚不符合稀疏期 望的情况,使隐藏层节点的平均激活值保持在一个较低的比例ρ,优化问题变为: mi=(G-)2+BE把1SP(P 10共中sP同)=p号+(1--,作为稀疏惩罚项。可=2()是第个隐藏层 的平均溦活值,ρ是稀疏参数,β作为控制稀疏惩罚因子的权重。当隐藏层单元的个数π小于 输入单元个数,网终将学习到输入数据的稀疏表示 13降噪自编码网络 降噪自编码用带有噪声或破损的数据去去训练自编码网络6,使自编码学习到的特征更 15 具有鲁棒性,如图4所小。 y g0′ 图4降噪自编码网络 Fig 4 Denoising autoencoder 实验数据及模型 21实验数据 实验数据为中囻食品药品检定研究院收集,包括西安杨森及吴太集团、武汉第四、石家 庄制药等企业生产的琥乙红霉素,另外还有少量红霉素,克拉霉素,麦白霉素等性状类似的 其它药品,涉及了不同批次、不同仪器、不同厂家和不同品种。分析过程中,将不同批次和 不同仪器的测定光谱作为自身光谱,把不同厂家和不同品种的光谱作为假劣药品对照光谱 4 团技论文在线 http:/www.paper.edu.cn 共包含负类样本(真药)171个,正类样本(假药)78个。其中每个光谱数据有1247维。 22数据处理 将光谱数据进行一阶导数化(13个点平滑)消除基线和其他背景干扰,并通过矢量归 一化预处理来校正由微小光程差异引起的光谱变化。 23建立分类模型 实验来用 MATLAB R2015b作为编码工具,选用 Deeplearn Toolbox中自编码工具箱 (hts:/ github. com/rasmusbergpalm/ DeepLearnToolbox)。通过实验设定网络结构为 1247-200-100-l,如图4所示,网络中间两层通过自编码算法来初始化权值W,最后一层使 用具有RBF核函数的SVM对正负样本进行分类。 1(2) 2 3 .t S /1 1(2) b 百ta面tem second autoencoder 图4两层白编码网络结构 Fig 4 The structure of the two-layer autoencoder 将预处理后的光谱数据(1247维)作为稀疏降噪自编码网终的输入效据。在自编码网 15 终预训练阶段尢需样本标签参与训练,用训练集逐层训练自编似焖络。自编码內络共两层, 其网络结构分别为1247-200-1247和200-100-200。其中稀疏参数设为0.09。加入方差为0.001 的髙斯噪声,随机晑斯噪声的加入使得学习到的特征更具有鲁棒性。学习率为0.001,神经 元溦活函数为 sigmoid,使用BP算法训练网络,使用随机梯度下降法,每一层迭代200次。 分别得到自编码网络权重W、W2。预训练后,构造网络结构为1247-200-100-1的神经网 终。用预训练得到的权值wI、W2初始化神经网络的前两层连接权值。用带标签的训练数 据集来训练整个网终。最后选用高斯核RBF作为SVM的核函数,用稀疏降噪自编码网终提 取好的的特征作为SVM的输入,并用SVM进行二分类。 选择常用的BP神经网终和SⅴM算法作为对比实验。其中神经网络选用 MATLAB中 的神经网络工具箱,k络结构分别选用单层网(1247-200-1)以及与自编码网终具有相同结 25 构的恻终(1247-200-100-1)。SⅥM算法选用台湾大学林智仁等开发的 Libsvm (https:!github.com/cjlinl/libsvm)工具箱。选择常用的高斯核RBF作为SVM的核函数,通 过工具箱中的网格寻参函数通过交叉验证来桷定SⅤM高斯核参数。 团技论文在线 http:/www.paper.edu.cn 3结果与讨论 随机从各个类别的数据集中选取相应比例的数据组成训练集与测试集进行测试对比,取 10次测试结果的平均值,实验结果如表1所示。实验结果表明:在分类准确率方面,稀疏 降噪自编码结合支持向量机网络SDAE-SVM的分类准确率大体髙于BP和SⅥM的准确率, 说明 SDAE-SVE复杂的非线性建模能力能很好地适用于该二分类问题,并且取得了很好的 分类效果。 表1不同比例训练集测试集下各算法分类准确率 Tab. 1 The classification accuracy of different ratios of training set 训练测试集 BP BP SDAE (比例) (one layer)(two layer) (RBF) SVM 49/200(0.2 90.83 97.06 97.06 74/170(0.3) 83.60 89.10 96.80 99.44 99/150(0.4) 86.99 9 97.65 100 124/125(0.5) 87.09 93.54 98.50 99.21 149/100(0.6) 87.86 95.53 98.45 98.06 17475(0.7) 86.71 95.06 97.60 199/50(0.8) 88.46 95.58 98.45 22425(0.9) 88.89 95.93 99.62 100 104结论 本文提岀一种稀疏降噪自编码结合支持向量机的方法用于近红外光谱分析,可用于药品 鍳别。对比实验表明,稀疏降噪自编码可以很好地提取光谱特征信息,同时结合对小样本数 据有良好分类效果的SVM,从而最终的分类准确率优于BP及SVM等其他方法。 |参考文献( References 1]白英奎.近红外光谱技术在药品检测中的应用研究[D]长春:吉林大学,2005 「2刘树春.基于支持向量机和深度学习的分类算法研究D].上海:华东师范大学,2015 [3]Linton ( E, SalakhutdinovRR. Reducing the dimensionality of data with neural networks[]. Science, 2006, 313(5786:504-507 [4 Vincent P, Larochelle H, Bengio Y, et al. Extracting and composing robust features with denoisin autoencoders[J]. Proceedings of the 25th international conference on machine learning, 2008: 1096-1103 [5]高晓健.基于支持向量机的高光谱遥感图像分类方法研究[D].杭州:杭州电子科技大学,2012. [6]杨辉华、雒志超.蒋淑洁等.稀疏降噪自编码算法用于近红外光谱鉴别真假药的硏究J.光谱学与光谱 分析,2016.36(09:27742779 25 6

...展开详情
试读 6P 论文研究-稀疏降噪自编码结合支持向量机的近红外光谱药品鉴别方法 .pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
抢沙发
一个资源只可评论一次,评论内容不能少于5个字
weixin_39840650 如果觉得有用,不妨留言支持一下
2019-08-15
  • 至尊王者

    成功上传501个资源即可获取
关注 私信 TA的资源
上传资源赚积分or赚钱
    最新推荐
    论文研究-稀疏降噪自编码结合支持向量机的近红外光谱药品鉴别方法 .pdf 9积分/C币 立即下载
    1/6
    论文研究-稀疏降噪自编码结合支持向量机的近红外光谱药品鉴别方法 .pdf第1页
    论文研究-稀疏降噪自编码结合支持向量机的近红外光谱药品鉴别方法 .pdf第2页

    试读结束, 可继续阅读

    9积分/C币 立即下载 >