红外与中红外 的光谱数 据 使 用 偏最小二乘 判别
p
artial
least squares discriminant analysis PLSDA 模型进行低级
融合 中级融合 高级融合 成功鉴别 种植物油掺假 个
不同来源橄榄油 Li 等
融合近红外与中红外的光谱数据
使用随机森林进行低级融合 中级融合 高级融合 成功鉴
别三七地理位置
现阶段 野生牛肝菌的产地鉴别以中红外光谱为主 基
于近红外光谱对野生牛肝菌产地鉴别未见报道 本研究的主
要目的是探讨融合近红外光谱与中红外光谱鉴别不同产地美
味牛肝菌的可行性 对 个单一信息矩阵 近红外的菌柄
Nb 近红外的菌盖 N
g
中红外的菌柄Mb 中红外
的菌盖M
g
结合 PLSDA 进行低级 中级 高级数据融
合 选出美味牛肝菌产地鉴别最佳方法 为野生牛肝菌产地
鉴别提供参考
实验部分
11 材料
份美味牛肝菌采自云南 个产地 分别为昆明 楚
雄 玉溪 迪庆 大理 保山 文山 曲靖表 均由云南农
业大学刘鸿高教授鉴定 样品采集后去除土样等杂质 用纯
净水清洗干净 置于 烘箱 烘干至恒重 高速粉 碎机
FW 型粉碎 过 目标准筛盘 分别储存于自封袋
中 保存于避光处
表 1 美味牛肝菌产地信息
Table 1 The specific geographical origin
information of Boletus edulis
产地 样本数 经纬度 海拔 m
云南省昆明市安宁县温水村 N 沣儋 E =
云南省昆明市安宁县八街镇 /N 沣儋 E =
云南省昆明市安宁县八街镇凤仪村 N 沣儋 E =
云南省昆明市石林县蓑衣山 /N 沣儋 E =
云南省楚雄州南华县龙川镇 /N 沣儋 E =
云南省楚雄州南华县沙桥镇 N 沣儋 E =
云南省玉溪市易门县普贝乡 /N 沣儋 E =
云南省玉溪市易门县铜厂 /N E
云南省迪庆州香格里拉县普达措 N 沣儋 E
云南省迪庆州维西县保和镇 N 鼢眄 E (
云南省大理州弥渡县弥城镇 /N 沣儋 E =
云南省大理州鹤庆县松桂镇 N 鼢眄 E (
云南省保山市隆阳区 N 鼢眄 E �
云南省文山市东山乡 N 沣儋 E =
云南省曲靖市马龙区旧县镇 N 挝哪 E (
12 光谱信息采集
近红外光谱
近红外光谱是由 Antaris 型傅里叶变换近红外光谱仪
Thermo Fisher 公司 USA用漫反射显微镜采集 称取
g
样品混合均匀后 置于玻璃器皿中压缩 扫描 扫描波数
范围 cm
分辨率 cm
信号扫描累计
次 每个样本重复扫描 次 取平均光谱
中红外光谱
中红外 光 谱 是 由 Frontier 型 傅 里 叶 变 换 红 外 光 谱 仪
Perkin Elmer 公司 USA采集 取 mg 美味牛肝
菌样品和 mg KBr 粉末在研钵中磨细混匀 再将细
粉倒入磨具中压成薄片 扫描 扫描波数范围
cm
分辨率 cm
信号扫描累计 次 每个样本重复
扫描 次 取平均光谱
13 偏最小二乘判别分析及评价
PLSDA 是在标准 PLS 回归算法的基础上建立的线性监
督分类方法 从变量矩阵x中寻找与分类矩阵
y
有最大协
方差的变量 其中
y
分为 类
y
代表样本属于特定分
类
y
代表样品不属于特定分类 最终得出每个样品分类
到每一类的概率 该算法解释样本观测数目少且可以降低样
本间多重共线性的影响 使用 KennardStone 算法划分数据
集的 为训练集 和 为预测集 以提高模
型识别能力 避免随机选择的不可重复性
根据交 叉验 证 均方根误差 root mean square error of
cross validation RMSECV 和预测 均方根误差 root mean
square error of prediction RMSEP两个重要参数评价模型
稳定性 RMSECV RMSEP 且数值越小 表明模型稳定且
预测能力越好 综合训练集和预测集的正确率再加上非错误
率nonerror rate NER评价模型分类性能 NER 是灵敏度
和特异性的平均值 NER 越高模型分类性能越强
14 数据融合
低级融合又名数据级融合 直接将多个数据矩阵串联得
到一个新的数据矩阵 再建立判别模型 中级融合又名特征
级融合 将多个特征值数据矩阵串联得到一个新的数据矩
阵 再建立判别模型 潜在变量 latent variable LV是一种
常见的特征提取方法 根据 Q
第一次到达最大值时的因子
第 期 光谱学与光谱分析