没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
针对藻类荧光光谱解析中常见的信息冗余和光谱相关性问题,基于偏最小二乘(PLS)的方法,提出了区间蒙特卡罗偏最小二乘(IMC-PLS)方法,有效地解决了特征波长的选取问题。根据特征色素荧光峰位置预选出特征区域,综合利用了此特征区域内单个波段的信息和不同的随机波段组合对于模型的贡献,基于荧光光谱的三线性特点,联合了发射波长和激发波长的信息。研究结果表明,与无信息变量消除算法(UVE)相比,IMC-PLS反演4种藻类浓度得到的平均相对标准偏差分别降低了0%、34.3%、55.9%、30.5%,选择出的特征波长数和运算时间分别减少了80.1%、81.3%,IMC-PLS方法有效地解决了实时监测问题,也为离散三维荧光光谱仪器的研制提供了理论支持。
资源推荐
资源详情
资源评论
书书书
第
34
卷
第
9
期
光
学
学
报
Vol.34
,
No.9
2014
年
9
月
犃犆犜犃犗犘犜犐犆犃犛犐犖犐犆犃
犛犲
狆
狋犲犿犫犲狉
,
2014
基于偏最小二乘回归的藻类荧光光谱特征波长选取
余晓娅
张玉钧
殷高方
肖
雪
赵南京
段静波
石朝毅
方
丽
(中国科学院安徽光学精密机械研究所环境光学与技术重点实验室,安徽 合肥
230031
)
摘要
针对藻类荧光光谱解析中常见的信息冗余和光谱相关性问题,基于偏最小二乘(
PLS
)的方法,提出了区间蒙
特卡罗偏最小二乘(
IMCPLS
)方法,有效地解决了特征波长的选取问题。根据 特 征 色 素 荧 光 峰 位 置 预 选 出 特 征 区
域,综合利用了此特征区域内单个波段的信息和不同的 随 机 波 段 组 合 对 于 模 型 的 贡 献,基 于 荧 光 光 谱 的 三 线 性 特
点,联合了发射波长和激发波长的 信 息。 研 究 结 果 表 明,与 无 信 息 变 量 消 除 算 法(
UVE
)相 比,
IMCPLS
反 演
4
种
藻类浓度得到的平均相对标准偏差分别降低了
0%
、
34.3%
、
55.9%
、
30.5%
,选择出的特征波长数和运算时间分别
减少了
80.1%
、
81.3%
,
IMCPLS
方法有效地解决 了 实 时 监 测 问 题,也 为 离 散 三 维 荧 光 光 谱 仪 器 的 研 制 提 供 了 理
论支持
。
关键词
光谱学;特征波长;区间蒙特卡罗偏最小二乘回归;无信息变量消除;荧光光谱;藻类
中图分类号
O433.4
文献标识码
A
犱狅犻
:
10.3788
/
犃犗犛201434.0930002
犉犲犪狋狌狉犲 犠犪狏犲犾犲狀
犵
狋犺犛犲犾犲犮狋犻狅狀狅犳犘犺
狔
狋狅
狆
犾犪狀犽狋狅狀犉犾狌狅狉犲狊犮犲狀犮犲犛
狆
犲犮狋狉犪
犅犪狊犲犱狅狀犘犪狉狋犻犪犾犔犲犪狊狋犛
狇
狌犪狉犲狊
犢狌犡犻犪狅
狔
犪
犣犺犪狀
犵
犢狌
犼
狌狀
犢犻狀犌犪狅犳犪狀
犵
犡犻犪狅犡狌犲
犣犺犪狅犖犪狀
犼
犻狀
犵
犇狌犪狀犑犻狀
犵
犫狅
犛犺犻犆犺犪狅
狔
犻
犉犪狀
犵
犔犻
(
犓犲
狔
犔犪犫狅狉犪狋狅狉
狔
狅
犳
犈狀狏犻狉狅狀犿犲狀狋犪犾犗
狆
狋犻犮狊犪狀犱犜犲犮犺狀狅犾狅
犵狔
,
犃狀犺狌犻犐狀狊狋犻狋狌狋犲狅
犳
犗
狆
狋犻犮狊犪狀犱犉犻狀犲犕犲犮犺犪狀犻犮狊
,
犆犺犻狀犲狊犲犃犮犪犱犲犿
狔
狅
犳
犛犮犻犲狀犮犲狊
,
犎犲
犳
犲犻
,
犃狀犺狌犻
230031
,
犆犺犻狀犪
)
犃犫狊狋狉犪犮狋
犉狅狉狊
狆
犲犮狋狉犪犾犻狀犳狅狉犿犪狋犻狅狀狉犲犱狌狀犱犪狀犮
狔
犪狀犱犮狅狉狉犲犾犪狋犻狅狀犻狀
狆
犺
狔
狋狅
狆
犾犪狀犽狋狅狀狊
狆
犲犮狋狉犪犾犪狀犪犾
狔
狊犻狊
,
犻狀狋犲狉狏犪犾犕狅狀狋犲
犆犪狉犾狅
狆
犪狉狋犻犪犾犾犲犪狊狋狊
狇
狌犪狉犲狊
(
犐犕犆犘犔犛
)
狑犺犻犮犺 犲犳犳犲犮狋犻狏犲犾
狔
狊狅犾狏犲狊狋犺犲
狆
狉狅犫犾犲犿 狅犳犳犲犪狋狌狉犲 狑犪狏犲犾犲狀
犵
狋犺狊犲犾犲犮狋犻狅狀犻狊
狆
狉犲狊犲狀狋犲犱犫犪狊犲犱狅狀
狆
犪狉狋犻犪犾犾犲犪狊狋狊
狇
狌犪狉犲狊
(
犘犔犛
)
.犉犲犪狋狌狉犲狉犲
犵
犻狅狀犻狊
狆
狉犲狊犲犾犲犮狋犲犱犪犮犮狅狉犱犻狀
犵
狋狅狋犺犲犾狅犮犪狋犻狅狀狅犳狋犺犲
狆
犻
犵
犿犲狀狋
犳犾狌狅狉犲狊犮犲狀犮犲
狆
犲犪犽狊
,
狋犺犲犻狀狋犲狉狀犪犾犻狀犳狅狉犿犪狋犻狅狀狊狅犳犪狊犻狀
犵
犾犲 犫犪狀犱 犪狀犱狋犺犲 犮狅狀狋狉犻犫狌狋犻狅狀狊狅犳犱犻犳犳犲狉犲狀狋狉犪狀犱狅犿 犫犪狀犱
犮狅犿犫犻狀犪狋犻狅狀狊狋狅狋犺犲 犿狅犱犲犾犪狉犲
狆
犾犲狀犪狉犻犾
狔
狌狊犲犱.犅犪狊犲犱 狅狀狋犺狉犲犲犾犻狀犲犪狉犳犲犪狋狌狉犲狅犳犳犾狌狅狉犲狊犮犲狀犮犲 狊
狆
犲犮狋狉犪
,
犲犿犻狊狊犻狅狀
狑犪狏犲犾犲狀
犵
狋犺犫犪狀犱犪狀犱犲狓犮犻狋犪狋犻狅狀狑犪狏犲犾犲狀
犵
狋犺犫犪狀犱犪狉犲犮狅狀狊犻犱犲狉犲犱犪狊犪狌狀犻狋.犜犺犲狉犲狊狌犾狋狊犺狅狑狊狋犺犪狋犮狅犿
狆
犪狉犻狀
犵
狑犻狋犺狋犺犲
狌狀犻狀犳狅狉犿犪狋犻狏犲狏犪狉犻犪犫犾犲犲犾犻犿犻狀狅狋犻狅狀
(
犝犞犈
),
犳犲犪狋狌狉犲 狑犪狏犲犾犲狀
犵
狋犺
狆
狅犻狀狋狊犪狀犱犮狅犿
狆
狌狋犪狋犻狅狀狋犻犿犲狅犫狋犪犻狀犲犱犫
狔
犐犕犆犘犔犛
犱犲犮狉犲犪狊犲犫
狔
80.1% 犪狀犱81.3% 犪狀犱犪狏犲狉犪
犵
犲狉犲犾犪狋犻狏犲狋狅犾犲狉犪狀犮犲狊
(
犃犚犜狊
)
犫
狔
犻狀狏犲狉狊犻狅狀狅犳犳狅狌狉犪犾
犵
犪犲犮狅狀犮犲狀狋狉犪狋犻狅狀狊
犱犲犮狉犲犪狊犲犫
狔
0%
,
34.3%
,
55.9%
,
30.5%.犐犕犆犘犔犛 犪犾
犵
狅狉犻狋犺犿 犲犳犳犲犮狋犻狏犲犾
狔
狊狅犾狏犲狊狋犺犲
狆
狉狅犫犾犲犿 狅犳狉犲犪犾狋犻犿犲
犿狅狀犻狋狅狉犻狀
犵
,
犪狀犱
狆
狉狅狏犻犱犲狊狋犺犲狅狉犲狋犻犮犪犾狊狌
狆狆
狅狉狋犳狅狉狋犺犲 犱犲狏犲犾狅
狆
犿犲狀狋狅犳犪 犱犻狊犮狉犲狋犲狋犺狉犲犲犱犻犿犲狀狊犻狅狀犪犾犳犾狌狅狉犲狊犮犲狀犮犲
狊
狆
犲犮狋狉狅犿犲狋犲狉犿犲犪狀狑犺犻犾犲.
犓犲
狔
狑狅狉犱狊
狊
狆
犲犮狋狉狅狊犮狅
狆狔
;
犳犲犪狋狌狉犲狑犪狏犲犾犲狀
犵
狋犺
;
犻狀狋犲狉狏犪犾犕狅狀狋犲犆犪狉犾狅
狆
犪狉狋犻犪犾犾犲犪狊狋狊
狇
狌犪狉犲狊
;
狌狀犻狀犳狅狉犿犪狋犻狏犲狏犪狉犻犪犫犾犲
犲犾犻犿犻狀犪狋犻狅狀
;
犳犾狌狅狉犲狊犮犲狀犮犲狊
狆
犲犮狋狉犪
;
狆
犺
狔
狋狅
狆
犾犪狀犽狋狅狀
犗犆犐犛犮狅犱犲狊
300.6170
;
300.6280
;
260.2510
收稿日期:
20140320
;收到修改稿日期:
20140504
基金项目:国家自然科学基金 (
61378041
)、国 家
863
计 划 (
2014AA06A509
,
2013AA065502
)、安 徽 省 杰 出 青 年 科 学 基 金
(
1108085J19
)、安徽省自然科学基金(
1408085MD72
)、中国科学院仪器设备功能开发技术创新项目(
yg
2012071
)
作者简介:余晓娅(
1985
—),女,博士研究生,主要从事三维荧光光谱数据处理方面的研究。
Email
:
x
yy
u
@
aiofm.ac.cn
导师简介:张玉钧(
1964
—),男,博士,研究员,主要从事光学信息处理和环境监测技术等方面的研究。
Email
:
yj
zhan
g
@
aiofm.ac.cn
(通信联系人)
本文电子版彩色效果请详见中国光学期刊网
www.o
p
tics
j
ournal.net
09300021
光
学
学
报
1
引
言
近年来河 流湖泊 污染日 益严重,给生产 生活和
生态系统的平衡带 来 了恶 劣 影响
,亟 需建 立 水质 监
测体系。藻类是湖 泊 中的 主 要污 染 物,识 别 不同 藻
类能够有效预警水质的变化
[
1-2
]
。目前常用的荧光
光 谱 方 法 通 常 只 能 识 别 蓝 藻、绿 藻 和 硅 藻 三 种
藻
[
3-4
]
,但是,其他藻类在水体污染中也扮演者一定
的角色,比如隐藻水华在淡水渔场经常出现
[
5
]
等,因
此需要建立多种藻的识别体系。
在对藻类 进行现 场识别 时,常用 仪器采 用二维
发射光谱进行识别,存 在识 别 藻种 有 限和 正 确率 低
的问题,本文尝试用离散三维荧光光谱来识别藻类,
以期望达到 识 别 的 藻 种 增 加、识 别 率 提 高 的 效 果。
三维荧光光 谱可 以提 供比 二维 荧 光 光 谱 更 多 的 信
息
[
6
]
,但是用所有波段数据进行回归建模时,计算量
很大,无法实现现场快速监测,而且一些光谱区域容
易受到噪声干扰,或者基本不包含信息,直接把全光
谱带入回归建模 会 影响 计 算精 度。 因此,需 要对 采
集到的波长进行优选,以实现实时监测,使得预测结
果误差最小。
常用的波长 选 择 方 法 有 遗传 算法
[
7-8
]
,蚁 群 算
法
[
9
]
,偏最小二乘(
PLS
)
[
10
]
和无 信 息变 量 消除 算 法
(
UVE
)
[
11
]
。遗传算 法 和蚁 群 算法 在 数据 点 数较 多
的情况下,计算量大,收敛 速 度缓 慢;
PLS
通过 分 别
考察单个变量对于 建 模误 差 的影 响,来决 定 最终 建
模时变量的去留;
UVE
则通过考察所有波长对应的
偏最小二乘回归系 数 的稳 定 性来 选 择特 征 波长,实
现简单,计算速度快,但是用
PLS
和
UVE
选择特征
波长时,没有考虑到波 长 之间 的 相互 联 系以 及 进行
组合建模时 对 模 型 的 贡 献。 韩 清 娟
[
12
]
提 出 了 用蒙
特卡罗偏最 小 二 乘 方法 (
MCPLS
)选 择 特 征 波长,
增强了特征波长选 择 结果 的 稳定 性 和可 靠 性,考 虑
了特征波长之间的 联 系,但 是 这种 方 法对 单 个波 长
反复进行蒙特卡罗运算耗费大量时间。受荧光区域
索引
[
13
]
和荧光特征区域
[
14
]
的启发,本文提出了区间
蒙特卡罗偏最小二乘 方 法
(
IMCPLS
),先用 荧 光区
域积分选择出特征荧光区域,在此特征区域内,考虑
荧光光谱的三线性特点,以每个波段为单位,用蒙特
卡罗方法分别从发射波段和激发波段两个方面来随
机选择 波 段组 合
,进 行
PLS
建模 计 算预 测 误 差,选
择出特征发射波段 和 特征 激 发波 段 后,组 合 两组 特
征波段用
PLS
进行浓度反演。
本文给出 特征波 长选择 方法的 理论基 础,用实
测
4
种藻类荧光光谱 数 据检 验 所提 方 法,并 与 常用
的
UVE
进行对比,分析了方法的有效性。
2
方法与原理
2.1
犘犔犛
PLS
是
Word
于
1983
年提 出 的多 元 统 计 数 据
分析方法
[
15
]
,考 察 自 变 量 之 间 的 多重 相关 性,不 是
直接用因变量和自 变 量进 行 回归 建 模
,而 是在 系 统
变量中提取若干对系统具有最佳解释能力的新综合
变量,再对新综 合变 量 进行 回 归建 模。 它将 浓 度矩
阵
犢
和相应的量 测 响 应 矩 阵
犡
同 时 进 行 主 成 分 分
解,以提取新综合变量,即
犡
=
犜犘
+
犈
, (
1
)
犢
=
犝
犙
+
犉
, (
2
)
式中
犜
和
犝
分别为
犡
和
犢
的得分矩阵,
犘
和
犙
分别
为
犡
和
犢
的载荷矩阵,
犈
和
犉
分别为运用
PLS
去拟
合矩阵
犡
和
犢
时所引进的误差。
PLS
就是利 用 各 列 向 量 相 互 正 交 的 特 征 响 应
矩阵
犜
和特征浓度矩阵
犝
进行回归建模,即
犝
=
犜犅
, (
3
)
得到回归系数矩阵,又称关联矩阵
犅
,表达式为
犅
=
(
犜
T
犜
-
1
)
犜
T
犝
.
(
4
)
因此,
PLS
的主要步骤包括对浓度矩阵
犢
和相应的
量测响应矩阵
犡
的 主 成 分分 解以 及对 关联 矩阵
犅
的计算。
2.2
犝犞犈
UVE
是基于
PLS
的特征 波 长选 择 方法
[
16-17
]
,
将随机噪声 矩 阵加 入 到 光 谱 矩 阵 中,通 过
PLS
、留
一交叉验证等运算 获 得一 组 回归 系 数,计 算 各个 波
长下回归系数的平均值与标准差的比值来表征各个
波长的稳定性,小于特 定 阈值 的 比值 对 应的 波 长变
量被认为是无信息变量,予以删除。
UVE
具体计算步骤如下:
1
)对光谱矩阵
犡
(
狀
,
狆
)(
狀
为样本 数,
狆
为波 长
点 数 )进 行
PLS
建 模,根 据 预 测 误 差 均 方 根
(
RMSEP
,
犚
RMSEP
)确 定
PLS
模 型 的 建 模 因 子 数
犃
LV
,记作
犃
1
,
犃
2
=
犃
1
,
犚
RMSEP
记为
犚
OLD
RMSEP
。
犚
RMSEP
=
∑
狀
犻
=
1
(
^
狔
犻
-
狔
犻
)
2
/
[ ]
狀
1
/
2
, (
5
)
式中
^
狔
犻
是估计值,
狔
犻
是测量值。
2
)在光谱矩阵
犡
中加入人工噪声矩阵,新矩阵
变为
犡
(
狀
,
2
狆
)。
3
)将新矩阵按
犃
LV
=
犃
2
进行
狀
次留 一 交叉 建
模,获得系数矩阵
犅
(
狀
,
2
狆
)。
4
)计算每个波长对应的系数的标准差[
std
(·)]及
09300022
剩余6页未读,继续阅读
资源评论
weixin_38592758
- 粉丝: 5
- 资源: 924
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- AutonomousDecisionMakingException.md
- ConstraintError(解决方案).md
- FileNotFoundError(解决方案).md
- ServiceMeshFailureException.md
- EventDrivenProcessingException.md
- FileSystemError(解决方案).md
- ServerlessFunctionFailureException.md
- HighConcurrencyControlException.md
- DataLakeSyncFailureException.md
- FileReaderError(解决方案).md
- MediaError(解决方案).md
- 覆盖率生成工具lcov 1.9版本 ,覆盖率数据可视化,用于单元测试
- 家政项目小程序+ssm.zip
- 小区租拼车管理信息系统+ssm.zip
- 基于rk3588的drm例子modeset-single-buffer
- 安卓大作业 记账应用Kotlin.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功