没有合适的资源?快使用搜索试试~ 我知道了~
一种新颖的深度因果图建模及其故障诊断方法.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 85 浏览量
2023-02-23
16:52:22
上传
评论
收藏 1.2MB DOCX 举报
温馨提示
试读
18页
一种新颖的深度因果图建模及其故障诊断方法.docx
资源推荐
资源详情
资源评论
现代工业过程是一个高度复杂的系统. 由于实际的物理连接、控制回路的作用, 工业
过程中的设备、部件、过程变量相互耦合, 构成了复杂的互连网络. 这种互联耦合关系使得
系统某一部位一旦发生异常, 将会随着系统网络传播并演变演化, 进而导致更加严重的故
障. 采用先进的故障检测和诊断技术是保证工业过程安全有效稳定运行的重要手段. 传统的
基于知识或者模型的方法很难构建大规模系统变量间的复杂关系. 随着工业自动化、信息
化的快速发展, 工业过程收集了越来越多的传感器数据, 这为数据驱动方法提供强有力的支
撑. 数据驱动的故障检测和诊断方法也因此受到了广泛关注和研究, 并大量应用到化工、半
导体制造等过程, 尤其是多元统计过程监测 (Multivariate statistical process monitoring,
MSPM) 方法
[1]
.
MSPM 利用多元投影技术将高维观测数据投影到低维主元子空间和残差子空间, 并设
计相应的多元统计量 (如 T2T2, SPESPE) 及其控制限来监测数据是否超出正常工作范围,
常用的多元统计方法有主元分析 (Principal component analysis, PCA)
[2]
、偏最小二乘 (Partial
least squares, PLS)
[3]
、独立主元分析 (Independent component analysis, ICA)
[4]
和典型相关分
析(Canonical correlation analysis, CCA)
[5]
等. 一旦检测出故障, 需要采用贡献图
[6]
、重构贡献
图
[7]
等故障隔离方法来辨识故障相关变量. 这些方法由于拖尾效应
[8]
的影响并不能准确地辨
识出所有的故障变量. 随后, 格兰杰因果分析
[9]
、传递熵
[10]
等因果分析方法被用来进行故障
根源诊断和传播路径辨识, 然而这些算法很难达到预期效果, 且需要较长的分析时间. 深度
学习能够处理大规模数据, 自动地提取深层次特征, 在工业领域也取得了较成功的应用. 近
些年来, 自动编码器 (Autoencoder, AE)
[11]
、深度信念网(Deep belief network, DBN)
[12]
、变分
自编码器(Variational autoencoder, VAE)
[13]
等深度学习技术越来越多地应用到过程监测中,
但是由于神经网络的黑箱特性, 变量贡献率难以计算, 限制了其在故障隔离、根源诊断和传
播路径辨识方面的应用.
图论技术利用由若干节点和连接节点的线构成的图模型来定性或者定量地表征变量之
间关系, 能够较好地描述工业过程的复杂网络结构
[14-15]
. 其中贝叶斯网络 (Bayesian network,
BN) 作为一种概率有向图模型, 已经应用在风险分析、可靠性可维护性分析等领域
[16]
, 在
故障检测和诊断领域也取得了较成功的应用. Mehranbod 等使用 BN 进行稳定和过渡阶段的
故障检测和隔离
[17-18]
. Azhdari 和 Mehranbod 验证了 BN 在田纳西−伊斯曼 (Tennessee
Eastman, TE) 过程中故障检测与诊断应用的有效性
[19]
. Gonzalez 等将 BN 应用在过程监测中
的维数化简过程
[20]
. Chen 和 Ge 提出了一个分层 BN (Hierachical Bayesian network, HBN) 建
模框架
[21]
, 通过对工业过程进行分解, 构建局部单元以及单元间的贝叶斯网络, 实现大规模
工业过程的故障检测与诊断. 随后, Chen 和 Ge 又针对过程监测中低质量数据建模问题, 提
出了鲁棒 BN (Robust Bayesian networks, RBN)
[22]
. 针对工业过程中存在的动态特性, Yu 和
Rashid 采用动态贝叶斯网络 (Dynamic Bayesian networks, DBN), 用异常似然指标
(Abnormality likelihood index, ALI) 和动态贝叶斯概率指标 (Dynamic Bayesian probability
index, DBPI) 分别进行故障检测和根源诊断
[23]
. Zhang 和 Dong 将高斯混合模型(Gaussian
mixture model, GMM)和三时间切片 DBN 整合来解决过程监测中存在的数据缺失和非高斯
问题
[24]
.
BN 为过程变量的因果关系提供了条件概率表示, 但是, 该条件概率关系一般是线性
的, 无法描述过程中存在的非线性特性. 同时, 大多数基于 BN 的方法需要通过过程知识得
到 BN 的网络结构, 这在很多复杂工业过程中是很难确定的. BN 作为一种有向无环图模型,
也较难表示系统中存在的闭环结构. 为解决上述问题, 并考虑系统中存在的动态特性, 本文
提出了一种深度因果图 (Deep causality graph, DCG) 建模方法, 利用多层感知器 (Multilayer
perceptron, MLP) 和门控循环单元 (Gate recurrent unit, GRU) 对每一个过程变量建立概率预
测模型. 在模型训练过程中, 引入组稀疏惩罚项, 自动地检测变量间因果关系, 从而得到过
程变量的因果有向图结构以及定量的条件概率表征; 然后基于 DCG 模型的条件后验概率分
布建立单变量监测统计指标, 并通过贝叶斯推理融合, 构建综合的监测统计量, 实现工业过
程的整体监测. 进一步通过计算变量贡献度指标, 隔离出故障相关变量; 最后根据深度因果
图模型获得的有向图结构, 诊断出故障根源, 并辨识故障的传播路径.
论文的结构如下: 第 11 节详细介绍了深度因果图推导和建模过程; 第 22 节提出了基
于深度因果图模型的故障检测和诊断框架; 随后, 在第 33 节利用 TE 过程数据对所提算法
进行了验证, 并在最后一节中进行了总结.
1. 深度因果图建模方法
1.1 图结构已知的因果关系建模方法
考虑一个有向图模型, 其网络结构为 G=⟨V,E⟩G=⟨V,E⟩, VV 表示节点的集合, EE 表示连
接节点的有向边集合. 在工业过程中, 节点可以指过程变量特征, 有向边对应着连接节点之
间的因果关系, 有向边的首和尾连接的节点分别表示为父节点和子节点.
对一个有 nn 维观测变量的工业过程, tt 时刻观测变量表示为
xt=[x1,t,x2,t,⋯,xn,t]xt=[x1,t,x2,t,⋯,xn,t], 则节点 ii 在 tt 时刻观测变量为 xi,txi,t, 其父节点集在
tt 时刻的状态用 xpa(i),txpa(i),t 表示. 考虑系统的动态特性, 观测变量 xi,txi,t 不仅与当前时
刻父节点状态有关, 而且与历史时刻自节点和父节点的状态有关. tt 时刻观测变量 xi,txi,t 用
节点 ii 的历史观测数据 xi,t−T:t−1xi,t−T:t−1 和其父节点集的观测数据 xpa(i),t−T:txpa(i),t−T:t
非线性表示:
xi,t=g(xpa(i),t−T:t,xi,t−T:t−1)+εi,txi,t=g(xpa(i),t−T:t,xi,t−T:t−1)+εi,t
(1)
式中, εi,tεi,t 为随机噪声项. 利用概率形式来表示这种变量间的依赖关系:
xi,t∼N(μi(xc,t−T:t−1),σ2i(xc,t−T:t−1))xi,t∼N(μi(xc,t−T:t−1),σi2(xc,t−T:t−1))
(2)
式中, xc,t−T:txc,t−T:t 为 xpa(i),t−T:txpa(i),t−T:t 和 xi,t−T:t−1xi,t−T:t−1 组合的观测值向
量; μi(xc,t−T:t)μi(xc,t−T:t)和 σ2i(xc,t−T:t)σi2(xc,t−T:t)分别为 xi,txi,t 的后验概率分布的均值和
方差, 均为非线性函数, 其非线性关系可以用神经网络表示.
通过神经网络构建节点 ii 预测模型, 其条件概率对数似然表示为
lnp(xi,t|xc,t−T:t)lnp(xi,t|xc,t−T:t). 设预测模型参数集为 ΘiΘi, 模型参数 ΘiΘi 学习的目标是
最大化对数似然期望值, 目标函数表示为:
Ji=E(lnp(xi,t|xc,t−T:t;Θi))=1N∑t=1Nlnp(xi,t|xc,t−T:t;Θi)Ji=E(lnp(xi,t|xc,t−T:t;Θi))=1N∑t=1Nlnp(xi,t|xc,t−T:t;Θi)
(3)
由上述讨论可知观测变量 xi,txi,t 由节点 ii 与其父节点的历史状态以及父节点的 tt 时刻
状态共同决定. 将节点 ii 及其父节点的历史状态中与变量 xi,txi,t 相关的动态特征信息表示
为 zi,t−1zi,t−1, 父节点当前时刻的相关特征信息表示为 hi,thi,t, 式 (1) 中的非线性预测模型
于是可以转变为以下形式:
xi,t=g(zi,t−1,hi,t)+εi,txi,t=g(zi,t−1,hi,t)+εi,t
(4)
当前时刻相关特征 hi,thi,t 的信息提取可以利用多层感知器实现, 历史时刻的动态特征
信息 zi,t−1zi,t−1 采用 GRU 进行特征提取. GRU 作为循环神经网络 (Recurrent neural
network, RNN) 的一种变体能够提取时间序列的动态特征, 同时有效地解决标准 RNN 算法
存在的长期记忆和反向传播中的梯度问题. GRU 的详细介绍可以参考文献[25].
1.2 图结构未知的因果图建模方法
上述节点预测模型是建立在因果有向图结构已知的情况. 而在很多复杂工业过程中,
变量之间的因果关系是未知的. 为了寻找每个变量的因变量, 本文首先将除自变量外的其他
变量都默认为因变量, 然后在模型训练过程中引入 Group Lasso 惩罚项, 使得节点预测模型
中与输入变量相关的连接稀疏化, 使用尽可能少的输入获取尽可能准确的预测, 进而实现变
量之间的因果关系自动检测, 其单一节点 ii 的后验概率预测模型如图 1 所示. 节点的概率
分布预测模型由两个动态特征提取单元和一个预测输出单元构成. 在第一个动态特征提取
单元中, 输入为 tt 时刻观测变量值 xt={xi,t,xi−,t}xt={xi,t,xi−,t}, xi−,txi−,t 表示除节点 ii 之外其
他节点的观测值. h1i−,t∈Rm1hi−,t1∈Rm1 为在 tt 时刻从输入 xi−,txi−,t 提取的 m1m1 维隐藏
特征, 其过程表示为:
图 1 深度因果图的单节点预测模型网络结构
Fig. 1 The network structure of single node prediction model for deep causality graph
剩余17页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3542
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功