近年来, 关于多元统计过程的监控策略可谓百花齐放, 早期由于主成分分析方法(principal components analysis, PCA)拥有良好的降维能力被普遍应用, 但由于PCA不适用于非线性系统, Schölkopf等人[1]提出了核主元分析法(kernel principal components analysis, KPCA), KPCA通过非线性映射函数将原始输入空间映射到高维特征空间, 然后再利用特征空间中映射数据点的内积就可解决非线性问题. 吴天昊等人[2]将KPCA引入核电厂设备在线监控领域中, 使监测手段提供更为早期的预报警. 吕宁等人[3]提出一种改进的多向核主元分析故障诊断模型, 使得非线性主元能够在高维特征空间中被快速提取. 吴洪艳等人[4]提出了基于小波的KPCA故障监测方法, 降低了KPCA计算的复杂性, 缩短了计算时间. 霍特林的T2统计量和Q统计量(也称平方预测误差, squared prediction error, SPE)是PCA与KPCA在过程监控中常用的两个统计量指标. T2统计量用于监控模型空间的变化, 而Q统计量用于监控剩余空间的变化. 然而, T2和Q统计量仅适用于高斯分布过程的监控. 借鉴文献[5–8]提出的算法, 本文采用核密度估计(kernel density estimation, KDE)方法推导核主元分析的控制限; 然后, 比较了基于高斯分布统计量控制限的KPCA和KPCA-KDE在田纳西伊斯曼(TE)过程中的故障检测性能. 结果表明, 基于KPCA-KDE的监测方法比基于高斯假设的KPCA具有更好的性能.
1 基于KPCA-KDE的过程监控 1.1 KPCA算法给定m个训练样本
$ {C_F} = \frac{1}{m}\sum\limits_{j = 1}^m { \left\langle \varphi ({X_j}), \varphi ({X_j}) \right\rangle } $ | (1) |
在
$ \lambda a = {C_F}a $ | (2) |
其中, λ是
$ a = \sum\limits_{i = 1}^m {{\alpha _i}\phi ({X_i})} $ | (3) |
用
$ \lambda \left\langle \phi ({X_k}), a \right\rangle \; = \; \left\langle \phi ({X_k}), {C_F}a \right\rangle $ | (4) |
将式(1)、式(3)代入式(4), 得:
$ \begin{split} \lambda \sum\limits_{i = 1}^m & {{\alpha _i} \left\langle \phi ({X_k}), \phi ({X_i}) \right\rangle \; = }\\ & \frac{1}{m}\sum\limits_{i = 1}^m {{\alpha _i} \left\langle \phi ({X_k})\sum\limits_{j = 1}^m \phi ({X_j}) \right\rangle \left\langle \phi ({X_j}), \phi ({X_i}) \right\rangle } \end{split} $ | (5) |
不直接对式(1)中
$ {\left[ K \right]_{ij}} = {K_{ij}} = \left\langle {\phi ({X_i}), \phi ({X_j})} \right\rangle = k({X_i}, {X_j}) $ | (6) |
对于所有
$ \lambda \sum\limits_{i = 1}^m {{\alpha _i}{K_{ki}}} = \frac{1}{m}\sum\limits_{i = 1}^m {{\alpha _i}} \sum\limits_{j = 1}^m {{K_{kj}}{K_{ji}}} $ | (7) |
注意,
$ \lambda mK\alpha = {K^2}\alpha $ | (8) |
式(8)等价于特征值问题:
$ m\lambda \alpha = K\alpha $ | (9) |
更进一步, 核矩阵可以表示为式(10):
$ {K_{ctr}} = K - UK - KU + UKU $ | (10) |
其中, U是一个
由于核矩阵
$ \left\langle {{\alpha _i}, {\alpha _j}} \right\rangle = {\delta _{i, j}} \; (i, j = 1, 2, \cdots, m) $ | (11) |
然后, 将
$ {Z_{K, j}} = \left\langle {{\alpha _k}, ({K_{ctr}})} \right\rangle = \sum\limits_{i = 1}^m {{\alpha _{k, i}}\left\langle {\phi ({X_i}), \phi ({X_j})} \right\rangle } $ | (12) |
应用内核技巧, 这可以表示为:
$ {Z_{K, j}} = \sum\limits_{i = 1}^m {{\alpha _{K, i}}{{\left[ {{K_{ctr}}} \right]}_{i, j}}} $ | (13) |
特征空间中第j个样本的霍特林的
$ T_j^2 = \left[ {{Z_{1, j}}, \cdots, {Z_{q, j}}} \right]{\Omega ^{ - 1}}{\left[ {{Z_{1, j}}, \cdots, {Z_{q, j}}} \right]^{\rm{T}}} $ | (14) |
其中,
$ T_\alpha ^2 \sim \frac{{q(m - 1)}}{{m - q}}{F_{q, m - q, \alpha }} $ | (15) |
其中,
$ {Q_j} = {\left\| {\phi ({X_j}) - \mathop {{\phi _q}}\limits^ \wedge ({X_j})} \right\|^2} = \sum\limits_{i = 1}^m {Z_{i, j}^2} - \sum\limits_{i = 1}^q {Z_{i, j}^2} $ | (16) |
如果所有分数都是正态分布,
$ {Q_\alpha } = {\theta _1}{\left[ {\frac{{{C_a}{h_0}\sqrt {2{\theta _2}} }}{{{\theta _1}}} + 1 + \frac{{{\theta _2}{h_0}({h_0} - 1)}}{{\theta _1^2}}} \right]^{1/{h_0}}} $ | (17) |
其中,
KDE是从一组随机样本中使用合适的平滑概率密度函数对数据集进行拟合的过程. 它被广泛应用于概率密度函数(probability density functions, PDFS)的估计, 特别是单变量的随机数据[10-13]. 尽管这些统计特征的过程是多变量的, 因为两者都是单变量的, 所以KDE可应用于
$ g(y) = \frac{1}{{mh}}\sum\limits_{j = 1}^m {k\left(\frac{{y - {y_j}}}{h}\right)} $ | (18) |
其中, k为核函数, h为带宽或平滑参数. 基于Cheng等人[14]提出的选择带宽的最佳方法, 本文在连续范围内对密度函数积分得到概率. 因此, 假设PDF在指定的显著水平上, y小于c的概率为:
$ p(y < c) = \int\limits_{ - \infty }^c {g(y)dy} = \alpha $ | (19) |
因此, 监测统计量(
$ \int\limits_{ - \infty }^{{T^2}} {g({T^2})d{T^2}} = \alpha $ | (20) |
$ \int\limits_{ - \infty }^{{Q_\alpha }} {g(Q)dQ} = \alpha $ | (21) |
对于一个以均值为中心的观测样本, 使用训练例子计算相应的核向量
$ {\left[ {{K_{tt}}} \right]_j} = k({X_j}, {X_{tt}}) $ | (22) |
然后将测试核向量标准化, 如式(23)所示:
$ {K_{ctt}} = {K_{tt}} - K{u_1} - U{k_{tt}} + UK{u_1} $ | (23) |
$ {Z_{tt, k}} = \left\langle {{\alpha _k}, ({K_{ctt}})} \right\rangle = \sum\limits_{i = 1}^m {{\alpha _{k, i}}\left\langle {\phi ({X_i}), \phi ({X_{tt}})} \right\rangle } $ | (24) |
也可写成:
$ {Z_{tt, k}} = \sum\limits_{i = 1}^m {{\alpha _{k, i}}{{\left[ {{K_{ctt}}} \right]}_i}} $ | (25) |
用向量形式表示为:
$ {Z_{tt}} = A{K_{ctt}} $ | (26) |
其中,
TR1. 获取正常运行条件下的数据(NOC), 使用数据集中代表不同变量的列的均值和标准差对数据进行规范化;
TR2. 决定内核函数的类型并确定内核参数;
TR3. 构造NOC数据的核矩阵并将其中心化;
TR4. 获得特征值及其对应的特征向量, 并将其按降序排列;
TR5. 使用式(11)对特征向量进行正交化;
TR6. 使用式(13)得到非线性得分向量;
TR7. 根据核化NOC数据, 利用式(14)和式(16)计算监控性能指标(
TR8. 用式(20)、式(21)确定
TT1. 获取测试样本
TT2. 用式(22)获得样本的核向量;
TT3. 据式(23)对核向量进行中心化;
TT4. 据式(25)求出测试样本的主元值;
TT5. 将测试样本的
TT6. 如果
2.3 故障变量识别
在检测到故障之后, 重要的是要识别与故障关联最紧密的变量, 以便于确定故障发生的原因.
贡献图是一种常用的故障识别方法, 它显示了各变量对故障区域的高统计指标值的贡献. 然而, 由于转换后的过程变量与原始过程变量之间存在非线性关系, 基于非线性PCA的故障识别不像线性主成分分析那样简单.
在本文中, 使用Petzold等人[15]提出的敏感性分析原理识别故障变量. 该方法基于Deng等人[16]研究的方法, 计算因参数变化而引起系统输出变化的变化率. 给定一个测试数据向量
$ T_{i, {\rm{con}}}^2 = {x_i}{\alpha _i}, \; {Q_{i, {\rm{con}}}} = {x_i}{b_i} $ | (27) |
其中,
在使用多元统计方法的故障识别中, 一种获得变量贡献的有效方法, 即通过对定义
TE过程是基于真实工业过程的模拟[18], 具有较强的非线性和动态特性, Chiang等人[19]把它用作评价和比较过程监控的基准过程. 该过程由分离器、压缩机、反应器、汽提器和冷凝器5个关键部件和编码为A到H的8个部件组成, 共采样960个, 变量53个, 其中连续变量22个, 3个成分分析器采样的成分测量值19个, TE过程中的操纵变量为12个. 采样每隔3分钟进行一次, 而每个故障在采样数160处引入. McAvoy等人[20]阐述了干扰和基线操作的信息工艺条件.
由于
由于从化学过程获得的测量通常是有噪声的, 统计量可能会随机地超过其控制限. 这相当于在没有实际发生故障的情况下统计量可能超过控制限, 即虚假警报. 换句话说, 一个统计量可能会超过它的控制限一次, 但是如果没有出现故障, 在随后的监控中, 统计量可能不会总是保持在它的控制限之上. 相反, 如果在连续的测量中统计量保持在其控制限以上, 则可能发生故障. van Sprang等人[21]使用故障检测规则解决了假警报的问题. 检测规则也为比较不同的监测方法提供了统一的依据. 在本文中, 当一个统计量在至少两个连续监控中超过其控制限时, 即认为发生了故障. 所有实验在使用基于此准则的数据进行测试时, 都记录了一个零的误报率的数据来用于评估不同技术的监视性能. 性能监控基于3个指标: 故障检出率(fault detection rate, FDR)、误报率(false alarm rate, FAR)和检测延迟(detection delay, DD). 故障检出率是正确识别的故障样本的百分比:
$ {\textit{FDR}} = \frac{{{n_{fc}}}}{{{n_{tf}}}} \times 100 {\text{%}} $ | (28) |
其中,
$ {\textit{FAR}} = \frac{{{n_{nf}}}}{{{n_{tf}}}} \times 100 {\text{%}} $ | (29) |
其中,
使用TE流程的故障11显示了基于KPCA的故障检测. 故障11是反应堆冷却水入口温度的随机变化, 图2显示了故障的监控图. 实线代表监测指标, 红线和绿线分别代表基于高斯分布和基于KDE的99%置信水平的控制限值. 在
图3显示了故障14在
以故障11为例, 显示了基于KPCA-KDE的故障识别. 故障11的出现引起反应堆冷却水流量的变化, 从而导致反应堆温度波动. 在图4中所示的样本300处, 基于
为了测试KPCA-KDE技术的性能, 通过改变两个参数进行故障检测: 带宽和保留的主元数量. 表1显示, 当保留25个主元时, KPCA记录的FAR值也同样高. 相反, KPCA-KDE方法仍然没有记录任何假报警. 因此, 除了提供更高的FDR和更早的检测外, KPCA-KDE比基于高斯假设的KPCA方法监控性能更好, 当故障及早发现时, 操作人员将有更多的时间找出故障的根本原因, 以便采取补救措施. 其次, 虽然有方法可获得开发过程监控模型的最优设计参数, 但不能保证最优值一直使用. 造成这种情况的原因可能是人员缺乏经验, 以及对流程本身缺乏了解. 因此, 监控方法性能越好, 就更利于过程监控.
4 结论与展望
本文研究了基于KPCA-KDE技术的非线性过程故障检测与识别. 在这种方法中, 用于构建控制图的控制限是直接从监测指标的概率密度函数得到的, 而不是基于高斯分布的控制限. 将该方法应用于田纳西伊斯曼过程, 并与基于高斯假设的核主成分分析方法进行了性能比较. 结果表明, 基于KPCA-KDE比基于高斯分布的KPCA检测到的故障更多、更早. 研究还表明, 基于KDE的控制限比基于高斯假设的控制限更符合监测统计量的实际分布, 因此具有更好的监控性能. 接下来的研究工作是设计更优化的方法, 既在复杂的环境中更能迅速准确的检测出故障, 此外, 将KPCA-KDE结合自适应算法也是一个有价值的研究方向.
[1] |
Schölkopf B, Smola A, Müller KR. Nonlinear component analysis as a kernel eigenvalue problem. Neural Computation, 1998, 10(5): 1299-1319. DOI:10.1162/089976698300017467 |
[2] |
吴天昊, 刘韬, 施海宁, 等. 基于核主元分析法的核电厂设备状态监测技术研究. 核动力工程, 2020, 41(5): 132-137. |
[3] |
吕宁, 颜鲁齐, 白光远. 分段多向核主元分析的啤酒发酵过程故障检测. 计算机科学, 2016, 43(S1): 25-27, 33. |
[4] |
吴洪艳, 黄道平. 基于特征向量提取的核主元分析法. 计算机科学, 2009, 36(7): 185-187, 255. DOI:10.3969/j.issn.1002-137X.2009.07.044 |
[5] |
杨大勇, 杨建华, 卢伟. 基于动态阈值的核密度估计前景检测算法. 计算机应用, 2015, 35(7): 2033-2038. DOI:10.11772/j.issn.1001-9081.2015.07.2033 |
[6] |
郭金玉, 张安宝, 李元. 基于故障检测的KPCA中核主元的选取方法. 计算机应用与软件, 2021, 38(9): 60-66, 85. DOI:10.3969/j.issn.1000-386x.2021.09.010 |
[7] |
郑丹, 陈路, 童楚东. 基于KPCA非线性故障监测过程优化. 数据通信, 2021(3): 23-25, 28. DOI:10.3969/j.issn.1002-5057.2021.03.005 |
[8] |
Wang H, Peng MJ, Yu Y, et al. Fault identification and diagnosis based on KPCA and similarity clustering for nuclear power plants. Annals of Nuclear Energy, 2021, 150: 107786. DOI:10.1016/j.anucene.2020.107786 |
[9] |
Choi SW, Lee IB. Nonlinear dynamic process monitoring based on dynamic kernel PCA. Chemical Engineering Science, 2004, 59(24): 5897-5908. DOI:10.1016/j.ces.2004.07.019 |
[10] |
Bowman AW, Azzalini A. Applied Smoothing Techniques for Data Analysis: The Kernel Approach with S-plus Illustrations. Oxford: Clarendon Press, 1977.
|
[11] |
王萌萌, 梁泸丹, 寇俊克. 基于MATLAB的核密度估计研究. 科技视界, 2021(4): 45-47. |
[12] |
王国良, 梁德群, 王新年, 等. 基于分箱核密度估计的非参数多模态背景模型. 计算机应用, 2007, 27(5): 1121-1122. |
[13] |
Xiong L, Liang J, Qian JX. Multivariate statistical process monitoring of an industrial polypropylene catalyzer reactor with component analysis and kernel density estimation. Chinese Journal of Chemical Engineering, 2007, 15(4): 524-532. |
[14] |
Cheng C, Chiu MS. Nonlinear process monitoring using JITL-PCA. Chemometrics and Intelligent Laboratory Systems, 2005, 76(1): 1-13. DOI:10.1016/j.chemolab.2004.08.003 |
[15] |
Petzold L, Li ST, Cao Y, et al. Sensitivity analysis of differential-algebraic equations and partial differential equations. Computers & Chemical Engineering, 2006, 30(10–12): 1553-1559. |
[16] |
Deng XG, Tian XM, Chen S. Modified kernel principal component analysis based on local structure analysis and its application to nonlinear process fault diagnosis. Chemometrics and Intelligent Laboratory Systems, 2013, 127: 195-209. DOI:10.1016/j.chemolab.2013.07.001 |
[17] |
Martins JRRA, Sturdza P, Alonso JJ. The complex-step derivative approximation. ACM Transactions on Mathematical Software, 2003, 29(3): 245-262. DOI:10.1145/838250.838251 |
[18] |
Downs JJ, Vogel EF. A plant-wide industrial process control problem. Computers & Chemical Engineering, 1993, 17(3): 245-255. |
[19] |
Chiang LH, Russell E, Braatz RD. Fault Detection and Diagnosis in Industrial Systems. London: Springer, 2001.
|
[20] |
McAvoy TJ, Ye N. Base control for the Tennessee Eastman problem. Computers & Chemical Engineering, 1994, 18(5): 383-413. |
[21] |
van Sprang ENM, Ramaker HJ, Westerhuis JA, et al. Critical evaluation of approaches for on-line batch process monitoring. Chemical Engineering Science, 2002, 57(18): 3979-3991. DOI:10.1016/S0009-2509(02)00338-X |