基于互信息的分布式动态过程故障检测方法

文档序号:10593359阅读:400来源:国知局
基于互信息的分布式动态过程故障检测方法
【专利摘要】本发明涉及一种基于互信息的分布式动态过程故障检测方法,该方法首先为过程每个测量变量引入延时测量值;其次,通过互信息定义的相关性指标,为过程每个测量变量区分出能体现在不同采样时刻上的自相关性和交叉相关性;然后,对每个变量所对应的数据集子块都分别建立相应的主元分析故障检测模型;最后,实施在线监测时,利用贝叶斯推理将不同故障检测模型的结果融合成一个概率型监测指标,以方便最终的故障决策。与现有方法相比,该发明充分考虑了体现在不同采样时刻上的不同测量变量间的自相关性和交叉相关性,避免了丢失过程数据复杂动态特性可能隐藏的有用信息,使相应的故障检测结果更加可靠与精确。
【专利说明】
基于互信息的分布式动态过程故障检测方法
技术领域
[0001] 本发明设及工业过程故障检测方法,尤其是设及一种基于互信息的分布式动态过 程故障检测方法。
【背景技术】
[0002] 近年来,数据驱动的故障检测方法因其简单通用性,已作为保障生产安全与保证 产品质量稳定性的重要技术手段而得到了研究者们的重视。针对W主元分析(PCA)为代表 的多变量统计过程监测方法的研究已经受到了工业界和学术界的广泛关注,其基本思想都 是从工业过程采集的数据中挖掘出能反映过程运行状况的潜在信息。运类方法能避免建立 精确的过程机理模型,因而很适合于监测现代大型复杂化工业过程。
[0003] 通常来讲,生产过程采集的数据因采样间隔短而使过程数据无可避免地存在动态 性(或称自相关性)。在现有方法中,动态PCA(DPCA)法与动态潜隐变量(DLV)法是两种常见 的解决动态过程故障检测问题的技术手段。考虑到现代工业过程的大规模性与复杂性,过 程数据间的动态性比较复杂,不同测量变量会存在不同的自相关性,而且变量间的相互影 响(即交叉相关性)也会体现在不同的采样时刻上。然而,DPCA与DLV等传统的方法一般都假 设测量变量间的自相关性和交叉相关性在采样时间上的一致性,忽略了过程数据复杂动态 特性可能隐藏的有用信息。若是在建立故障检测模型的过程中,能从不同采样时刻上体现 出不同测量变量间的自相关性和交叉相关性,将会获得更加精确的故障检测结果,大幅度 提升相应故障检测模型的可靠性。

【发明内容】

[0004] 本发明的目的在于提供一种基于互信息的分布式动态过程故障检测方法,该发明 充分考虑了体现在不同采样时刻上的不同测量变量间的自相关性和交叉相关性,避免了丢 失过程数据复杂动态特性可能隐藏的有用信息,使相应的故障检测结果更加可靠与精确。
[0005] 本发明解决上述技术问题所采用的技术方案为:一种基于互信息的分布式动态过 程故障检测方法,包括W下步骤:
[0006] (1)收集生产过程正常运行状态下的采样数据,组成建模用的训练数据集X=[xi, X2,…,Xn]T。其中,XGRnXm,n为训练样本数,m为过程测量变量数,R为实数集,Rnxm表示nXm 维的实数矩阵,上标号T表示矩阵转置。
[0007] 为数据矩阵X中每个测量变量引入其前1个时刻的测量值构成如下所示增广型数 据矩阵 XaGRfn-lWl+Um.
(1) 然后,对矩阵Xa进打称准化处理,得剖均值刃0,称准差为1的新数据矩阵文。。
[000引(3)针对第;[个测量变量义1,计算其与文。中各个变量巧'司的互信息值切=1^1,义'^), 其中,i = l,2,…,m与j = l,2,…,m(l+l)分别为过程各测量变量与矩阵文。中各变量的上标 号,I (Xi,X叫表示计算变量Xi与X非司的互信息,具体的计算方式如下所示: (2) 其中,进缘概率P (与9 (
,W及联合概率P (X叫是通过核密度估计方法来确定出 相应的概率值。
[0009] (4)针对过程第i个测量变量xi,对得到的互信息值所组成的向量Cl,声RixmU+U进 行降序排列后,选择前k个最大值所对应的变量并记录变量标号。
[0010] (5)根据记录的变量标号从数据矩阵文。中选择相对应的列组成训练数据集子块 疋e民(。-'批。
[0011] (6)对数据集子块文刑用PCA方法建立相应的故障检测模型,记录相应的模型参数 0拟备用。
[001 ^ (7)重复上述步骤(3)~(6)直至针对所有m个过程变量都有其相对应的PCA故障检 测模型。
[0013] (8)收集新的过程采样数据xGRmxi,先对其中每个测量变量都引入前1个时刻的测 量值,得到新的数据Xa G RmU+llXl,后对Xa进行标准化处理得到兩。
[0014] (9)利用记录的变量标号,将数据向量而分解成m个不同的向量子块巧};li。
[001引(10)利用第i个PCA故障检测模型参数构造对应于向量子块去,的矿和Qi统计量,即:
(3) (4) 其中,I I M表示计算向量的2-范数,并重复此步骤直至得到m组统计量。
[0016] (11)通过贝叶斯推理,将得到m个T2(或Q)统计量值进行概率融合,得到一个统一 的概率型监测指标或BIq),并做出关于当前数据样本是否正常的决策。
[0017] 进一步地,所述步骤(6)具体为:利用PCA方法为子块文,建立故障检测模型,并记录 模型参I 。其中,d为保留的主元个数,PiGRkXd为PCA模型的投影 变换矩阵,八I = IV TE ' TfflLT r巧巧值组成的对角矩阵,对角线上的兀素为,a为计算统计 量控制限与时所采用的置信度。具体实现步骤如下所示: ① 计算不的协方差矩阵
,其中SGRkXk。 ② 设定参数d,求解矩阵S的前d个最大特征值Al>A2>…>Ad所对应的特征向量P1, P2,…,pd。那么,对角矩阵Ai = diag{Al,A2,...,M,投影变换矩阵Pi=[Pl,P2,...,pd]。 ③ 设定置信度日,控制限巧1>"与a.耐分别为:
(5) (6) 其中,Fd,n-1-d,a表示置信度为a、自由度分别为d与n-1-d的F分布所对应的值,尤2,。表示 自由度为h、置信度为a为卡方分布所对应的值,M和V分别为Q统计量的估计均值和估计方 差。
[0018] 进一步地,所述步骤(11)具体为:首先,利用贝叶斯推理将m个T2(或Q)统计量值进 行概率融合得到概率型监测指标与Big。然后,将计算得到的与BIg指标的具体数值 与概率控制限1-a进行对比。若任何一个指标数值大于1-a,则决策新数据兩^为故障样本; 反之,该数据馬W为正常样本,进而对下一个新采样得到的数据继续进行故障检测。贝叶斯 推理的具体实现步骤如下所示:
[0019] (A)对m个t2统计量进行融合: ① 按照下式计算新数据韦属于故障的概率:
(7) 其C (8) 其中,财日F分别表示正常和故障工况,先验概率W巧峰2(f)分别取值a和l-a,条件 概率气:巧I AO和气,巧I巧的计算方式如下:
(9) ② (10)
[0020] (B)对m个Q统计量进行融合 针对于Q统计量,首先计算新数据兩W属于故障的概率、条件概率等,然后得到最终的 概率型指标BIq,与上述融合T2统计量的方式相同。
[0021 ]与现有方法相比,本发明的优点与效果如下:
[0022] 1.本发明针对过程每个测量变量,在不同采样时刻上,选取与之相关联的测量值, 充分考虑到了现代工业过程数据间的复杂特性,即不同测量变量会存在不同的自相关性, 而且变量间的交叉相关性也会体现在不同的采样时刻上。在此基础上建立的分布式PCA故 障检测模型能有效地避免丢失过程数据复杂动态特性可能隐藏的有用信息,极大地提升了 相应故障检测模型的可靠性。
[0023] 2.本发明利用数据间的互信息来度量变量在不同采样时刻上的自相关性和交叉 相关性,在不需要依赖任何过程先验知识的前提下,实现了对过程数据复杂的动态特性进 行了描述。同时,本发明还发挥了分布式建模方法的优势,通过建立多个PCA故障检测模型 而降低了对过程数据分析的难度和复杂度。因此,相比于传统的方法,本发明能有效地改善 故障检测效果。
【附图说明】
[0024] 图1为本发明基于互信息的数据分块方法示意图。
[0025] 图2为本发明方法、DPCA、DLV方法对TE过程故障16工况数据的故障检测结果。
【具体实施方式】
[0026] 下面结合附图和具体实施例对本发明进行详细说明。
[0027] 如图1所示,本发明公开了一种基于互信息的分布式动态过程故障检测方法,该方 法针对现代工业过程的故障检测问题,首先利用数据采集系统收集生产过程正常运行状态 下的数据集。其次,为过程的每个测量变量引入其前1个时刻的延时测量值组成增广型矩 阵。然后,利用互信息选取与每个测量变量相对应的矩阵子块,并建立PCA故障检测模型。最 后,对新的采样数据进行在线监测,即构建Wf;与BIq监测指标,并决策当前监测数据是否正 常。
[00%]本发明的具体实施步骤如下:
[0029] 步骤1:收集生产过程正常运行状态下的采样数据,组成建模用的训练数据集X = [X1,X2,…,Xn]T。其中,XGRnxm, n为训练样本数,m为过程测量变量数,R为实数集,Rmxn表示m X n维的实数矩阵,上标号T表示矩阵转置。
[0030] 步骤2:为数据矩阵X中每个测量变量引入其前1个时刻的测量值构成如下所示增 广型数据矩阵Xa G Rfn-lWl+Um:
(11) 然后,对矩阵Xa进行标准化处理,得到均值为0,标准差为1的新数据矩阵文。
[0031] 步骤3:针对第i个测量变量xS计算其与文。中各个变量X响的互信息值Cu = Kxi,
。其中,i = l,2,…,m与j = l,2,…,m(l+l)分别为过程各测量变量与矩阵文。中各变量的 上标号,T ( yi . yj )味H+貸巧音yi白yj巧的百倍烏.即. (12) 其甲,巧绿概準PUj;Uj;,W巧甘概準PUj,Xj)是通过核密度估计方法来确定出 相应的概率值。
[00创步骤4:针对过程第i个巧慢变量xi,对得到的互信息值所组成的向量Ci,jERixm(i") 进行降序排列后,选择前k个最大值所对应的变量并记录变量标号。
[0033] 步骤5:根据记录的变量标号从数据矩阵文。中选择相对应的列组成训练数据集子 块文,€ Rfn-O处。
[0034] 步骤6:对数据集子块疋利用PCA方法建立相应的故障检测模型,记录相应的模型 参数备用。
[00对利用PCA方法为子块文,建立故障检巧时莫型,并记录模型参数0,=枯/%4,a,巧。 其中,d为保留的主元个数,PiERkx<^PCA模型的投影变换矩阵,AiERdXd是一个由d个特征 值组成的对角矩阵,对角线上的元素为,Cl为计算统计量控制限7;5im与Qiaim时所采用的置信 度。具体实现步骤如下所示: ① 计算疋的协方差矩阵S=文,巧,/(M-/-1),其中SERkXk。 ② 设定参数d,求解矩阵S的前d个最大特征值Al >A2 >…>^d所对应的特征向量Pi, P2,...,Pd。那么,对角矩阵Ai = diag(Al,A2,...山},投影变换矩阵Pi=[Pl,P2,…,Pd]。
③ 设定置信度a,控制限巧im与Qi, Hm分别为: (13) (14) 其中,Fd,n-1-d,a表示置信度为a、自由度分别为d与n-1-d的F分布所对应的值,义&2,。表示 自由度为h、置信度为a为卡方分布所对应的值,M和V分别为Q统计量的估计均值和估计方 差。
[0036] 步骤7:重复上述步骤(3)~(6)直至针对所有m个过程变量都有其相对应的PCA故 障检测模型。
[0037] 步骤8:收集新的过程采样数据xGRmxi,先对其中每个测量变量都引入前1个时刻 的测量值,得到新的数据Xa G rU+llXl,后对Xa进行标准化处理得到电。
[0038] 步骤9:利用记录的变量标号,将数据向量馬分解成m个不同的向量子块?(疋};li。
[0039] 步骤10:利用第i个PCA故障检测模型参数构造对应于向量子块与的7;2和Qi统计量, 并重复此步骤直至得到m组统计量。构造矿和Qi统计量的具体方式如下所示:
(15) (16)
[0040] 步骤11:通过贝叶斯推理,将得到m个T2(或Q)统计量值进行概率融合,得到一个统 一的概率型监测指标或BIq),并做出关于当前数据样本是否正常的决策。
[0041] 首先,利用贝叶斯推理将m个T2(或Q)统计量值进行概率融合得到概率型监测指标 与Big。然后,将计算得到的^^与邮指标的具体数值与概率控制限1-a进行对比。若任 何一个指标数值大于1-0,则决策新数据而W为故障样本;反之,该数据馬W为正常样本,进而 对下一个新采样得到的数据继续进行故障检测。贝叶斯推理的具体实现步骤如下所示:
[0042] (A)对m个T2统计量进行融合 ①按照下式计算新数据式属于故障的概率: 其中,概率巧)的计算方式如下: (17) (18) 其中,N和F分别表示正常和故障工况,先验概率户r,2 (W巧峰,2 (/〇分别取值a和l-a,条件 概率吃巧I AO和气:巧I巧的计算方式如下:
(19) ②通过如下公式计算得到最终的概率型指标:
(20)
[0043] (B)对m个Q统计量进行融合 针对于Q统计量,首先计算新数据而W属于故障的概率、条件概率等,然后得到最终的 概率型指标BIq,与上述融合T2统计量的方式相同。
[0044] 下面结合一个具体的工业过程的例子来说明本发明相对于现有方法的优越性与 可靠性。该过程数据来自于美国田纳西-伊斯曼(TE)化工过程实验,原型是伊斯曼化工生产 车间的一个实际工艺流程。目前,TE过程因其流程的复杂性,已作为一个标准实验平台被广 泛用于故障检测研究。整个TE过程包括22个测量变量、12个操作变量、和19个成分测量变 量。所采集的数据分为22组,其中包括1组正常工况下的数据集与21组故障数据。而在运些 故障数据中,有16个是已知故障类型,如冷却水入口溫度或进料成分的变化、阀口粘滞、反 应动力学漂移等,还有5个故障类型是未知的。为了对该过程进行监测,选取如表1所示的33 个过程变量,接下来结合该TE过程对本发明具体实施步骤进行详细的阐述。
[0045] 1.采集正常工况下的过程数据,同时采集21中不同的故障数据,并选取960个正常 数据组成矩阵X G R9^X33O
[0046] 2.针对训练数据X,建立分布式的PCA故障检测模型。 (1) 为数据矩阵X中每个测量变量引入其前1 = 2个时刻的测量值构成增广型数据矩阵 Xa e R958X",并对其进行标准化处理得到均值为0,标准差为1的新数据矩阵文。。 (2) 针对第;[个测量变量义1,计算其与疋^中各个变量义^^间的互信息值(:^ = I(yi,,其 中,上标号i = l,2,…,33,上标号j = l,2,…,99。 (3) 对得到的互信息值所组成的向量Cl,进行降序排列后,选择前k个最大值所 对应的变量并记录变量标号。 (4) 设置k = -10,根据记录的变量标号从数据矩阵文。中选择相对应的列组成训练数据 集子块式e R9誦。 (5) 利用PCA方法对训练数据集子块不建立相应的故障检测模型,记录相应的模型参
备用 (6) 复上述步骤2~5直至针对所有33个过程变量都有其相对应的PCA故障检测模型。
[0047] 3.获取新采样数据,并对其引入前1 = 2个时刻的测量值得到新数据向量XaGRW Xi,然后对其进行标准化处理,最后计算3/,2与BIg概率型监测指标。 (1) 利用记录的变量标号,将数据向量兩分解成m个不同的向量子块?{文,};3。 (2) 利用第i个PCA故障检测模型参数构造对应于向量子块式的T;2和化统计量,并重复 此步骤直至得到33组统计量。 (3) 通过贝叶斯推理,将得到33个T2(或Q)统计量值进行概率融合,得到一个统一的概 率型监测指标或BIq)。
[004引表1: TE过程监测变量。 LQQ49」4.在线故障检测
根据当前计算得到的S/f:和BIq指标的具体值与控制限l-a = 0.Ol进行比较,判断当前 数据是否正常。本发明方法、DPCA、W及DLV对TE过程故障16的故障检测结果如图2所示。可 W看到,本发明方法对该故障的检测效果明显优越于DPCA与DLV方法。
[0050]上述实施例只用来解释本发明,而不是对本发明进行限制,在本发明的精神和权 利要求的保护范围内,对本发明做出的任何修改和改变,都落入本发明的保护范围内。
【主权项】
1. 一种基于互信息的分布式动态过程故障检测方法,其特征在于,包括以下步骤: (1) 收集生产过程正常运行状态下的采样数据,组成建模用的训练数据集Χ=[χι, χ2,…,Χη]τ,其中,XeRnXm, n为训练样本数,m为过程测量变量数,R为实数集,RnXm表示nx m 维的实数矩阵,上标号T表示矩阵转置; (2) 为数据矩阵X中每个测量变量引入其前1个时刻的测量值构成如下所示增广型数据 矩阵 XaeR(n-1)x(1+1)m:(1) 然后,对矩阵13进行标准化处理,得到均值为0,标准差为1的新数据矩阵足; (3) 针对第i个测量变量X1,计算其与足中各个变量V间的互信息值(^ = Ι(?),其 中,i = l,2,…,m与j = l,2,···,m(l+l)分别为过程各测量变量与矩阵中各变量的上标号, I(xW)表示计算变量X1与V间的互信息,具体的计算方式如下所示:(2) 其中,边缘概率P( V)与P( V ),以及联合概率P(X W )是通过核密度估计方法来确定出 相应的概率值; (4) 针对过程第i个测量变量X1,对得到的互信息值所组成的向量ClueR1Xm(1+1)进行降 序排列后,选择前k个最大值所对应的变量,并记录变量标号; (5) 根据记录的变量标号从数据矩阵又中选择相对应的列组成训练数据集子块(6) 对数据集子块叉利用PCA方法建立相应的故障检测模型,记录相应的模型参数?,以 备用; (7) 重复上述步骤(3)~(6)直至针对所有m个过程变量都有其相对应的PCA故障检测模 型; (8) 收集新的过程采样数据xeRmX1,先对其中每个测量变量都引入前1个时刻的测量 值,得到新的数后对 Xa进行同样的标准化处理得到元; (9) 利用记录的变量标号,将数据向量元分解成m个不同的向量子块 (10) 利用第i个PCA故障检测模型参数构造对应于向量子块&的1^2和Qi统计量,即:其中,I I I I表示计算向量的2-范数,并重复此步骤直至得到m组统计量; (11) 通过贝叶斯推理,将得到m个T2(或Q)统计量值进行概率融合,得到一个统一的概率 型监测指标(或BI Q),并做出关于当前数据样本是否正常的决策。2. 根据权利要求1所述的基于互信息的分布式动态过程故障检测方法,其特征在于,所述步 骤(6)具体为:利用PCA方法为子块足建立故障检测模型,并记录模型参数Θ,· =·μ,冬4,?,7^,2娜}, 其中,d为保留的主元个数,PAR1^为PCA模型的投影变换矩阵JARW是一个由d个特征 值组成的对角矩阵,α为计算统计量控制限巧^与化^时所采用的置信度,具体实现步骤如 下所示: ① 计算兄的协方差矩阵》无;^/(?-/-1),其中SeRkxk; ② 设定参数d,求解矩阵S的前d个最大特征值…>Ad所对应的特征向量Pl, P2,···,pd,那么,对角矩阵为Ai = diag{X1,A2,···山},投影变换矩阵为Pi^pu〗,…,pd]; ③ 设定置信度α,控制限7;^与&, lim分别为:(5) (6) 其中,Fd,n-1-d,a表不置信度为α、自由度分别为d与n-1-d的F分布所对应的值,;^,^表不自 由度为h、置信度为a为卡方分布所对应的值,Μ和V分别为Q统计量的估计均值和估计方差。3.根据权利要求1所述的基于互信息的分布式动态过程故障检测方法,其特征在于,所 述步骤(11)具体为:首先,利用贝叶斯推理将m个Τ2(或Q)统计量值进行概率融合得到概率 型监测指标&卢与則^然后,将计算得到的S/广与則卩指标的具体数值与概率控制限l-α进行 对比,若任何一个指标数值大于Ι-a,则决策新数据I为故障样本;反之,该数据^为正常 样本,进而对下一个新采样得到的数据继续进行故障检测;贝叶斯推理的具体实现步骤如 下所示: (A) 对m个T2统计量进行融合: ① 按照下式计算新数据七属于故障的概率:(7) 其中,概率&沃)的计算方式如下: (8) '1 */ *1?/ */ 其中,N和F分别表示正常和故障工况,先验概率&2 (#)和^;2 (F)分别取值a和l-a,条件 概率?^和I F)的计算方式如下:(9) ② 通过如下公式计算得到最终的概率型指标3^2:(10) (B) 对m个Q统计量进行融合 针对于Q统计量,首先计算新数据^属于故障的概率、条件概率等,然后得到最终的概 率型指标BIq,与上述融合T2统计量的方式相同。
【文档编号】G05B19/418GK105955219SQ201610389000
【公开日】2016年9月21日
【申请日】2016年5月30日
【发明人】童楚东, 史旭华
【申请人】宁波大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1