本发明涉及一种数据驱动的过程监测方法,尤其涉及一种基于多子空间正交典型相关分析的过程监测方法。
背景技术:
1、近年来,由于工业大规模化,生产过程中采集到了大量的数据。在这种背景下,数据驱动的过程监测愈加得到重视并被广泛研究。然而,由于工业过程中闭环控制的存在,并非每个故障都会导致产品质量的恶化。根据故障是否影响产品质量,故障可分为三类:质量相关、质量半相关和质量无关。当质量相关的故障发生时,需要立即诊断故障以采取措施使其恢复正常。从成本效益的角度来看,当与质量无关的故障发生时,不需要花费大量的精力和资源来立即采取行动。为了判断故障是否影响产品质量,人们对质量相关过程监测方法进行了广泛的研究,例如,偏最小二乘(partial least squares,pls)、主成分回归分析(principal component regression,pcr)、典型相关分析(canonical correlationanalysis,cca) 算法等等。此外,由于闭环控制系统的存在,生产过程往往是动态的,有些传感器采集到的数据具有较强的时间序列相关性,而有些传感器采集到的数据具有较弱的时间序列相关性,甚至没有时间序列相关性。如果在过程监测模型中忽略时间尺度上的序列相关性,会导致监测结果不理想,增加误检和漏检的风险。因此,考虑到时间序列的相关性,可以根据过程知识、专家知识、统计数据分析和工程经验将过程变量划分为时间序列相关子空间和时间序列不相关子空间,同时设置时滞对时间序列相关子空间进行矩阵增广以考虑时序相关性。另外,一些过程变量与质量变量具有关联,而一些过程变量与质量变量无关。因此,根据变量是否具有时间序列相关性以及是否与过程变量有关,将原始空间划分为四个子空间。然后对每个子空间都建立一个局部过程监测模型,最后通过贝叶斯融合策略进行整合。在目前的科研文献与专利文件中,还鲜有同时考虑过程数据与质量的相关性以及过程数据时间序列相关性的问题,并将各个子空间融合监测的质量相关过程监测方法。
技术实现思路
1、本发明所要解决的主要技术问题是:在考虑采样数据时间序列相关性的基础上,提取采样数据的质量相关信息和质量不相关信息,并在此基础上实施过程监测。具体来讲,本发明首先将原始信息空间划分为四个不同的子空间;其次,根据不同子空间中的数据特征,利用正交cca、pca方法在不同的子空间中提取特征分别建立对应的监测模型,进而构建各子空间内监测统计量;最后,采用贝叶斯融合策略构建综合质量相关监测统计量和综合质量无关监测统计量以检测故障是否发生。
2、本发明解决上述技术问题所采用的技术方案为:一种基于多子空间正交典型相关分析的过程监测方法,包括以下所示步骤:
3、步骤(1):采集生产过程正常运行状态下的样本,组成训练数据集x∈rn×m,y∈rn×p,其中n为训练样本数,m为过程测量变量数,p为质量测量变量数,r为实数集,rn×m表示n×m 维的实数矩阵,rn×p表示n×p维的实数矩阵;
4、步骤(2):对矩阵x中各列向量实施z-score标准化处理,得到标准化后的矩阵:其中xi∈rm×1(i=1,2,…,n),yi∈rp×1(i= 1,2,…,n);
5、步骤(3):采用lasso回归度量过程变量与质量变量的相关性,并采用自相关函数(acf) 度量过程变量的自相关性,从而将过程数据集划分为四个子空间:质量相关-序列相关子空间:a=[a1,a2,…,an]t∈rn×a,质量无关-序列相关子空间:b=[b1,b2,…,bn]t∈rn×b,质量无关-序列不相关子空间:c=[c1,c2,…,cn]t∈rn×c,质量相关-序列不相关子空间:d= [d1,d2,…,dn]t∈rn×d。其中a+b+c+d=m。具体的实施过程如下所示:
6、步骤(3.1):采用lasso算法构建回归模型,作为输入,yj(j=1,2,…,p)作为输出。 lasso方法估计参数如下:
7、
8、∑i|βi|≤t (1)
9、其中,k=1,2,…,n;i=1,2,…,m。t是调整参数。对于所有的t,当时,α可忽略。
10、步骤(3.2):由式(1)可得β=[β1,β2,…,βm]t,则满足下式的变量可以被挑选为质量相关的过程变量
11、
12、其中d<m且ε取为一个极小的正数。
13、步骤(3.3):对于每个输出变量yj(j=1,2,…,p),通过lasso方法获得对应的质量相关过程变量集,并取并集作为整体质量相关变量集将剩余变量作为质量无关变量集
14、步骤(3.4):自相关函数(acf)度量了xt(i)与xt+k(i)之间的相关性,其中k为滞后。对于 x(i),其滞后k阶的自相关式为:
15、acf(k)=ck/c0 (3)
16、
17、
18、置信区间:
19、
20、对于每个过程变量,若其acf在置信区间内,则认为该变量没有时间序列相关性;否则,认为该变量具有时间序列相关性。因而,根据acf将训练数据集划分为序列相关子空间和序列不相关子空间
21、步骤(3.5):根据下式,将过程数据集划分为四个子空间:
22、a=xq∩xd (7)
23、b=xu∩xd (8)
24、c=xu∩xn (9)
25、d=xd∩xn (10)
26、其中,a=[a1,a2,…,an]t∈rn×a为质量相关-序列相关子空间,b=[b1,b2,…,bn]t∈rn×b为质量无关-序列相关子空间,c=[c1,c2,…,cn]t∈rn×c为质量无关-序列不相关子空间,d= [d1,d2,…,dn]t∈rn×d为质量相关-序列不相关子空间,且a+b+c+d=m。
27、步骤(4):对质量相关-序列相关子空间a∈rn×a和质量无关-序列相关子空间b∈rn×b,进行矩阵增广,将时滞设置为2,从而得到新的数据集和
28、步骤(5):在数据扩展后的质量相关-序列相关子空间中以及在质量相关-序列不相关子空间中,分别构建正交cca模型。以数据扩展后的质量相关-序列相关子空间为例,具体的实施过程如下所示:
29、步骤(5.1):在数据扩展后的质量相关-序列相关子空间中,a'∈r(n-2)×3a和y'∈r(n-2)×3p,构造矩阵并对k进行svd分解:
30、k=r∑vt (11)
31、其中则典型相关变量系数矩阵
32、步骤(5.2):构造矩阵h=jλl-1,并对h进行svd分解:
33、ht=u[ξ,0][vy,vn]t (12)
34、从而得到了质量相关投影矩阵vy和质量无关投影矩阵vn;
35、步骤(5.3):然后,依据如下公式
36、
37、
38、分别构建质量相关统计量ta2和质量无关统计量nta2进行子空间内监测;
39、类似地,在质量相关-序列不相关子空间中分别构建质量相关统计量td2和质量无关统计量ntd2进行子空间内监测;
40、步骤(5.4):利用核密度估计(kde)方法得到质量相关统计量控制限talim2和tdlim2以及质量无关统计量控制限ntalim2和ntdlim2。
41、步骤(6):在数据扩展后的质量无关-序列相关子空间,以及在质量无关-序列不相关子空间中,分别构建pca模型。以数据扩展后的质量无关-序列相关子空间为例,具体的实施过程如下所示:
42、步骤(6.1):在数据扩展后的质量无关-序列相关子空间中b'∈r(n-2)×3b,计算b'的协方差矩阵∑=b'tb'/(n-2-1);
43、步骤(6.2):对∑进行特征值分解,得到主成分方差latent1=[λ1,λ2,…,λ3b]t,并求所有特征值λ1≥λ2≥…≥λ3b所对应的特征向量p1,p2,…,p3b;
44、步骤(6.3):设置保留的主成分个数kb'为满足如下所示条件的最小值,并将对应的kb'个特征向量组成主成分系数矩阵
45、
46、步骤(6.4):根据公式score1=b'coeff1计算主成分得分矩阵score1;
47、步骤(6.5):然后,依据如下公式
48、ntb2(t)=b'icoeff1(cov(b'coeff1))-1(b'icoeff1)t (16)
49、构建质量无关统计量ntb2进行子空间内监测;
50、类似地,在质量无关-序列不相关子空间中分别构建质量无关统计量ntc2进行子空间内监测;
51、步骤(6.6)利用核密度估计(kde)方法得到质量无关统计量控制限ntblim2和ntclim2。
52、步骤(7):根据贝叶斯融合策略将质量相关统计量ta2,td2以及质量无关统计量nta2, ntb2,ntc2,ntd2融合成质量相关概率指标bicq和质量无关概率指标bicu,具体的实施过程如下所示:
53、步骤(7.1):根据下列公式计算bicq
54、
55、
56、
57、
58、p(ta2)=p(ta2|n)p(n)+p(ta2|f)p(f) (21)
59、p(td2)=p(td2|n)p(n)+p(td2|f)p(f) (22)
60、
61、
62、
63、步骤(7.2):根据下列公式计算bicu
64、
65、
66、
67、
68、
69、
70、
71、
72、p(nta2)=p(nta2|n)p(n)+p(nta2|f)p(f) (34)
73、p(ntb2)=p(ntb2|n)p(n)+p(ntb2|f)p(f) (35)
74、p(ntc2)=p(ntc2|n)p(n)+p(ntc2|f)p(f) (36)
75、p(ntd2)=p(ntd2|n)p(n)+p(ntd2|f)p(f) (37)
76、
77、
78、
79、
80、
81、其中,n为正常情况,f为故障情况,p(n)=β;p(f)=1-β。β为置信度,一般设置为0.99,从而可以得到bicq和bicu;
82、上述步骤(1)至步骤(7)为本发明方法的离线建模阶段,如下所示步骤(8)至(16)为本发明方法的动态过程在线监测实施过程·
83、步骤(8):收集新采样时刻的样本数据xt∈rm×1,其中t表示当前采样时刻;
84、步骤(9):根据离线建模步骤(2)中的均值和标准差对xt中实施标准化处理;
85、步骤(10):根据离线建模时得到的四个子空间划分标准对测试样本xt进行划分,从而得到四个子空间中的样本数据:at,bt,ct,dt;
86、步骤(11):将at组成质量相关-序列相关的扩展向量at,将bt组成质量无关-序列相关的扩展向量bt;
87、步骤(12):对于at和dt,分别利用离线建模步骤(5)中构建的正交cca模型进行特征提取分别构建计量tat2,ntat2,tdt2,ntdt2;
88、步骤(13):对于bt和ct,分别利用离线建模步骤(6)中构建的pca模型进行特征提取分别构建计量ntbt2,ntct2;
89、步骤(14):对于得到的质量相关统计量tat2,tdt2以及质量无关统计量ntat2,ntbt2,ntct2,ntdt2根据步骤(7)融合成质量相关概率指标bicqt和质量无关概率指标bicut;
90、步骤(15):若bicqt<1-β并且bicut<1-β,则当前监测时刻系统处于正常运行状态,返回步骤(8)继续实施对下一个样本数据的监测;若bicqt>1-β并且bicut>1-β,则当前采样数据发生质量相关故障;若bicqt<1-β并且bicut>1-β,则当前采样数据发生质量无关故障。
91、与传统方法相比,本发明方法的优势在于:
92、首先,本发明方法可以提取出过程变量中蕴含的质量相关信息和质量无关信息,以此判断故障是否影响质量,使得在发生质量无关的故障时可以大大减少成本和精力;其次,本发明方法虽然是基于多子空间的模型,但是实施故障检测的模型却只有一个,这能极大的方便在线故障检测的实施与触发故障警报的决策。因此,本发明方法理应具备更优秀的故障检测性能,是一种更为优选的多子空间故障检测方法。