基于非高斯成分提取和支持向量描述的过程监控方法

文档序号:6283056阅读:180来源:国知局
专利名称:基于非高斯成分提取和支持向量描述的过程监控方法
技术领域
本发明涉及工业过程故障诊断领域,特别地,涉及一种基于非高斯成分提取和支持向量描述的非高斯统计监控和故障检测的方法。

背景技术
随着现代工业及科学技术的迅速发展,现代化的流程工业呈现出规模大、结构复杂、生产单元之间强耦合、投资大等特点。与此同时,生产过程发生故障的可能性也随之增加。这类系统一旦发生故障,不仅会造成人员和财产的巨大损失,而且对生态环境也将会造成不可挽回的影响。为了提高工业生产过程与控制系统的安全性,同时提高产品的质量、降低生产成本,过程监控和故障诊断已成为企业信息化中不可或缺的一部分。
近年来,多变量统计分析应用于过程监控和故障诊断得到了广泛研究。传统的多变量统计监控方法多采用主元分析(PCAPrincipal Component Analysis),偏最小二成分析(PLSPartial Least Square)等方法,这些方法在假设变量独立同分布的同时,还要求变量服从正态分布,并且运用的仅是二阶统计量信息。在工业实际过程中,由于测量干扰、生产工况的波动等原因,通常会导致变量不再服从正态分布,T2与Q统计量也不在满足F分布与x2分布。因此,如果对此类工业过程仅采用传统的多变量统计方法进行监控,往往难以得到较好的监控效果,漏报、误报率较高,而无法及时有效地发现异常。
独立主元分析方法(ICAIndependent Component Analysis)是一种基于信号高阶统计特性的分析方法,可以用来提取非高斯成分。该方法的目的是将观察得到的数据进行某种线性分解,利用源信号的独立性和非高斯性,使其分解成统计独立的成分。将其用于流程工业的过程数据分析处理,能更有效的利用变量的概率统计特性,可以在统计独立的意义下对观测变量进行分解,得到过程内在的驱动信息源,从而更本质的描述过程特征。FastICA算法是目前基于ICA进行监控工作的常用算法,它的不足之处是分离结果依赖于初始解,无法保证解的全局最优性,另外还缺少选择主元数目的有效标准。


发明内容
本发明的目的是为了克服已有的多变量统计方法没有考虑过程变量的非高斯性、难以得到较好监控效果的不足,提供一种基于非高斯成分提取和支持向量数据描述的统计过程监控和故障检测方法。该方法避免了传统统计过程监控方法假设数据服从正态分布的不足,能够及时地发现过程中出现的异常情况。
本发明的技术解决方案为通过PCA对过程变量数据空间进行降维,然后对主元空间和残差空间分别采用基于微粒群的FastICA算法提取非高斯的独立成分。获得过程非高斯独立成分之后,利用支持向量数据来描述其分布情况,构造新的统计量,确定其统计控制限。具体步骤如下 1)读取生产过程正常运行时关键变量的数据作为训练样本TX; 2)对训练样本TX进行预处理,使得各变量的均值为0,方差为1,得到输入矩阵X∈RN×n,步骤为 (1)计算均值 (2)计算方差 (3)白化处理 其中,TX为训练样本,N为训练样本数,n为变量数; 3)建立主元分析模型; 4)基于微粒群优化算法的非高斯投影计算,提取数据中的非高斯成分; 5)基于支持向量数据描述,构建非高斯信号的统计变量和控制限;求取非高斯信号分布的超球面,求解以下二次规划问题 得到超球面的中心和半径xi、xj为非高斯成分的样本点,xk为超球面边界上的支持向量; 6)主元估计构建主元高斯信号的T2统计量,计算控制限;当检验水平为α,控制限按下式计算 l为主元个数。
7)残差分析构建残差高斯信号Q统计量,计算控制限; 对于任一输入残差ei,Q统计量为 当检验水平为α,控制限按下式计算 其中ρ和μ分别为Q统计量的方差和均值。
8)读取生产过程中最新的变量数据作为待诊断数据VX; 9)故障检测; 10)定期将过程状态正常的点添加到训练集TX中,重复2)~7)的训练过程,以便及时更新支持向量描述、残差分析和主元统计等模型。
所述的建立主元分析模型步骤 (1)计算X的协方差阵,记为∑x; (2)对∑x进行奇异值分解,得到特征根λ1,λ2,…,λn,其中λ1≥λ2≥…≥λn,对应的特征向量矩阵为U; (3)计算总方差和每个特征值对应的方差贡献率,按各个特征值的方差贡献率从大到小累加直到总的方差贡献率达到给定值,记选取个数为r; (4)选取特征向量矩阵U的前r列,构成主元空间P∈Rn×r,剩余列构成残差空间 (5)分别计算PCA保留的得分变量Z=XP和剩余得分变量所述的基于微粒群优化算法的非高斯投影计算的步骤 (1)令Z(1)=Z′,i=1,通过采用微粒群优化算法求取下式最强的非高斯性独立成分所对应的分离向量b1 其中J(·)为非高斯度量函数,其函数形式为J(y)≈[E{G(y)}-E{G(v)}]2,式中,v为零均值、单位方差高斯变量,G(·)为一非二次函数,第一个独立成分为 (2)检验si的高斯性;计算非高斯度量J(si)显著程度为α的置信限Jα。如果J(si)≤Jα,则si为高斯信号,非高斯信号数m=i-1,转到(5),否则继续; (3)i=i+1,式中的r为输入样本点的维数; (4)采用PSO算法求取第i个非高斯成分的分离向量 式中,通过M阵的投影,保证了分离向量之间的正交性。第i个独立成分为返回(2); (5)输出分离矩阵B=(b1,b2,…,bm),结束; 所述的微粒群优化算法步骤 (1)初始化一群微粒,包括微粒数目、微粒随机位置和速度; (2)评价每个微粒的适应度; (3)对每个微粒,若适应值大于其最好位置,则将其作为当前最好位置;若适应值大于全群的最好位置,则重新设置索引号; (4)如未达到结束条件,则按下式修改第i个粒子的速度和位置,返回(2);否则,结束 式中,表示第i个微粒,Vi=[Vi1,Vi2,...,Vir]为微粒的速度,pi=[pi1,pi2,…,pir]是该微粒经历的最佳位置,pg=[pg1,pg2,…,pgr]为群体中所有微粒经历的最好位置,r等同于待求解的维数;w表示惯性权重,c1和c2为正的加速度常数,r1,r2为区间
上平均分布的随机数。
所述的故障检测 对待检测数据VX用训练时地得到的TX和σx2进行白化处理,并将白化后的数据作为主元分析模型的输入,用训练得到的P和

将其划分为主元空间和残差残差空间,变换后矩阵分别输入到非高斯投影模块,得到主元空间的非高斯成分、高斯成分,和残差空间的非高斯成分和高斯成分,非高斯成分通过支持向量描述计算相应的统计量,高斯成分通过常规的主元分析计算相应的T2统计量和Q统计量,如果均小于各自控制限,则判定该样本点正常;否则,认为样本点统计异常,过程对象可能出现故障。
本发明的有益效果主要表现在1、通过非高斯投影,分离出了过程变量中的非高斯成分,并利用支持向量数据来描述其分布情况,构造新的统计量,确定其统计控制限,避免了传统统计过程监控方法假设服从正态分布的不足;分离后的高斯信号更加适合于主元分析、残差分析等多变量监控,从而能够及时地发现过程中的异常情况;2、基于微粒群优化的非高斯投影算法,克服了独立主元分析(ICA)方法易陷入局部极小值的不足,能保证提取的独立成分非高斯性最大化,并无需事前设定非高斯成分数目。



图1是本发明所提出的过程监控方法的原理框图 图2是非高斯投影算法的流程图 图3是在线监控执行示意图 图4是传统主元分析方法与本发明方法监控效果比较图
具体实施例方式 下面结合附图对本发明作进一步描述。
参照图1、图2以及图3,一种基于非高斯成分提取和支持向量数据描述的过程监控方法,具体实施方法如下 (一)离线建模 获取工业过程一批测量数据,建立各模型,获取相应的投影矩阵,具体过程如下 1)读取生产过程正常运行时关键变量的数据作为训练样本TXN×n,其中,N为训练样本数,n为变量数; 2)对训练样本TX进行预处理,使得各变量的均值为0,方差为1,得到输入矩阵X∈RN×n,步骤为 (1)计算均值 (2)计算方差 (3)白化处理 3)建立主元分析模型; 主元分析主要用于降维,提取主元成分,把测量空间分解为主元空间和残差空间。主元方差提取率一般大于80%,计算过程采用协方差奇异值分解的方法,步骤如下 (1)计算X的协方差阵,记为∑x; (2)对∑x进行奇异值分解,得到特征根λ1,λ2,…,λn,其中λ1≥λ2≥…≥λn,对应的特征向量矩阵为U; (3)计算总方差和每个特征值对应的方差贡献率,按各个特征值的方差贡献率从大到小累加直到总的方差贡献率达到给定值,记选取个数为r; (4)选取特征向量矩阵U的前r列,构成主元空间P∈Rn×r,剩余列构成残差空间 (5)分别计算PCA保留的得分变量Z=XP和剩余得分变量 主元分析在力求数据信息丢失最少的原则下,对高维的变量空间降维。其实,实质是研究变量体系的少数几个线性组合,并且这几个线性组合所构成的综合变量将尽可能多地保留原变量信息。
4)基于微粒群优化算法的非高斯投影计算,提取数据中的非高斯成分; 非高斯投影计算是用于提取输入数据的非高斯成分,采用基于微粒群的FastICA算法实现,能够保证提取的独立成分是全局最优,并自动给出非高斯成分数目,无需人为设置。假设要对数据集Z∈RN×r提取非高斯成分,N为样本数,r为变量数,具体实现步骤如下 (1)令Z(1)=Z′,i=1,采用微粒群优化算法求取下式最强的非高斯性独立成分所对应的分离向量b1,得到第一个独立成分为 式中,J(·)为非高斯度量函数,其函数形式为J(y)≈[E{G(y)}-E{G(v)}]2,式中,v为零均值、单位方差高斯变量,G(·)为一非二次函数,可选用如下的形式 G2(u)=exp(-a2u2/2), G3(u)=u4. 式中,1≤a1≤2,a2≈1。
(2)检验si的高斯性 ①计算非高斯度量J(si)显著程度为α的置信限Jα(si),可按以下定理求取 假设y服从标准高斯分布即y∈N(0,1),y1,y2,...,yN为从总体y中独立抽取的容量为N的简单样本,则当N→∞时,根据样本y1,y2,...,yN计算得到的y的非高斯度量J(y1,y2,...,yN)满足以下条件 即渐近地服从自由度为1的x2分布,其中J(·)、G(·)函数定义同上,D(·)为方差函数。给定显著性水平α,则 α一般取0.05或0.1; ②如果J(si)≤Jα,则si为高斯信号,非高斯信号数m=i-1,转到(5),否则继续; (3)i=i+1, (4)采用PSO算法求取第i个非高斯成分的分离向量 式中,通过M阵的投影,保证了分离向量之间的正交性。第i个独立成分为返回(2); (5)输出分离矩阵B=(b1,b2,…,bm),结束; 所述的微粒群优化算法,用于求解无约束优化问题,获取全局最优解,采用以下步骤来实现 (1)初始化一群微粒,包括微粒数目、微粒随机位置和速度;微粒子的维数等同于待求解的维数,微粒子规模(数目)为粒子维数的10~15倍,位置初始值、速度初始值均为随机数; (2)评价每个微粒的适应度,即计算对应目标函数值; (3)对每个微粒,若适应值大于其最好位置,则将其作为当前最好位置;若适应值大于全群的最好位置,则重新设置索引号; (4)如未达到结束条件,则按下式修改第i个粒子的速度和位置,返回(2);否则,结束 式中,表示第i个微粒,Vi=[Vi1,Vi2,...,Vir]为微粒的速度,pi=[pi1,pi2,…,pir]是该微粒经历的最佳位置,pg=[pg1,pg2,…,pgr]为群体中所有微粒经历的最好位置,r等同于待求解的维数;w表示惯性权重,c1和c2为正的加速度常数,r1,r2为区间
上平均分布的随机数。
5)基于支持向量数据描述,构建非高斯信号的统计变量和控制限;求取非高斯信号分布的超球面,求解以下二次规划问题 得到超球面的中心和半径xi、xj为非高斯成分的样本点,xk为超球面边界上的支持向量; 6)主元估计构建主元高斯信号的T2统计量,计算控制限;当检验水平为α,控制限按下式计算 l为主元个数。
7)残差分析构建残差高斯信号Q统计量,计算控制限; 对于任一输入残差ei,Q统计量为 当检验水平为α,控制限按下式计算 其中ρ和μ分别为Q统计量的方差和均值。
(二)在线监控 上述步骤为过程监控建模过程。模型建立后,得到分离矩阵和控制限,可实现在线监控,包括以下步骤 8)读取生产过程中最新的变量数据作为待诊断数据VX; 9)故障检测; 对待检测数据VX用训练时地得到的TX和σx2进行白化处理,并将白化后的数据作为主元分析模型的输入,用训练得到的P和

将其划分为主元空间和残差残差空间,变换后矩阵分别输入到非高斯投影模块,得到主元空间的非高斯成分、高斯成分,和残差空间的非高斯成分和高斯成分,非高斯成分通过支持向量描述计算相应的统计量,高斯成分通过常规的主元分析计算相应的T2统计量和Q统计量,如果均小于各自控制限,则判定该样本点正常;否则,认为样本点统计异常,过程对象可能出现故障。
10)定期将过程状态正常的点添加到训练集TX中,重复2)~7)的训练程,以便及时更新支持向量描述、残差分析和主元统计等模型。
对于实际工业过程,本发明实现在线监控的具体实施过程为 (1)用定时器设置好每次采样的时间间隔; (2)在每个采样周期从DCS的实时数据库中,得到最新的变量数据,作为待诊断数据VX; (3)待检测数据VX,用训练得到的TX和σx2进行白化处理,并将处理后的数据作为主元分析模型的输入; (4)用训练得到的P阵对输入进行变换,得到z和

分别作为非高斯投影计算的输入; (5)非高斯投影计算中,z通过训练得到的B1阵变换得到s1和τ1信号;

通过训练得到的B2阵变换得到s2和τ2信号,分别作为支持向量数据描述、主元估计和残差分析的输入。这里需要注意的是,根据过程数据X线性程度和非高斯程度的不同,可能只能获取部分信号。
(6)支持向量数据描述中,对输入数据s1,采用下式来计算输入数据的D统计量 若说明该样本点D统计正常,反之,说明该样本点统计异常。
同理,对输入数据s2,若为残差空间的非高斯成分,采用下式来计算输入数据的D统计量 若说明该样本点D统计正常,反之,说明该样本点统计异常。
(7)主元估计中,采用下式来计算输入数据的T2统计量 若说明该样本点T2统计正常,反之,该样本点T2统计异常。
(8)残差分析中,采用下式来计算输入数据的Q统计量 若说明该样本点Q统计正常,反之,该样本点Q统计异常,过程对象出现故障; (9)将过程监控结果传给DCS,同时通过DCS系统和现场总线将过程信息传递到现场操作站进行显示,使得现场操作工可以及时处理异常事件。
在在线监控过程中,定期将过程状态正常的点添加到训练集TX中,重复训练过程,以便及时更新支持向量描述、残差分析和主元统计中的模型,保持模型具有较好的动态性。
为了更好的说明本发明提出的基于非高斯成分提取和支持向量数据描述的过程监控方法,利用工业玻璃熔过程数据,与传统的主元分析统计监控方法进行了比较。图4给出了两者的监控结果。结果表明,本发明提出的方法能较早地检测出故障,比主元分析方法更灵敏,且误警率低。
权利要求
1、一种基于非高斯成分提取和支持向量描述的过程监控方法,其特征在于包括以下步骤
1)读取生产过程正常运行时关键变量的数据作为训练样本TX;
2)对训练样本TX进行预处理,使得各变量的均值为0,方差为1,得到输入矩阵X∈RN×n,步骤为
(1)计算均值
(2)计算方差
(3)白化处理
其中,TX为训练样本,N为训练样本数,n为变量数;
3)建立主元分析模型;
4)基于微粒群优化算法的非高斯投影计算,提取数据中的非高斯成分;
5)基于支持向量数据描述,构建非高斯信号的统计变量和控制限;求取非高斯信号分布的超球面,求解以下二次规划问题
得到超球面的中心和半径xi、xj为非高斯成分的样本点,xk为超球面边界上的支持向量;
6)主元估计构建主元高斯信号的T2统计量,计算控制限;当检验水平为α,控制限按下式计算
l为主元个数。
7)残差分析构建残差高斯信号Q统计量,计算控制限;
对于任一输入残差ei,Q统计量为
当检验水平为α,控制限按下式计算
其中ρ和μ分别为Q统计量的方差和均值。
8)读取生产过程中最新的变量数据作为待诊断数据VX;
9)故障检测;
10)定期将过程状态正常的点添加到训练集TX中,重复2)~7)的训练过程,以便及时更新支持向量描述、残差分析和主元统计等模型。
2.如权利要求1所述的一种基于非高斯成分提取和支持向量描述的过程监控方法,其特征在于所述的建立主元分析模型步骤
(1)计算X的协方差阵,记为∑x;
(2)对∑x进行奇异值分解,得到特征根λ1,λ2,…,λn,其中λ1≥λ2≥…≥λn,对应的特征向量矩阵为U;
(3)计算总方差和每个特征值对应的方差贡献率,按各个特征值的方差贡献率从大到小累加直到总的方差贡献率达到给定值,记选取个数为r;
(4)选取特征向量矩阵U的前r列,构成主元空间P∈Rn×r,剩余列构成残差空间
(5)分别计算PCA保留的得分变量Z=XP和剩余得分变量
3.如权利要求1所述的一种基于非高斯成分提取和支持向量描述的过程监控方法,其特征在于所述的基于微粒群优化算法的非高斯投影计算的步骤
(1)令Z(1)=Z′,i=1,通过采用微粒群优化算法求取下式最强的非高斯性独立成分所对应的分离向量b1
其中J(·)为非高斯度量函数,其函数形式为J(y)≈[E{G(y)}-E{G(v)}]2,式中,v为零均值、单位方差高斯变量,G(·)为一非二次函数,第一个独立成分为
(2)检验si的高斯性;计算非高斯度量J(si)显著程度为α的置信限Jα。如果J(si)≤Jα,则si为高斯信号,非高斯信号数m=i-1,转到(5),否则继续;
(3)i=i+1,式中的r为输入样本点的维数;
(4)采用PSO算法求取第i个非高斯成分的分离向量
式中,通过M阵的投影,保证了分离向量之间的正交性。第i个独立成分为返回(2);
(5)输出分离矩阵B=(b1,b2,…,bm),结束;
4、如权利要求3所述的一种基于非高斯成分提取和支持向量描述的过程监控方法,其特征在于所述的微粒群优化算法步骤
(1)初始化一群微粒,包括微粒数目、微粒随机位置和速度;
(2)评价每个微粒的适应度;
(3)对每个微粒,若适应值大于其最好位置,则将其作为当前最好位置;若适应值大于全群的最好位置,则重新设置索引号;
(4)如未达到结束条件,则按下式修改第i个粒子的速度和位置,返回(2);否则,结束
式中,表示第i个微粒,Vi=[Vi1,Vi2,...,Vir]为微粒的速度,pi=[pi1,pi2,…,pir]是该微粒经历的最佳位置,pg=[pg1,pg2,…,pgr]为群体中所有微粒经历的最好位置,r等同于待求解的维数;w表示惯性权重,c1和c2为正的加速度常数,r1,r2为区间
上平均分布的随机数。
5、如权利要求1所述的一种基于非高斯成分提取和支持向量描述的过程监控方法,其特征在于所述的故障检测
对待检测数据VX用训练时地得到的TX和σx2进行白化处理,并将白化后的数据作为主元分析模型的输入,用训练得到的P和
将其划分为主元空间和残差残差空间,变换后矩阵分别输入到非高斯投影模块,得到主元空间的非高斯成分、高斯成分,和残差空间的非高斯成分和高斯成分,非高斯成分通过支持向量描述计算相应的统计量,高斯成分通过常规的主元分析计算相应的T2统计量和Q统计量,如果均小于各自控制限,则判定该样本点正常;否则,认为样本点统计异常,过程对象可能出现故障。
全文摘要
本发明公开了一种基于非高斯成分提取和支持向量描述的过程监控方法,该方法包括读入训练数据和待诊断数据,数据预处理,建立主元分析模型,微粒群优化算法,非高斯投影计算,支持向量数据描述,残差分析,主元估计,故障检测及模型更新。通过本发明提出的方法,能自动地从工业过程运行数据中提取非高斯成份,从而避免了传统统计过程监控方法假设数据服从正态分布的不足;并且,基于微粒群优化算法的非高斯投影算法,保证了提取的独立成分非高斯性的最大化,避免了独立成分分析方法易陷入局部最优解的问题。与传统的统计过程监控方法相比,本发明提出的方法能够及时发现异常,有效减小误报率,取得良好监控效果。
文档编号G05B23/02GK101403923SQ20081012208
公开日2009年4月8日 申请日期2008年10月31日 优先权日2008年10月31日
发明者许仙珍, 磊 谢, 王树青 申请人:浙江大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1