一种基于稀疏GMM的多模过程质量相关的故障诊断方法与流程

文档序号:17158472发布日期:2019-03-20 00:18阅读:351来源:国知局
一种基于稀疏GMM的多模过程质量相关的故障诊断方法与流程

本发明涉及工业过程监控技术领域,特别是一种基于稀疏gmm的多模过程质量相关的故障诊断方法。



背景技术:

现代工业的过程监测对保障生产安全、提高产量等具有举足轻重的作用。随着分布式控制系统的发展,生产规模和操作复杂度急剧增加,过程采集了大量的高维数据。而且,由于生产的产品等级、产量会随市场需求及季节效应不断调整,产品成分、过程设定值、进料比例等工艺参数也会出现波动,现代的工业过程会在多个不同的操作模态之间进行切换。这些生产过程中的随机变化使得过程数据呈现非线性、多模态等特点。尽管基于数据驱动的多元统计过程控制(multivariatestatisticalprocesscontrol,mspc)方法在过程监测中取得了成功的应用,但是多模非线性数据的均值和协方差均发生了重大的变化,传统的mspc方法忽视了不同过程变量之间存在的非线性和多模关系,可能导致监测结果的退化。而且,在实际生产过程中,产量和产品质量通常难以直接在线测量,需要在生产完成后进行测量。因此,构建产品变量和质量变量之间的关系模型对于质量相关的多模过程监测尤其重要。高斯混合模型(gaussianmixturemodel,gmm)被用于多模态过程监测,利用一系列高斯成分估计多模过程中复杂的数据分布,并构建基于马氏距离和似然概率的统计指标实施过程监测。

然而,gmm假设多模过程的每个单模态呈高斯分布,实际的过程数据有可能集中分布在低维的子流形结构上。因此,每个流形的邻域样本可能分布在相同的高斯成分中,可以融合过程的流形几何信息,构建流形gmm监测模型。而且,对生产过程的产量和产品质量这些关键变量而言,难以直接在线测量,而是在生产完成后测量的。因此,构建过程变量和质量变量之间的关系模型对质量相关的故障检测与诊断尤其重要。

最近,马等(neurcomputing,2015(285))提出鲁棒高斯混合模型(robustgaussianmixturemodel,rgmm),自动获取高斯成分数,用于质量相关的故障检测与诊断。然而,多模过程中每个高斯成分内,在建模时也需要抓取近邻数据分布的相似性,充分挖掘多模态的流形鉴别能力,保持高斯内部局部几何结构特征。此外,局部流形结构中的权重矩阵在描述数据的几何结构中具有重要的作用,传统的流形学习通常采用k近邻或ε-球形方法,在给定参数的情况下确定邻域值。这些方法对数据噪音和离群点敏感。



技术实现要素:

本发明所要解决的技术问题是克服现有技术的不足而提供一种基于稀疏gmm的多模过程质量相关的故障诊断方法,本发明提出的稀疏gmm方法可以充分发现多模过程的内在变化,依据已检测到故障的受控近邻,选取与质量相关的重要的故障变量;相比传统gmm监测方法,可以获得更高的诊断精度和更强的故障鉴别能力。

本发明为解决上述技术问题采用以下技术方案:

根据本发明提出的一种基于稀疏gmm的多模过程质量相关的故障诊断方法,包括以下步骤:

步骤a、建立过程变量与质量变量之间的稀疏表示模型,获得样本的稀疏重构权重矩阵s;

步骤b、构建稀疏高斯混合模型:根据稀疏表示模型获得的稀疏重构权重矩阵s中的稀疏系数,形成高斯成分周围近邻样本相似性的约束条件,自适应选择训练样本的邻域范围,获取了高斯成分相似的条件概率分布,保持了数据流形结构的局部性和稀疏性,自动地识别高斯成分数目;

步骤c、构建稀疏gmm监测指标,利用稀疏高斯混合模型的输出结果和每个模态的局部马氏距离设计故障检测与诊断指标,融合过程全局输出和局部信息,评估多模态过程的运行状态。

作为本发明所述的一种基于稀疏gmm的多模过程质量相关的故障诊断方法进一步优化方案,所述步骤a具体如下:

给定来自多模过程的n个样本,每个样本包含过程变量x∈rm和质量变量y∈r,则历史数据集d表示为:

其中,rm表示m维变量,r表示1维变量,[y(1)x(1)]t表示质量变量和第1个过程变量,简写成d1,以此类推,[y(1)x(n)]t表示质量变量和第n个过程变量,简写成dn,上标t为转置;

稀疏表示通过下列公式联合优化目标函数,计算出训练样本的稀疏表示量:

式中,l1-范式表示矩阵元素的绝对值之和,λ为正则化参数正值,e为稀疏误差,e为元素为1的列向量;利用凸优化方法求解出稀疏重构权重矩阵s=[s1,s2,…,sn]∈rn×n,rn×n表示行和列均为n的存储空间,其中sn=[sn1,sn2,…,snn-1,0,snn+1,…,snn]t,n=1,2...,n,sn为第n个样本数据dn的稀疏系数变量,它的每个元素snj表示dn对重构第j个样本dj的贡献度。

作为本发明所述的一种基于稀疏gmm的多模过程质量相关的故障诊断方法进一步优化方案,构建稀疏高斯混合模型的具体步骤如下:

步骤a、构建与质量相关的高斯混合模型,每个样本的概率密度函数p(d|θ)表示为:

其中,d是样本数据,c是高斯成分数目,ωk是第k个高斯成分的后验概率,满足高斯参数θk={μk,σk},μk是第k类均值,σk是第k类协方差矩阵,θ={θ1,θ2,...,θc}是全局高斯模型参数的集合,θ1,θ2,...,θc分别代表第1个、第2个,…,第c个局部高斯成分;对于第k个高斯成分,它的概率密度函数g(dθk)表示为

设z={z1,z2,…,zn}表示类别的缺失数据,且zi∈{1,2,...,c},zi表示第i样本属于的类别;若zi=k,则表示第i样本属于第k个高斯成分,则潜变量zki=1,否则zki=0;m是样本的维数,质量相关的高斯混合模型的参数θ通过最大化下列似然函数来求解:

式中,l(ω,θ;d,z)是似然函数,ω是后验概率;

步骤b、基于稀疏表示和流形结构中的相似样本在嵌入空间仍然靠近的原则,在gmm目标函数中融合条件概率分布的几何结构知识,构建稀疏gmm;对高斯概率分布上的成对相似约束实现最小化稀疏正则项,约束项表示为:

其中,γn=p(zn|dn),表示第n个样本dn属于zn类别的概率,γj=p(zj|dj),表示第j个样本dj属于zj类别的概率,h(·||·)度量了两种分布的相似程度,采用kl距离度量,最小化约束项后,数据将沿着流形几何测距平滑分布;将该稀疏正则项与gmm的似然函数融合,得到稀疏gmm的目标函数j:

其中,δ>0是正则化参数;采用期望值最大化方法求解稀疏gmm的参数;

步骤c、根据原始的gmm和贝叶斯法则,计算潜变量zki:

其中,ωl是高斯成分l的后验概率,g(di|θk)是样本di在高斯成分θk的密度概率,g(di|θl)是样本di在高斯成分θl的密度概率;

步骤d、更新模型参数:

式中,是第k个高斯成分的样本的类别总和,ωnk=(dn-μk)(dn-μk)t,是第k个高斯成分的样本协方差。

作为本发明所述的一种基于稀疏gmm的多模过程质量相关的故障诊断方法进一步优化方案,构建稀疏gmm监测指标的步骤具体如下:

步骤①、对于每个监控样本dt,根据稀疏gmm表征全局结构信息的输出结果,利用模型输出jout度量监控样本偏离受控训练基线的程度,度量监控样本偏离受控训练基线的程度jout表示为:

jout=-lnp(dt|θ)(12)

式中,p(dt|θ)表示监控样本dt基于训练模型的概率密度;

统计出监控样本的输出值比训练样本输出值小的概率,设计lot指标量化过程状态:

lot(dt)=pr(jout(dt)≤jout(dtrain))(13)

式中,jout(dtrain)表示训练集的输出,jout(dt)表示测试样本的输出,lot(dt)为全局信息指标;pr(jout(dt)≤jout(dtrain))表示测试样本输出低于训练集输出的概率;

马氏距离用于度量单一模态内的质量相关的故障检测,计算监控样本dt到每个模态ck的马氏距离md为:

马氏距离遵循逼近的χ2分布,即

通过融合全局信息指标lot(dt)和局部信息指标md(k)(dt|dt∈k),设计一合成故障检测指标gl,减少监控成本和操作负担,gl表示为:

给定控制限ηα,当监控样本的gl超出该控制限,则检测出与质量相关的故障,否则,说明无故障发生;

步骤②、在检测出质量相关的故障后,进一步确定故障发生的根源变量;将过程变量的贡献度定义为故障样本到受控近邻之间的距离,通过求解故障的虚拟受控近邻,获得故障偏离正常操作的方向,确定故障产生的根源变量;

定义故障的受控近邻的优化函数为:

其中,dfault是检测出的故障样本,dnicn是故障的虚拟受控近邻样本,从训练样本中随机选择样本作为非线性规划技术的初始化输入,求解出受控近邻样本,则故障样本进一步表示为:

dfault=dnicn+f(17)

式中,f表示估计出的故障向量,用于评估出故障样本调整到正常状态的最小值;每个变量的贡献度定义为dfault和dnicn之间的欧氏距离conq:

式中,和fq分别表示dnicn,dfault和f的第q个元素;

利用马氏距离重新定义变量的贡献度conmdq:

式中,ξq是第q个元素为1的单位向量,将具有最大conmdq值的变量集隔离,设置阈值τ为:

如果故障的变量超出了这个阈值τ,则确定该变量的变化造成了过程异常,触发故障。

作为本发明所述的一种基于稀疏gmm的多模过程质量相关的故障诊断方法进一步优化方案,α=0.05。

本发明采用以上技术方案与现有技术相比,具有以下技术效果:本发明利用稀疏表示表征流形结构的权重矩阵,保持高斯成分中数据流形的局部几何结构特征,自动地获取高斯成分数量,对过程中的噪音和离群点具有鲁棒性;本方法在gmm的基础上,融合流形几何结构的稀疏性和局部性,构建稀疏gmm,抓取与质量变量相关的过程变量特性,反映多模过程的状态变化情况,并依据已检测到故障的受控近邻,识别出故障的根源变量;本发明方法适合多模过程中质量相关的故障检测与诊断。

附图说明

图1是本发明方法的实施流程图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明进行详细描述。

本发明采用一种无参数鲁棒性的稀疏表示方法,构建流形结构的本征矩阵,自动地决策样本邻域范围。

鉴于稀疏表示和质量相关的gmm模型在过程监测的优势,提出基于稀疏gmm的多模过程质量相关的故障诊断方法,保持高斯成分的流形几何上样本之间的局部相似性和稀疏性,强化gmm模型学习性能,提升模型的诊断能力。

本发明在高斯混合模型的基础上,针对质量相关的多模过程潜在的复杂结构特性,利用稀疏表示无参数鲁棒地表征流形结构的权重矩阵,并基于高斯成分上流形数据样本之间的相似性,构建稀疏高斯混合模型,保持多模过程数据的局部特征和稀疏特征。提出的稀疏gmm方法可以充分发现多模过程的内在变化,依据已检测到故障的受控近邻,选取与质量相关的重要的故障变量。相比传统gmm监测方法,可以获得更高的诊断精度和更强的故障鉴别能力。

基于稀疏gmm的多模过程质量相关的故障诊断方法,利用稀疏表示表征高斯成分的几何信息分布情况,构建稀疏gmm,分析多模过程的数据分布特征,提取与质量相关的过程变量特征,抓取多模过程的内在变化,分析故障发生的根源变量,增强稀疏gmm方法的故障诊断能力。

如图1所示,本发明涉及了一种基于稀疏gmm的多模过程质量相关的故障诊断方法,该方法的具体实施步骤如下所示:

(1)建立过程变量与质量变量之间的稀疏表示模型,获得样本的稀疏重构权重矩阵s。

给定来自多模过程的n个样本,每个样本包含过程变量x∈rm和质量变量y∈r,则历史数据集d表示为:

其中,rm表示m维变量,r表示1维变量,[y(1)x(1)]t表示质量变量和第1个过程变量,简写成d1,以此类推,[y(1)x(n)]t表示质量变量和第n个过程变量,简写成dn,上标t为转置;

稀疏表示通过下列公式联合优化目标函数,计算出训练样本的稀疏表示量:

式中,l1-范式表示矩阵元素的绝对值之和,λ为正则化参数正值,e为稀疏误差,e为元素为1的列向量;利用凸优化方法求解出稀疏重构权重矩阵s=[s1,s2,…,sn]∈rn×n,rn×n表示行和列均为n的存储空间,其中sn=[sn1,sn2,…,snn-1,0,snn+1,…,snn]t,n=1,2...,n,sn为第n个样本数据dn的稀疏系数变量,它的每个元素snj表示dn对重构第j个样本dj的贡献度。

(2)构建稀疏高斯混合模型。通过增加高斯成分周围近邻样本相似性的约束条件,自适应选择训练样本的邻域范围,获取了高斯成分相似的条件概率分布,保持了数据流形结构的局部性和稀疏性,自动地识别高斯成分数目,对数据噪音和离群点具有鲁棒性。求解稀疏高斯混合模型的子步骤如下所示:

步骤a、构建与质量相关的高斯混合模型,每个样本的概率密度函数p(d|θ)表示为:

其中,d是样本数据,c是高斯成分数目,ωk是第k个高斯成分的后验概率,满足高斯参数θk={μk,σk},μk是第k类均值,σk是第k类协方差矩阵,θ={θ1,θ2,...,θc}是全局高斯模型参数的集合,θ1,θ2,...,θc分别代表第1个、第2个,…,第c个局部高斯成分;对于第k个高斯成分,它的概率密度函数g(dθk)表示为

设z={z1,z2,…,zn}表示类别的缺失数据,且zi∈{1,2,...,c},zi表示第i样本属于的类别;若zi=k,则表示第i样本属于第k个高斯成分,则潜变量zki=1,否则zki=0;m是样本的维数,质量相关的高斯混合模型的参数θ通过最大化下列似然函数来求解:

式中,l(ω,θ;d,z)是似然函数,ω是后验概率;

步骤b、基于稀疏表示和流形结构中的相似样本在嵌入空间仍然靠近的原则,在gmm目标函数中融合条件概率分布的几何结构知识,构建稀疏gmm;对高斯概率分布上的成对相似约束实现最小化稀疏正则项,约束项表示为:

其中,γn=p(zn|dn),表示第n个样本dn属于zn类别的概率,γj=p(zj|dj),表示第j个样本dj属于zj类别的概率,h(·||·)度量了两种分布的相似程度,采用kl距离度量,最小化约束项后,数据将沿着流形几何测距平滑分布;将该稀疏正则项与gmm的似然函数融合,得到稀疏gmm的目标函数j:

其中,δ>0是正则化参数;采用期望值最大化方法求解稀疏gmm的参数;

步骤c、根据原始的gmm和贝叶斯法则,计算潜变量zki:

其中,ωl是高斯成分l的后验概率,g(di|θk)是样本di在高斯成分θk的密度概率,g(di|θl)是样本di在高斯成分θl的密度概率;

步骤d、更新模型参数:

式中,是第k个高斯成分的样本的类别总和,ωnk=(dn-μk)(dn-μk)t,是第k个高斯成分的样本协方差。

(3)构建稀疏gmm监测指标,利用整个模型的输出结果和每个模态的局部马氏距离设计合理的故障检测与诊断指标,融合过程全局输出和局部信息,评估多模态过程的运行状态。求解稀疏gmm监测指标的子步骤表示为:

步骤①、对于每个监控样本dt,根据稀疏gmm表征全局结构信息的输出结果,利用模型输出jout度量监控样本偏离受控训练基线的程度,度量监控样本偏离受控训练基线的程度jout表示为:

jout=-lnp(dt|θ)(12)

式中,p(dt|θ)表示监控样本dt基于训练模型的概率密度;

统计出监控样本的输出值比训练样本输出值小的概率,设计lot指标量化过程状态:

lot(dt)=pr(jout(dt)≤jout(dtrain))(13)

式中,jout(dtrain)表示训练集的输出,jout(dt)表示测试样本的输出,lot(dt)为全局信息指标;pr(jout(dt)≤jout(dtrain))表示测试样本输出低于训练集输出的概率;

马氏距离用于度量单一模态内的质量相关的故障检测,计算监控样本dt到每个模态ck的马氏距离md为:

马氏距离遵循逼近的χ2分布,即

通过融合全局信息指标lot(dt)和局部信息指标md(k)(dt|dt∈k),设计一合成故障检测指标gl,减少监控成本和操作负担,gl表示为:

给定控制限ηα(α=0.05),当监控样本的gl超出该控制限,则检测出与质量相关的故障,否则,说明无故障发生;

步骤②、在检测出质量相关的故障后,进一步确定故障发生的根源变量;将过程变量的贡献度定义为故障样本到受控近邻之间的距离,通过求解故障的虚拟受控近邻,获得故障偏离正常操作的方向,确定故障产生的根源变量;

定义故障的受控近邻的优化函数为:

其中,dfault是检测出的故障样本,dnicn是故障的虚拟受控近邻样本,从训练样本中随机选择样本作为非线性规划技术的初始化输入,求解出受控近邻样本,则故障样本进一步表示为:

dfault=dnicn+f(17)

式中,f表示估计出的故障向量,用于评估出故障样本调整到正常状态的最小值;每个变量的贡献度定义为dfault和dnicn之间的欧氏距离conq:

式中,和fq分别表示dnicn,dfault和f的第q个元素;

利用马氏距离重新定义变量的贡献度conmdq:

式中,ξq是第q个元素为1的单位向量,将具有最大conmdq值的变量集隔离,设置阈值τ为:

如果故障的变量超出了这个阈值τ,则确定该变量的变化造成了过程异常,触发故障。

本发明利用稀疏表示表征流形结构的权重矩阵,保持高斯成分中数据流形的局部几何结构特征,自动地获取高斯成分数量,对过程中的噪音和离群点具有鲁棒性。本方法在gmm的基础上,融合流形几何结构的稀疏性和局部性,构建稀疏gmm,抓取与质量变量相关的过程变量特性,反映多模过程的状态变化情况,并依据已检测到故障的受控近邻,识别出故障的根源变量。因此,本发明方法适合多模过程中质量相关的故障检测与诊断。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1