基于狄利克雷混合模型的转动机械运行状态异常检测方法与流程

文档序号:12271726阅读:958来源:国知局
基于狄利克雷混合模型的转动机械运行状态异常检测方法与流程

本发明属于机械异常检测领域,涉及针对转动机械运行状态的异常检测方法,具体是一种基于狄利克雷混合模型的转动机械运行状态异常检测方法。



背景技术:

化工机械遍布在化工生产的方方面面,对化工生产起着至关重要的作用。一旦发生故障,轻则影响生产,重则机毁人亡。因此如何有效实现转动机械实时智能状态监测,及时发现机组异常,成为当前研究的热点。

目前,国内对转动机械运行状态异常检测进行了大量的研究,异常检测方法主要分为两种:一、单特征值预警;二、提取多特征值,运用降维方法将多特征降维成一个或少数几个特征,根据特征值在空间分布上的变化判断机组是否发生异常。这些方法虽然在异常检测方面取得了一些成果,但还存在很多不足。转动机械信号具有非平稳性,机组发生异常后,波形幅值可能不会升高。因此,单特征值很难较全面的描述波形特征实现预警;高维特征降维获取一个或少数几个特征的方法,在降维过程中,做了很多理想的假设,忽视了特征之间实际的相互联系,弱化了降维方法的性能,使异常检测的准确率低。因此如何利用高维特征实现异常检测,成为当前研究的难点。

针对上述问题,提出了基于统计模型的异常检测方法。传统的基于统计模型的异常检测方法存在诸多的局限性,比如,实际生产中的状态监测数据很复杂,难以确定其分布形式,为了简化计算,大多假设数据呈高斯分布,这种假设具有较大的主观性,对于复杂的数据分布问题,会使分析结果和实际偏离较大;训练过程中,模型参数直接由样本数据计算得到,忽视了先验知识对异常检测的作用;模型个数依据经验设定等。这些都大大降低了异常检测的准确率。

近年来,随着机器学习的发展,狄利克雷混合模型受到越来越多的关注,该方法目前较成熟的运用于多个领域,且取得了很好的效果。因此,将狄利克雷混合模型与机械异常检测相结合,提出了一种基于狄利克雷混合模型的机械异常检测方法,该方法无需假设数据分布形式,运用先验知识建立统计分布模型,可依据训练数据学习出最优的模型参数和模型个数。该方法提高了异常检测准确率,提前了报警时间点,适用于转动机械多种故障的异常检测。



技术实现要素:

本发明的目的是克服现有技术缺点,将狄利克雷混合模型与机械异常检测相结合,提供一套全新的,智能的,实时的,准确率高的转动机械异常检测方法。该方法将狄利克雷混合模型用于转动机械异常检测,能够在不停车的情况下应用实时监测数据,监测转动机械运行状态,准确率高,能够实现机械异常检测和预警。

本发明公开了一种基于狄利克雷混合模型的转动机械异常检测方法,具体步骤为:

步骤1分别采集机组正常工况运行数据和实时工况运行数据:通过安装在机械上的传感器采集可以表征机组运行状态的数据,数据包括正常工况数据和实时工况数据,每种工况数据推荐样本数为50-150组。

步骤2提取数据特征,构造特征相空间:提取能反映机组状态监测数据变化的多种特征,包括时域特征,频域特征。运用这些特征构造相空间,结果如下:

其中:x(i,j)(i=1,2,…,n;j=1,2,…,m)代表样本特征,Xi(i=1,2,…,n)代表每组样本m个特征构造的相空间,Aj(j=1,2,…,m)为n组样本的同一类特征构成的特征子集。

步骤3设定狄利克雷混合模型初始聚集参数α。

步骤4运用正常数据特征相空间训练得到基于狄利克雷混合模型的统计分布模型,模型数自学习结果为T,并将该模型设定为基准模型:

狄利克雷混合模型形式定义如下式:

Xii~F(θi);

θi|G~G;

G|α,G0~DP(α,G0);

其中:

Xi服从参数为θi的某种分布F(θi);

θi代表观测数据服从的混合分布中某个分布分量,可能被重复抽样,分量个数可以从相空间自动推断,无需人工设定,根据推断结果,可自学习出狄利克雷混合模型个数T。该分量先验分布服从某种未知随机测度G,G可以通过狄利克雷过程构造。

G0为基础分布,α为聚集参数或者质量参数,基础分部G0可以理解为狄利克雷过程均值,即E(G(A))=G0(A),聚集参数α可以理解为狄利克雷过程逆方差,即V(G(A))=G0(A)(1-G0(A))/(α+1)。

基于上述方法,运用正常数据特征相空间Xnorm,构造基于狄利克雷混合模型的转动机械运行状态相空间的统计分布模型:

(1)根据正常数据特征相空间Xnorm,构造狄利克雷分布模型DP(α,G0(A));

(2)依据DP(α,G0(A))构造出θi的先验分布,并计算θi的后验分布;

(3)根据θi的后验分布,推导出特征相空间X的分布,得出正常数据特征相空间Xnorm基于狄利克雷混合模型的相空间统计分布模型:

其中:αi为模型权重,θ为模型参数集。

步骤5计算正常数据特征相空间模型间距离,自学习报警门限。

步骤6将模型数设定为T,训练实时数据统计分布模型:

假设当前数据特征相空间为Xcurrent,则依据步骤4的方法,得到模型为:

其中:βj为模型权重,θ为模型参数集。

步骤7计算正常数据和实时运行数据特征相空间模型间的距离D:

D=|f(Xcurrent)-f(Xnorm)|

步骤8判断距离是否超过设定的报警门限,超过报警门限则报警,反之,继续采集数据:

式中:th为报警门限。若距离D超过报警门限,则认为正常数据相空间模型和当前运行数据相空间模型差异度较大,机组存在异常,发生报警;若未超过报警门限,则继续采集运行数据。

本发明提出基于狄利克雷混合模型的转动机械运行状态异常检测方法,该方法在转动机械运行状态下即可进行异常检测,具有实时性强,准确率高等优点。

本发明的第一方面,公开了用特征值构造相空间的方法;

本发明的第二方面,公开了基于狄利克雷混合模型的转动机械运行状态异常检测方法流程。

附图说明

图1:转动机械异常检测流程图

图2:机组波形数据

图3:特征值

图4:A1特征

图5:均值向量

图6:协方差矩阵

图7:模型距离及报警线

具体实施方式

下面将结合附图对本发明的具体的异常检测流程做进一步说明。

如图1所示,本发明具体的流程如下所示:

1、分别采集机组正常工况运行数据和实时工况运行数据:通过安装在机械上的传感器采集可以表征机组运行状态的数据,数据包括正常工况数据和实时工况数据,每种工况数据推荐样本数为50-150组;

2、提取数据特征,构造特征相空间:提取能反映机组状态监测数据变化的多种特征,包括时域特征,频域特征。运用这些特征构造相空间,结果如下:

其中:x(i,j)(i=1,2,…,n;j=1,2,…,m)代表样本特征,Xi(i=1,2,…,n)代表每组样本m个特征构造的相空间,Aj(j=1,2,…,m)为n组样本的同一类特征构成的特征子集。

3、设定初始参数:设定狄利克雷混合模型初始参数α。

4、运用正常数据特征相空间训练得到基于狄利克雷混合模型的统计分布模型,模型数自学习结果为T,并将该模型设定为基准模型:

狄利克雷混合模型形式定义如下式:

Xii~F(θi);

θi|G~G;

G|α,G0~DP(α,G0);

其中:

Xi服从参数为θi的某种分布F(θi);

θi代表观测数据服从的混合分布中某个分布分量,可能被重复抽样,分量个数可以从相空间自动推断,无需人工设定,根据推断结果,可自学习出狄利克雷混合模型个数T。该分量先验分布服从某种未知随机测度G,G可以通过狄利克雷过程构造。

G0为基础分布,α为聚集参数或者质量参数,基础分部G0可以理解为狄利克雷过程均值,即E(G(A))=G0(A),聚集参数α可以理解为狄利克雷过程逆方差,即V(G(A))=G0(A)(1-G0(A))/(α+1)。

基于上述方法,运用正常数据特征相空间Xnorm,构造基于狄利克雷混合模型的转动机械运行状态相空间的统计分布模型:

(1)根据正常数据特征相空间Xnorm,构造狄利克雷分布模型DP(α,G0(A));

(2)依据DP(α,G0(A))构造出θi的先验分布,并计算θi的后验分布;

(3)根据θi的后验分布,推导出特征相空间X的分布,得出正常数据特征相空间Xnorm基于狄利克雷混合模型的相空间统计分布模型:

其中:αi为模型权重,θ为模型参数集。

5、计算正常数据模型间距离,自学习报警门限。

6、将模型数设定为T,训练实时数据统计分布模型:

假设当前数据特征相空间为Xcurrent,则依据步骤4的方法,得到模型为:

其中:βj为模型权重,θ为模型参数集。

7、计算正常数据和实时运行数据特征相空间模型间的距离D:

D=|f(Xcurrent)-f(Xnorm)|

8、判断距离是否超过设定的报警门限,超过报警门限则报警,反之,继续采集数据:

式中:th为报警门限。若距离D超过报警门限,则认为正常数据特征相空间模型和当前运行数据特征相空间模型差异度较大,机组存在异常,发生报警;若未超过报警门限,则继续采集运行数据。

这里以某石化2缸往复机组拉缸故障数据为例进行说明。

1、分别采集50组正常工况数据和50组异常数据。其中一组振动波形数据如图2;

2、将波形数据带入特征值计算公式,提取特征值,本案例波形数为n=50,提取特征数为m=22,特征种类包括时域波形峰值、有效值、峭度、形状因子、脉冲因子;小波包分解后,各层的峰值、有效值。一组波形的特征X1见图3,特征包括波形的时域特征和频域特征。A1至A22为分别代表所有波形的22类特征中的一类,A1特征见图4。50组波形22类特征构成了相空间X。

3、参考相关文献,可将狄利克雷模型参数α值设定为0.01。

4、将X输入至算法,自学习出模型数T=3和模型f(Xnorm)。生成的模型参数θ包括均值μ和协方差Σ,每一个模型对应一个均值和一个协方差矩阵,分别为22×1的向量和22×22的矩阵,第一个模型的均值和协方差矩阵学习结果见图5和图6(图6(a)为协方差矩阵1-22行1-12列,图6(b)为协方差矩阵1-22行13-22列)。模型权重

5、计算正常工况数据相空间模型间距离,距离计算方法见7中说明。将正常数据模型距离最大值设定为报警门限,本案例前20组为正常工况距离值,报警门限为图7中的红线。

6、根据4中的学习结果,将模型数设定为3,用同样的方法学习出当前工况数据特征相空间模型f(Xcurrent)。

7、计算正常数据和实时运行数据特征相空间模型间的距离D:

D=|f(Xcurrent)-f(Xnorm)|

多组当前工况数据(含故障数据)模型距离计算结果见图7。

传统的单值报警时间点在第60个点处,本方法报警时间点在第48个点,报警时间提前了4小时(点与点之间的时间差为20分钟),提高了异常检测准确率。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1