一种基于正则化架构的工业过程故障分离方法

文档序号:9523576阅读:316来源:国知局
一种基于正则化架构的工业过程故障分离方法
【技术领域】
[0001] 本发明属于工业过程监测技术领域,特别设及一种基于正则化架构的工业过程故 障分离方法。
【背景技术】
[0002] 所谓故障,是指系统中有一个或多个特征或变量很大程度上偏离正常状态。广义 说,故障可解释为使系统出现所不期待的特征的所有异常现象。一旦系统出现故障,会降 低系统的性能,使其低于正常水平,难W达到系统预期的结果和功能,不能及时排除和解决 时,就会导致生产事故的发生。
[0003] 工业过程监测技术是一个W故障分离和诊断技术为基础的学科,它针对提高产品 质量、系统可靠性及设备可维护性等问题进行研究,对确保复杂工业过程安全运行具有重 大意义。
[0004] 工业过程产生的样本数据主要分为标记样本数据和未标记样本数据。标记样本数 据通常较难获取,因为它主要受实际工作现场的生产条件限制,并且往往需要相关领域专 家或者有经验的工人进行标注,非常耗时,代价昂贵。所W工业过程中的数据中标记样本 数据很少,大多是没有标记的样本数据,如何能合理利用两者,减少人力标记样本数据的成 本,成为近年来基于数据驱动的故障诊断方法研究的热点。但是标记样本数据目前还没有 得到充分的信息挖掘,所W如何在少量不够准确的标记样本数据下尽量提高分类器的泛化 能力,如何充分利用大量廉价的非标记样本,提高故障分离的精确度已经成为故障诊断领 域研究的热点。

【发明内容】

[0005] 针对现有技术存在的不足,本发明提供一种基于正则化架构的工业过程故障分离 方法。
[0006] 本发明的技术方案:
[0007] -种基于正则化架构的工业过程故障分离方法,包括W下步骤:
[0008] 步骤1 :采集工业过程样本数据;
[0009] 步骤2:对采集的样本数据进行滤波处理,滤除奇异样本数据,保留可用样本数 据;所述可用样本数据包括标记样本数据和未标记样本数据;所述标记样本数据指的是通 过有经验的专家或者工人对所采集的数据进行特征区分,分别标记为正常样本数据、故障 样本数据及其对应的故障状态类别,使得运些样本数据具有类标签;所述未标记数据指的 是直接采集的未经过任何标记处理而不具有类标签的数据;
[0010] 可用样本数据集表示为:
[0011] T= {(xi,Yi), . . . (xi,Yi)}u . . .xj;XjeRj= 1, ···,n(1)
[001引其中d为变量个数;n为样本个数;x|=i是标记数据,是未标记数据; y^e(1,2,...,c},i= 1,...,1,其中c是故障状态类别,1为标记样本个数;
[0013] 步骤3 :建立具有局部正则项和全局正则项的工业过程故障分离目标函数;
[0014]
C
[0015] 其中J(巧为工业过程故障分离目标函数;F为预测类标签矩阵;tr是矩阵的 迹符号;D是一个对角矩阵,其中对角元素Dii=D1> 0,i= 1,. . .,1,DD0,i= l+l,...,n;(F-Y)TD(F-巧为经验损失,用来度量预测类标签和初始类标签的差值;丫是调 节参数;^FTgF为全局正则项,G为全局正则矩阵;FTmF为局部正则项,Μ是局部正则矩阵; Υe 为初始类标签矩阵,Υ的元素定义如下:
[0016]
(3)
[0017] 步骤4 :利用可用样本数据集,求解式(2)所示的工业过程故障分离目标函数的最 优解的
[0018] 步骤5 :根据最优解r,通过式(4)可W得到预测类标签矩阵,从而可W确定过程 的故障信息;
[001引
抖)
[0020] 其中为样本点X1的预测类标签。
[0021] 根据所述的基于正则化架构的工业过程故障分离方法,所述的步骤4包括如下步 骤:
[002引步骤4. 1 :根据改进的相似度度量算法和K順分类算法,求取全局正则矩阵G;
[002引 G可W通过式妨计算:
[0024]G=S-WeRnxn(5)
[002引采用正则化的拉普拉斯矩阵,对式(5)做进一步改进,得到式化):
[002引
(6)
[0027] 其中I是一个kXk的单位矩阵;S是一个对角矩阵,其对角元素是
/'=1.2….,々;:W= [Wij]GRnXn,为相似度矩阵;W与样本点构成一个无向 加权图,该图的顶点对应样本点,该图的边Wi,对应样本点XfΙ,Ιι和X, 的相似度;W的计算 方法决定着最终故障分类的精确度,利用样本点的近邻点,通过局部重构的方法求取W, 重构误差方程为:
[0028]
(7)
[002引其中
求式(7)的最小值,便可W求得W,进而可W通过式(5)求得G;求 取W的具体步骤如下:
[0030] 步骤4. 1. 1 :利用改进的距离公式做求解Xi与其k个近邻点的距离度量,从而计 算出样本点之间的距离,即样本相似度度量;
[0031]
(8)
[003引M(i),M(j)分别表示样本点X剧它的k个近邻之间的距离的平均值和样本点Xi到它的k个近邻之间的距离的平均值;
[003引步骤4. 1. 2 :通过核映射,将式做转换为式(9);
[0034]
(9)
[0035] 其中,1(。=Φ(Χι)Τφ(Xj),Kii=Φ(Χι)Τφ(Χι),Κ"=Φ(Xj)T〇 (Xj),K为Mercer 核;式(9)分子
是通过式(8)的分子IIXi-x,II经过核映射推导得到的,即
;式(9)分母中的
x.j的第q个近邻点;
[0038] 步骤4. 1. 3 :利用式巧),并根据采集的数据中标记数据与非标记数据的情况,定 义样本相似度度量,即样本间距离度量,由式(11)表示:
[0039]
[0040] 其中β是控制参数,它依赖于采集的样本数据点的分布密度;α是调节参数;
[00川步骤4. 1.4:用式(10)定义的距离度量求取样本的k个近邻,得到的近邻域 Ni;
[004引步骤4. 1. 5 :利用样本的k个近邻点重构X1,求取X運构误差的最小值,即得到 最优的相似度矩阵W:
[0043]
(1η
[0044] 其中,通过对样本点进行核映射后,式(7)转换为式(11) ;Μ.Μ是欧式范数;W。 有两个约束条件:
及当X/fW'时,Wii= 0;
[0045] 步骤4. 2:求取局部正则矩阵Μ;
[0046] 步骤4. 3:通过对工业过程故障分离目标函数J(巧偏导为0,得到目标函数的最优 解的
[0047]
(12)
[0048] 根据所述的基于正则化架构的工业过程故障分离方法,所述步骤4. 2包括如下步 骤:
[0049] 步骤4.2. 1:通过欧氏距离确定样本点的k个近邻点,并定义运k个近邻点集为 W,.=战,巧=1,其中X。表示样本点X1的第j个近邻点;
[0050] 步骤4. 2. 2:建立由式(蝴表示的损失函数,使得样本类标签分布光滑;
[0051]
(13)
[0052] 式中第一项是所有样本的预测类标签与实际类标签的误差总和;λ是调节参数; 第二项s(gi)是惩罚函数;函数裝一>?,
其能够使 每个样本点通过该映射到达一个类标签:
[00閲 疋三容,'(x,'),/=1:,去.',克 (14)
[0054] 其中·4为样本点的第j个近邻点的类标签;
m是X的维数,S是 半范数的偏导阶数;构成了一个阶数不小于S的多项式空间,2s>m;Φ1,,(X)是 格林函数;βj和Φj为格林函数的两个系数;
[00巧]步骤4. 2. 3 :通过求取步骤4. 2. 2中建立的损失函数的最小值,求取样本点的近 邻点集Ni的类标签估计损失;
[0056] 对于k个分散样本数据点,损失函数J(gi(x))的最小值可由式(15)估计:
[0057]
〇5)
[00则其中Hi是一个kXk的对称矩阵,它的(r,Z)元素:=也(X!.,) '曰i=
[口i, 1'曰i,2'· · · '口i,k] E R,β i - [ β i,1,β i,2, . . .,β i, d 1] E R ;
[0059] 对于一个较小的λ,损失函数J(gi(x))的最小值则可W用标签矩阵估计,得到样 本点的近邻点集N1的类标签估计损失:
[0060] J(gi) >入FiTMiFi (16)
[00川其中,F=[乂.R&对应N冲k个数据的类标签;Ml是系数矩阵的逆矩阵 的左上kXk子块矩阵,由式(17)求取:
[0062]曰化1+入I)曰1= F iTMiFi (17)
[006引步骤4. 2. 4:将η个样本点的近邻域化杞的类标签估计损失集中到一起得到总 的类标签估计损失,求取总损失Ε(f)的最小值即得到样本数据的类标签,进而求得局部正 则矩阵Μ;所述总的类标签估计损失由式(18)表示:
[0064]
(18)
[006引其中f=扣,fz,. . .,fn]TeR"是类标签向量;
[006引忽略式(18)中的系数λ,那么式(18)变为式(19):
[0067]
(峭i
[0068] 又根据存在着行选择矩阵SiG Rkx",使得Fi= S if ;其中Si的第U行和第V列元 素Si (U, V)能由式(20)定义:
[0069]
(20)
[0070] 将Fi = S if代入式(20)中,得到E讯OC fMf,其中
[0071] 本发明的有益效果:在少量标记数据样本的基础上,利用大量廉价的未标记数据 样本训练,可W有效提高故障分离的正确率。为了充分利用已知的标记
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1