一种多变量工业过程故障识别方法

文档序号:9431788阅读:310来源:国知局
一种多变量工业过程故障识别方法
【技术领域】
[0001] 本发明属于工业过程故障识别技术领域,具体地说,设及一种基于统计量主元相 异度分析的多变量工业过程故障识别方法。
【背景技术】
[0002] 随着高集成、大规模化的现代工业系统日益形成,故障诊断技术成为确保现代工 业系统安全稳定运行的一项关键技术,并且由于工业过程数据库中存储了丰富的运行数 据,基于数据驱动的故障诊断技术已经引起了工业过程工程师和学术研究人员的广泛关 注。研究人员提出了一系列基于数据驱动的故障诊断方法,包括主元分析(PCA)、独立元分 析(ICA)、偏最小二乘(PLS)。目前的故障诊断方法研究多数集中在故障检测问题(即如何 快速有效的发现过程故障),然而故障源诊断问题(即检测到故障后识别故障的类型和原 因)的研究相对较少,后者是一种更具有挑战性的研究问题。
[0003] 当工业过程数据库中存在一些已知的故障模式数据时,故障模式识别方法就成 为故障源诊断的一种有效手段。对于复杂的故障模式识别问题,可W利用的方法有费 舍尔判别子空间方法、支持向量机方法进行故障辨识。Kano等人首先提出相异度分析 (参考文献;ManabuKano,ShinjiHasebe,loriHashimoto,HiromuOhno,Statistical processmonitoringbasedondissimilarityofprocessdata,AIChE Journal, 48 (2002) 1231-1240)。近几年来,相异度分析值issimilarityanalysis)作为一 种故障诊断和识别的有效技术,引起了广泛的研究关注。该方法通过比较未知故障数据和 已知故障模式数据之间的相异度指数来判断故障模式。虽然该方法取得初步的成功应用, 但是其缺陷在于:(1)在相异度指数计算过程中没有考虑噪声抑制问题,但是噪声信息会 恶化识别效果;(2)相异度分析直接针对原始测量变量,无法充分利用数据的高阶统计信 息。

【发明内容】

[0004] 本发明针对现有技术存在的上述不足,提供一种简单、精确有效的多变量工业过 程故障识别方法,该方法基于统计量主元相异度分析,在相异度分析中,提取主元信息,擬 弃次要数据信息,抑制噪声的影响,能够充分挖掘数据高阶统计信息。
[0005] 本发明的技术方案是:一种多变量工业过程故障识别方法,含有W下步骤:
[0006](一)收集历史数据库的正常操作工况数据集X和K类已知的故障模式数据集 化。1,H"2, . . .,,计算正常操作工况数据集的均值mean狂)和标准差std狂),对已知的故 障模式数据集化。1,H"2, ...,进行标准化处理获得新故障模式数据集化1,也...,&}。
[0007](二)在各个故障模式数据集下构造数据窗,计算低阶统计量的变量均值e1(t)、 低阶统计量的方差Vi(t)、高阶统计量的3阶中屯、距cf,的、高阶统计量的4阶中屯、距cf片)、 高阶统计量的偏斜度丫i(t)和高阶统计量的峰度Ki(t)六种统计量变量。
[0008](=)检测过程故障,收集实时故障数据S,进行标准化处理。
[0009](四)在步骤(s)的基础上执行统计量主元相异度分析,计算待识别故障数据集 和已知故障模式数据集之间的故障识别指数FRI。
[0010](五)对故障识别指数FRI进行排序,获得故障识别结果。
[0011] 进一步的,所述步骤(一)中,通过公式(1)对故障模式数据进行标准化处理,公 式(1)的表达式如下:
[0012] Hi=OlM-mean狂))/std狂),(i= 1,2,. . .,K) (1)
[001引经上述公式(1)标准化处理后即可获得新故障模式数据集化,也...,&}。
[0014] 进一步的,所述步骤(二)中,构造数据窗的步骤为:对任意t时刻的数据窗 X,e诉"'X'"记为:
[0015]
符)
[001引式中,W为数据窗宽度。
[0017] 进一步的,所述六种统计变量分别由计算公式(3)、(4)、巧)、化)、(7)、(8)计算获 得,公式(3)、(4)、巧)、化)、(7)、做的表达式如下所示:
[0018]
[0023]
C8)
[0024] 根据上面所述的六个公式(3)至(8)获得数据窗的6类变量,将其堆积为一个行 向量[e(t)v(t)c(3)(t)c(4)(t) 丫(t)K(t)],其中,ea) = [Ei(t)…ema)],v(t) =[Vi(t)…Vm(t)]
,丫(t) =[丫I(t)…丫m(t)],K (t) = [Ki(t)…Km(t)];
[0025] 将各个故障模式数据集分割为一系列如公式(9)所示的数据窗Hit(w《t《n), 公式(9)表达式如下:
[0026]
(:9:>
[0027] 针对各故障模式数据集的每一个数据窗Hit(w《t《n)计算其统计量,进而获得 各个故障模式数据集的统计量矩阵,记为:
[00?Rl
[0029] 进一步的,所述步骤(四)中,执行统计量主元相异度分析的步骤为:首先构造实 时数据S的窗宽为W的数据窗,根据公式(3)至(8)计算待识别故障数据集的统计量,记 为:
[0030]
01)
[0031] 对于已知故障模式数据集的统计量矩阵X,.eR"'x'",(i=1,2, . . .,K)和待识别故 障数据统计量X,ER"'x'",分别包含m个变量的rii(i= 1,. . .,K)和n,个样本,其协方差阵 计算公式为:
[0032]
C12)
[003引对第i个故障模式,构造总体统计量数据集X:^於XU''的协方差矩阵,记为:
[0034]
《所:
[0035] 对其开展特征值分解,获得:
[0036] RP=PA(14)
[0037] 式中,P是特征向量矩阵,A(入A. . ? > ^m)是特征值矩阵;
[0038] 保留L个特征值和对应的特征向量Pi,P2,...,化,对矩阵Xi和XS进行主元线性变 换,得到Yi和Y,,记为:
[0039]
[00川式中,Pk=[P1,P2, . . .,Pk],Ak为{> 1,^2,...,入J构成的对角矩阵;
[004引Y郝YS的协方差矩阵记为:
[0043]
[0045] 两个数据集的协方差矩阵满足下式:
[0046]
[0047] 对协方差矩阵应用特征值分解,得到
[0048]
[0049]
[0050] 由于孕+聲和wf ,。的特征向量与Ci的特征向量相同,仅仅是次序 相反,对相同大小的数据集Xi和XS,如果具有相似的数据分布和关联关系,则特征值入,和 1-A,均接近0. 5 ;相反的,如果数据集描述了不同的数据分布和数据关系,则特征值分别趋 近1和0 ;
[0051] 计算各故障模式的统计量变量与待识别故障数据统计量的故障识别指数FRI的 步骤为:相异度指数D可W用来评价数据集之间的相似程度,定义为:
[0052]
(22)
[005引式中,A,是C1或者C曲特征值,如果两个数据集相似程度高,则特征值接近0. 5,D接近0 ;
[0054] 为了方便故障识别,定义故障识别指数FRI为Sda,其计算公式为:
[00 巧]
my
[0056] 当两个数据集相似程度高时,Sda接近1。
[0057] 进一步的,所述步骤(=)中,过程检测到故障后,收集实时故障数据集S。,使用公 式S= (SD-mean狂))/std(X)进行标准化,上式中,X为正常操作工况数据集。
[0058] 进一步的,所述步骤(五)中,对故障识别指数进行排序,最大的故障识别指数为 故障识别结果Xim。、,其中,故障识别结果的序号为:
[0059]
(24)
[0060] 真实故障模式的序号为如果im。、,则故障识别结果是正确的。
[0061] 进一步的,所述步骤(五)中,获得故障识别结果后,为了评价不同方法的故障识 别结果,通过识别误差指数REI和识别对比度RCD两个故障识别性能指标进行不同方法的 故障识别效果对比。
[0062] 进一步的,所述识别误差指数REI的计算公式为:
[0063]
(W)
[0064] 式中,rei是识别误差,其计算公式为:
[0065]
[0066] 式中,P是惩罚因子,错误的识别结果为1,正确的识别结果为0。
[0067] 进一步的,所述识别对比度的计算公式为:
[0068] (27)
[006引式中,SspDA(imJ是最大的FRI,SsPDA(isubmJ是次大的FRI,丫是故障识别错误参 数,对于错误的识别结果,丫是-1,否则是1。
[0070] 本发明的有益效果是:(1)本发明基于统计量主元相异度分析,在传统相异度分 析方法的基础上引入噪声抑制机制,在相异度分析中,提取主元信息,擬弃次要数据信息, 抑制工业噪声对故障辨识结果的影响,防止噪声信息恶化识别结果。(2)本发明引入统计模 式分析技术,首次计算原始测量变量的统计量变量,故障识别时构建原始测量变量的六个 统计量变量,对统计量数据集进行主元相异度分析,能够充分挖掘数据高阶统计信息,改善 故障识别结果。
【附图说明】
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1