一种基于子时段mpca-svm的间歇过程故障诊断方法

文档序号:9864686阅读:566来源:国知局
一种基于子时段mpca-svm的间歇过程故障诊断方法
【技术领域】
[0001] 本发明设及基于模式识别的故障诊断技术领域,特别设及一种针对间歇过程在线 故障诊断技术。本发明的基于模式识别的方法即是在典型的间歇过程一青霉素发酵过程故 障监测方面的具体应用。
【背景技术】
[0002] 间歇过程因其产品具有特定功能、高附加值、小批量、多品种等特点,使得其在生 产中所占的比重越来越大,因此对间歇过程的故障诊断也越来越重要。但间歇过程具有动 态性、强非线性和时段特性等特点,且操作复杂度高和产品质量易受到环境等因素的影响, 使得对其故障诊断的研究面临更大的挑战。
[0003] 对于间歇过程的故障诊断,目前比较常用的方法有贡献图和模式识别的方法,有 些学者利用多向主成分分析(Multi-way principal component analysis,MPCA)对间歇过 程进行分时段在线监控,并利用贡献图的方法追溯故障变量,但该方法采用正常的数据进 行故障诊断,不能够真正反应故障的信息,且忽略了变量之间的相关性,只能诊断单变量故 障,而模式识别的方法可W克服MPCA贡献图的不足。支持向量机(Suppod Vector Machine,SVM)因其在小样本下具有较强的非线性系统学习能力,使得SVM成为一种被广泛 应用的模式识别方法。有些学者利用MPCA与SVM对整个间歇过程建立离线故障诊断模型,不 可避免的在诊断阶段需人为的填充过程的未知数据,但填充的数据往往与真实的过程数据 存在差异,在一定程度上会影响到故障诊断的准确率;为了解决运个问题,另外一些学者将 滑动时间窗技术与SVM结合应用于间歇过程的故障诊断,虽可解决因大量填充数据带来诊 断准确率的问题,但存在模型更新频繁的缺点,使得诊断过程繁琐。

【发明内容】

[0004] 为了克服现有技术的不足,本发明提供了一种基于子时段MPCA-SVM的间歇过程在 线故障诊断方法。利用MPCA划分间歇过程,将故障诊断的捜索空间局限到一个个特定的时 段内,并对每个时段建立故障监测和诊断模型。该方法无需填充整个生产过程的未知数据, 而只填充发生故障时段的数据,因此可减小由于人为的填充过多的未知数据对SVM故障诊 断的准确率带来的影响。同时,也可W减少建模的数量,从而解决了因频繁地更新模型而造 成的诊断过程复杂的问题。
[0005] 本发明采用了如下的技术方案及实现步骤:
[0006] A.离线建模阶段
[0007] 1)采集发酵过程正常工况下的历史数据,所述的历史数据X由离线测试得到的同 一发酵过程相同工艺下的巧比次数据构成,乂=村1,乂2,...,乂1)了,其中乂1。= 1,2,-,,1)表示 第i批次数据。每个批次包含K个采样时刻,目化=化,1,乂1,2,...,乂1,1(),其中乂1,康示第1批 次第1^采样时刻采集的数据。每个采样时刻采集1个过程变量,即乂1,1<=^1丸1,义1,1<,2,..., XI,kj),其中XI,Μ表示第i批次中第k采样时刻的第j个过程变量的测量值;
[0008] 2)对历史数据X进行标准化处理,处理方式如下:
[0009] 首先计算历史数据X的所有时刻上所有过程变量的均值和标准方差,其中第k采样 时刻的第j个过程变量的均值的计算公式为
其中表示第i批次中 第k采样时刻的第j个过程变量的测量值,k=l,. . .,Κ,j = l,. . .,J;第k采样时刻的第j个过 程变量的标准方差skj的计算公式为,
,k=l,. . .,Κ,j = l,..., J;
[0010] 然后对历史数据X进行标准化,其中第i批次中第k采样时刻的第j个过程变量的标 准化计算公式如下:
[0011]
(1)
[0012] 其中,i = l, . . . = . . . ,J,k = l, . . . ,Κ;
[0013] 3巧通过步骤2)的标准化得到新的二维矩阵X',该矩阵共有化XJ)个列向量,即X' = (Xl',X'2,...,X'κχJ),其中第j个列向量X'j = (X'j,l,...,X'j,κ)τ,X'j,k=(X'j,k,l,..., X'J,k,I)τ,其中X'Lk,l表示经过步骤2)标准化处理后的第j个过程变量第k个采样时刻在第i 个批次中对应的值,其中i = l,. . .,1,j = l,. . .,J,k=l,. . .,Κ;
[0014] 4)利用多向主元分析MPCA方法提取X'中每个时刻的主成分。若提取第k个采样时 刻数据X ' k主成分,具体的步骤如下:
[00巧]4.1)求出二维矩阵X'k的协方差矩阵C0V;
[0016]

[0017] 4.2)对矩阵C0V的特征值分解;
[001 引 c0V = VA^ (3)
[0019] 式(3)掲示了协方差矩阵的关联关系,其中Λ=(λl,λ2,…,λv)为对角阵,v为二维 矩阵X'k的特征值数,Λ包含m个幅值递减的非负实特征值(λι >入2 >…> λ。> 0) dV是正交阵 (vTy=E,E为单位阵)。
[0020] 定义上,通过MPCA方法,矩阵X'k等价于X'k = QpT+R,并将其代入到式(3)得到:
[0021]
(4)
[0022] 其中,Q为得分矩阵,P为负载矩阵,R为残差矩阵。
[0023] 对应式(3)和(4)各项,可得:
[0024]

[0025] 若前A个主成分的累加方程超过一个阔值0.85,那么就提取前A个主元来作为综合 指标,则原始的J维空间就变为A维,且A < J。
[0026] 4.3)求出得分矩阵Q;
[0027]为了最优地获取数据的变化量,同时最小化随机噪声对PCA产生的影响,保留与A 个最大特征值相对应的负载向量,贝化'k在低维空间的投影信息就包含在得分矩阵:
[002引 Q=X'kP (6)
[0029] 5)利用MPCA对间歇过程进行时段划分:
[0030] 5.1)时段粗划分:
[0031] 当相邻采样点具有相同的主成分个数(Q矩阵的列数)时,就把运些采样点划分到 同一个时段,若具有相同主成分个数的时段长度L小于整个间歇过程的1/10时,将此时段数 据归到左右相邻的主成分个数相差相对小的一段内。若此时段长度小于整个发酵过程的1/ 10且该时段的主成分个数与相邻的两个时段的主成分个数差值相等时,则分别取前后时段 主成分个数为该段的主成分个数并计算其贡献率,把该段归到贡献率变化相对小的一个时 段内。
[0032] 最终粗划分可W得到F个时段,分别表示为Si,S2,…,Sf。
[0033] 5.2)时段细划分:在任意粗划分的时段5:^=1,2,-,,。)内,利用负载矩阵之间角 度信息和距离信息来定义相似性度量公式(7)。
[0036] 其中b和C表示在时段Sf内任意相邻的两个采样时间,af为时段Sf内的采样点个数, 1和h表示采样点1到af中的任意一个值,II Pbi II和II Pea II分别是b和C采样时刻的负载矩阵 的模值,II巧II表示b和C采样时刻负载矩阵的距离,ri为加权系数,用W强调不同投影方向 的不同重要性,
表示两个时间片负载矩阵中af个投影方向的夹角余弦值的加权和 表示b和C采样时刻负载矩阵的相似度。
[0037] 最终细化分得到G个时段,分别表示为Si',S'2, ...,S'e,并计算任意一个子时段 8'8(邑=1,2,,,,,6)得均值负载矩阵/3;
[003引6)在Si',S'2,. . .,S'G中建立各子时段MPCA监控模型,如式(9)。
[0039]对于每个子时段均具有相近的负载矩阵,因此各个子时段的MPCA模型均可采用均 值负载矩阵&来描述。对于任意子时段S'g中任意第t时刻的MPCA模型可W表示为: 鋒0]
巧)
[0041] 其中qt是子时段S'g中第t时刻的负载向量,《4子时段S'g的特征向量,rt是残差向 量。
[0042] 7)利用MPCA建立监控模型时,必须先要确定两个控制限,控制限用来判断当前数 据是否处于正常运行状态,运两个控制限分别称为T2统计量控制限和SPE统计量控制限,计 算τ2统计量的控制限满足F分布式,如式(10),其中β为主成分个数,I为建模的批次数,α为 显著性水平。
[0043]
(10)
[0044] SPE统计量的控制限由式(11)计算,其中meant, vart分别表示建模数据中每个子时 段批次测量数据在t时刻SPE的均值和方差。
[0045]
(11)
[0046] 8)在每个子时段内,采用1)和2)中的方式,分别取不同类型故障运行状态下的数 据各Ifault组,利用3)方法标准化处理,并利用4)中方法提取出各个类型的故障数据的主成 分Qi,Q2,··· ,Qfault;
[0047] 9)将提取出的主成分化,Q2,-',Qfault作为支持向量机模型的输入,在每个子时段 内建立一个故障诊断模型,最后可得到G个模型,分别是SVMi,SVM2,…,SVMg,其中每个SVM模 型都采用一对一的多分类器构造方式。
[004引9.1)任意一个SVMg(g= 1,2,..·,G)模型都是一个决策超平面。
[0049] 9.2)-对一的多分类器构造方法,该方法针对U类训练样本,将不同类样本两两组 合用来训练^个二分类器。然后将测试样本代入所有分类器,采用投票法进行决策,如 果分类器S
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1