一种基于MLLE‑OCSVM的青霉素发酵过程故障监测方法与流程

文档序号：12064062阅读：193来源：国知局

本发明涉及基于数据驱动的故障监测技术领域，特别是涉及一种针对间歇过程的故障监测技术。本发明的基于数据驱动的方法是在典型间歇过程——青霉素发酵过程故障监测方面的具体应用。

背景技术：

在制造技术加速发展的今天，为了满足市场上各种不同的需求，生物化学产品、高分子产品、医药产品等高附加值的产品大量涌现，由于间歇过程正好可以满足生产高附加值产品的需求，从而越来越受到广泛关注。在间歇过程中，人们获得的数据呈现出的非单一工况、非线性、非高斯等特点愈发显著。同时，生产过程中所获得的数据维数越来越高，数据结构也越来越复杂，并且其机理复杂，操作复杂度到，产品的质量容易受不确定因素的影响。为了保证间歇过程操作系统的安全性和稳定性，建立一种有效的过程监控方案来及时地检测异常现象是十分有必要。

降维是数据处理的一种有效的解决方案，目前在故障诊断中的数据降维方法分为线性方法和非线性方法。主元分析法(Principal Component Analysis,PCA)和多维尺度变换(Multi-Dimensional Scaling，MDS)是两种典型的线性降维方法。典型的非线性方法包括核主元分析(Kernel Principal Component Analysis，KPCA)、等距映射(Isometric mapping，Isomap)和拉普拉斯特征映射(Laplacian Eigenmaps，LE)等。

然而，以上方法都是从全局出发确定的投影向量，没有考虑局部的线性特征。例如，传统的MPCA方法，提取的是全局的主成分，降维后的数据没有包含残差空间的成分，不能很好的保留一些对全局数据相关的而又不明显的隐含数据。这些使得基于局部保持投影(Locality Preserving Projections，LPP)和邻域保持嵌入(Neighborhood Preserving Embedding，NPE)等相关算法被提出。它们虽然考虑了局部几何结构，但是距离比较大的点在目标函数中起主导作用，因此不能保证邻域内相距较远的点，投影后相距也较远，破坏了数据的多样性和局部拓扑的几何属性。MLLE可以利用线性嵌入方法得到高维数据的低维线性嵌入矩阵，显现出比其他方法更优的特征提取效果。然而，实际的工业过程多为高斯和非高斯的混合分布，因此传统的多元统计的监控方法因需假设过程变量服从具体的分布而受到应用限制。一些学者采用提出了组合方法MLLE-PCA对非高斯信息和高斯信息分别监控，但该方法无法做到有效区分非高斯信息和高斯信息。

技术实现要素：

为了克服以上不足，本发明提供了一种基于MLLE-OCSVM的青霉素发酵过程故障监测方法。将MLLE特征提取得到的低维成分用于OCSVM建模并构造非线性的监控统计量。OCSVM是基于统计学习理论提出的，因此其无需假设过程变量服从具体的分布。而且OCSVM可以确定正常工况下潜隐变量的非线性边界，有效减少过程监测中误报、漏报的发生，提高故障监测的准确性。

本发明采用了如下的技术方案及实现步骤：包括“离线建模”和“在线监测”两个阶段，其中“离线建模”阶段主要是基于青霉素发酵过程正常工况下的历史数据建立发酵过程的模型，并通过一系列方法确定模型的“控制限”；“在线监测”阶段主要是对被监测的实时过程数据按照模型进行处理，判断其是否超过“控制限”，若超限则认为发酵过程发生故障，进行报警；若未超限则认为发酵过程运行正常。具体如下：

A.离线建模阶段：

1)青霉素发酵过程正常工况下历史数据的采集：每次发酵过程的反应时间有限，产品需要多批量、重复性生产，故而一次间歇过程周期可称之为一个批次。因此，收集到的发酵过程正常工况下的历史数据集合要比连续过程多一维“批次”元素，即典型的发酵过程数据是一个三维矩阵，其表达形式为X_I×J×K，I是批次数，J是过程变量的个数，K是采样次数；

2)对历史数据进行标准化处理，处理方式如下：

三维数据的预处理：三维数据的预处理和标准化是非常重要的一个环节，不同的数据处理和标准化方法可以体现发酵过程数据中不同的方差和协方差结构。本发明采用新的数据处理方法：首先计算历史数据X的所有采样时刻上所有过程变量的均值和标准方差，其中第k采样时刻的第j个过程变量的均值的计算公式为，x_i,k,j表示第i批次中第k采样时刻的第j个过程变量的测量值，k＝1,...,K，j＝1,...,J；第k采样时刻的第j个过程变量的标准方差s_k,j的计算公式为，

采集当前发酵过程第k采样时刻的J个过程变量的数据X，然后对历史数据X进行标准化后得到其中第i批次中第k采样时刻的第j个过程变量的标准化计算公式如下：

其中，i＝1,...,I，j＝1,...,J，k＝1,...,K；

3)将步骤2)标准化后的数据重新构造成二维矩阵X'，该矩阵共有J个列向量，即X'＝(X'₁,X'₂,...,X'_J)，其中第j个列向量X'_j＝(X'_j,1,...,X'_j,K)^T，X'_j,k＝(X'_j,k,1,...,X'_j,k,I)^T，其中X'_j,k,i表示经过步骤2)标准化处理后的第j个过程变量第k个采样时刻在第i个批次中对应的值，其中i＝1,...,I，j＝1,...,J，k＝1,...,K；

4)利用局部线性嵌入(MLLE)方法进行特征提取：

对展开后的二维矩阵X'利用局部线性嵌入(MLLE)方法，对数据进行标准化处理以消除量纲的影响，然后根据计算的欧氏距离得到近邻a，并利用极大似然估计方法求得降维维数d；在重构过程中根据误差最小原则确定最优权值矩阵W，求解相关矩阵M，然后求得M的前(1,d+1)个最小非零特征值对应的特征向量V，再根据得到低维局部空间的低维矩阵Y，其中标准化以后步骤3)得到的二维矩阵X'；

5)利用OCSVM对Y每个时刻的所有批次数据分别进行训练，得到第k采样时刻的决策超平面函数F_k(·)，然后计算建模数据相应的D统计量，D＝(D'₁,...,D'_K)，D'_k＝(d'_k,1,...,d'_k,I)，其中，d'_k,i＝-F_k(Y'_k,i)，Y_k'_,i为Y在第k采样时刻的第i列；

优选决策超平面函数F_k(·)计算公式如下：

F_k(·)＝w_kφ_k(·)+b_k

其中w_k、φ_k(·)、b_k为使用OCSVM对第k个采样时刻进行训练时得到的参数。

6)利用核密度估计方法估计上述求得的D统计量在预设置信限时的估计值，并将其作为模型的控制限，一般可设得置信限为0.99。

B.在线监测阶段：

7)采集当前发酵过程第k采样时刻的J个过程变量的数据x_k，并根据步骤2)中得到的k时刻的均值和标准方差的方法对x_k进行标准化得到其中第k采样时刻的第j个过程变量的标准化公式如下：

其中，x_k,j为当前第k采样时刻所采集发酵数据中的第j个过程变量，为第k采样时刻的第j个过程变量的平均值，s_k,j为第k采样时刻的第j个过程变量的标准方差，j＝1,...,J，k＝1,...,K；

8)将步骤7)中标准化后的数据作为二维矩阵X'，并求得X'低维矩阵y如下式所示：

其中对应步骤8)X'；

其中，V为离线建模阶段步骤4)中矩阵M前(1,d+1)个最小非零特征值所对应的特征向量；

9)按下式计算新采集数据的监控统计量D：

D(y)＝-F_k(y)

其中，F_k为离线建模阶段步骤5)所确定的第k时刻的决策超平面；

10)将上述计算得到的监控统计量D与建模阶段的步骤6)确定的控制限进行比较，如果超限则认为发生故障，进行报警；否则即为正常。

11)若发酵过程完毕，则终止监测；否则采集下一时刻的数据，返回步骤7)，继续进行过程监测。

有益效果

与现有技术相比，本发明将MLLE特征提取的低维成分直接用于OCSVM建模并构造非线性的监控统计量。OCSVM是基于统计学习理论提出的，因此其无需假设过程变量服从具体的分布。而且OCSVM可以确定正常工况下潜隐变量的非线性边界，有效利用独立成分的结构信息。本发明方法可以减少过程监测中误报、漏报的发生，提高故障监测的准确性。

附图说明

图1为本发明方法的流程图；

图2为正常数据X_30×10×400组成形式示意图；

图3为标准化后重新构造的二维矩阵X'组成形式示意图；

图4(a)为现有MLLE方法对正常批次数据的独立成分平方和T²监测图；

图4(b)为现有MLLE方法对正常批次数据的预测误差平方和SPE监测图；

图5为本发明方法对正常批次数据的故障监测效果图；

图6(a)为现有MLLE方法对阶跃故障批次数据的独立成分平方和T²监测效果图；

图6(b)为现有MLLE方法对阶跃故障批次数据的预测误差平方和SPE监测图；

图7为本发明方法对阶跃故障批次数据的故障监测效果图；

图8(a)为现有MLLE方法对斜坡故障批次数据的独立成分平方和T²监测效果图；

图8(b)为现有MLLE方法对斜坡故障批次数据的预测误差平方和SPE监测图；

图9为本发明方法对斜坡故障批次数据的故障监测效果图。

其中，图1中的虚线表示“在线监测”与“离线建模”各步骤之间存在的联系。

具体实施方式

青霉素是一种高效、低毒、临床应用广泛的重要抗生素，其生产过程是一个典型的动态、非线性、多阶段的间歇生产过程。美国Illinois州立理工学院过程监控与技术小组开发的青霉素仿真平台PenSim2.0，为青霉素间歇生产过程的监测、故障诊断以及控制提供了一个标准平台。在此平台上可以实现青霉素发酵过程的一系列仿真，相关研究已表明该仿真平台的实用性与有效性，其已经成为国际上较有影响的青霉素仿真平台。

本实验即以PenSim2.0为仿真研究对象，设置采样时间间隔为1h，选取10个过程变量监视过程运行状况，如表1所示。仿真了31批正常数据，2批故障数据。其中选择30批正常数据X_30×10×400用于建立模型，另外1批正常数据和2批故障数据作为测试数据，用于验证方法的有效性。设置的2种故障类型、幅度、起止时间，见表2。

将本发明方法应用到上述发酵过程仿真对象包括离线建模和在线监测两个大步骤，具体陈述如下：

表1建立模型所用变量

表2故障设置情况

A.离线建模阶段：

步骤1：将上述30批正常数据X_30×10×400沿批次方向展开，具体形式见图2。可以看到一共有400个矩形框(即400个时刻)，每个矩形框都由30行10列构成(即30个批次，10个变量)；

步骤2：对X_30×10×400进行标准化处理。首先按公式计算第k采样时刻的第j个过程变量在所有批次上的均值，其中x_i,k,j为X_30×10×400第i批次中第k采样时刻的第j个过程变量的测量值，k＝1,...,400，j＝1,...,10；第k采样时刻的第j个过程变量的标准方差s_k,j的计算公式为，

采集当前发酵过程i个批次第k采样时刻的J个过程变量的数据X_30×10×400，然后对其进行标准化后得到其中第i批次中第k采样时刻的第j个过程变量的标准化计算公式如下：

其中，i＝1,...,30，j＝1,...,10，k＝1,...,400；

步骤3：将步骤2)标准化后的数据重新构造成二维矩阵X'，见图3，可以看到一共有400个矩形框(即400个时刻)，每个矩形框都由30行10列构成(即30个批次，10个变量)；

步骤4：对展开后的二维矩阵X'利用局部线性嵌入(MLLE)方法，对数据进行标准化处理以消除量纲的影响，然后根据计算的欧氏距离得到近邻a，并利用极大似然估计方法求得降维维数d；在重构过程中根据误差最小原则确定最优权值矩阵W，求解相关矩阵M，然后将M的前(1,d+1)个最小非零特征值对应的特征向量作为原始数据X嵌入到低维局部空间的低维矩阵Y；

即将二维矩阵X'利用MLLE算法求得相关矩阵M前(1,d+1)个特征值所对应的特征向量V，再根据得到低维嵌入成分Y，其中对应步骤3)中的得到的二维矩阵X'；

步骤5：利用Matlab中libsvm工具箱的“svmtrain”函数，对每个时刻的独立成分分别进行训练，依次得到Y在第k采样时刻的决策超平面函数F_k(·)，k＝1,...,400，然后使用“svmpredict”函数计算建模数据相应的D统计量，D＝(D'₁,...,D'_K)，D'_k＝(d'_k,1,...,d'_k,I)，其中，d'_k,i＝-F_k(Y'_k,i)，i＝1,...,30，Y'_k,i为Y在第k采样时刻的第i列；

步骤6：利用Matlab中的核密度估计函数“ksdensity”估计上述求得的D统计量在置信限为0.99时的值，并将其作为模型的控制限；

B.在线监测阶段：

步骤7：采集当前发酵过程第k采样时刻的10个过程变量的数据x_k，并根据步骤2中得到的k时刻的均值和标准方差对其进行标准化得到其中第k采样时刻的第j个过程变量的标准化公式如下：

其中，x_k,j为当前第k采样时刻所采集发酵数据中的第j个过程变量，为第k采样时刻的第j个过程变量的平均值，s_k,j为第k采样时刻的第j个过程变量的标准方差，j＝1,...,10；

步骤8：将步骤7)中标准化后的数据重新构造成二维矩阵X'，并求得X'低维矩阵y如下式所示：

其中，V为离线建模阶段步骤4)中矩阵M前(1,d+1)个特征值所对应的特征向量，对应X'；

步骤9：利用“svmpredict”函数按照步骤5中“svmtrain”训练得到的第k时刻的模型，计算当前发酵过程s_k的监控统计量D(y)，即：

D(y)＝-F_k(y)

其中，F_k为离线建模阶段步骤5)所确定的第k时刻的决策超平面，其中y对应步骤8)中的y；

步骤10：将上述计算得到的监控统计量D(y)与建模阶段的步骤6确定的控制限进行比较，如果超限则认为发生故障，进行报警；否则即为正常。

步骤11：若发酵过程完毕，则终止监测；否则采集下一时刻的数据，返回步骤7，继续进行过程监测。

上述步骤即为本发明方法在青霉素发酵仿真平台故障监测领域的具体应用。为了验证本方法的有效性，对3批测试数据分别进行了在线监测阶段的实验。得到的实验结果见图4至图9，每幅图分别包括与横坐标平行的线和曲线，其中与横坐标平行的线为通过核密度估计方法确定的控制限，曲线为实时的监测值。如果曲线的值大于控制限的值，说明在此时刻发酵过程发生了故障；否则说明发酵过程运行正常。图4和图5分别为现有MLLE方法和本发明方法对正常批次数据的监测效果图。图4(a)中与横坐标平行的线为控制限，曲线为实时的T²监测值；图4(b)中与横坐标平行的线为控制限，曲线为实时的SPE监测值；图5中与横坐标平行的线为控制限，曲线为实时的D监测值。可以发现，通过MLLE方法对青霉素发酵过程进行监测时，传统MLLE方法的T²监测图在30h、39h发生了2次误报警，SPE监测图在58h、186h、268h、363h、388h发生了5次误报警。然而，通过本文所提出的发明方法得到的监测图没有发生任何误报警，相比于其他两种方法，监测效果较好。

图6和图7分别为现有MLLE方法和本发明方法对阶跃故障批次数据的监测效果图。图6(a)中的横线为控制限，曲线为实时的T²监测值；图6(b)中的横为控制限，曲线为实时的SPE监测值；图7中的横线为控制限，曲线为实时的D监测值。由于故障1为较大的阶跃型故障，两种监测方法均可有效的检测出故障的发生。但是，传统的MLLE方法均产生了较多的误报，然而本文所用方法没有任何误报警，呈现出了较好的监测效果。图8和图9分别为现有MLLE方法和本发明方法对斜坡故障批次数据的监测效果图。图8(a)中的横线为控制限，曲线为实时的T²监测值；图8(b)中的横线为控制限，曲线为实时的SPE监测值；图9中的横线为控制限，曲线为实时的D监测值。虽然两种方法都能检测出缓慢变化的斜坡故障2，但相比于本文方法，传统MLLE方法的监测图波动较大，产生了较多的误报警，并有一定的延时性。相比之下，本文所提方法在故障监测准确率和时效性方面略好于其它方法。相比之下，本发明方法无论是在误报率、漏报率方面还是在准确率方面，本发明方法的统计量均比现有方法的统计量有所提升，提高了青霉素发酵过程故障监测效果，在故障检测的及时性方面略优于现有MLLE方法。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高学金;马荣
技术所有人：北京工业大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。