本发明属于故障检测技术领域,具体涉及一种基于并发偏最小二乘的过程故障检测方法。
背景技术:
青霉素的发酵流程如图1所示。随着现代技术的发展,青霉素发酵过程越来越趋于大型化、连续化和自动化,设备的结构与组成十分复杂,生产规模非常庞大,各生产周期之间的联系也特别密切。一方面,这有助于成本的下降、青霉素产量和质量的提高;另一方面,设备发生故障而停工所造成的损失却大幅度的增加。因此,在青霉素发酵过程中,尽可能早的检测到过程异常变化和降低误报是十分必要的。
针对青霉素发酵过程,专利号为zl201410337732.x的发明专利提出了一种青霉素发酵过程故障诊断方法,虽然此专利可以诊断出青霉素发酵过程的故障类型。但是,其改进的偏最小二乘在划分与输出直接相关的主元空间时,与传统的偏最小二乘没有实质上的技术区别和进步,这就导致了输出相关的信息和输出不相关的信息没有完全被分离,在改进的偏最小二乘的检测中:(1)输出相关信息和输出不相关信息没有完全被分离;(2)需要较高的计算负载数目;(3)得到的并发偏最小二乘检测模型较难解释。故而,输出相关故障和输出不相关故障的检测率会降低甚至会出现分辨不出故障是否与输出相关。专利号为zl201410337732.x的发明专利中,故障1和故障2为输出相关的故障,从附图2和附图3中可以看出:青霉素发酵过程中的操作变量主元空间的霍特林统计量、以及过程变量残差空间的霍特林统计量
技术实现要素:
针对现有技术存在的问题,本发明提供一种基于并发偏最小二乘的过程故障检测方法。
本发明的技术方案是这样实现的:
一种基于并发偏最小二乘的过程故障检测方法,包括
在线获取青霉素发酵过程的输入变量数据和输出变量数据;
利用基于并发偏最小二乘的青霉素发酵过程故障检测模型处理输入变量数据和输出变量数据:将输入变量数据表示为完全输出相关空间数据集、输出不相关空间的主元空间数据集和输出不相关空间的残差空间数据集之和,将输出变量数据表示为输入相关空间数据集、输入不相关空间的主元空间数据集和输入不相关空间的残差空间数据集之和;
计算输入变量数据在完全输出相关空间中的霍特林统计量、输出不相关空间的主元空间中的霍特林统计量、输出不相关空间的残差空间中的spe统计量,计算输出变量数据在输入不相关空间的主元空间中的霍特林统计量和输入不相关空间的残差空间中的spe统计量;
计算输出变量数据在输入不相关空间的主元空间中的霍特林统计量和输入不相关空间的残差空间中的spe统计量的组合统计量;
当前青霉素发酵过程故障判断:
判断计算得到的输入变量数据在完全输出相关空间中的霍特林统计量是否高于其相应的控制限:是,则当前青霉素发酵过程出现输出相关故障;否则:
判断输入变量数据在输出不相关空间的主元空间中的霍特林统计量和输入变量数据在输出不相关空间的残差空间中的spe统计量中是否有至少一个统计量高于其相应的控制限:是,则当前青霉素发酵过程出现输出不相关但是输入相关的故障,否则:
判断输出变量数据在输入不相关空间的主元空间中的霍特林统计量和输出变量数据在输入不相关空间的残差空间中的spe统计量的组合统计量是否高于其相应的控制限:是,则当前青霉素发酵过程出现不可预测的输出相关故障,否则继续在线获取下一时刻青霉素发酵过程的输入变量数据和输出变量数据。
所述输入变量数据为青霉素发酵过程中的底物的浓度、二氧化碳的浓度、通风率、搅拌器功率、ph值和底物喂料温度,所述输出变量数据为青霉素发酵过程中的青霉素的浓度和发酵反应器的温度。
在所述利用基于并发偏最小二乘的青霉素发酵过程故障检测模型处理输入变量数据和输出变量数据之前,对在线获取的输入变量数据和输出变量数据进行规范及标准化。
所述规范及标准化,具体是分别使输入变量数据和输出变量数据的均值为0且方差为1。
所述基于并发偏最小二乘的青霉素发酵过程故障检测模型的建立方法如下:
采集输入变量离线历史正常数据集和输出变量离线历史正常数据集;
利用正交偏最小二乘将输入变量离线历史正常数据集划分为输出相关空间数据集和输出正交空间数据集;
利用完全正交分解将输出相关空间数据集和输出变量离线历史正常数据集分别进行完全正交分解,得到输入变量离线历史正常数据集的完全输出相关空间数据集、完全输出不相关空间数据集和输出变量离线历史正常数据集的输入相关空间数据集和输入不相关空间数据集;
将输入变量离线历史正常数据集的输出正交空间数据集和完全输出不相关空间数据集合并为输出不相关空间数据集;
将输出不相关空间数据集划分为输出不相关空间的主元空间数据集和输出不相关空间的残差空间数据集;
将输出变量离线历史正常数据集的输入不相关空间数据集划分为输入不相关空间的主元空间数据集和输入不相关空间的残差空间数据集;
将输入变量数据表示为完全输出相关空间数据集、输出不相关空间的主元空间数据集和输出不相关空间的残差空间数据集之和,将输出变量数据表示为输入相关空间数据集、输入不相关空间的主元空间数据集和输入不相关空间的残差空间数据集之和,即得到基于并发偏最小二乘的青霉素发酵过程故障检测模型。
在所述利用正交偏最小二乘将输入变量离线历史正常数据集划分为输出相关空间数据集和输出正交空间数据集之前,对输入变量离线历史正常数据集和输出变量离线历史正常数据集进行规范及标准化。
所述利用完全正交分解将输出相关空间数据集和输出变量离线历史正常数据集分别进行完全正交分解,具体是:
将输出变量离线历史正常数据集映射到输出相关空间得回归系数矩阵;
将输出相关空间数据集映射到回归系数矩阵得到输入相关空间数据集,将输出变量离线历史正常数据集减去输入相关空间数据集得到输入不相关空间数据集;
将回归系数矩阵乘回归系数矩阵的转置矩阵得回归矩阵,对其进行奇异值分解得到两个互相正交的映射矩阵;
将输出相关空间数据集映射到以上两个互相正交的映射矩阵得到完全输出相关空间数据集和完全输出不相关空间数据集。
有益效果:
本发明方法首先利用正交偏最小二乘提取输入变量数据的输出相关信息,从而降低了计算负载数目,提高了模型的解释性能,然后利用完全正交分解彻底地分离输出相关信息和输出不相关信息,可以更加准确地检测青霉素发酵过程的故障、更加清晰地识别故障是否与输出相关,从而更好的操作青霉素发酵过程的设备来降低成本、提高青霉素的产量和质量。与传统方法相比,本发明提高了故障检测的稳定性和准确性,通过仿真实验结果说明了本发明的有效性及可行性。
附图说明
图1是青霉素发酵流程示意图;
图2本发明的具体实施方式的故障1数据的故障检测统计量图;
(a)为在线获取青霉素发酵过程输入变量数据的完全输出相关空间的霍特林统计量图;
(b)为在线获取青霉素发酵过程输入变量数据的输出不相关空间的主元空间的霍特林统计量图;
(c)为在线获取青霉素发酵过程输入变量数据的输出不相关空间的残差空间的spe统计量图;
(d)为在线获取青霉素发酵过程输出变量数据的输入不相关空间的主元空间的霍特林统计量和在线获取的青霉素发酵过程输出变量数据输入不相关空间的残差空间的spe统计量的组合统计量图;
图3本发明的具体实施方式的故障2数据的故障检测统计量图;
(a)为在线获取青霉素发酵过程输入变量数据的完全输出相关空间的霍特林统计量图;
(b)为在线获取青霉素发酵过程输入变量数据的输出不相关空间的主元空间的霍特林统计量图;
(c)为在线获取青霉素发酵过程输入变量数据的输出不相关空间的残差空间的spe统计量图;
(d)为在线获取青霉素发酵过程输出变量数据的输入不相关空间的主元空间的霍特林统计量和在线获取的青霉素发酵过程输出变量数据输入不相关空间的残差空间的spe统计量的组合统计量图。
具体实施方式
下面结合附图对本发明的具体实施方式做详细说明。
由于青霉素发酵过程中的故障是千变万化的,不同的输入变量的不同故障输入对输出变量的影响是不同的,但最终都会影响发酵反应器的温度和青霉素的产量与质量。
本实施方式中青霉素发酵过程存在两种故障:
故障1是通风率发生的故障,是一种斜率为0.5的斜坡故障,在101个采样点到200个采样点之间发生。故障2是搅拌器功率发生的故障,是一种幅值为+3%的阶跃故障,在101个采样点到200个采样点之间发生。应用基于并发偏最小二乘的过程故障检测方法对于通风率的故障类型1和搅拌器的故障类型2两种不同故障类型的青霉素发酵过程进行检测。
本实施方式的基于并发偏最小二乘的过程故障检测方法,包括:
步骤1:在线获取青霉素发酵过程的输入变量数据xnew和输出变量数据ynew。
青霉素发酵过程中,温度控制器和ph被设置为闭环控制,在生产过程中逐渐加入葡萄糖,加入量是以斜率为0.01方式直线增加。以上三个条件设置可以更好的控制发酵过程各变量的线性关系。考虑到并发偏最小二乘要求各变量符合高斯分布,青霉素的浓度和发酵反应器的温度更便于检测,选择以下变量作为输入和输出:
本实施方式中输入变量数据优选为青霉素发酵过程中的底物的浓度、二氧化碳的浓度、通风率、搅拌器功率、ph值和底物喂料温度;
本实施方式中输出变量数据优选为青霉素发酵过程中的青霉素的浓度和发酵反应器的温度。
在执行步骤2之前,需要对在线获取的输入变量数据和输出变量数据进行规范及标准化,具体是分别使输入变量数据和输出变量数据的均值为0且方差为1。
步骤2:利用基于并发偏最小二乘的青霉素发酵过程故障检测模型处理输入变量数据和输出变量数据:将输入变量数据表示为完全输出相关空间数据集、输出不相关空间的主元空间数据集和输出不相关空间的残差空间数据集之和,将输出变量数据表示为输入相关空间数据集、输入不相关空间的主元空间数据集和输入不相关空间的残差空间数据集之和。
基于并发偏最小二乘的青霉素发酵过程故障检测模型的建立方法如下:
步骤2.1:采集输入变量离线历史正常数据集
每个输入变量离线历史正常数据集和输出变量离线历史正常数据集各包含200个采样样本。
在执行步骤2.2之前,对输入变量离线历史正常数据集和输出变量离线历史正常数据集进行规范及标准化。
步骤2.2:利用正交偏最小二乘将输入变量离线历史正常数据集划分为输出相关空间数据集xc和输出正交空间数据集xo;
本实施方式中将正交偏最小二乘作为一种预处理方法,移除输出不相关的信息,可以降低计算负载的数量、以减少步骤2.3的计算复杂度。
步骤2.3:利用完全正交分解将输出相关空间数据集xc和输出变量离线历史正常数据集y分别进行完全正交分解,得到输入变量离线历史正常数据集的完全输出相关空间数据集
步骤2.3包括的具体步骤是:
步骤2.3.1:将输出变量离线历史正常数据集映射到输出相关空间得回归系数矩阵;
其中,ξ为回归系数矩阵,上标t表示转置,上标
传统的偏最小二乘方法分解后,由于输入变量的主元空间和残差空间存在一个倾斜角,导致了输出相关信息和输出不相关信息没有被完全分离。本实施方式为了达到完全正交分解,利用上述公式求解回归系数矩阵。其中,输入不相关空间数据集yr和输入数据是完全正交的,故上述公式中的
步骤2.3.2:将输出相关空间数据集xc映射到回归系数矩阵得到输入相关空间数据集,将输出变量离线历史正常数据集减去输入相关空间数据集得到输入不相关空间数据集。
步骤2.3.3:将回归系数矩阵乘回归系数矩阵的转置矩阵得回归矩阵,对其进行奇异值分解得到两个互相正交的映射矩阵。
其中,pξ,c是以回归系数矩阵为基向量的空间的负载,pξ,r是以回归系数矩阵为基向量的空间的正交空间的负载,λ是由ξξt的特征值组成的对角矩阵,
根据奇异值分解的特性,可以知道
步骤2.3.4:将输出相关空间数据集映射到以上两个互相正交的映射矩阵得到完全输出相关空间数据集和完全输出不相关空间数据集。
其中,
根据奇异值分解的特性,可以知道
此外,
步骤2.4:将输入变量离线历史正常数据集的输出正交空间数据集和完全输出不相关空间数据集合并为输出不相关空间数据集。
考虑到
其中,xr是输出不相关空间数据集。
步骤2.5:利用主元分析将输出不相关空间数据集划分为输出不相关空间的主元空间数据集和输出不相关空间的残差空间数据集。
其中,
步骤2.6:利用主元分析将输出变量离线历史正常数据集的输入不相关空间数据集划分为输入不相关空间的主元空间数据集和输入不相关空间的残差空间数据集。
其中,
步骤2.7:将输入变量数据表示为完全输出相关空间数据集、输出不相关空间的主元空间数据集和输出不相关空间的残差空间数据集之和,将输出变量数据表示为输入相关空间数据集、输入不相关空间的主元空间数据集和输入不相关空间的残差空间数据集之和,即得到基于并发偏最小二乘的青霉素发酵过程故障检测模型。
步骤3:计算输入变量数据在完全输出相关空间中的霍特林统计量、输出不相关空间的主元空间中的霍特林统计量、输出不相关空间的残差空间中的spe统计量,计算输出变量数据在输入不相关空间的主元空间中的霍特林统计量和输入不相关空间的残差空间中的spe统计量。
其中,
步骤4:计算输出变量数据在输入不相关空间的主元空间中的霍特林统计量和输入不相关空间的残差空间中的spe统计量的组合统计量。
其中,φy是输出变量数据在输入不相关空间的主元空间中的霍特林统计量和输出变量数据在输入不相关空间的残差空间中的spe统计量的组合统计量,
步骤5:当前青霉素发酵过程故障判断:
判断计算得到的输入变量数据在完全输出相关空间中的霍特林统计量
步骤6:判断输入变量数据在输出不相关空间的主元空间中的霍特林统计量
步骤7:判断输出变量数据在输入不相关空间的主元空间中的霍特林统计量和输出变量数据在输入不相关空间的残差空间中的spe统计量的组合统计量φy是否高于其相应的控制限:是,则当前青霉素发酵过程出现不可预测的输出相关故障,否则继续在线获取下一时刻青霉素发酵过程的输入变量数据和输出变量数据,返回步骤3。
本实施方式中,首先选取青霉素发酵过程的离线历史正常数据的200个采样点,利用基于并发偏最小二乘的青霉素发酵过程故障检测模型,在线检测故障类型1和故障类型2,表1~表3的数据为部分数据:
表1建立基于并发偏最小二乘的青霉素发酵过程故障检测模型中的四组数据
表2检测青霉素发酵过程的故障数据1中的两组数据
表3检测青霉素发酵过程的故障数据2中的两组数据
由图2可以看出尽管输入变量数据在完全输出相关空间中的霍特林统计量
由图3可以看出尽管出现少许超过控制限的点,输入变量数据在完全输出相关空间中的霍特林统计量
由图2(a)~(d)和图3(a)~(d)的检测结果可以说明本方法能够很好的检测出青霉属发酵过程中的故障。对于不同斜率的故障类型1和不同幅值的故障类型2的检测结果见表4~表5。
表4青霉素发酵过程的故障数据1的检测率和检测点
表5青霉素发酵过程的故障数据2的检测率、误报率和检测点
其中,表4~表5中的检测点是连续五个或者更多的样本超过控制限的采样点,检测率和误报率的计算方法如下:
由表4可以看出,对于不同的故障斜率,青霉素发酵过程中的输入变量数据在完全输出相关空间中的霍特林统计量
由表5可以看出,对于不同幅值的故障类型2,青霉素发酵过程中的输入变量数据在输出不相关空间的残差空间中的spe统计量qx的检测率均在98%以上,检测点在103以内,青霉素发酵过程中的输入变量数据在完全输出相关空间中的霍特林统计量
由上述结果可以得到,通过本发明方法,能有效地检测到不同类型、不同故障大小的输出相关故障和输出不相关故障。
虽然以上描述了本发明的具体实施方式,但是本领域内的熟练的技术人员应当理解,这些仅是举例说明,可以对这些实施方式做出多种变更或修改,而不背离本发明的原理和实质。本发明的范围仅由所附权利要求书限定。