基于动态隐变量模型的多采样率软测量方法与流程

文档序号:16855680发布日期:2019-02-12 23:15阅读:172来源:国知局

本发明设计一种控制方法,具体是涉及一种基于动态隐变量模型的多采样率软测量方法。



背景技术:

随着现代工业的发展,过程安全和产品质量受到广泛重视。随着集散控制系统(dcs)在工业领域的广泛应用,大量过程变量可以被各种高采样率的传感器采集并存储,而与生产安全以及产品质量相关的关键质量变量则需以低采样率方式采集并通过化验获取,从而导致了数据的多采样率特性与重要变量数据的难获取性,对于实际工业工程的管理是一种挑战。同时,随着基于多元统计分析的过程监测(mspm)和软测量技术的不断进步,海量数据变量实现降维、重构及可视化,并在制药、化工和治污等领域得到广泛应用。传统的静态主成分分析(pca)和最小二乘估计(pls)模型可以有效地提取变量的互相关性,但测量高度依赖于时间的情况下则效果不佳。基于动态pca(dpca)的技术能够提取测量中的自相关增广矩阵上的特征值分解,更有效地处理数据的动态性,但它无法完整利用多采样数据。规范变量分析(cva)和pls都能够模拟两个数据集之间的关系,实现数据的软测量,但两者无法有效处理数据的动态性,而且无法处理两个数据集本身带有多采样特性的情况。而基于多采样概率主成分分析的方法可以完整地利用多采样率数据信息,并利用期望最大化(em)算法对模型参数进行有效估计,不过对于动态数据的处理效果不佳。因此,需要提出一种既可以完整利用多采样率数据信息,又能充分考虑到数据动态特性的软测量技术。



技术实现要素:

本发明的目的在于针对现有技术的不足,提供一种基于动态隐变量模型的多采样率工业工程软测量方法。

一种基于动态隐变量模型的多采样率软测量方法,包括:

(1)采集化工过程中正常运行状态下的不同采样率的过程变量样本和关键质量变量样本,组成建模用的训练样本集;

(2)对得到的训练样本集进行标准化,使得各个标准化后的变量值与潜隐变量间存在线性相关关系;

(3)基于预处理后的训练样本集构建多采样率动态隐变量模型;

(4)在线收集新的化工过程中与训练样本集过程变量对应的多采样率过程样本数据,得到测试样本集;

(5)对得到的测试样本集进行标准化;

(6)采用步骤(3)得到的多采样率动态隐变量模型得到当前时刻的关键质量变量,实现关键质量变量的软测量。

作为优选,步骤(1)中,所述过程变量样本采用集散控制系统收集;所述关键质量变量采用化验手段收集。

本发明中,所述的化验手段包括但是不限于化学滴定、试纸检测、纯度检测(比如借助hplc、lc-ms等等进行的检测)、核磁检测等等测试方法。

本发明中,过程变量样本一般指那些可以由现有的传感器检测得到的变量,可以方便通过集散控制系统收集,比如可以是温度、压力、流量等。所述的关键质量变量一般不能、很难或者是不宜采用现有传感器直接检测检测的变量,比如某一中间体或者原料的浓度等。

通过步骤(1),假设采集到了m种不同采样率的正常过程变量样本集x,x={x1;x2;...;xm;...;xm};其中,第m种采样率的过程变量样本为xm,一般为一个向量;m种不同采样率的正常过程变量样本的样本数量分别为k1,k2,...,km,而通过化验得到n种不同采样率的正常关键质量变量样本集y,y={y1;y2;...;yn;...;yn};第n种采样率的关键质量变量样本集为yn;n种不同采样率的正常关键质量变量样本的样本数量分别为h1,h2,...,hn;有:

其中,r表示实数集;在m种易测的多采样率过程变量数据中,gm为采用第m种采样率的过程变量的变量数,km为第m种采样率下的每个过程变量的样本数;xm(i)为第m种采样率下过程变量对应的第i个样本;在n种难测的多采样率的关键质量变量数据中,jn为采用第n种采样率的关键质量变量的变量数,hm为第n种采样率下的每个过程变量的样本数;yn(j)为第n种采样率下关键质量变量对应的第j个样本。将这些数据存入历史数据库,组成建模用的训练样本集;

作为优选,步骤(2)中,所述标准化方法为:在某一采样率下,针对该采样率下的每个过程变量或者每个关键质量变量,先使得其中的每个元素减去其对应的过程变量或者每个关键质量变量的平均值,然后再除以样本集的整体标准差。经过所述标准化,使得每个过程变量或者每个关键质量变量中的每个元素值围绕0上下波动;大于0表明高于平均水平,小于0表明低于平均水平,且与潜隐变量间存在线性相关关系。

步骤(3)中,首先构建静态多采样率模型;然后将所构建的静态多采样率模型,转换为与当前时刻相关的动态多采样率模型;最后基于得到的动态多采样率模型,利用预处理后的训练样本集构建多采样率动态隐变量模型。

具体讲,由于经过标准化后的训练数据集与潜隐变量间存在线性相关关系,可得到如下的静态模型:

其中,xm取上述的xm(i);yn取上述的yn(j);am和bn分别为采用第m种采样率的过程变量的输入型负载矩阵和采用第n种采样率的关键质量变量的输出型负载矩阵,wm和un分别为采用第m种采样率的正常过程变量的输入噪声矩阵和采用第n种采样率的关键质量变量的输出噪声矩阵,均服从如下的高斯分布:

其中,φm和ωn分别为采用第m种采样率的过程变量的输入噪声矩阵的方差和采用第n种采样率的关键质量变量的输出噪声矩阵的方差。

同时,基于以上所构建的静态多采样率模型,通过形式转换,可以得到如下动态多采样率模型:

其中,t∈rd为该模型的动态潜隐变量,t(k)表示该模型在k时刻对应的潜隐变量,d是潜隐变量的维度;z(k-1)=[t(k-1)t(k-2)...t(k-l+2)]∈rdl×1包含了过去l个值,l为滞后时间;c为模型的动态矩阵;aξ(k)和bξ(k)为模型的负载矩阵:

其中,e和f分别表示了在k时刻数据集x和y所含数据对应的采样率总数;ak1、bk1分别为第一个被采集到的过程变量数据或关键质量变量对应的采样率下的模型参数,以此类推;同理,bξ(k)的值都源自{b1,b2,...,bn}并由其对应的样本是否被采集决定。同样的道理xξ(k)的值源于{x1,x2,...,xm},yξ(k)的值源于{y1,y2,...,yn}。v(k)表示k时刻的动态噪声,其方差为γ,具体分布为v(k)~n(0,γ);wξ(k)和uξ(k)分别为k时刻的过程变量的测量噪声和关键质量变量的测量噪声,φξ(k)和ωξ(k)分别为它们的方差,具体分布如下:

同理,此处的φξ(k)源于φm,而ωξ(k)源于ωn。

步骤(3)中,利用期望最大化算法来更新模型参数。利用期望最大化算法来更新模型参数时,在e步利用卡尔曼滤波算法结合当前模型参数估计潜隐变量的后验概率;在m步中,则通过极大化似然函数的方式更新模型参数;最后,反复迭代e步和m步直至达到模型收敛条件,最终得到多采样率动态隐变量模型。

步骤(5)中,在线收集新的造纸废水处理过程中与训练样本集过程变量对应的多采样率过程样本数据,采样时间间隔由采样率最高的过程变量的采样率确定(可以等于或者大于最高的采样率,当然也可以小于),得到测试样本集,并进行标准化,所述步骤(5)中的标准化方法与步骤(2)中的标准化方法相同。

步骤(6)中,在线收集新的化工过程中与训练样本集过程变量对应的多采样率过程样本数据;首先,采用得到的多采样率动态隐变量模型以及模型训练得到的模型参数对测试样本进行处理,利用卡尔曼滤波算法计算测试样本的当前时刻的动态潜隐变量的期望值;

然后,利用得到的动态潜隐变量的期望值和与当前采样率总数所对应的模型输出负载矩阵,计算出当前时刻关键质量变量的多采样数据,实现软测量目标。

可以使用本发明的化工过程包括但不限于化工废水处理过程(比如造纸废水处理过程)、化工原料或者中间体制备过程、化工原料或者中间体的精制过程、农药/医药/医药中间体的制备过程、精制过程等。

本发明中,涉及的“软测量”是相对于可以直接通过现有检测方法直接检测得到的测量方法而言的,其利用可以直接检测的大量过程变量,去得到难测的少量关键质量变量,实现对少量关键质量变量的测量。

与现有技术相比,本发明的有益效果体现在:

本发明的基于动态隐变量模型的多采样率造纸废水处理过程的软测量方法,以化工过程不同采样率的大量过程变量、少量关键质量变量为建模样本,在充分考虑数据的自相关性和互相关性的同时,提取能够包含多采样率数据特性的动态潜隐变量,而模型参数的估计通过期望最大化(em)算法和卡尔曼滤波算法实现,并在此模型的基础上建立了相应的软测量方法,以解决多采样动态关键质量变量的估计难题。该方法在实现多采样率信息处理的同时,既可以完整利用数据信息,又能利用卡尔曼滤波充分考虑数据的动态特性,并对动态潜隐变量实现精确的估计,使降维后的少数动态潜隐变量实现对难以直接测量的多采样关键质量变量更好的估计与描述,从而在软测量精度与应用范围上实现提升。

具体实施方式

以造纸废水处理过程为例,对本发明做进一步说明:

一种基于动态隐变量模型的多采样率软测量方法,该方法针对造纸废水处理过程中难以测量的关键质量变量的估计问题,首先利用集散控制系统收集正常工作状态下比较容易测量的过程变量的多采样率数据,同时利用化验手段获取正常工作状态下比较难测的关键质量变量的多采样率数据,建立多采样率动态隐变量模型。该模型结构由期望最大化算法估计得到。在此基础上,对在线造纸废水处理过程进行采样,获得多采样测试样本,然后可利用已有的模型结构估计测试样本的潜隐变量,并对造纸废水处理过程中难以测量的关键质量变量进行估计,实现最终的软测量效果。

本发明是一种基于动态隐变量模型和造纸废水处理过程的多采样率软测量方法,包括以下步骤:

第一步:利用集散控制系统收集造纸废水处理过程中正常运行的不同采样率的过程变量数据,同时利用化验手段获取比较难测的关键质量变量的多采样率正常数据,并组成建模用的训练样本集,假设采集到了m种不同采样率的正常过程变量样本集x,x={x1;x2;...;xm;...;xm};其中,第m种采样率的过程变量样本为xm;m种不同采样率样本的样本数量分别为k1,k2,...,km,而通过化验得到n种不同采样率的正常关键质量变量样本y,y={y1;y2;...;yn;...;yn};第n种采样率的关键质量变量样本集为yn,其样本数量分别为h1,h2,...,hn:

其中,r表示实数集;在m种易测的多采样率过程变量数据中,gm为采用第m种采样率的过程变量的变量数,km为第m种采样率下的每个过程变量的样本数;xm(i)为第m种采样率下过程变量对应的第i个样本;在n种难测的多采样率的关键质量变量数据中,jn为采用第n种采样率的关键质量变量的变量数,hm为第n种采样率下的每个过程变量的样本数;yn(j)为第n种采样率下关键质量变量对应的第j个样本。将这些数据存入历史数据库,组成建模用的训练样本集;

第二步:对样本集x和y进行标准化,即每个样本集中的元素先减去其对应的过程变量样本的平均值,然后再除以样本集的整体标准差,使得各个标准化后的元素值围绕0上下波动,大于0表明高于平均水平,小于0表明低于平均水平,且与潜隐变量间存在线性相关关系,可得到如下的静态模型:

其中,xm可取上述的xm(i);yn为上述的yn(j);am和bn分别为采用第m种采样率的过程变量的输入型负载矩阵和采用第n种采样率的关键质量变量的输出型负载矩阵,wm和un分别为采用第m种采样率的正常过程变量的输入噪声矩阵和采用第n种采样率的关键质量变量的输出噪声矩阵,均服从如下的高斯分布:

其中,φm和ωn分别为采用第m种采样率的过程变量的输入噪声矩阵的方差和采用第n种采样率的关键质量变量的输出噪声矩阵的方差。

同时,基于以上所构建的静态多采样率模型,通过形式转换,可以得到如下动态多采样率模型:

此模型中,t∈rd为该模型的潜隐变量,t(k)表示该模型在k时刻对应的动态潜隐变量,d是潜隐变量的维度;z(k-1)=[t(k-1)t(k-2)...t(k-l+2)]∈rdl×1包含了过去l个值,l为滞后时间;c为模型的动态矩阵;v(k)表示k时刻的动态噪声,其方差为γ,具体分布为v(k)~n(0,γ);wξ(k)和uξ(k)分别为k时刻的过程变量的测量噪声和关键质量变量的测量噪声;aξ(k)和bξ(k)为模型的负载矩阵:

其中,e和f分别表示了在k时刻数据集x和y所含数据对应的采样率总数,即在k时刻数据集x中有e个采样率的过程变量样本被采集,数据集y中有f个采样率的过程变量样本被采集;其中ak1、bk1分别为第一个被采集到的过程变量数据或关键质量变量对应的采样率下的模型参数,以此类推。

为便于处理多采样数据以及后续公式的直观表达,此处引入了两种采样系数ψ和τ,其表现形式分别如下所示:

因此,aξ(k)的值都源自{a1,a2,...,am}并由采样系数ψ决定其构成。例如,在k时刻,当ψk1=1时,第1种采样率的正常过程变量样本值被采集,ak1=a1;而当ψk1=ψk2=0且ψk3=1时,第3种采样率的正常过程变量样本值被采集,第1种和第2中采样率对应的正常过程变量样本值未被采集,ak1=a3。同理,bξ(k)的值都源自{b1,b2,...,bn}并由采样系数τ决定其构成。xξ(k)的值源于{x1,x2,...,xm}并由采样系数ψ决定其构成,yξ(k)源于{y1,y2,...,yn}并由采样系数τ决定其构成。v(k)表示k时刻的动态噪声,其方差为γ,具体分布为v(k)~n(0,γ);wξ(k)和uξ(k)分别为k时刻的过程变量的测量噪声和关键质量变量的测量噪声,φξ(k)和ωξ(k)分别为它们的方差,具体分布如下:

同理,此处的φξ(k)源于φm并由采样系数ψ决定其构成,而ωξ(k)源于ωn,并由采样系数τ决定其构成。

第三步:利用期望最大化(em)算法来更新模型参数,在e步利用卡尔曼滤波算法结合当前模型参数估计潜隐变量的后验概率;在m步中,则通过极大化似然函数的方式更新动态多采样率模型参数。最后,反复迭代e步和m步直至达到模型收敛条件。

首先,对模型参数{am,bn,c,φm,ωn,γ,μl,σl}随机进行初始化;由于卡尔曼滤波的输入数据格式的需要,对模型作出适当变换,其变换结果如下:

其中,k时刻的扩展的动态潜隐变量为z(k),其具体表达式为z(k)=[t(k)t(k-1)...t(k-l+1)]∈rdl×1,包含了过去l个值,l为滞后时间,其初值且zl~n(μl,σl),μl为zl的期望,σl为zl的方差;为变换后的动态矩阵,表示变换后的k时刻的动态噪声,其方差为具体分布为ξξ(k)表示变换后的k时刻的模型负载矩阵,表示变换后的k时刻的模型测量噪声。模型参数的具体变换如下所示:

其中,i为单位阵;加粗的0为零矩阵;

然后在模型参数估计的e步,根据当前的模型参数的初始值,利用卡尔曼滤波算法获取模型潜隐变量估计的更新值,其主要公式为:

其中,表示利用k-1时刻的预测结果对k时刻训练样本的扩展的动态潜隐变量进行估计,表示k-1时刻的训练样本的最优预测结果;表示k时刻训练样本的扩展的动态潜隐变量的最优估计;表示对应的协方差,对应的协方差;表示对应的协方差;kk表示k时刻的卡尔曼增益。

比较新模型参数所对应的极大似然值θnew与其原模型参数对应的极大似然值θold的差异,如果||θnew-θold||2<ε,则进入到第四步,否则,继续进行em算法的迭代,其中,ε为模型收敛的阈值,模型完整对数极大似然估计公式如下:

其中,θ表示极大似然函数值,constant表示任意常数。x′m(k)和y′n(k)表示利用公式(24)中提出的多采样率数据整合矩阵变换后得到的过程变量样本集和关键质量变量样本集;tk=t(k);p(·)表示概率密度的计算,p(tk|zk-1)表示求解tk关于zk-1的概率密度函数,其他概率密度函数的求解以此类推;

在m步,根据e步的结果,获取模型参数{am,bn,c,φm,ωn,γ,μl,σl}的更新值如下:

其中,e(·)表示期望的计算,为k时刻动态潜隐变量的估计值;为k-1时刻扩展的动态潜隐变量的估计值;为扩展的动态潜隐变量的估计值的初值;是一个多采样率数据整合矩阵,用于统一各多采样数据的矩阵维度,实现不同样本数的多采样率数据存放于统一的样本空间中,m=1,2,...,m。k表示这个统一的样本空间的样本总数,km表示第m种采样率的实际样本数,采样速率为α所对应的的表现形式如下:

相应地,对于不同采样率的yn(k),也有

第四步:在线收集新的造纸废水处理过程中与训练样本集过程变量对应的多采样率过程样本数据,采样时间间隔由采样率最高的过程变量的采样率确定(可以等于或者大于最高的采样率,当然也可以小于,本实施例中,选择等于),得到测试样本集,并进行标准化,该步骤的标准化与第二步可以采用相同的标准化方法,其样本数量分别为k′1,k′2,...,k′m:

第五步:采用多采样率动态隐变量模型以及模型训练得到模型参数{am,bn,c,φm,ωn,γ,μl,σl}对测试样本进行处理,利用卡尔曼滤波算法计算测试样本的第k时刻的动态潜隐变量的期望值

其中,表示k-1时刻的测试样本的最优预测结果;表示利用k-1时刻的预测结果对k时刻测试样本的扩展的动态潜隐变量进行估计;表示k时刻测试样本的扩展的动态潜隐变量的最优估计;表示对应的协方差;表示对应的协方差;表示对应的协方差;表示k时刻测试样本的卡尔曼增益;

第六步:利用在k时刻卡尔曼滤波算法得到的测试样本的动态潜隐变量的期望值和与当前采样率总数所对应的模型输出负载矩阵bξ(k),计算出k时刻关键质量变量的多采样数据实现最终的软测量目标:

其中,bξ(k)的值都源自{b1,b2,...,bn}并由采样系数τ决定其构成,τ包含k时刻数据采样率的分布信息,其具体结构与模型训练时类似。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1