一种基于多变量互信息优选的质量预测与监测方法与流程

文档序号:16539730发布日期:2019-01-08 20:15阅读:596来源:国知局
一种基于多变量互信息优选的质量预测与监测方法与流程

本发明涉及一种质量预测与监测方法,特别涉及一种基于多变量互信息优选的质量预测与监测方法。



背景技术:

在整个综合自动化系统的设计中,产品的质量是首要考虑的因素,实时监测产品质量的系统占有着很重要的地位。随着科学技术的飞速发展,虽然诸如温度、压力、流量等信息的测量仪表在现代工业过程中得到了广泛的应用,但是直接测量产品质量指标的在线分析仪价格依旧高昂,而且后期维护成本很高。以浓度这个质量指标为例,测量浓度成分的在线分析仪价格就是普通测量温度、压力等仪表的十几倍,而且后期还需人工定期维护。若因成本原因不采用在线分析仪实时获取质量数据,可通过离线采样分析的手段获取产品质量数据。但是,离线测量的产品质量数据存在较大延时,不能为实时监测质量信息提供时间上的保障。

在这个背景下,软测量技术就应运而生,通过建立过程测量数据与产品质量数据之间的输入-输出关系模型,从而可实现对产品质量的软测量。建立软测量模型的方法有很多种,如偏最小二乘回归、神经网络、支持向量回归等等。这其中,偏最小二乘回归及其相应的衍生算法是最基本也是最常用的软测量实施技术手段。然而,过程测量数据中并非所有测量变量对预测产品质量是有作用的,有效地挖掘出与质量指标相关的测量变量,对于后续建立软测量模型是由重要的积极作用的。在目前的科研文献与专利中,存在一些变量挑选的技术方案。以偏最小二乘回归算法为例,有通过相关性确定与质量相关联的输入变量,也有通过遗传算法优选出最佳的输入特征变量用于构建回归模型。

考虑到现代生产过程测量变量之间的非线性关系,若是利用相关性选取与质量相关联的过程测量变量,需要考虑变量间的非线性特征。在定义非线性相关性上,互信息是一种很好的度量方式,但是标准的互信息只能度量单变量与单变量之间相关性。另外,过程测量变量的优选最好的方式是从整体层面出发,而不是单个变量的两两匹配相关性。虽然使用遗传算法等智能优化算法可以从整体层面出发选择出与质量相关的输入变量,但是智能优化算法容易陷入局部最优是一个被人所熟知的问题。因此,如何实施基于多变量互信息的变量优选是需要迫切解决的一个问题,这对于开发设计产品质量预测与监测系统具有重要的意义。



技术实现要素:

本发明所要解决的主要技术问题是:如何基于多变量互信息,从整体层面最优选择与质量相关的过程测量变量,并基于此建立相应的质量指标预测与监测模型。

本发明方法解决上述问题所采用的技术方案为:一种基于多变量互信息优选的质量预测与监测方法,包括以下步骤:

(1):从生产过程对象的历史数据库中找出能反映产品质量的指标所对应的数据组成输出矩阵y∈rn×k,与输出y相对应的采样数据组成输入矩阵x∈rn×m,其中,n为训练样本数,m为过程测量变量数,k为质量指标数,r为实数集,rn×m表示n×m维的实数矩阵。

(2):计算输出矩阵y中各列向量的均值μ1,μ2,…,μk与标准差δ1,δ2,…,δk后,按照公式对y中各行向量实施标准化处理得到标准化后的输出矩阵其中行向量y与分别表示矩阵y与中的任意一个行向量,输出均值向量μ=[μ1,μ2,…,μk]、输出标准差对角矩阵中对角线上的元素为δ1,δ2,…,δk。

(3):对矩阵x实施标准化处理,得到标准化后的输入矩阵初始化c=1并根据如下所示公式初始化一条长度为m的二进制数b:

(4):根据二进制数b中元素1的位置,对应地从矩阵中选取相应的列向量组成矩阵z。

(5):利用如下所示的多变量互信息计算过程,计算矩阵z与矩阵之间的相关性φc。

①将矩阵z与矩阵合并成一个矩阵设置距离近邻个数r=3并初始化p=1。

②计算矩阵a中第p行向量与a中第q=1,2,…,n行向量之间的距离,然后按数值大小做升序排列,并记录第r+1个数值θp。

③计算矩阵z中第p行向量与中第q=1,2,…,n行向量之间的距离然后记录距离大小满足条件的个数βp。

④计算矩阵中第p行向量与中第q=1,2,…,n行向量之间的距离然后记录距离大小满足条件的个数δp。

⑤利用记录的βp与δp计算其相应的digamma函数ψ(βp)与ψ(δp),其中digamma函数满足条件ψ(x+1)=ψ(x)+1/x,x为函数自变量,当x=1时,ψ(1)=-0.57721。

⑥判断是否满足条件:p<n?若是,则置p=p+1后返回至②;若否,则分别计算得到ψ(β1),ψ(β2),…,ψ(βn)与ψ(δ1),ψ(δ2),…,ψ(δn)的平均值,记为与ξ。

⑦按照下式计算窗口矩阵z与之间的互信息大小:

那么,矩阵z与矩阵之间的相关性φc为

(6):判断是否满足条件:c<2m-1+2m-2+…+20?若是,则置c=c+1与b=b+1后返回至步骤(4);若否,则得到c=2m-1+2m-2+…+20个相关性数值φ1,φ2,…,φc。

(7):将φ1,φ2,…,φc中的最大值所对应的下标号c转换成m位的二进制数后,记录该二进制数中元素1所在位置为集合ф,则ф中优选出的变量即为与输出质量指标密切相关的输出变量。

(8):根据集合ф中存储的变量位置从矩阵中选出对应的列向量组成输出相关矩阵中其余的列向量则组成输出不相关矩阵

(9):建立输出相关矩阵与输出矩阵之间的软测量模型:其中表示软测量模型拟合出的函数关系,e为预测误差,根据应用对象的不同,可用算法有偏最小二乘回归、神经网络、支持向量回归。

(10):根据公式计算出软测量模型的输出估计值并计算的协方差矩阵上标号t表示矩阵或向量的转置。

(11):计算矩阵的协方差矩阵并根据公式计算出控制上限dlim与qlim。

离线建模阶段至此已经完成,当过程对象测量到新的样本数据时,即开始实施如下所示的在线质量指标预测与监测。

(12):采集过程对象最新采样时刻的样本数据x∈r1×m,并对其实施步骤(3)中与矩阵x相同的标准化处理得到向量

(13):根据集合ф从行向量中选出相应的列组成行向量中其余元素则组成行向量

(14):根据公式计算出当前采样时刻的软测量模型的输出并根据公式计算当前采样时刻的质量指标数据y。

(15):根据如下所示公式计算与质量指标相关的监测统计量d,和与质量不相关的监测统计量q:

(16):若d≤dlim且q≤qlim,则当前工况运行正常,返回步骤(12)继续实施对下一个采样时刻的质量指标预测与监测;若d>dlim,则过程对象运行出现了与质量相关的故障;若q>qlim,则过程对象运行出现了与质量不相关的故障。

与现有软测量与监测方法相比,本发明方法的优点在于:

本发明方法通过穷举输入变量所有的可能组合形式,绝对能保证选择出最优的与输出相关的输入变量,避免了使用遗传算法陷入局部最优的问题。此外,本发明方法利用优选后的输入变量建立软测量模型,能剔除与质量指标不相关测量数据的干扰影响。由于本发明方法不仅实施了对质量指标的软测量,而且还能依据软测量值实施对质量指标的实时监测,并将故障区分为与质量相关以及与质量不相关。因此,本发明方法能较好地解决与质量相关的软测量与监测问题。

附图说明

图1为本发明方法的实施流程示意图。

图2为本发明方法中计算多变量互信息大小的实施流程图。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

如图1所示,本发明公开了一种基于多变量互信息优选的质量预测与监测方法,该方法的具体实施方式如下所示。

首先,离线建模阶段包括如下所示步骤(1)至步骤(11)。

步骤(1):从生产过程对象的历史数据库中找出能反映产品质量的指标所对应的数据组成输出矩阵y∈rn×k,与输出y相对应的采样数据组成输入矩阵x∈rn×m

步骤(2):计算输出矩阵y中各列向量的均值μ1,μ2,…,μk与标准差δ1,δ2,…,δk后,按照公式对y中各行向量实施标准化处理得到标准化后的输出矩阵其中行向量y与分别表示矩阵y与中的任意一个行向量,输出均值向量μ=[μ1,μ2,…,μk]、输出标准差对角矩阵中对角线上的元素为δ1,δ2,…,δk。

步骤(3):对矩阵x实施标准化处理,得到标准化后的输入矩阵初始化c=1并根据如下所示公式初始化一条长度为m的二进制数b:

步骤(4):根据二进制数b中元素1的位置,对应地从矩阵中选取相应的列组成矩阵z。

步骤(5):利用多变量互信息计算矩阵z与矩阵之间的相关性φc,计算多变量互信息大小的实施流程如图2所示,具体的实施方式包括如下所示步骤①至步骤⑦。

①将矩阵z与矩阵合并成一个矩阵设置距离近邻个数r=3并初始化p=1。

②计算矩阵a中第p行向量与a中第q=1,2,…,n行向量之间的距离,然后按数值大小做升序排列,并记录第r+1个数值θp。

③计算矩阵z中第p行向量与中第q=1,2,…,n行向量之间的距离然后记录距离大小满足条件的个数βp。

④计算矩阵中第p行向量与中第q=1,2,…,n行向量之间的距离然后记录距离大小满足条件的个数δp。

⑤利用记录的βp与δp计算其相应的digamma函数ψ(βp)与ψ(δp),其中digamma函数满足条件ψ(x+1)=ψ(x)+1/x,x为函数自变量,当x=1时,ψ(1)=-0.57721。

⑥判断是否满足条件:p<n?若是,则置p=p+1后返回至②。若否,则分别计算得到ψ(β1),ψ(β2),…,ψ(βn)与ψ(δ1),ψ(δ2),…,ψ(δn)的平均值,记为与ξ。

⑦按照下式计算矩阵z与之间的互信息大小:

那么,矩阵z与矩阵之间的相关性φc为

步骤(6):判断是否满足条件:c<2m-1+2m-2+…+20?若是,则置c=c+1与b=b+1后返回至步骤(4);若否,则得到c=2m-1+2m-2+…+20个相关性数值φ1,φ2,…,φc。

步骤(7):将φ1,φ2,…,φc中的最大值所对应的下标号c转换成m位的二进制数后,记录该二进制数中元素1所在位置为集合ф,则ф中优选出的变量即为与输出质量指标密切相关的输出变量。

步骤(8):根据集合ф中存储的变量位置从矩阵中选出对应的列向量组成输出相关矩阵中其余的列向量则组成输出不相关矩阵

步骤(9):建立输出相关矩阵与输出矩阵之间的软测量模型:根据应用对象的不同,可用算法有偏最小二乘回归、神经网络、支持向量回归。

步骤(10):根据公式计算出软测量模型的输出估计值并计算的协方差矩阵上标号t表示矩阵或向量的转置。

步骤(11):计算矩阵的协方差矩阵并根据公式计算出控制上限dlim与qlim。

其次,离线建模阶段完成后,当过程对象测量到新的样本数据时,即开始实施如下所示的在线质量指标预测与监测,包括如下所示步骤(12)至步骤(16)。

步骤(12):采集新时过程对象的样本数据x∈r1×m,并对其实施步骤(3)中与矩阵x相同的标准化处理得到向量

步骤(13):根据集合ф从行向量中选出相应的列组成行向量中其余元素则组成行向量

步骤(14):根据公式计算出当前采样时刻的软测量模型的输出并根据公式计算当前采样时刻的质量指标数据y。

步骤(15):根据如下所示公式计算与质量指标相关的监测统计量d,和与质量不相关的监测统计量q:

步骤(16):若d≤dlim且q≤qlim,则当前工况运行正常,返回步骤(12)继续实施对下一个采样时刻的质量指标预测与监测;若d>dlim,则过程对象运行出现了与质量相关的故障;若q>qlim,则过程对象运行出现了与质量不相关的故障。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1