基于时间差分模型的软测量建模方法与流程

文档序号：15558833发布日期：2018-09-29 01:45阅读：284来源：国知局

本发明涉及污水处理过程中出水指标的软测量建模方法，具体涉及一种基于时间差分的相关向量机与典型相关分析软测量建模方法。

技术背景

不同工业对控制的态度和动机是不同的，近年来，随着人们环保意识的增强，污水处理工业与其他重工业一样具备高级控制。并且由于污水处理自身独特的特征，如相较于大多数工业过程，污水处理厂的每日水质水量的波动很大；废水必须达标处理排放，不同于其他工业生产可以“返厂”处理；由于污水中的污染物的含量可能很小，传感器难以测量或直接测量等原因，使得污水处理过程需要采用更加复杂、更加高级的控制系统。近年来，软测量技术已成为解决工业过程中重要变量难以实时测量的重要手段，而软仪表的核心是软测量建模。软测量模型按照建模的机制可划分为机理模型和数据驱动模型。机理模型通过分析过程的反应机理，运用物理、化学和生物等基本定理来表述过程的内部规律，建立过程模型，但即使是一般对象其反应机理都比较复杂，并且由于工况与环境的影响，导致机理模型的预测性能大大降低。数据驱动建模是通过输入输出数据建立与过程外特性等价的模型，因此不需要研究对象的内部规律，只需获得足够多的数据即可建立对象的软测量模型。

污水处理过程是典型的非线性、大时滞的测量与控制过程，针对这个问题，大量的非线性软测量方法应用于废水处理领域，其中以人工神经网络(artificialneuralnetwork,ann)与支持向量机(supportvectormachine,svm)为建模工具的基于数据驱动的方法最为活跃。但是大多数方法在对软测量模型的建立时，都不考虑建模数据的时滞性。实际上由于在线仪表获得的过程变量通常隐含着较长的测量周期与分析时间，以及由于测量仪表的老化导致测量的变量数据出现漂移、偏移等问题，使得我们用来软测量建模的数据受到影响，导致建立的模型不能准确地解释变量的过程特性。另外对于参数模型来说，随着时间的推移，过程变量数据会发生动态的变化，如果参数不能随之进行相应的调整模型将不能正常地应用，但是在参数调整的过程中将会花费大量时间及降低工厂的运行效率。因此建模时分析过程变量的时滞性，对建模数据的时序进行合理的匹配，充分利用数据中的动态信息，对于模型的建立是有利的。

如何在考虑数据时滞性的前提下建立污水处理过程的软测量模型是急需有待解决的工业问题。

技术实现要素：

本发明针对上述现有技术存在的问题，提出一种基于时间差分的相关向量机与典型相关分析软测量建模方法，引入时间差分(timedifference，td)模型用来对输入输出变量的漂移进行处理，利用输入输出数据的时间差分进行建模学习。

本发明是通过以下技术方案实现：一种基于时间差分的相关向量机与典型相关分析软测量模型的建立，主要包括以下几个步骤：

s1.时间差分预处理：对于输入数据样本进行时间差分处理，得到差分重组数据作为软测量模型的输入进行数据预测；

s2.建立所述差分重组数据的相关向量机与典型相关分析回归模型；

s3.完成对软测量模型预测能力的评估：用新的测试数据代入模型进行预测，根据输出的预测值与真实值计算模型的均方根误差rmse与相关系数r。

步骤s1中，时间差分处理对输入数据x与输出数据y的计算如下：

其中，x(t)与y(t)表示t时刻的输入输出值，i表示模型的时间差分阶数。

步骤s2包括：

s21：相关向量机模型的函数预测输出为：

式中，εn是独立的零均值，方差为σ²的高斯噪声。k(xn；xi)表示核函数，w＝(w0…wn)^t表示参数向量。假定目标值y独立分布，则rvm的似然概率估计为：

其中φ是训练样本中的特征向量xi代入核函数中得到的结构矩阵，φ(xi)表示基函数对xi的非线性映射：

为了避免在svm中出现的由于过多的“支持向量”导致的过拟合问题，因此在rvm模型中，对权值wi进行约束，使得其机率分布是在0周围的正态分布：

式中每个超参数αi与其相对应的权值wi相关，α＝(α0，α1，…，αn)^t。根据贝叶斯概率框架及似然估计分布，权重的后验概率分布为：

上式中，后验协方差矩阵∑＝(σ^-2φ^tφ+a)^-1，均值m＝σ^-2∑φ^tt，矩阵a＝diag(α0，α1，…，αn)。由于大多数的αi都是趋近于无穷的，与之对应的后验分布协方差∑与均值则无限趋近于零：

即与αi相对应的权值wi等于0，因此相应的基函数φ(xi)将从结构矩阵φ去除，而保留下的非零权重所对应的特征向量也就是相关向量。

对于新的输入值x′，模型的预测分布：

p(ynew，|x′，α，σ²)＝n(m^tφ(x′)，σ²(x′))(8)

式中均值m^tφ(x′)为我们所要求的估计值ynew，即

ynew＝m^tφ(x′)(9)

通过极大似然法对超参数进行优化：

s22：典型相关分析通过找到一对投影方向r与c，使得投影t＝xr与u＝yc之间具有最大的相关性，相关性最大化可由下列目标函数求得：

且需服从下列条件：

权重矩阵r与c可通过对x与y进行svd求解得到

[ux，sx，vx]＝svd(x)

[uy，sy，vy]＝svd(y)(14)

在得到矩阵x的相关变量矩阵t＝[t1，t2，…，tl]后，cca将矩阵x与y分解为：

其中e与f分别是矩阵x与y的残差矩阵，p与q分别是矩阵x与y的负载矩阵，通过求解||x-tp^t||²与||y-tq||²的最小值得到

上式(15)中，矩阵t满足t^tt＝i；

最后通过典型变量t求得cca模型的预测输出：

其中回归系数矩阵θ＝qt^t。

步骤s3包括：

s31：根据输出数据的预测值与真实值计算出模型对应的均方根误差(rootmeansquareerror，rmse)：

式中，是估计值，yi是真实值，n是样本数；

s32：根据输出数据的预测值与真实值计算出模型对应的相关系数r(correlationcoefficient，r)：

其中yt是测量值，是模型预测值，分别yt与的平均值。

s33：rmse的值越小，代表该模型预测效果越佳；相关系数r越接近1，代表数据的相关性越强。

有益效果：

本发明提出的td软测量模型不同于直接用过程变量建模的一般方法，该方法利用时间差分对原始变量进行数据重构处理，得到的差分重构数据建立的模型能够不受因设备老化造成的漂移、偏移及测量分析过程的时滞性影响。其优势在于对输入输出数据同时进行时间差分提取，使得模型能获取过程变量的动态信息，通过对变量的过程时序的重新匹配，能够较好地处理由于设备老化的影响导致的过程变量出现的漂移及测量分析过程的时滞性问题，从而建立考虑时滞的动态软测量模型，更加有利于软测量模型的精准预测。

相比于忽略了输入输出变量的动态漂移信息的稳态建模方法，利用td模型对输入输出数据进行时间差分处理从而建模学习的方法，能够充分地利用数据中的动态信息，最终达到提高模型精度的效果。本发明主要利用了非线性模型中的相关向量机模型与线性模型中的典型相关分析法，并结合时间差分模型，建立了一种利用过程变量的漂移与时滞特性进行建模学习的方法，并成功利用了过程变量的动态信息提升了模型的精度，表明了时间差分方法应用到污水处理软测量建模研究中有相当的有效性。

附图说明

图1是基于时间差分的软测量建模方法流程图；

图2是污水处理过程变量数据折线图：分别是进水悬浮固形物ss、进水生物需氧量bod、进水化学需氧量cod、进水总氮tn、进水总磷tp、出水cod和出水tn；

图3是污水处理过程进水总流量q的折线图；

图4是差分阶数的变化对不同td模型的误差影响趋势图：其中模型1表示出水cod的td-cca模型，模型2表示出水tn的td-cca模型，模型3表示出水cod的td-rvm模型，模型4表示出水tn的td-rvm模型；

图5是rvm模型对测试数据的出水cod的预测结果图；

图6是rvm模型对测试数据的出水tn的预测结果图；

图7是td-rvm模型对测试数据的出水cod的预测结果图；

图8是td-rvm模型对测试数据的出水tn的预测结果图；

图9是cca模型对测试数据的出水cod的预测结果图；

图10是cca模型对测试数据的出水tn的预测结果图；

图11是td-cca模型对测试数据的出水cod的预测结果图；

图12是td-cca模型对测试数据的出水tn的预测结果图。

具体实施方式

该方法对污水处理过程的出水水质进行预测所使用的技术方案是：

s1.时间差分预处理：对于输入数据样本x∈r^n×m，y∈r^n×d(n是样本数，m是解释变量维数，d是过程变量维数)进行时间差分处理，得到差分重组数据作为软测量模型的输入进行数据预测；

s2.建立所述差分重组数据的相关向量机与典型相关分析回归模型；

s3.完成对软测量模型预测能力的评估：用新的测试数据代入模型进行预测，根据输出的预测值与真实值计算模型的均方根误差rmse与相关系数r。

步骤s1中，时间差分处理对输入数据x输出数据y的计算如下：

其中，x(t)与y(t)表示t时刻的输入输出值，i表示模型的时间差分阶数。

步骤s2包括：

s21：相关向量机模型的函数预测输出为：

式中，εn是独立的零均值，方差为σ²的高斯噪声。k(xn，xi)表示核函数，w＝(w0…wn)^t表示参数向量。假定目标值y独立分布，则rvm的似然概率估计为：

其中φ是训练样本中的特征向量xi代入核函数中得到的结构矩阵：

为了避免在svm中出现的由于过多的“支持向量”导致的过拟合问题，因此在rvm模型中，对权值wi进行约束，使得其机率分布是在0周围的正态分布：

式中每个超参数αi与其相对应的权值wi相关，α＝(α0，α1，…，αn)^t。根据贝叶斯概率框架及似然估计分布，权重的后验概率分布为：

即与αi相对应的权值wi等于0，因此相应的基函数φ(xi)将从结构矩阵φ去除，而保留下的非零权重所对应的特征向量也就是相关向量。

对于新的输入值x′，模型的预测分布：

p(ynew|x′，α，σ²)＝n(m^tφ(x′)，σ²(x′))(8)

式中均值m^tφ(x′)为我们所要求的估计值ynew，即

ynew＝m^tφ(x′)(9)

通过极大似然法对超参数进行优化：

s22：典型相关分析通过找到一对投影方向r与c，使得投影t＝xr与u＝yc之间具有最大的相关性，相关性最大化可由下列目标函数求得：

且需服从下列条件：

权重矩阵r与c可通过对x与y进行svd求解得到

[ux，sx，vx]＝svd(x)

[uy，sy，vy]＝svd(y)(14)

在得到矩阵x的相关变量矩阵t＝[t1，t2，…，tl]后，cca将矩阵x与y分解为：

其中p与q分别是矩阵x与y的负载矩阵，通过求解||x-tp^t||²与||y-tq||²的最小值得到

上式(15)中，矩阵t满足t^tt＝i；

最后通过典型变量t求得cca模型的预测输出：

其中回归系数矩阵θ＝qr^t。

相关向量机(relevancevectormachine，rvm)是tipping提出的一种基于贝叶斯框架的稀疏概率模型，是一种新的有监督学习方法。与svm相比，rvm的核函数的选择不受mercer条件的限制，可以根据实际需要构建合适的核函数，并且rvm是机率式预测的。此外相较于基于概率核函数的高斯过程模型，避免了高斯过程局限于先验高斯分布的假设条件，且同样能实现概率式预测。为了对比td模型的建模效果，本发明采用一种线性的典型相关分析(canonicalcorrelationanalysis，cca)模型。cca是hotelling提出的处理两组变量之间相互依赖关系的统计方法，是对主成分分析法的延伸。

步骤s3包括：

s31：根据输出数据的预测值与真实值计算出模型对应的均方根误差(rootmeansquareerror，rmse)：

式中，是估计值，yi是真实值，n是样本数；

s32：根据输出数据的预测值与真实值计算出模型对应的相关系数r(correlationcoefficient，r)：

其中yt是测量值，是模型预测值，分别yt与的平均值。

s33：rmse的值越小，代表该模型预测效果越佳；r越接近1，数据的相关性越强。

实施例1：

污水数据取自某污水处理厂的污水检测数据，数据包括8个变量，共有356天的样本数据，如图2、图3所示。图2是进水悬浮固形物(ss)、进水生物需氧量(bod)、进水化学需氧量、进水总氮(tn)、进水总磷(tp)、出水cod与出水tn；图3是污水进水总流量(q)。

通过matlab对上述算法进行仿真，进一步详述本发明：

第一步：对采集的356天测量数据进行时间差分处理。将后120个样本作为模型的测试集，用于检验模型的预测能力。模型的输入变量为污水进水总流量、进水悬浮固形物、进水生物需氧量、进水化学需氧量、进水总氮与总磷共6个变量，也可根据实际情况选取不同的废水处理指标；输出变量为出水化学需氧量与出水悬浮固形物两个变量。

第二步：建立差分重组数据的相关向量机与典型相关分析的回归软测量模型。

第三步：对比传统的rvm模型与cca模型及改进的基于时间差分的td-rvm模型与td-cca模型的预测能力，完成最优预测模型的评估。表1及图4反映了不同差分阶数对td模型的影响。可以看出，td模型的差分阶数的变化对于线性td-cca模型具有较大影响，随着差分阶数的增加，td模型的均方根误差变大。而对于非线性td-rvm模型而言，差分阶数的变化对td模型几乎没有影响。因此本发明采用一阶差分建立时间差分模型。由表2可知，基于时间差分的模型对出水cod与出水tn的建模预测效果要优于传统的rvm与cca模型。其中对出水cod的预测，td-rvm模型较rvm模型rmse降低了54.2％，td-cca模型较cca模型rmse降低了62.8％；对出水tn的预测，td-rvm模型较rvm模型rmse降低了49.2％，td-cca模型较cca模型rmse降低了50.5％。rvm模型对出水cod和出水tn的预测结果分别如图5与图6所示，td-rvm模型对出水cod和出水tn的预测结果分别如图7和图8所示，cca模型对出水cod和出水tn的预测结果分别如图9与图10所示，td-cca模型对出水cod和出水tn的预测结果分别如图11与图12所示。

表1不同td模型的rmse对比

表2不同模型的出水cod和出水tn的预测结果

以上实施例仅为说明本发明的技术思想，不能以此限定本发明的保护范围，凡是按照本发明提出的技术思想，在技术方案基础上所做的任何改动，均落入本发明保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘鸿斌;宋留;杨冲
技术所有人：南京林业大学
我是此专利的发明人

上一篇：一种临床医学用药片研磨器的制作方法
上一篇：一种研磨设备的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。