污水处理出水TP区间预测方法与流程

文档序号:16089338发布日期:2018-11-27 22:49阅读:918来源:国知局

本发明是为了寻找出水TP的有效测量方法,利用集员辨识和神经网络相结合的思想基于采集到的数据进行建模,并给出输出变量出水TP的区间估计。集员辨识在近几年已经得到广泛应用,其与神经网络相结合,已经在软测量技术、信号处理、鲁棒控制及故障检测等方面得到验证,并有了很大发展。



背景技术:

随着中国水环境问题的日益突出,污水处理作为保护环境的重要措施,也越来越受到社会的广泛关注,出水TP反映了水体富营养化的问题,是评价水质的重要指标,因此,对污水处理过程中TP的含量进行实时、准确的监测尤为重要。另外,污水处理过程具有机理复杂、强非线性和高度不确定性的特点,因而用基于生化反应机理建立软测量模型的传统方法效果欠佳。而近些年来,传统的神经网络凭借其良好的逼近能力被广泛应用于污水处理出水TP软测量建模中,尤其是RBF神经网络、BP网络、T-S模糊神经网络等。然而,这些方法大都是获得一个单一值预测出水指标的浓度,并未曾给出评估真实值和预测值之间偏差(即预测误差)的有效办法,即便是采用均方根误差(RMSE)来评价神经网络的建模精度,也不能直接得出各个时刻的预测误差。目前,围绕污水处理区间预测模型开展研究的工作并不多见。

系统辨识理论中的区间预测方法有很多,其主要有两大类。一类方法基于随机误差假设,如最小二乘法或极大似然法,要求误差的统计特性已知或部分已知,然后通过概率论给出被估计量的置信区间。另一类方法基于有界误差假设,如集员辨识,只要求误差有界而不需要知道其统计特性,然后通过集理论给出被估计量的置信区间。在实际应用中,误差的统计特性难以获得,此时第一类方法给出的置信区间不一定可靠,为此,基于有界误差假设,给出一种新的出水TP的软测量方法,以实现其保证估计。利用径向基函数(RBF)神经网络的逼近能力,将其应用于污水处理出水TP软测量建模。同时,径向基函数神经网络的中心和宽度被确定后,考虑到建模误差有界,使用参数线性集员辨识算法得到网络输出权值的集合描述。在污水处理系统运行过程中,所建立好的软测量模型可以预测出水TP的上下界。此外,本文建立多个软测量模型,并将多模型测量结果进行融合以降低单一模型所给结果的保守性。



技术实现要素:

1、基于RBF神经网络与集员辨识相结合的出水总磷的区间估计共包括两个部分:利用RBF神经网络基于输入输出数据进行建模以及采用参数线性集员辨识算法得到网络输出权值的集合描述;辅助变量选用进水总磷浓度TP、温度T、溶解氧浓度DO、总悬浮颗粒浓度TSS和氢离子浓度指数pH,将它们作为神经网络的输入,待预测的主导变量为出水总磷浓度TP,将其作为神经网络的输出,以实现对出水总磷浓度TP的软测量建模;

1)RBF神经网络模型

RBF神经网络因为其简单的拓扑结构和强大的逼近能力,在软测量建模中得到了广泛的应用;RBF神经网络包括输入层、隐含层和输出层,表示为:

式中:x∈RQ和y∈R分别为网络的输入和输出,在软测量模型中分别代表辅助变量和出水总磷,R表示实数,Q表示辅助变量的个数,RQ表示Q维的实数向量;gi(x,σ,ci)为神经网络第i个隐层节点的输出,ci∈RQ和σ∈R分别为隐含层的中心和宽度;wi∈R为线性输出权值,p为隐含层节点的个数;RBF神经网络隐含层的基函数为:

式中||·||表示欧式范数,从式(1)看出,RBF神经网络从隐含层到输出层是线性传递;

将降维后的数据分为两部分,一部分作为训练集,另一部分作为测试集,分别表示为和软测量模型建立好后,预测出水TP的过程表示为:

式中:N为训练集样本数,l为样本总数,k表示第k个样本数据,相当于过程变量,为神经网络的预测输出,为神经网络输出权值的估计;采用集员辨识算法估计RBF神经网络输出权值wi,得到出水TP的置信区间;

2)置信区间的基本计算

采用聚类算法确定RBF神经网络的中心ci和宽度σ,一旦RBF神经网络隐含层的中心和宽度被确定后,得到关于输出权值wi的线性方程

式中

φk=[g1(xk,σ,c1),g2(xk,σ,c2),…,gp(xk,σ,cp)]T (5)

θ=[w1,w2,…,wp]T (6)

ek包含RBF神经网络中心、宽度和输出权值的选择带来的建模误差,而建模误差是与神经网络逼近能力有关的有界量,因此认为ek为有界误差,即|ek|≤ε,其中ε表示建模误差界,p为隐含层节点的个数;

集员辨识是一种有效的能够代替随机参数估计(如最小二乘和极大似然估计)的方法,因为其在应用时只需要知道误差的上下界,采用集员辨识方法估计神经网络的输出权值一方面是因为这里的估计问题符合集员辨识的应用条件,另一方面以集员辨识的估计结果为基础能够得到出水TP的置信区间;

由样本数据误差的有界假设|ek|≤ε以及式(4)得到

Sk表示由第k组数据所确定的参数空间Rp的子集,其中Rp表示一组p维的实数向量,这一子集Sk是介于参数空间中两个超平面之间的部分,其中

N个Sk的交集得到一个凸多面体即ΘN称为权值向量θ的不确定集;权值不确定性θ∈ΘN使模型输出为区间k≥N+1,式中

这个区间表示出神经网络模型输出的不确定性,即k≥N+1,此区间称为神经网络输出的置信区间,其中表示神经网络模型输出的下界,表示神经网络模型输出的上界;根据θ∈ΘN、式(4)和误差有界假设|ek|≤ε,得到出水TP的置信区间

出水总磷的置信区间式(10)和式(11)能通过线性规划的方法得到,但为了提高计算效率,采用集员辨识中的椭球外界算法给出一个包含权值不确定性集ΘN的椭球

式中:为椭球EN的中心,PN∈Rp×p是一个表征椭球形状和大小的正定矩阵,其中Rp×p表示一个p×p的实数矩阵,EN表示一个包含权值不确定性集ΘN的椭球,椭球EN的计算过程如下:

初始化:置P0=δ-1I,δ取小的正数10-5,I∈Rp×p为单位阵;

递推:对k=1,2,...,N;

步骤1(a)计算

步骤1(b)如果置Pk=Pk-1,转步骤3;其中,ε与式(7)意义相同,表示建模误差界,βk为简化表达用的中间变量,vk为更新误差,表示第k-1次迭代过程中椭球的中心,表示第k次迭代过程中椭球的中心,Pk-1表示第k-1次迭代过程中表征椭球形状和大小的正定矩阵,Pk表示第k次迭代过程中表征椭球形状和大小的正定矩阵;

步骤1(c)如果则由式(15)和(16)计算ε′和v′k的值,并由式(17)求得qk,将ε′和v′k的值分别赋给ε和vk之后,转步骤2;

如果且则置Pk=Pk-1,转步骤3;其中,qk为待求加权系数,ε′和v′k表示迭代更新过程中产生的新的ε和vk,意义与ε和vk相同;

步骤1(d)如果则由式(18)和(19)计算ε′和v′k的值,并由式(20)求得qk,将ε′和v′k的值分别赋给ε和vk之后,转步骤2;

如果且则置Pk=Pk-1,转步骤3;

步骤1(e)如果则置Pk=Pk-1,转步骤3;否则,解方程(21),求其正实根qk,转步骤2;

步骤2将qk代入式(22)~(24)中,计算和Pk;

式中

步骤3如果k<N,则k增1并返回步骤1(a);

由于有所以得式中

其中在表示采用椭球EN(式12)描述神经网络权值向量θ的条件下神经网络输出的下界,表示在采用椭球EN描述神经网络权值向量θ的条件下神经网络输出的上界;同时推导出

式中:为椭球的中心,将式(26)和式(27)替换等式(11),得到出水总磷的置信区间

3)置信区间的保守性降低

借鉴集员估计的思想,设计多个出水TP神经网络软测量模型,并将多模型测量结果进行融合以降低单一模型所给结果的保守性;设软测量模型个数为M,第i个软测量模型的输出为置信区间I(i),同时表示用第k组样本数据得到的置信区间,关于实际出水总磷yk的关系式如下

因而有并且有

即将各模型输出的交集作为最终结果,并且最终结果比任意单一模型的输出具有更低的保守性,另外,有

由式(31)看出:子模型个数越多,所得的结果的保守性就越低;在本方案中,选取3个模型的交集来降低置信区间的保守性,即M=3;

4)TP置信区间的使用

所计算出的置信区间描述了出水TP真实值yk的存在范围,即式中:和分别表示置信区间的上下界。通过此置信区间可给出一个点估计

它可以作为TP真实值yk的一个预测,而且,不难推导出即TP真实值yk与预测值之间的偏差小于置信区间的半径,因此,置信区间的保守性越低,预测误差的最大值就越小;可以看出,通过出水TP置信区间不仅可给出TP真实值的一个预测而且还可以评估预测误差,现有工作多是获得一个TP预测值,而未曾给出评估各时刻预测误差的有效方法,关于水质参数TP是否达标或满足运行调控要求,直接使用预测值而不参考预测误差(预测精度没有保证)可能会导致错误的分析和判断;

2、面对污水处理厂大数据所带来的挑战,本发明提出污水处理过程出水总磷特征建模方法,从污水处理过程的实际需求出发,将复杂的动力学特性通过主要特征变量表述,基于污水处理过程机理分析和数据挖掘,获得与出水总磷相关性强的过程变量,并基于神经网络完成对出水总磷的区间预测;在基ASM1模型及BSM1模型中关于总磷形成机理分析的基础上,通过采集大量实际污水处理厂数据,基于偏最小二乘(PLS)算法,分析总磷相关的污水处理过程变量;本次数据选择中,最初采集到的易测过程变量共有10个,待筛选的辅助变量为9个,分别是进水TP、氧化还原电位ORP(共两处)、溶解氧DO、总悬浮颗粒TSS、氢离子浓度指数pH、温度T、氨氮NH4-N和硝氮NO3-N,待预测的主导变量为出水总磷TP;降维后,最终确定的辅助变量数为5个,分别是进水TP、温度T、溶解氧DO、总悬浮颗粒TSS与氢离子浓度指数pH,待预测的主导变量为出水总磷TP,从而进行软测量建模;

总磷相关性污水处理过程变量分析过程主要包括:

步骤1:自变量集合为X=[x1,...,xα],X表示可供筛选的辅助变量的集合,α为可供筛选的辅助变量个数,因变量记作y,表示待预测的主导变量,并将数据做标准化处理;从X,y标准化后的矩阵中分别提取主成h及u,即

其中,V与U分别为集合X和y的得分矩阵,P与Z分别为集合X和y的负荷矩阵,E与F分别为集合X和y的残差矩阵,i=1,2,…,α,α为可供筛选的辅助变量个数,hi、pi、ui与zi分别为矩阵V、P、U与Z中的向量;

步骤2:主成分vi与ui的相关性有

ui=bihi (35)

其中,bi为两个主成分之间的相关系数,相关系数矩阵记作b=[b1,b2,…,bα]T,α为可供筛选的辅助变量个数;

步骤3:PLS算法的中止条件记为

其中,bselect为已选取主元个数的相关系数,Rselect为设定的已选取主元的有效性;该有效性通过留一法进行确定,||·||为范数运算,选定Rselect≥0.85时,算法终止。

附图说明

图1.神经网络拓扑结构图。

图2.置信区间保守性降低方案。

图3.模型1给出的出水TP置信区间。

图4.模型2给出的出水TP置信区间。

图5.模型3给出的出水TP置信区间。

图6.3个模型给出结果的交集。

图7.采用最小二乘法所建模型得出的结果。

具体实施方式

1、数据采集预处理阶段:

本次数据采集在线测量了进水TP、温度T和氢离子浓度指数pH等辅助变量,然而由于来自污水处理现场的数据并非全部有助于出水TP的预测,因此需要对采集到的辅助变量进行筛选。而此次利用偏最小二乘法(PLS)对输入数据进行降维处理,在Rselect≥0.85的前提下,最终将辅助变量降到5维,分别用进水TP、温度T、溶解氧DO、总悬浮颗粒TSS与氢离子浓度指数pH作为预测出水TP的输入。

2、软测量建模阶段

软测量建模阶段主要是用基于RBF神经网络与集员辨识相结合的方法对降维后的数据进行处理,过程如图1所示,同时,为了降低预测结果的保守性,采用多模型融合的方法,如图2所示,然后对比最小二乘法,来验证集员辨识对区间估计的有效性。

1)采用聚类算法确定RBF神经网络的中心和宽度,一旦神经网络的中心和宽度确定后,采用参数线性集员辨识算法得到网络输出权值的集合描述。

2)在建立RBF神经网络模型过程中,中心个数分别取45、50、60,从而得到3个不同的RBF神经网络模型,测试结果如图3~5所示。为了降低保守性,将3个模型进行融合,最终结果如图6所示。

3、实验分析阶段

实验数据共235组,即l=235,先用PLS方法选取辅助变量,在已选取主元的有效性Rselect≥0.85情况下,得到出水TP软测量模型的辅助变量为进水TP、温度T、溶解氧DO、总悬浮颗粒TSS与氢离子浓度指数pH。将降维后的数据分成两部分,一份用于神经网络模型建立,共155组,即N=155;另一份用于模型预测,共80组。

实验建立3个软测量模型,然后将各模型输出的交集作为最终结果。在神经网络建模之前,先对数据进行归一化处理,即式(4)中的xk和yk都是归一化后的数据。对于模型1,神经网络隐节点数p、宽度σ以及建模误差界ε分别为45、1.2和0.43185;对于模型2,神经网络隐节点数p、宽度σ以及建模误差界ε分别为50、1.4和0.45458;对于模型3,神经网络隐节点数p、宽度σ以及建模误差界ε分别为60、1.5和0.46150。在权值估计过程中,集员辨识重复处理所有数据以进一步降低椭球描述的保守性。

图3~5分别为已建立好的模型1~3给出的出水TP的置信区间,图6是模型1、2以及3所给出的结果的交集,图中实线为测量值yk,虚线和点线分别为反归一化后的区间上下界和通过图6观察到,出水TP实测值完全落入3个模型所给出的置信区间中,以及进一步完全落入3个模型所给出的交集中,并且融合后的结果比单一结果保守性更低。不难看出,在时间允许的前提下,可建立更多的模型以进一步降低保守性。

此外,本实验还与传统的神经网络软测量建模方法进行对比,该方法采用最小二乘法确定RBF神经网络的输出权值,并且用试凑法试凑中心和宽度以减小建模误差。神经网络隐节点数p和宽度σ分别为45、0.9,图7给出了该方法的结果。图中实线为测量值yk,点划线为单点估计虚线和点线分别为反归一化后的区间上下界和可以看出,大概在第183组数据之后该方法所得的置信区间保守性有所提高,大于集员辨识的方法所得的结果,这是由于该方法基于随机误差假设计算置信区间,而这里误差的统计特性难以获得,因此计算的置信区间并不理想。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1