本发明涉及废水处理智能控制研究领域,特别涉及一种基于pca-lstm网络的废水处理智能监控方法。
背景技术:
废水处理包含多个复杂生化反应过程,其机理目前尚未完全清楚,因此很难用精确的数学模型来有效预测和调控废水处理系统出水水质,如出水cod和出水ss浓度,近年来,基于深度学习的预测方法在许多领域得到广泛应用。
相对于传统预测方法,深度学习具有更强的学习能力和泛化能力,能够组合更加复杂的非线性运算,尤其在时序预测方面性能显著,但在实际使用时同时存在梯度消失和梯度爆炸等问题,使得预测准确性不高。
技术实现要素:
本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于pca-lstm网络的废水处理智能监控方法,基于废水处理系统出水水质与进水指标、模型控制参数之间的联系,充分利用主成分分析(pca)降维优化和lstm神经网络准确感知对象时序演变内在规律的优势,创建基于pca-lstm融合模型的出水水质参数软测量模型,有效解决模型使用时梯度消失和梯度爆炸问题,可用于对废水处理系统出水cod和ss浓度进行实时监测,进而对废水处理系统进行智能化调控,提升出水水质,提高废水处理系统安全性和稳定性。
本发明的目的通过以下的技术方案实现:
一种基于pca-lstm网络的废水处理智能监控方法,包括以下步骤:
s1、获取输入自变量和输出变量,划分训练集和测试集,并对输入自变量进行标准化处理,得到标准化输入自变量;
s2、通过pca算法筛选出最优输入自变量;
s3、通过最优输入自变量,构建pca-lstm融合回归预测模型;所述pca-lstm融合回归预测模型包含输入层、lstm层、双向lstm层、全连接层、dropout层、输出层;
s4、对pca-lstm融合回归预测模型进行训练,得到训练后pca-lstm融合回归预测模型;
s5、通过训练后pca-lstm融合回归预测模型对废水处理系统水质进行智能监控,得到相应结果。
进一步地,所述输入自变量包括进水cod、进水流量q、进水ss、温度t、溶解氧do和ph;所述输出变量包含出水cod和出水ss浓度
进一步地,所述标准化处理具体如下:
s101、按照8:2比例将样本数据划分为训练集与测试集,均匀随机选取样本中80%组数据为训练集,20%组数据为测试集;
s102、对训练集和测试集的输入自变量分别进行标准化处理,标准化方法如下:
对每组数据减去均值再除以标准差,则标准化后数据为:
xtrain(k,:)=(xtrain(k,:)-mu)/sig,
xtest(k,:)=(xtest(k,:)-mu)/sig,
其中,xtrain为标准化训练集数据矩阵,xtrain为训练集数据矩阵,k为第k行数据,xtest为标准化测试集数据矩阵,xtest为测试集数据矩阵,mu为训练集平均值,sig为训练集标准差。
进一步地,所述步骤s2具体为:
s201、将标准化数据输入pca函数,得到训练样本的特征向量、新的数据主成分、特征值:
[coeff,score,latent]=pca(xtrain),
其中,coeff为训练样本特征向量,score为训练样本新的数据主成分,latent为训练样本特征值,xtrain为标准化训练集数据矩阵;
s202、利用计算每个训练样本新的数据主成分的贡献率,方法如下:
explained=latent/sum(latent),
其中,explained为训练样本新的数据主成分的贡献率;
s203、计算训练样本新的数据主成分的累积贡献率,提取累积贡献率大于80%的前k个训练样本新的数据主成分组成新的训练集,方法如下:
ptrain=score(:,1:k),
其中ptrain为提取的新的训练集主成分;
s204、提取测试集输入变量的主成分,方法如下:
计算出训练集标准化后的平均值,把该平均值复制x次,组成平均值矩阵,使用测试集减去平均值再乘以训练集特征向量,得到测试集新成分:
ptest=[xtest-repmat(mu,[x,1])]*coeff(:,1:k),
其中,ptest为提取的新的测试集主成分,xtest为标准化后的测试集,mu为训练集平均值,x为测试集的样本数,repmat(mu,[x,1])为将训练集平均值复制x次,coeff为训练集特征向量。
进一步地,所述pca-lstm融合回归预测模型包含一个输入层、一个lstm层、一个双向lstm层、一个全连接层、一个dropout层、一个输出层。
进一步地,所述pca-lstm融合回归预测模型具体结构为:
第一层为输入层,用于导入数据并传递给下一层网络,在输入层中输入pca提取的前k个输入自变量主成分,输出矩阵表示为:
x=(x1,x2…xk),
其中,xk表示为输入自变量前k个主成分的第k个输入自变量主成分;
第二层为lstm层,lstm层通过门机制来控制流过单元的信息,门机制包括输入门、遗忘门、输出门;其中,输入门用于确定需要更新的信息;遗忘门用于控制从存储状态丢弃/继续保存前一时刻的信息,即通过输入门和遗忘门更新存储状态;输出门用于确定存储状态中输出信息;
第三层为双向lstm层,所述双向lstm层包含2个相互独立并且传播方向相反的隐藏层,对于同一输入数据,可得到2个隐藏层输出,即2个有关输入信息的特征向量,将其取均值最终得到1个输出向量;
第四层为全连接层,所述全连接层的每个节点与前一层的所有节点相连,经过连接层的输出为:
xi=f(∑wij*hj+bi),
其中,xi为全连接层第i个神经元输出,hj为前一层第j个神经元,wij为连接权值,bi为全连接层第i个神经元阈值,f为激活函数;
第五层为dropout层,所述dropout层用于减少中间特征的数量;
第六层为输出层,所述输出层用于输出废水处理出水水质参数预测结果。
进一步地,所述步骤s4具体如下:
s401、对网络结构的权值进行初始化;
s402、由lstm网络结构原理计算网络输出的预测值;
s403、计算预测值与所对应的真实值之间的误差:
ei=di-yi,
其中,ei为真实值与预测值的误差,di为对应的真实值,yi为预测值;
s404、根据增量公式计算权重更新值:
其中,为α学习率,
s405、把动量加入权重更新值,计算更新后的权重:
wt+1=wt+m=wt+δwij+βm-,
其中,δwij权重更新值,β为0~1之间常量,m为动量,m-为前一个动量;
s406、通过动量驱动的随机梯度下降法对网络进行训练,进而得到整个网络的更新权值,直到误差达到训练精度要求。
进一步地,所述步骤s5具体为:
利用训练后pca-lstm融合回归预测模型对废水处理系统水质进行实时智能监控;对进水cod、进水流量q、进水ss、温度t、溶解氧do、ph进行实时测量,保存所测数据,通过训练后的pca-lstm融合回归预测模型对出水cod和ss浓度进行快读估算,并设置固定采样时间间隔,进行软测量。
进一步地,还包括对所测数据进行分析,估算出水cod和出水ss浓度,进而获得系统发生故障时间和位点。
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明采用采用动量随机梯度下降算法优化训练lstm神经网络,有效提高网络预测性能和稳定性,可用于多个场景下模型改进优化,具有普适性。
2、本发明构建pca-lstm融合回归预测模型,有效提升模型预测性能和精度,能够准确、高效地实现对废水处理系统出水cod和出水ss浓度预测和调控,促进废水处理系统长期稳定高效运行。
附图说明
图1是本发明所述的一种基于pca-lstm网络的废水处理智能监控方法流程图;
图2是本发明所述实施例中废水处理系统出水cod浓度预测图;
图3是本发明所述实施例中废水处理系统出水ss浓度预测图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例
一种基于pca-lstm网络的废水处理智能监控方法,其流程如图1所示,该方法基于废水处理系统出水水质与进水指标、模型控制参数之间的联系,充分利用pca降维优化及lstm神经网络准确感知对象时序演变内在规律的优势,建立基于pca-lstm融合网络的出水关键水质参数软测量模型,对废水处理过程出水cod和ss浓度进行实时监测,进而对废水处理系统进行智能控制,调控出水水质,保证废水处理系统运行的安全性和稳定性。
包括以下步骤:
s1、获取输入自变量和输出变量,划分训练集和测试集,并对输入自变量进行标准化处理,得到标准化输入自变量;
s2、通过pca算法筛选出最优输入自变量;
s3、通过最优输入自变量,构建pca-lstm融合回归预测模型;所述pca-lstm融合回归预测模型包含输入层、lstm层、双向lstm层、全连接层、dropout层、输出层;
s4、对pca-lstm融合回归预测模型进行训练,得到训练后pca-lstm融合回归预测模型;
s5、通过训练后pca-lstm融合回归预测模型对废水处理系统水质进行智能监控,得到相应结果。
具体过程如下:
首先选取输入自变量和输出变量,所述输入自变量包括进水cod、进水流量q、进水ss、温度t、溶解氧do和ph;所述输出变量包含出水cod和出水ss浓度;并对数据进行标准化处理;
所述标准化处理具体如下:
s101、按照8:2比例将样本数据划分为训练集与测试集,均匀随机选取样本中80%组数据为训练集,20%组数据为测试集;
s102、对训练集和测试集的输入自变量分别进行标准化处理,标准化方法如下:
对每组数据减去均值再除以标准差,则标准化后数据为:
xtrain(k,:)=(xtrain(k,:)-mu)/sig,
xtest(k,:)=(xtest(k,:)-mu)/sig,
其中,xtrain为标准化训练集数据矩阵,xtrain为训练集数据矩阵,k为第k行数据,xtest为标准化测试集数据矩阵,xtest为测试集数据矩阵,mu为训练集平均值,sig为训练集标准差。
然后通过主成分分析提取输入变量中的主成分;具体如下:
s201、将标准化数据输入pca函数,得到训练样本的特征向量、新的数据主成分、特征值:
[coeff,score,latent]=pca(xtrain),
其中,coeff为训练样本特征向量,score为训练样本新的数据主成分,latent为训练样本特征值,xtrain为标准化训练集数据矩阵;
s202、利用计算每个训练样本新的数据主成分的贡献率,方法如下:
explained=latent/sum(latent),
其中,explained为训练样本新的数据主成分的贡献率;
s203、计算训练样本新的数据主成分的累积贡献率,提取累积贡献率大于80%的前k个训练样本新的数据主成分组成新的训练集;方法如下:
ptrain=score(:,1:k),
其中ptrain为提取的新的训练集主成分;
s204、提取测试集输入变量的主成分,方法如下:
计算出训练集标准化后的平均值,把该平均值复制x次,组成平均值矩阵,使用测试集减去平均值再乘以训练集特征向量,得到测试集新成分:
ptest=[xtest-repmat(mu,[x,1])]*coeff(:,1:k),
其中,ptest为提取的新的测试集主成分,xtest为标准化后的测试集,mu为训练集平均值,x为测试集的样本数,repmat(mu,[x,1])为将训练集平均值复制x次,coeff为训练集特征向量;
最终确定的主成分个数为4个。
构建pca-lstm融合回归预测模型:
所述pca-lstm融合回归预测模型包含一个输入层、一个lstm层、一个双向lstm层、一个全连接层、一个dropout层、一个输出层。
所述pca-lstm融合回归预测模型具体结构为:
第一层为输入层,用于导入数据并传递给下一层网络,在输入层中输入pca提取的前k个输入自变量主成分,输出矩阵表示为:
x=(x1,x2…xk),
其中,xk表示为输入自变量前k个主成分的第k个输入自变量主成分;
第二层为lstm层,lstm层通过门机制来控制流过单元的信息,门机制包括输入门、遗忘门、输出门;其中,输入门用于确定需要更新的信息;遗忘门用于控制从存储状态丢弃/继续保存前一时刻的信息,即通过输入门和遗忘门更新存储状态;输出门用于确定存储状态中输出信息;
第三层为双向lstm层,所述双向lstm层包含2个相互独立并且传播方向相反的隐藏层,对于同一输入数据,可得到2个隐藏层输出,即2个有关输入信息的特征向量,将其取均值得到1个输出向量;
第四层为全连接层,所述全连接层的每个节点与前一层的所有节点相连,经过连接层的输出为:
xi=f(∑wij*hj+bi),
其中,xi为全连接层第i个神经元输出,hj为前一层第j个神经元,wij为连接权值,bi为全连接层第i个神经元阈值,f为激活函数;
第五层为dropout层,所述dropout层用于减少中间特征的数量;
第六层为输出层,所述输出层用于输出废水处理出水水质参数预测结果。
最后,通过动量随机梯度下降算法训练pca-lstm融合回归预测模型,并用于废水处理系统出水cod和ss浓度预测;具体如下:
s401、对网络结构的权值进行初始化;
s402、由lstm网络结构原理计算网络输出的预测值;
s403、计算预测值与对应的真实值之间的误差:
ei=di-yi,
其中,ei为真实值与预测值的误差,di为对应的真实值,yi为预测值;
s404、根据增量公式计算权重更新值:
其中,为α学习率,
s405、把动量加入权重更新值,计算更新后的权重:
wt+1=wt+m=wt+δwij+βm-,
其中,δwij权重更新值,β为0~1之间常量,m为动量,m-为前一个动量;
s406、通过动量驱动的随机梯度下降法对网络进行训练,进而得到整个网络的更新权值,直到误差达到训练精度要求。
完成pca-lstm融合回归预测模型构建后,采用vc和matlab语言联合编制上述pca-lstm网络算法程序,并录入废水处理处理监控系统及仪表中。
模型在进行废水处理处理出水cod和出水ss浓度在线监测前要先进行离线训练,包括以下步骤:将水质传感器采集的历史数据传递到废水处理系统在线监控系统及仪表中,通过pca-lstm融合网络及相应改进算法分析计算监控模型以满足所需性能,将训练好的模型保存在废水处理水质在线监控系统中。
将训练好的废水处理在线监控系统及仪表运用到废水处理厂进行现场测量,先用传感器和相应的在线检测仪器实时测量废水处理处理系统中的进水cod、进水流量q、ph、进水ss、温度t、溶解氧do,然后把测得的数据导入废水处理系统仪表中,利用pca-lstm融合回归预测模型快速估计废水处理系统出水cod和ss浓度。
设置固定采样时间间隔,每采样一次,进行重复训练。
此外,需要利用有线或无线接口与集控室的以太网进行连接,把所测的数据导入监控的主机,运用基于pca-lstm算法的监控系统对所测数据进行分析,估算出水cod和出水ss浓度,实时调控出水水质,准确诊断出系统发生故障时间和位点,促进废水处理处理系统高效稳定运行;主要包括对精度下降、漂移和偏移等设备故障类型的诊断。该方法具有诊断时间短,诊断准确率高,实时性强等优点,适合复杂非线性的废水处理过程。
为了体现出本方法的优越性,将本发明中pca-lstm融合回归预测模型与传统lstm神经网络和bp神经网络进行对比,三者预测结果如下表1所示。从表1中数据可知,pca-lstm融合回归预测模型的均方根误差(rmse)和平均绝对百分比误差(mape)均比bp和单一lstm神经网络方法小,决定系数(r2)也最小,即pca-lstm融合回归预测模型的能够更好地预测出水水质。
表1.bp、lstm和pca-lstm预测性能比较
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。