一种基于粒子群算法和支持向量机的废水厌氧处理系统出水挥发性脂肪酸的软测量方法与流程

文档序号:11384822阅读:230来源:国知局
一种基于粒子群算法和支持向量机的废水厌氧处理系统出水挥发性脂肪酸的软测量方法与流程

本发明涉及废水处理技术领域,具体涉及一种厌氧废水处理系统出水挥发性脂肪酸的软测量方法。



背景技术:

随着我国经济发展和工业化进程的加快,我国的废水排放量逐年增加,水污染控制任重而道远。厌氧生物处理工艺具有动力消耗小、污泥产量少、对氮和磷的需要量低,可减少补充氮和磷营养的费用、厌氧消化可产生生物能等优点,使得厌氧生物处理在工业废水处理中越来越重要,运用也越来越广泛。然而,厌氧消化过程是一个极其复杂、非线性、极具不确定的生化过程。一方面,厌氧微生物对包括三氯苯酚等有毒有机物较为敏感,若对于有毒废水性质了解不足或操作不当,在严重情况下可能导致反应器运行条件的恶化;另一方面,厌氧生物处理的效果容易受到操作条件变化的扰动,厌氧微生物(特别是产甲烷菌)对环境条件要求比较苛刻。当进水负荷突然增高或水温、碱度过低时,水解酸化过程与甲烷化过程容易失衡,从而导致有机酸大量积累、厌氧甲烷化受到抑制甚至厌氧体系崩溃。

由于厌氧消化体系的复杂性和易受运行条件的扰动的特点,厌氧消化过程的监控和水质参数的分析对于保证厌氧生物处理工艺的稳定性、高效性极为重要。然而,我国大部分废水处理厂在处理废水过程中大多靠人工化验来确定这些参数,人工化验不仅费时费力,还耗费了大量化学品,增加了污染物的排放量,严重影响了废水处理工艺的控制效果。虽然,由于近年仪表技术的发展,出现了可以在线测量这些废水水质的分析仪表,但这些专用仪表在我国发展比较晚,通常选用国外产品;同时,专用仪表普遍存在价格昂贵、设备投资和运行维护成本高、检测滞后时间长、稳定性不好和重复性差等问题,从而降低了重要参数的控制品质,这使其应用受到了进一步的限制。

近年来,基于人工神经网络、数理统计学等的软测量技术在废水处理过程中的应用越来越广。软测量模型适用于非线性系统建模,可以应用快速并行处理算法从而大大提高辨识速度。用于系统建模的方法很简单,只需通过系统的输入和输出数据,使系统对于水质变化频繁的废水生物处理仍然具有比较好的精度。近些年来,科研工作者对软测量建模技术以及其运用的研究和实践,特别是最近一两年人工智能算法和在各领域的运用逐渐成为研究热点,通过软测量技术构建的软测量系统逐步可以用来代替传统硬件仪表,也可以与硬件仪表同时使用以确保测量的准确性。

支持向量机(supportvectormachine,svm)是近年来机器学习领域中受到关注较多的一种软测量建模新技术,svm基于统计学原理,相比神经网络的启发式学习机制,svm的经验成分甚少,具有更为严格的数学论证。同时,svm对于所提供的样本数据的依赖性较少,且泛化能力较强,局部最优解一定是全局最优解,避免了产生维数灾难,特别适用于解决小样本、非线性、局部极小点等问题。目前,针对挥发性脂肪酸的检测,研究人员提出了很多方法,基于支持向量机的厌氧废水处理系统出水挥发性脂肪酸的软测量方法也有相关的文献及专利报道。如刘博等提出一种基于pca-lssvm的厌氧废水处理系统出水vfa在线预测模型,仿真结果表明在稳态环境下该模型具有很好的仿真能力(刘博,万金泉,黄明智等.基于pca-lssvm的厌氧废水处理系统出水vfa在线预测模型.[j].环境科学学报,35(6):1768-1778.)。然而,从这些文献中可知,元数据集加入非稳态数据后,模型在非稳态环境下的仿真表现会受到干扰。



技术实现要素:

本发明的目的是提供一种废水厌氧处理系统出水挥发性脂肪酸(vfa)的软测量方法,为了提高模型的精确性和鲁棒性,该检测方法结合了粒子群算法和支持向量机。

粒子群算法(particleswarmoptimization,pso)用于对模型参数的选优。

支持向量机(svm)特别适用于解决小样本、非线性、局部极小点等问题,且训练速度快,并对加入的元数据集具有有效的分类策略;svm模型是在统计学习理论的vc维理论和结构风险最小原理之上发展而来的一种新的智能算法,是由corinnacortes和vapnik等人(cortesc,vapnikv.1995.support-vectornetworks[j].machinelearning,20(3):273-297)首先提出来,其基本思想就是引入核函数的概念,将低维空间不可分的问题通过核函数映射到高维空间线性可分,在高维空间做分类或者回归处理。

svm最初是学术界针对两个数据类别的分类问题提出来的,分类问题可数学表达为:对于样本集(xi,yi),i=1,2,...,n,xn∈rn,yn∈{-1,1},构造分类面wx+b=0,该分类面能将两类样本无错误的分开,并且使两类之间的距离最大;w、x为n维向量,线性判别函数的一般形式为g(x)=wx+b,同倍缩放w、b使其进行归一化处理,使离分类面最近的样本满足|g(x)|=1,那么两类所有样本都满足|g(x)|≥1,其中两类样本的分类间隔为2/||w||。

则svm要解决的数学问题是:在满足式(3)的条件下,求式(4)的最小值:

yi(wtxi+b)-1≥0,i=1,2,3……n(3);

定义lagrange函数,其中,ai为lagrange系数,ai≥0;问题转化为对w和b求lagrange函数的最小值。

分别对w、b、ai求偏微分,当等于零时,得:

式(6)和式(3)构成把原问题转化为如下凸二次规划的对偶问题的约束条件:

原问题形成不等式约束下的二次函数机制问题,存在唯一最优解;若为最优解,则其中不为零的样本即为支持向量;因此,最优分类面的权系数向量是支持向量的线性组合;

b*由约束条件式(3)等于零时求解,由此求得的最优分类函数是:

最终,svm求解回归性问题可描述为如下优化问题:

式(9)中,为第i个样本点的训练误差,为经验风险,衡量机器学习的复杂性;γ>0为惩罚因子,又称正则化参数,用以在训练中平衡机器学习的复杂性和经验风险;式(9)应满足约束条件:

yi=wtφ(xi)+b+ξi,i=1,2,3,……,n(10);

式(10)中引入lagrange函数:

式(11)中,ai是lagrange乘子,利用karush-kuhn-tucker’s(kkt)最优化条件对式(11)进行优化,对w、b、ξ、ai求偏导可得:

消除w、ξ,式(11)优化的问题就可以转化为下面的线性方程求解问题:

式(13)中,将k(xi,xj)定义为核函数,解方程(13)求得ξ、ai的值,获得的回归模型,表达为:

本发明采用径向基核函数(rbf,radialbasisfunctions)作为核函数,即:

由式(15)得到的分类器与传统rbf方法的重要区别是,每个基函数中心对应一个支持向量,输出权值一般由算法自动确定的,式中σ为核宽度。

粒子群算法(pso)和支持向量机(svm)二者结合实现厌氧废水处理系统挥发性脂肪酸的软测量,对厌氧废水处理系统的在线监测及后续工艺优化控制具有重要意义,同时对厌氧废水处理系统其他难以在线监测的指标具有指导意义。

为了实现本发明目的,本发明的技术方案如下。

一种基于粒子群算法和支持向量机的废水厌氧处理系统出水挥发性脂肪酸的软测量方法,包括如下步骤:

(1)搭建厌氧废水处理系统,获取并收集输入量以及不同输入量条件下对应的厌氧反应器输出量的元数据;

(2)将得到的元数据分为训练集p训练={x;y}和测试集和p测试={x’;y’},并将数据集p={xx’;yy’}做归一化处理;将训练集数据用于svm-regression模型建模,得到训练集的模型输出量y,根据模型输出量y与训练集实际值y的相对误差,将训练集分成两个训练集,即训练集①和训练集②,也即p训练1={x1;y1}和p训练2={x2;y2},并标记训练集①和训练集②的元数据标签分别为1和-1;

(3)根据分类的训练集①和训练集②,利用svm-classification模型将测试集分成两个对应的测试集,即测试集①和测试集②,也即p测试1={x’1;y’1}和p测试2={x’2;y’2},从而将元数据分为两组数据集,即数据集①和数据集②,也即p1={x1x’1;y1y’1}和p2={x2x’2;y2y’2};

(4)将得到的训练集①和训练集②分别利用svm-regression模型进行处理,并分别用对应的测试集①和测试集②验证模型的有效性;当模型的精度达到设定要求,得到包含svm-classification模型和svm-regression模型的pso-svm的出水挥发性脂肪酸软测量模型;

(5)将训练并测试后的pso-svm的出水挥发性脂肪酸软测量模型嵌入工控机中,并利用工控机中的组态软件构建好人机交互界面;

(6)采用opc(oleforprocesscontrol)技术实现基于pso-svm的出水挥发性脂肪酸软测量模型与工控机的组态软件之间的数据交换,将收集的数据输送至pso-svm的出水挥发性脂肪酸软测量模型,计算出水挥发性脂肪酸浓度的预测值,再把该预测值返回至工控机人机交互界面显示;

(7)不断重复步骤(6),从而实现厌氧废水处理系统出水挥发性脂肪酸的在线实时监测;

(8)将系统输出以报表形式展现,并给出表征系统的表征指标指数。

进一步地,所述粒子群算法是迭代模式的算法,数学描述为:

设在一个n维搜索空间中,种群x={x1,x2,……,xn}是由n个粒子构成,其中第i个粒子所处的当前位置为x1={xi1,xi2,……,xin}t,速度为v1={vi1,vi2,……,vin}t,该粒子的个体极值表示为p1={pi1,pi2,……,pin}t,整个种群的全局极值表示为pg={pg1,pg2,……,pgn}t,按照粒子不断寻优的原理,粒子群算法的粒子xj的速度及位置更新公式如下所示:

式中,xj是粒子向量位置,vj是粒子的速度,w是权重值,c1、c2为加速常数;rand1、rand2是随机函数,作用是为了产生(0,1)的随机数;pbest是个体极值,gbest是全局极值;k表示迭代次数;j表示向量维数。

进一步地,步骤(1)中,所述厌氧废水处理系统包括厌氧反应器、与厌氧出水挥发性脂肪酸相关的监测和检测仪表、工控机、d/a及a/d模块。

进一步地,步骤(1)中,所述输入量包括进水有机负荷(cod)、出水ph、出水温度(t)、产气的量及组分、进水碱度和厌氧反应器的氧化还原电位(orp)。

更进一步地,步骤(1)中,所述产气的组分及产量包括甲烷和二氧化碳的产量。

进一步地,步骤(1)中,所述输出量包括出水总挥发性脂肪酸的浓度。

进一步地,步骤(2)中,所述归一化处理为:

式中,s(i)为数据集中的任一组数据;min(s)为数据集中,值最小的一组数据;max(s)为数据集中,值最大的一组数据。

进一步地,步骤(2)中,模型输出量y与训练集实际值y的相对误差低于50%的为训练集①;模型输出量y与训练集实际值y的相对误差高于或等于50%的为训练集②。

进一步地,步骤(3)中,所述svm-classification模型为:

式中,x为辅助变量样本数据,为拉格朗日乘子,b*为偏移量,w*为最优权重值,t代表转置,xi*为最优样本数据,n为≥1的自然数;(xi,yj)为训练集样本,xn∈rn,yn∈{-1,1}。

进一步地,步骤(2)、(4)中,所述的svm-regression模型为:

式中,x为辅助变量样本数据,ai为拉格朗日乘子,b为偏移量,n为≥1的自然数;k(xi,xj)为核函数且满足mercer条件。

进一步地,步骤(4)中,所述模型的精度要求由用户根据需要自行设置。

进一步地,步骤(8)中,所述表征指标指数包括相关系数(r)、平均绝对百分比误差(mape)、相对误差(re)和均方根误差(msre)。

表征指标指数的数学表达如下:

相关系数(correlationcoefficient,r)反映了预测值与实际值线性关系的强弱,r越接近于1,则预测值与实际值越接近。

平均绝对百分比误差(meanabsolutepercenterror,mape)是所有相对误差的绝对值求和的平均值,能从整体上更好地反映预测值的实际情况;

相对误差(relativeerror,re)表示绝对误差值与被测量值的真实值之比,相对误差更能反映预测的可靠程度;

均方根误差(rootmeansquareerror,rmse),观测值与真值偏差的平方与观测次数n比值的平方根,rmse主要是为了说明样本的离散程度。

rmse的值越小,说明预测模型描述实验数据具有更好的精确程度,反之,模型预测精度较差;

以上r、mape、re、rmse式中,y为实际值,y*为实际值均值,yp为预测值,为实际值均值,m为样本数量。

进一步地,借助传输控制协议、互联网协议和串行数据标准,通过计算机和双向通信,对测量输出数据进行实时监控,并通过组态软件的监控窗口显示,从而系统及时、准确地了解污水处理系统的指标变化情况,促进污水处理厂高效稳定运行。

与现有技术相比,本发明具有如下优点和有益效果:

(1)本发明提供了新的建模方法,引入分类策略来处理数据量大的对模型造成的性能下降问题,根据实验应用于实际,具备较好的仿真能力,可用于废水厌氧处理过程中出水vfa浓度的实时检测;

(2)本发明的建模方法对厌氧出水挥发性脂肪酸预测值与真实数据符合得较好,误差相对也较小,完全满足实际应用;

(3)本发明的软测量方法解决了测量设备滞后时间长的问题,真正实现对废水出水水质全面实时的监测,防止突发污染事故,同时可用于反馈控制实现厌氧废水处理系统的优化控制,为监控、优化和理解厌氧消化过程提供指导;

(4)本发明可用于代替部分价格昂贵的测量设备,节省维护费用,降低废水处理成本,容易在废水处理工程推广应用,具有很好的社会效益和经济效益。

附图说明

图1为实施例1中搭建的废水厌氧处理实时监控系统示意图;

图2a、图2b和图2c为实施例1中pso算法的寻优过程示意图;

图3a和图3b为实施例1中的pso-svm的出水挥发性脂肪酸软测量模型的建模流程示意图;

图4为实施例1中软测量模型matlab与组态软件mcgs之间的数据交换流程示意图;

图5a为实施例1中pso-svm的出水挥发性脂肪酸软测量模型分类前的仿真结果图;

图5b和图5c为实施例1中pso-svm的出水挥发性脂肪酸软测量模型分类后的仿真结果图。

具体实施方式

以下结合具体的实施例及附图对本发明做进一步的阐述。以下实施例仅用于对本发明做说明而不是对本发明的限制。需指出的是,以下若有未特别详细说明之过程或符号,如省略号,均是本领域技术人员可参照现有技术理解或实现的。

实施例1

基于粒子群算法和支持向量机的废水厌氧处理系统出水挥发性脂肪酸的软测量方法,使用mcgs作为组态软件收集来自传感器来的信息数据,使用matlab作为软测量建模平台,测量方法的步骤如下:

(1)搭建ic反应器作为废水厌氧处理系统,整个系统的搭建示意图如图1所示,虚线表示数据信息的传输路线,实线表示废水的流通路径,点虚线表示碱液的流通路径;实验所用的厌氧反应器是自主设计的ic厌氧反应器,该反应器为有机玻璃制作,高1272mm,内径200mm,有效容积25.1l,第一反应区与第二反应区的体积比为4∶1;

废水厌氧处理系统包括碱液罐1、进水储罐2、温度在线监测仪3、orp在线监测仪4、ph在线监测仪5、湿式气体流量计6、数据处理中心7、厌氧反应器9、碱液蠕动泵10和进水蠕动泵11;进水储罐2内设有搅拌装置,以调匀废水水质,配好的碱液放置于碱液罐1中;废水和碱液分别通过两个bt600-2j型蠕动泵,即进水蠕动泵11和碱液蠕动泵10输送至厌氧反应器9内;进水蠕动泵11和碱液蠕动泵10通过调节输入电压来调节转速,以此控制碱液和废水的流量;装置顶部设有导管以导出反应器产生的沼气,供后期气体收集和分析;为方便厌氧消化体系水质指标等参数的检测,系统设有ph在线监测仪5、orp在线监测仪4、温度在线监测仪3以及湿式气体流量计6等在线监测仪表;

反应器运行过程中通过变化进水有机负荷,变化进水碱度的方式改变反应器进水条件和处理条件来获得不同条件下厌氧处理出水vfa浓度的变化,并据国标监测进水cod、出水ph、出水t、产气量及产气组分、反应器氧化还原电位作为系统的输入量,反应器运行60d,收集数据共159组;

(2)将得到的元数据分为训练集p训练={x;y}和测试集p测试={x’;y’},此时数据集p={xx’;yy’}数据集(共计159组数据)分为训练集(共计118组数据)和测试集(共计41组数据),并做归一化处理:

式中,s(i)为数据集中的任一组数据;min(s)为数据集中,值最小的一组数据;max(s)为数据集中,值最大的一组数据;

(3)将训练集数据用于svm-regression模型建模,此时得到训练集的模型输出量y,根据模型输出量y与训练集实际值y的相对误差,将训练集分成两个训练集(相对误差低于50%为一类,高于或等于50%为另一类),即训练集①和训练集②,也即p训练1={x1;y1}和p训练2={x2;y2},并标记训练集①和训练集②的元数据标签分别为1和-1;

(4)根据分类的训练集①和训练集②,利用svm-classification模型将测试集分成两个对应的测试集,即测试集①和测试集②,也即p测试1={x’1;y’1}和p测试2={x’2;y’2},从而将元数据分为两组数据集,即数据集①和数据集②,也即p1={x1x’1;y1y’1}和p2={x2x’2;y2y’2};其中数据集①:训练集51组数据、测试集20组数据;数据集②:训练集67组数据、测试集21组数据;

(5)将得到的训练集①和训练集②分别利用svm-regression模型进行建模处理,并分别用对应的测试集①和测试集②验证模型的有效性,pso参数寻优过程见图2a至图2c,从图2a至图2c可知,分类之前模型经过127次迭代达到最佳适应度(图2a),分类之后,两个模型分别经过8次和10次迭代达到最佳适应度(见图2b及2c),由此可见将元数据集分类有效地加快了模型的训练速度;

整个软测量模型的建模流程如图3a和图3b所示,得到包含svm-classification模型和svm-regression模型的pso-svm的出水挥发性脂肪酸软测量模型;

(6)将训练并测试后的pso-svm的出水挥发性脂肪酸软测量模型嵌入工控机中,并利用工控机中的组态软件构建好人机交互界面;

(7)采用opc(oleforprocesscontrol)技术实现基于pso-svm的出水挥发性脂肪酸软测量模型与工控机的组态软件之间的数据交换,mcgs与matlab之间的数据交流流程见图4。安装mcgs组态软件及其高级开发包到正确路径,开启msgs的opc服务器,按照工程要求组态好人机交互界面。在组态软件中,定义好包括进水cod、出水ph、出水t、产气量及产气组分,反应器氧化还原电位和出水挥发性脂肪酸浓度的参量,供mcgs进行读写操作。启动matlab,在命令窗口中辅助变量命令opcregister(‘install’),用来安装由opcfoundation提供的一套可以在网络上浏览其他计算机并且能通信的核心组件。再辅助变量命令:a=opcda(‘localhost’,‘mcgs.opc.server’):connect(da),则mcgs与matlab建立连接。将训练好的pso-svm软测量模型嵌入工控机后,系统运行期间,计算机把收集到的水力进水cod,出水ph、t,产气量及产气组分,反应器氧化还原电位和出水挥发性脂肪酸的数据传递给软件,运行pso-svm软测量模型进行预测出水挥发性脂肪酸值,把软测量值返回到人机交互界面;

(8)不断重复步骤(7),从而实现厌氧废水处理系统出水挥发性脂肪酸的在线实时监测;

(9)将系统输出以报表形式展现,并给出表征系统的表征指标指数。

经系统分析运算后,实验实际值与系统运算分析值差异见图5a(svm-regression模型分类前)、图5b和图5c(svm-regression模型分类后),得到的仿真结果的表征指标指数如表1所示。

表1系统仿真结果

由图5a~图5c和表1可知,分类之前,模型的各性能指标(测试集)rmse为59.75,mape为42.97%,相关性r为85.25%;分类之后,数据集①及数据集集②的性能指标分别为:rmse为20.45、9.64,mape为12.11%、7.16%,相关性r为99.14%、99.59%。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1