一种厌氧废水处理系统出水挥发性脂肪酸的软测量方法_2

文档序号:9327037阅读:来源:国知局
化处理得到标准化矩阵Z ^xn,然后 建立标准化矩阵的协方差矩阵Rnxn,求出相关系数矩阵的η个特征值并按从大到小降序排 列,计算第j个的主元贡献率fVj,所述步骤主元贡献率fVj的计算公式为:
[0024] 式中λ ,为相关系数矩阵R的特征值选取累计贡献率p大于85%的k个主元作 为新的辅助变量数据样本,所述步骤主元贡献率P的计算公式为:
[0026] 式中λ为相关系数矩阵R的特征值,j,k < η。具体说来如下:
[0027] (3. 1)首先通过公式⑵计算Xnixn的均值和方差,然后利用公式(3)计算对Xnixn 进行零均值标准化处理得到标准化矩阵Znixn:
[0030] (3. 2)利用公式⑷和(5)求标准化矩阵Znixn的协方差矩阵R ηΧη:
[0033] (3.3)根据公式(6)解出R的η个特征值\(j = 1,2,…,η),并按从大到小的 顺序排列,λ λ 2彡…彡λ 〇,根据公式(7)解相应特征值的单位特征向量b (j =
[0034] IR- λ 占 I = 0 (6)
[0035] Rb = λ jb (7)
[0036] (3.4)按公式(8)计算累计方差贡献率,确定主成分个数k,累计方差贡献率 多85%的前k个主成分包含了绝大部分信息,后面的其他成分可以舍弃:
[0037]
[0038] (3. 5)利用公式(9)将标准化矩阵Z在k维上投影,组成k个主元的新的数据样本 矩阵U,U1称为第一主成分,U 2称为第二主成分…U k称为第k主成分,这样原始样本实现了 从η维将到k维:
[0039] UiJ= Z Jbj, i = 1,2,…m,j = 1,2,…k (9)
[0040] (3. 6)将主元成分分析后的新的样本分为训练样本和测试样本,以备后续使用
[0041] 所述步骤⑷中运用训练样本建立并训练基于最小二乘支持向量机的软测量模 型,支持向量机(Support Vector Machine,SVM)是在统计学习理论的VC维理论和结构风 险最小原理之上发展而来的一种新的智能算法,是由Vapnik等人首先提出来,其基本思想 就是引入核函数的概念,将低维空间不可分的问题通过核函数映射到高维空间线性可分, 在高维空间做分类或者回归处理,SVM它在解决小样本、非线性建模及高维模式识别中有许 多特有的优势。最小二乘支持向量机(Least Square Support Vector Machine,LSSVM)在 2001年由Suykens JAK提出,是标准SVM的扩展,采用最小二乘线性系统作为损失函数,将 不等式约束条件转为等式约束,大大简化算法的复杂程度。
[0042] 对于给定样本集DlXxi, y;),i = 1,2,…,1},其中XiG 1^为η维辅助变量向量, yie R为目标主导变量数据,LS-SVM可描述为如下优化问题:
(10)
[0044] 其中ξ i为第i个样本点的训练误差,&=1行为经验风险,&ω|!2用以衡量机器学 习的复杂性,γ >〇为惩罚因子又称正则化参数,用以在训练中平衡机器学习的复杂性和经 验风险,公式(10)满足约束条件:
[0045] Yi= ω ΤΦ (Xi)+b+ ξ = I, 2, ···, I (11)
[0046] 引入 Lagrange 函数:
[0048] 式中α ;是Lagrange乘子,利用Karush-Kuhn-Tucker's (KKT)最优化条件对上式 进行优化,对ω,b,ξ,α求偏导可得:
[0052]式中 Κ(χ〇 xj = Φ (χ;)τΦ Uj), i, j = 1,2,…,1,定义 Ω u = K(x i, Xj)为核函数, 常用的核函数有线性核函数、多项式核函数、径向基核函数(RBF)和Sigmoid核函数。本发 明以采用径向基核函数RBF为例建立软测量模型,该核函数形式为:
[0054]式中。为核宽度,令 Ω = (QijIi, j = 1,2,…,1},I = [1,1,...,1]τ,α =
[a D α 2, ···,a JT,y = [yi, y2···,yi]T,则上式可以化简为:
(16)
[0056] 利用最小二乘法解上述线性方程组可求得α与b的估计,则估计所得的软测量模 型为:
[0058] 式中X为辅助变量样本数据,a i为拉格朗日乘子,b为偏移量,K(X,X J为核函数。
[0059] 所述步骤⑷中在利用LS-SVM建模时,合适的核函数、核参数〇 2和正则化参数 γ对模型的性能起着决定性作用。由于厌氧消化过程为非线性复杂系统,我们选取径向基 函数RBF作为的核函数并采用网格搜索法确定核参数 〇2和正则化参数γ最优范围,然 后用交叉验证法最终选出核参数σ 2和正则化参数γ最优值。
[0060] 所述步骤(5)中运用步骤(3)划分的测试数据对建立并训练好的LS-SVM软测量 模型进行测试,评估其预测性能。预测性能指标包括以下几个:
[0061] (1)绝对误差(Absolute Error,AE)
[0062] AE = YtuIi, i = 1,2,…m (18)
[0063] 式中yPii最小二乘支持向量机的预测值,y i表示真实值,AE表示所获的结果减去 被测量的真值,它有大小和符号,表示测量结果偏离真值的程度。
[0064] (2)相对误差(Relative Error,RE)
[0066] RE表示相对误差值与被测量值的真实值之比,相对误差更能反映预测的可靠程 度。
[0067] (3)平均绝对百分比误差(Mean Absolute Percent Error,MAPE)
[0069] MPE是所有相对误差的绝对值求和的平均值,能更好的反映预测值的实际情况。
[0070] (4)均方根误差(Root Mean Square Error,RMSE)
[0072] RMSE主要是为了说明样本的离散程度。RMSE的值越小,说明预测模型描述实验数 据具有更好的精确程度,反之,模型预测精度较差。
[0073] (5)相关系数(correlation coefficient,R)
[0074] (22)
[0075] 式中f为实际值均值,斤为预测值均值,m为样本数目,R反映了预测值与实际值 线性关系的强弱,R越接近于1则预测值与实际值越接近。
[0076] 软测量模型建立并测试以后把训练好的最小二乘支持向量机模型嵌入至工控机 组态软件MCGS中,采用OPC技术实现挥发性脂肪酸最小二乘支持向量机软测量模型与组态 软件之间的数据交换,将组态软件MCGS收集好的数据输送至出水VFA最小二乘支持向量机 软测量模型,计算出出水VFA的预测值,再把该值返回至工控机人机交互界面,不断重复上 述步骤,从而实现厌氧废水处理系统出水VFA的在线实时监测。
[0077] 所述步骤(4)所述最小二乘支持向量机软测量模型为:
[0079] 式中X为辅助变量样本数据,a i为拉格朗日乘子,b为偏移量,K(X,X J为核函数。
[0080] 所述步骤(5)对应步骤(3)划分的测试样本,测试步骤(4)建立的最小二乘支持 向量机模型性能指标包括误差(ERR)、相对误差(RE)、平均绝对百分比误差(MPE)、均方根 误差(RMSE)和相关系数R。
[0081] 综上所述,建立的基于PCA-LSSVM的厌氧废水处理系统出水挥发性脂肪酸软测量 模型理论正确,对厌氧出水挥发性脂肪酸预测值与真实数据符合得较好,误差相对也较小, 完全满足实际应用,本发明相对于现有技术具有如下优点和有益效果:
[0082] (1)本发明将主成分分析与最小二乘支持向量机相结合建立PCA-LSSVM软测量模 型,PCA技术可以避免由于靠经验选择辅助变量变量而错失重要信息,同时可以降低辅助变 量变量维数降低模型复杂度。
[0083] (2)对出水挥发性脂肪酸的软测量可以解决测量设备时间滞后长的问题,真正实 现对废水出水水质全面实时的监测,防止突发污染事故,同时可以用于反馈控制实现厌氧 废水处理系统的优化控制。
[0084] (3)本发明可以用于代替部分价格昂贵的测量设备,节省维护费用,降低废水处 理成本,容易在废水处理工程推广应用,具有很好的社会效益和经济效益。
【附图说明】
[0085] 图1为基于PCA-LSSVM挥发性脂肪酸软测量模型设计流程图。
[0086] 图2为主成分分析主成分累计方差贡献率的Pareto图。
[0087] 图3主成分分析的荷载图(biplot)。
[0088] 图4 VFA训练数据和测试数据真实值与预测值的对比图
[0089] 图5软测量模型预测误差曲线 [0090] 图6软测量模型相对误差曲线。
[0091] 图7软测量模型验证相关系数图。
[0092] 图8 MCGS与MATLAB之间的数据交换流程
【具体实施方式】
[0093] 以下结合具体的实施例及其附图,对本发明做进一步的阐述。实施例仅用于对本 发明做说明而不是对本发明的限制。需指出的是,以下若有未特别详细说明之过程或符号 (如省略号)均是本领域技术人员可参照现有技术理解或实现的。
[0094] -种基于主成分分析-最小二乘支持向量机的厌氧废水处理系统出挥
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1