一种生化需氧量参数在线软测量方法

文档序号:9489603阅读:476来源:国知局
一种生化需氧量参数在线软测量方法
【技术领域】
[0001] 本发明属于数据测量技术领域,涉及一种生化需氧量参数在线软测量方法。
【背景技术】
[0002] B0D是指污水出水指标之生化需氧量,在污水处理过程中,生化需氧量(B0D)是评 价水质好坏和处理效果的关键参数之一。由于其涉及很多复杂的生化反应过程,因此长期 以来B0D的测量都存在着很多问题,具体表现在:国际通用的标准检测方法测量滞后性较 大,快速检测方法测量成本过高且测量不准确。
[0003] 污水处理过程高度复杂,测量参数众多,现场测试的数据由于受测量仪表精度、可 靠性和现场测量环境等因素的影响,会带有各种各样的测量误差,若数据不经过进一步处 理,采集到的低精度或失效的数据会导致测量精度大幅度下降,甚至会直接导致污水处理 软测量模型的失效。同时,通常需要采集更多的参数数据信息以更好的反映污水处理过程 状态,但是过多的参数数据使得后续的模型非常复杂。因此,如何保证采集数据的有效性, 以及如何剔除冗余信息是B0D参数软测量首先要解决的关键技术问题。
[0004] 目前市场上的B0D检测仪表采用的主要是测压差法和生物传感器法为原理制作 的。例如美国哈希BODTrakTMlI分析仪,德国LovibondB0D分析仪等,采用的是测压差法; 日本CKC公司的α1000型B0D测量仪采用的是生物传感器方法制作的。采用压差法的测 量仪器测量时间过长,需要5天,远远无法满足污水处理过程实时控制的需要;采用生物传 感器法的B0D测量仪器存在着仪器生物传感器制作困难,测量范围较窄,相关的膜材料容 易损坏从而导致仪器的使用寿命不足,使用成本过高,因而也无法广泛应用。

【发明内容】

[0005] 本发明的目的在于提供一种生化需氧量参数在线软测量方法,解决了现有的测量 方法时间长,成本高的问题。
[0006] 本发明所采用的技术方案是按照以下步骤进行:
[0007] 步骤1 :样本数据预处理,得到有效样本数据;
[0008] (1)样本数据归一化处理,使得样本数据处于[-1,1]之间;
[0009] (2)利用主元分析解耦和降维;
[0010] (3)利用Jolliffe参数剔除和主体数据不相符的离群点,以提高数据的可靠性;
[0011] (4)利用中值滤波器去除数据生成和采集过程中的噪声干扰;
[0012] 步骤2 :局部线性回归预测模型的建立及其训练;
[0013] (1)确定局部线性回归模型;
[0014] ⑵权值初始化;
[0015] (3)模型输出预测,给定一个新的数据输入点,计算K个线性输入模型并得到预测 值;
[0016] (4)模型训练,利用代价函数通过梯度下降法来调整半正定距离矩阵D得到权值;
[0017] (5)如果代价函数不满足要求,则调整矩阵D进而修改权值,回到第(3)步,直至代 价函数满足要求,则模型训练结束,权值确定;
[0018] 步骤3 :B0D参数在线软测量输出;将有效样本数据通过训练好的局部线性回归预 测模型进行在线B0D参数软测量。
[0019] 进一步,所述在线B0D参数软测量中,对实时检测到的辅助变量进行预处理,包括 如归一化、主元分析、判断是否为离群点、噪声滤波。
[0020] 进一步,所述步骤2中,权值初始化,权值wjlj用高斯核得到:
[0021]Wi=exp(_0·5 (X「xc)TD(x「xc)),W=diag{w!,…,wM}
[0022] 其中D为半正定距离矩阵,它决定了数据点x。附近数据集的大小和形状;
[0023] 模型输出预测,给定一个新的数据输入点,计算K个线性输入模型并得到预测值 &5总的输出则是根据权值进行线性平均:
[0025] 模型训练,利用式(8)所示的代价函数通过梯度下降法来调整矩阵D从而学习得 到权值;
[0027] 其中Μ是数据集合中数据点的个数,参数γ通过经验试凑的方式获得。
[0028] 本发明的有益效果是可以实现在线预测,而且只需检测一些容易测量的辅助变 量,成本较低。
【附图说明】
[0029] 图1是数据预处理流程图;
[0030] 图2是模型训练流程图;
[0031] 图3是活性污泥污水处理流程;
[0032] 图4是基于Jolliffe参数的测试数据的离群点检测;
[0033] 图5是LWPR算法预测效果图。
【具体实施方式】
[0034] 下面结合【具体实施方式】对本发明进行详细说明。
[0035] 步骤1 :样本数据预处理;
[0036] 如图1所示,样本数据预处理的具体步骤为:
[0037] (1)样本数据归一化处理,使得样本数据处于[-1,1]之间。
[0038] (2)利用主元分析(PCA)解耦和降维。例如给定一组Μ个已经中心化的观测值, 其标准方差为σ,同时每个变量Xk都是m维数据,x(k) = (xk(l); : : : ;xk(m))其中m <Μ。主元分析将变量xk映射成另外一个变量tk:
[0039]tk=pTxk (1)
[0040] 其中P是mXm的正交矩阵,它的第1列\是协方差矩阵c的第i个特征向量。 换句话说PCA必须先解决特征值问题:
[0041] 入;\^=(^;,1 = 1,··.,!]! (2)
[0042] 其中λ1是C的第i个特征值,vi则是与这个特征值相关的特征向量。基于v^口 Xk的正交变换可以得到主元tk,如以下公式所示:
[0044] 经过PCA变换,前几个特征向量根据特征值降序的方式排列出来。以此获得比较 重要的特征值、特征向量和主元,而忽视无关紧要的变量。以此同时,原始数据间的耦合性 也得到了消除。
[0045] (3)利用Jolliffe参数剔除和主体数据不相符的离群点,以提高数据的可靠性。
[0047] 其中tlk是第k个主元的第i个观测值,Μ变量的个数,即是属性个数,q代表了小 方差主元的个数(例如方差< 1),R代表大方差主元个数,σ是第k个主元的标准差,统计 量1和d2l主要用于检测偏离主体结构的数据,而d3l用于检测剧烈影响主体结构方差的数 据,设置4、d2l和d3l的阈值即可剔除离群点。
[0048] (4)利用中值滤波器去除数据生成和采集过程中的噪声干扰。
[0049] 本发明对样本数据预处理目的是为了得到干净有效的数据,它是建立软测量输出 模型的一个必要环节,其主要作用有:①利用主元分析(PCA)解耦和降低样本数据以获得 重要的主元即后续模型的输入辅助变量,忽略无关精要的辅助变量,从而减少数据维数,减 小模型处理的复杂度;②剔除和主体数据不相符的离群点,以提高数据的可靠性,离群点主 要来源于仪表的故障或者维护,它的存在极易导致后续建模的偏离甚至失败;③滤波去除 数据生成和采集过程中的噪声干扰,噪声干扰主要由于仪表本身问题以及周围环境对仪表 和传感器的干扰和影响而产生的,它恶化了数据的质量,甚至淹没了目标特征,给后续分析 处理带来了困难。经过预处理后的数据可靠性得到了明显提升。
[0050] 步骤2 :局部线性回归预测模型的建立及其训练;
[0051] (1)局部线性回归(LWPR)模型的确定。LWPR算法考虑的仍然是标准的回归模型:
[0052] y=f(x) +e (5)
[0053] 其中,x表示d维的输入数据,y表示标准化的输出,同时e是〇均值随机噪声
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1