一种污水来水与出水量建模方法与流程

文档序号:16151964发布日期:2018-12-05 17:51阅读:460来源:国知局

本发明属于城市排水领域,特别涉及一种污水来水与出水量建模方法。



背景技术:

在污水处理过程当中,因为污水的来水是随机的,而且污水的水质也时 有变化,存在很多的变化范围。因此,在将污水达标排放的前提下,简单地 根据污水处理工艺来建立污水的来水和出水量之间的关系模型,往往与实际 运行的数据之间存在很大偏差。而准确的污水来水与出水模型,对于污水处 理企业进行精准的污水处理控制,提高污水处理系统的效率,以及节能减排 和降低成本等方面,具有重大的指导意义。同时,准确的污水来水与出水模 型,对于环保监察部门动态地和实时地监测污水处理系统是否正常工作,提 供了一个客观的、直接的而又可信的监测指标。

因此,实践中亟须一种准确可靠的对污水来水和出水量进行建模的方法。



技术实现要素:

为了解决现有技术中存在的上述问题,本发明提供了一种污水来水与出 水量建模方法,包括:

1)获取出水口的日流量数据和入水口的日流量数据;

2)判断步骤1)获得的所述出水口的日流量数据和所述入水口的日流量 数据的时间序列平稳性;

如果所述出水口的日流量数据和所述入水口的日流量数据的时间序列平 稳,则进行如下步骤4);

如果所述出水口的日流量数据和所述入水口的日流量数据的时间序列不 平稳,则进行如下步骤3);

3)如果所述出水口的日流量数据和所述入水口的日流量数据的时间序列 不平稳,判断所述出水口的日流量数据和所述入水口的日流量数据是否符合 同阶单整,如果符合同阶单整,则进行如下步骤4),如果不符合同阶单整, 则结束;

4)如果所述出水口的日流量数据和所述入水口的日流量数据的时间序列 平稳,或者如果所述出水口的日流量数据和所述入水口的日流量数据符合同 阶单整,则对所述出水口的日流量数据和所述入水口的日流量数据进行拟合, 获得如下的线性回归公式:

y=ax+ε

上式中,y为所述出水口日流量数据,x为所述入水口日流量数据,ε为 回归残差序列,且0.9<a<1;

然后,分别将所述入水口的日流量数据代入所线性回归公式y=ax中计 算得到预测的出水口的日流量数据值,将该预测的出水口的日流量数据值减 去实际的所述出水口的日流量数据,获得线性回归对应的残差的序列ε;

如果是由所述出水口的日流量数据和所述入水口的日流量数据符合同阶 单整获得的线性回归公式,则判断回归残差序列ε的平稳性,如果回归残差 序列ε平稳,则进行如下步骤5),如果回归残差序列ε不平稳,则结束;

5)利用步骤4)获得的线性回归公式,将实际的某一个具体的出水口日 流量数据和与之对应的入水口日流量数据代入该线性回归公式中,计算得到 回归残差,判断该回归残差是否落在预测区间内,如果该回归残差没有落在 预测区间内,则输出异常警报,说明该具体的出水口日流量数据和与之对应 的入水口日流量数据存在异常;如果该回归残差落在预测区间内,则不输出 异常警报,判断为该具体的出水口日流量数据和与之对应的入水口日流量数 据正常。

优选地,基于出水口的流速的原始数据,统计汇总获得所述出水口的日 流量数据;

基于入水口的流速的原始数据,统计汇总获得所述入水口的日流量数据。

优选地,所述出水口的流速的原始数据和所述入水口的流速的原始数据 均为在一个自然日内,以30秒为单位统计的流速的平均值。

优选地,步骤2)中,采用ADF单位根检验的方法判断所述步骤1)获 得的所述出水口的日流量数据和所述入水口的日流量数据的时间序列平稳性;

优选地,所述ADF单位根检验过程为:假设所述出水口的日流量数据和 所述入水口的日流量数据的时间序列不平稳,在对应检验统计量下,对所述 检验统计量的分布进行蒙特卡洛模拟,得到检验量的概率分布,并计算该样 本条件下检验量取值的P值,作为不平稳条件下该实际情况出现的概率(P 值),如果P值小于0.05,则说明该假设发生的概率极小,即说明所述出水口 的日流量数据和所述入水口的日流量数据的时间序列平稳。

优选地,步骤3)中,判断所述出水口的日流量数据和所述入水口的日 流量数据是否符合同阶单整的方法为:

分别判断所述出水口的日流量数据和所述入水口的日流量数据从一阶差 分序列开始的多阶差分序列的平稳性;如果所述出水口的日流量数据的多阶 差分序列平稳的差分阶数与所述入水口的日流量数据的多阶差分序列平稳的 差分阶数相同,则说明所述出水口的日流量数据和所述入水口的日流量数据 符合同阶单整。

优选地,采用ADF单位根检验的方法分别判断所述出水口的日流量数 据和所述入水口的日流量数据从一阶差分序列开始的多阶差分序列的平稳性;

优选地,所述ADF单位根检验过程为:首先假设所述出水口的日流量数 据和所述入水口的日流量数据从一阶差分序列开始的一阶差分序列不平稳, 然后计算该假设发生的概率,如果概率小于0.01,则说明该假设发生的概率 极小,即说明所述出水口的日流量数据和所述入水口的日流量数据的一阶差 分序列平稳;同理,依次按照该方法判断所述出水口的日流量数据和所述入 水口的日流量数据的二阶差分序列、三阶差分序列、四阶差分序列等的平稳 性。

优选地,步骤4)中,采用ADF单位根检验的方法判断所述回归残差序 列ε的平稳性;

优选地,所述ADF单位根检验过程为:首先假设所述回归残差序列ε不 平稳,然后计算该假设发生的概率,如果所述概率小于0.01,则说明该假设 发生的概率极小,即说明所述回归残差序列ε平稳。

优选地,所述预测区间为所述回归残差序列ε的10%-75%分位数之间的 范围,优选为25%-65%分位数之间的范围。

优选地,将步骤5)中所述的具体的出水口日流量数据和与之对应的入 水口日流量数据代入步骤4)获得的线性回归公式中计算得到的残差加入所 述回归残差序列ε中,然后重新确定所述预测区间;再将下一个具体的出水 口日流量数据和与之对应的入水口日流量数据代入该线性回归公式中计算得 到残差,并判断该残差是否落入所述重新确定的预测区间内,如果该残差没 有落在所述重新确定的预测区间内,则输出异常警报,说明该下一个具体的 出水口日流量数据和与之对应的入水口日流量数据存在异常;如果该残差落 在重新确定的预测区间内,则不输出异常警报,判断为该下一个具体的出水 口日流量数据和与之对应的入水口日流量数据正常;按照所述操作方式不断 迭代,依次判断新的具体的出水口日流量数据和与之对应的入水口日流量数 据是否存在异常。

采用本发明提供的污水来水与出水量建模方法,可以建立准确的污水来 水与出水模型,对污水处理企业进行精准的污水处理控制,提高污水处理系 统的效率,以及节能减排和降低成本具有重大的指导意义;同时对环保监察 部门动态地和实时地监测污水处理系统是否正常工作,提供客观、直接又可 信的监测指标。

本发明的其他特征和优点将在如下的具体实施方式部分详细描述。

附图说明

构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本 发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限 定。

图1为本发明的优选实施例提供的污水来水与出水量建模方法的流程示 意图。

图2为本发明的实施例1的回归残差序列与按照时间(天)发生顺序排 列的观测数据的关系图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发 明的实施方式作进一步地详细描述。应当理解的是,此处所描述的具体实施 方式仅用于说明和解释本发明,并不用于限制本发明。

本发明提出了一种基于实际污水处理系统运行的监测数据进行数据分析, 从而建立污水来水与出水量模型的方法,即污水来水与出水量建模方法。

本发明的污水来水与出水量建模方法是将定时采样的监测数据视为时间 序列,利用时间序列的协整方法对污水来水和出水量的长期关系进行模拟, 从而建立有效的污水来水量和出水量的模型。具体的建模思路如下:

1、来水和出水流量的时间对应关系

考虑到来水和出水的监测采样的周期一般比较短,所以考虑对时间维度 进行调节,即,将时间粒度放大,将原来以“秒”级别统计的流量指标进行 统计汇总,从而形成以“天”级别统计的流量指标,从而转换为研究每天对 应的来水与出水的关系。

2、来水和出水流量的长期数量关系

为了研究来水和出水流量之间的数量关系,毫无疑问最直接的方法就是 进行回归,但是经典的回归涉及许多的假设,比如随时间变化,变量保持平 稳和均值、方差不变。但是实际情况中,时间序列往往不平稳,如果还是按 照一般线性回归的方法进行计算,极有可能出现伪回归的问题。

如果两组时间序列不平稳,但是两组时间序列之间的线性组合可以得到 一个平稳序列,那么称这两组时间序列协整,具有长期稳定的关系。随着时 间的变化,实际的关系跟模型预测的关系可能存在偏离,但是偏离很快会消 失,变量间关系又趋于平稳。因此,协整机制满足污水处理系统中对水平衡 的检测需求,所以采取该方法对来水和出水流量关系进行模拟。

3、来水和出水流量监测

利用协整的方法对来水和出水流量关系进行描述之后,接下来需要对实 际运作时的关系与预测得到的关系进行比对,对于偏离的情况及时给出预警。

具体来说,参考图1,本发明的污水来水与出水量建模方法包括如下步 骤:

1)获取出水口的流速的原始数据v1和入水口的流速的原始数据v2。

基于获取的出水口的流速的原始数据v1,统计汇总获得出水口的日流量 数据v1t。

基于获取的入水口的流速的原始数据v2,统计汇总获得入水口的日流量 数据v2t。

例如,在一种具体实施方式中,出水口的流速的原始数据v1和入水口的 流速的原始数据v2均为在一个自然日内,以30秒为单位统计的流速的平均 值,则出水口的日流量数据v1t为2880*v1,入水口的日流量数据v2t为2880*v2。

2)判断出水口的日流量数据v1t和入水口的日流量数据v2t的时间序列 平稳性。

其中,判断出水口的日流量数据v1t和入水口的日流量数据v2t的时间序 列的平稳性可以采用ADF单位根检验(Augmented Dickey–Fuller unit root test增广迪基-福勒单位根检验)的方法。具体的检验过程可以为:首先假设 出水口的日流量数据v1t和入水口的日流量数据v2t的时间序列不平稳,在对 应检验统计量下,对该检验统计量的分布进行蒙特卡洛模拟,得到检验量的 概率分布,并计算该样本条件下检验量取值的P值,作为不平稳条件下该实 际情况出现的概率(P值),如果P值小于0.05,则说明该假设发生的概率极 小,即说明出水口的日流量数据v1t和入水口的日流量数据v2t的时间序列平 稳。

其中,本发明中涉及的所有ADF单位根检验过程及P值计算方法为: (可以参考王艳编著的《应用时间序列分析》,中国人民大学出版社,2005年 7月第1版,第2章和第3章。)

1.将时间序列{x1,x2,…,xt}表示为:

2.令若时间序列{xt}平稳,等价于ρ<0

3.AR(p)过程单位根检验假设条件为,

H0:ρ=0(序列x0非平稳)

H0:ρ<0(序列x0平稳)

4.检验统计量为:

5.在原假设下,通过计算机蒙特卡洛模拟方法,得到检验统计量的概率 分布(即临界值表)

6.将检验统计量代入实际样本取值,计算P值:

如果出水口的日流量数据v1t和入水口的日流量数据v2t的时间序列平 稳,则进行如下步骤4);

如果出水口的日流量数据v1t和入水口的日流量数据v2t的时间序列不平 稳,则进行如下步骤3)。

3)如果出水口的日流量数据v1t和入水口的日流量数据v2t的时间序列 不平稳,则判断出水口的日流量数据v1t和入水口的日流量数据v2t是否符合 同阶单整,如果符合同阶单整,则进行如下步骤4),如果不符合同阶单整, 则结束。

其中,判断出水口的日流量数据v1t和入水口的日流量数据v2t是否符合 同阶单整的方法可以为:

分别判断出水口的日流量数据v1t和入水口的日流量数据v2t从一阶差分 序列开始的多阶差分序列的平稳性;如果出水口的日流量数据v1t的多阶差 分序列平稳的差分阶数与入水口的日流量数据v2t的多阶差分序列平稳的差 分阶数相同,则说明出水口的日流量数据v1t和入水口的日流量数据v2t符合 同阶单整;例如,如果出水口的日流量数据v1t的二阶差分序列平稳,同时入 水口的日流量数据v2t的二阶差分序列也平稳,则说明出水口的日流量数据 v1t和入水口的日流量数据v2t符合同阶单整。

其中,判断出水口的日流量数据v1t和入水口的日流量数据v2t从一阶差 分序列开始的多阶差分序列的平稳性可以采用ADF单位根检验的方法。

其中,一阶差分是离散函数中连续相邻两项之差;例如,如果定义X(k), 则Y(k)=X(k+1)-X(k)就是函数X(k)的一阶差分;同理,Y(k)的一阶差分为 Z(k)=Y(k+1)-Y(k)=X(k+2)-2*X(k+1)+X(k),Z(k)为函数X(k)的二阶差分;三阶 差分、四阶差分等等依次类推。与之相对应,一阶差分序列就是离散函数中 连续相邻两项之差形成的序列,即一阶差分形成的序列;同理,二阶差分序 列就是二阶差分形成的序列;三阶差分序列、四阶差分序列等等依次类推。

具体地,判断出水口的日流量数据v1t和入水口的日流量数据v2t从一阶 差分序列开始的多阶差分序列的平稳性的ADF单位根检验的方法可以为:

首先假设出水口的日流量数据v1t和入水口的日流量数据v2t从一阶差分 序列开始的一阶差分序列不平稳,然后计算该假设发生的概率(P值),如果 P值小于0.01,则说明该假设发生的概率极小,即说明出水口的日流量数据v1t和入水口的日流量数据v2t的一阶差分序列平稳。同理,依次按照该方法 判断出水口的日流量数据v1t和入水口的日流量数据v2t的二阶差分序列、三 阶差分序列、四阶差分序列等的平稳性。

4)如果出水口的日流量数据v1t和入水口的日流量数据v2t的时间序列 平稳(即,经过步骤2判断后认定出水口的日流量数据v1t和入水口的日流 量数据v2t的时间序列平稳),或者如果出水口的日流量数据v1t和入水口的 日流量数据v2t符合同阶单整(即,经过步骤3判断后认定出水口的日流量 数据v1t和入水口的日流量数据v2t符合同阶单整),则对出水口的日流量数 据v1t和入水口的日流量数据v2t进行拟合,获得如下的线性回归公式:

y=ax+ε

上式中,y为出水口日流量数据v1t,x为入水口日流量数据v2t,ε为回 归对应的残差的序列(回归残差序列),且0.9<a<1。

然后,分别将入水口的日流量数据v2t代入线性回归公式y=ax中计算得 到预测的出水口的日流量数据值,将该预测的出水口的日流量数据值减去实 际的出水口的日流量数据v1t,获得线性回归对应的残差的序列ε(简称“回 归残差序列”)。

如果是由出水口的日流量数据v1t和入水口的日流量数据v2t符合同阶单 整(即,经过步骤3判断后认定出水口的日流量数据v1t和入水口的日流量 数据v2t符合同阶单整),获得的上述线性回归公式,则还需要判断回归残差 序列ε的平稳性,如果回归残差序列ε平稳,则可以进行如下步骤5),如果 回归残差序列ε不平稳,则结束。

其中,判断回归残差序列ε的平稳性可以采用ADF单位根检验的方法。 具体地,可以首先假设回归残差序列ε不平稳,然后计算该假设发生的概率 (P值),如果P值小于0.01,则说明该假设发生的概率极小,即说明回归残 差序列ε平稳。其中,P值的具体计算方法如上所述,此处不再赘述。

5)利用步骤4)获得的线性回归公式,将实际的某一个具体的出水口日 流量数据和与之对应的入水口日流量数据代入该线性回归公式中,计算得到 回归残差,判断该回归残差是否落在预测区间内,如果该回归残差没有落在 预测区间内,则输出异常警报,说明该具体的出水口日流量数据和与之对应 的入水口日流量数据存在异常;如果该回归残差落在预测区间内,则不输出 异常警报,判断为该具体的出水口日流量数据和与之对应的入水口日流量数 据正常。

其中,预测区间为回归残差序列ε的10%-75%分位数之间的范围,优选 为25%-65%分位数之间的范围。其中,“分位数”是指对回归残差序列按照 从小到大的数值进行排序后,排在相应位置处的数值,例如,25%分位数是 指对回归残差序列按照从小到大的数值进行排序后,排在第25%位置处的就 是25%分位数,75%分位数是指对回归残差序列按照从小到大的数值进行排 序后,排在第75%位置处的就是75%分位数。

优选地,将上述具体的出水口日流量数据和与之对应的入水口日流量数 据代入上述线性回归公式中计算得到的残差加入回归残差序列ε中,然后重 新确定预测区间,再采用上述方式获得下一个具体的出水口日流量数据和与 之对应的入水口日流量数据代入该线性回归公式中计算得到的残差,并判断 该残差是否落入该重新确定的预测区间内,如果该残差没有落在重新确定的 预测区间内,则输出异常警报,说明该下一个具体的出水口日流量数据和与 之对应的入水口日流量数据存在异常;如果该残差落在重新确定的预测区间 内,则不输出异常警报,判断为该下一个具体的出水口日流量数据和与之对 应的入水口日流量数据正常。按照该操作方式不断迭代,依次判断新的具体 的出水口日流量数据和与之对应的入水口日流量数据是否存在异常。

由于本发明还可以将经过检测后的出水口的日流量数据和入水口的日流 量数据(即,利用上述方法判断后的出水口的日流量数据和入水口的日流量 数据)作为步骤4)中获取线性回归公式的出水口的日流量数据v1t和入水口 的日流量数据v2t,来进一步修正线性回归公式,依次不断迭代,从而不断提 高对最终的出水口的日流量数据和入水口的日流量数据的预测的准确性。

采用本发明的污水来水与出水量建模方法,可以建立准确的污水来水与 出水模型,对污水处理企业进行精准的污水处理控制,对提高污水处理系统 的效率,以及节能减排和降低成本具有重大的指导意义;同时还可以对环保 监察部门动态地和实时地监测污水处理系统是否正常工作,提供客观、直接 又可信的监测指标。

实施例1

本实施例用来说明本发明的污水来水与出水量建模方法。

1、数据来源与预处理

选取某水厂污水处理系统9月份出入水流量的数据进行研究,由于传感 器以30秒为间隔传回,所以出水口流速与入水口流速都分别有86400条观 测记录(每天有2880条观测记录),但是由于传感器存在干扰,其中不传数 的时间点数值被标志为0,假设出、入水口流速同时读数都为0的情况为受 干扰不传数情况,将数值用NA取代。接着按小时计算每小时的平均流量, 再按小时统计每天的出水口的流量总值和入水口的流量总值,进而分别得到 30天的出水口的日流量数据v1t和入水口的日流量数据v2t(如下表1,流量 的单位都为立方米)。

表1 9月份第1-20天的出、入水的日流量数据

2、判断出水口的日流量数据(v1t)和入水口的日流量数据(v2t)的时间 序列平稳性。

分别对出水口日流量数据和入水口日流量数据进行ADF单位根检验, 可以发现出水口日流量数据和入水口日流量数据检验的P值分别为0.5498与 0.4546,均大于0.05(具体计算方法参见说明书,此处不再赘述),因此,出 水口日流量数据和入水口日流量数据的时间序列不平稳,因此需要判断出水 口的日流量数据和入水口的日流量数据是否符合同阶单整。

分别对出水口日流量数据和入水口日流量数据从一阶差分起的多阶差分 序列分别进行ADF单位根检验,得到出水口日流量数据和入水口日流量数 据的一阶差分序列的P值均小于0.01(具体计算方法参见说明书,此处不再 赘述),说明出水口日流量数据和入水口日流量数据服从同阶单整。

3、建立线性回归方程

以出水口日流量数据为y变量,入水口日流量数据为x变量进行线性回 归,得到线性方程为:

y=0.97872x+ε

上式中,ε为回归对应的残差的序列。

对回归残差序列ε进行ADF单位根检验可以发现,P值小于0.01(具体 计算方法参见说明书,此处不再赘述),说明回归残差序列ε平稳(即,回归 误差平稳),出水口流量与入水口流量满足以上公式显示的长期均衡关系。

4、利用历史残差规定预测的残差范围

计算出残差的各分位数,并以出入水流量时间观察的先后顺序,对其计 算出的残差序列ε按照时间(天)进行图像展示(如图2所示),可以发现y- 0.97872x的均值为-1269立方米,中位数(对回归残差序列从小到大进行排 序,排在中间位置的就是中位数)为-314立方米,25%分位数(对回归残差 序列从小到大进行排序,排在第25%位置的就是25%分位数)为-3199.43立 方米,75%分位数(对回归残差序列从小到大进行排序,排在第75%位置的 就是75%分位数)为356.51立方米,数值主要集中在0的左边。

因此,在对发出警报的区间进行估计的时候,考虑采用历史残差的10% 分位数-3907.61(对回归残差序列从小到大进行排序,排在第10%位置的就 是10%分位数)与75%分位数356.52作为未来出入口水量关系,即y-0.97872x 的预测范围,同时在得出真实的残差后,又再一次更新分位数,不断迭代。 当实际残差范围超出预测的范围时,将会发出警报。

5、实践验证

分别将第21-30天的出水口日流量数据和与之对应的入水口日流量数据 代入y-0.97872x中,计算得到每日的残差,如果残差在-3907.61~356.52之外, 则发出警报,否则判断为正常。

表2 9月份第21-30天的出、入水的日流量数据

也可以将第21天的残差代入前面计算得到的回归残差序列ε中,然后 重新确定回归残差序列ε的10%-75%分位数之间的范围作为预测区间,再采 用上述方式获得第22天的出水口日流量数据和与之对应的入水口日流量数 据带入该线性回归公式中计算得到的残差,并判断该残差是否落入上述重新 确定的预测区间内,如果该残差没有落在重新确定的预测区间内,则输出异 常警报,说明第22天的出水口日流量数据和与之对应的入水口日流量数据 存在异常;如果该残差落在重新确定的预测区间内,则不输出异常警报,判 断为第22天的出水口日流量数据和与之对应的入水口日流量数据正常。按 照该操作方式不断迭代,依次判断第23-30天的出水口日流量数据和与之对 应的入水口日流量数据是否存在异常。

由技术常识可知,本发明可以通过其它的不脱离其精神实质或必要特征 的实施方案来实现。因此,上述公开的实施方案,就各方面而言,都只是举 例说明,并不是仅有的。所有在本发明范围内或在等同于本发明的范围内的 改变均被本发明包含。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1