多流域实时智能水质预测方法及系统的制作方法

文档序号:6630200阅读:209来源:国知局
多流域实时智能水质预测方法及系统的制作方法
【专利摘要】本发明公开了多流域实时智能水质预测方法及系统,利用遗传算法对NARX模型进行优化处理,解决NARX模型前期参数不确定的问题;通过模型存储模块储存或调用GA-NARX模型,使其能实时预测多流域的水质情况;对基础数据、近期数据、历史应急数据进行三段式训练,使得优化后的GA-NARX模型能基本包含河流的污染特征,提升预测的准确性;本发明通过用天气数据代替水文数据,并进行模糊化处理,有效解决流量数据缺失对模型的影响。本发明通过改进后的DTW算法进行相似污染时间序列模板的匹配,迅速找到流域历史上相似的污染过程,借鉴学习其经验,能更精准地预测突发性应急事故。本发明可广泛应用于水质预测领域中。
【专利说明】多流域实时智能水质预测方法及系统

【技术领域】
[0001] 本发明涉及水质预测领域,尤其涉及一种多流域实时智能水质预测方法及系统。

【背景技术】
[0002] 水质预测是一项前沿性工作,被广泛用在在水环境规划、评价、管理和科研中。科 学合理的水质预测对水资源开发利用,实时了解河流水质的发展趋势,制订水环境监测和 保护实施计划都有重要意义。随着国家对水资源保护的重视以及长期的建设探索积累,地 表水自动监测网络逐渐完善,水质监测数据呈现"实时监测、指标多、网络化"等特点,为大 尺度多流域水质实时预测提供了重要的数据基础。
[0003] 目前,国内外对水质预测方法的研究已经推向实用化阶段,随着环境科学及人工 智能、数据挖掘等研究进一步深入以及相关学科、领域的不断发展,新的预测模式还在不断 出现。但由于手工建模工作量大、预测影响因素的复杂性和水文信息的缺乏等因素的影响, 使大尺度多流域的水质预测结果仍不能令人满意,主要体现在以下几方面: (1)水质预测方法可分为基于机理模型方法和非机理模型方法两大类。机理模型方法 主要是根据污染物在水中的扩散迁移规律建立数学模型,使用定量的方法来仿真污染物的 扩散趋势。非机理模型方法主要使用统计分析、机器学习等数据挖掘方法建立数学模型来 预测水质污染物变化趋势。机理模型建模复杂,参数率定复杂,所需要的基础资料与参数 (如环境参数、传输参数、边界参数、转化参数等)很多,为确定这些参数需要大量物力和财 力,因而不适宜在多个流域同时建立机理模型。
[0004] (2)随着现代统计学、数据挖掘、人工智能等技术的发展,非机理模型得到了广泛 的应用。本专利选神经网络中的NARX回归神经网络作为智能水质预测系统的模型,它是非 线性动态系统中应用最广泛的一种神经网络,非常适合复杂的、非平稳、非线性时间序列的 预测。
[0005] 典型的NARX回归神经网络在应用前一般要事先确定输入和输出的延时阶数、隐 层神经元个数等。由于它们的选取没有成熟的理论依据,只能由经验给出,因不确定因素太 多而影响了其应用。
[0006] 同时,NARX神经网络连接权值和阈值的整体分布决定着数据拟合的效果,但目前 网络的初始权值和阈值是随机产生的,缺乏选择依据。
[0007] (3)NARX模型适用于于确定性关系的学习,但当存在矛盾样本和含有非实可测因 素的样本时,预测精度将大打折扣。如突发性污染事故,由于训练样本是历史数据的平滑处 理,没有对突发因素的描述,所以无法对这类突发污染事故进行精确预测。
[0008] 由于环境部门水质监测多年的发展,积累了大量的监测数据。从历史曾发生的污 染事故中学习其变化规律,能使NARX模型更好地应对突发性污染事故的预测,但如何从数 据库中找到最相似的污染事件并从中学习是一个尚未解决的技术难题。
[0009] (4)水质监测数据和水文监测数据分别反映了水资源的质与量,互相结合才能更 好地反映水资源的规律和特性。由于目前环境保护部门和水利部门的数据尚未实现实时共 享,因此进行水质预测时没有水文数据的支持,影响了预测的精度。
[0010] 针对上述现有技术中的缺陷,本发明的目的在于提供一种改进的多流域实时水质 预测系统和方法,实现自动、高效、准确的多流域水质实时预测。


【发明内容】

[0011] 为了解决上述技术问题,本发明的目的是提供一种能实现自动、高效、准确的多流 域实时水质预测方法及系统。
[0012] 本发明所采用的技术方案是: 多流域实时智能水质预测方法,包括以下步骤: A、 提取外源天气数据库的天气数据,并对其进行模糊化处理,得到天气特征状态量; B、 对基础训练数据库中的水质监测数据进行标准化处理,得到标准数据; C、 将天气特征状态量和标准数据融合到输入训练集,并通过NARX模型和遗传算法优 化程序对输入训练集进行训练,得到优化后的GA-NARX模型,进而将其存入GA-NARX模型库 中; D、 获取各个点位的实时数据并对其进行污染检测,判断是否属于突然性应急事故,若 是,则通过改进的DTW方法查找流域污染特征库的最相似污染时间序列并进行训练; E、 根据各点位的实时数据及其对应的GA-NARX模型库中的模型,将最近时间段的数据 对模型进行训练,进而对该点位进行水质预测,得出预测结果。
[0013] 作为所述的多流域实时智能水质预测方法的进一步改进,所述步骤A包括: AU从外源天气数据库获取降雨量和温度值的数据; A2、根据年均降雨量和年均温度值,得到背景降雨量和背景温度值; A3、根据最近若干年的年最大降雨量和年最高温度值,计算得到影响上限降雨量和影 响上限温度值; A4、根据背景降雨量、背景温度值、影响上限降雨量和影响上限温度值,得出降雨量隶 属度函数和温度隶属度函数; A5、根据降雨量隶属度函数和温度隶属度函数,得到降雨量和温度模糊化处理后的天 气特征状态量。
[0014] 作为所述的多流域实时智能水质预测方法的进一步改进,所述步骤B中标准数据 的计算公式为:

【权利要求】
1. 多流域实时智能水质预测方法,其特征在于:包括以下步骤: A、 提取外源天气数据库的天气数据,并对其进行模糊化处理,得到天气特征状态量; B、 对基础训练数据库中的水质监测数据进行标准化处理,得到标准数据; C、 将天气特征状态量和标准数据融合到输入训练集,并通过NARX模型和遗传算法优 化程序对输入训练集进行训练,得到优化后的GA-NARX模型,进而将其存入GA-NARX模型库 中; D、 获取各个点位的实时数据并对其进行污染检测,判断是否属于突然性应急事故,若 是,则通过改进的DTW方法查找流域污染特征库的最相似污染时间序列并进行训练; E、 根据各点位的实时数据及其对应的GA-NARX模型库中的模型,将最近时间段的数据 对模型进行训练,进而对该点位进行水质预测,得出预测结果。
2. 根据权利要求1所述的多流域实时智能水质预测方法,其特征在于:所述步骤A包 括: A1、从外源天气数据库获取降雨量和温度值的数据; A2、根据年均降雨量和年均温度值,得到背景降雨量和背景温度值; A3、根据最近若干年的年最大降雨量和年最高温度值,计算得到影响上限降雨量和影 响上限温度值; A4、根据背景降雨量、背景温度值、影响上限降雨量和影响上限温度值,得出降雨量隶 属度函数和温度隶属度函数; A5、根据降雨量隶属度函数和温度隶属度函数,得到降雨量和温度模糊化处理后的天 气特征状态量。
3. 根据权利要求1所述的多流域实时智能水质预测方法,其特征在于:所述步骤B中 标准数据的计算公式为:
4. 根据权利要求1所述的多流域实时智能水质预测方法,其特征在于:所述步骤C包 括: C1、将天气特征状态量和标准数据融合到输入训练集; C2、根据输入训练集,通过遗传算法对NARX模型的网络结构和连接权进行优化,得到 能自动寻优运行的GA-NARX模型; C3、将GA-NARX模型存入GA-NARX模型库中。
5. 根据权利要求1所述的多流域实时智能水质预测方法,其特征在于:所述步骤D包 括: D1、检测各个点位的实时数据是否有更新,若是,则执行步骤D2 ; D2、获取各个点位更新的实时数据,并将其与对应点位所在水功能区的污染阈值进行 对比,判断该点位的实时数据是否超标,若是,则执行步骤D3 ;反之,则执行步骤E; D3、根据超标的实时数据,从流域污染特征库中搜索历史上最相似的污染时间序列模 式; D4、将搜索得到的污染时间序列模式提供至GA-NARX模型库中的模型进行训练。
6. 根据权利要求5所述的多流域实时智能水质预测方法,其特征在于:所述步骤D3包 括: D31、根据流域污染特征库,查找其时间长度最短的模板,并计算得到其标准时间长 度; D32、计算流域污染特征库中其余的模板的时间长度,并计算其与标准时间长度的比 例; D33、根据计算得到的比例,对相应的模板进行相应的时间压缩; D34、当实时数据的污染时间序列的时间长度超过预设的基准时间长度时,则对污染时 间序列起止点进行匹配,并通过DTW算法对其与优化后的流域污染特征库中的模板进行匹 配,得到最短路径距离的模板即为最相似的污染时间序列模式。
7. 根据权利要求6所述的多流域实时智能水质预测方法,其特征在于:所述步骤D34 中对污染时间序列起止点进行匹配,其具体为: D341、根据预设的超标值,对实时数据在超标前的若干个高值点计算其平均值,得到背 景能量值; D342、查找若干个高值点至超标值的时间范围里的第一个超过背景能量值的数据,得 到污染时间序列起始点; D343、判断时间序列中是否有连续预设个数的数据低于超标值,若是,则查找最后一个 超过超标值的数据,得到污染时间序列终点。
8. 多流域实时智能水质预测系统,其特征在于,包括: 天气数据模糊化模块,用于提取外源天气数据库的天气数据,并对其进行模糊化处理, 得到天气特征状态量; 基础训练数据处理模块,用于对基础训练数据库中的水质监测数据进行标准化处理, 得到标准数据; 模型寻优模块,用于将天气特征状态量和标准数据融合到输入训练集,并通过NARX模 型和遗传算法优化程序对输入训练集进行训练,得到优化后的GA-NARX模型,进而将其存 入GA-NARX模型库中; 实时数据检测模块,用于获取各个点位的实时数据并对其进行污染检测,判断是否属 于突然性应急事故,若是,则通过改进的DTW方法查找流域污染特征库的最相似污染时间 序列并进行训练; 结果预测模块,用于根据各点位的实时数据及其对应的GA-NARX模型库中的模型,将 最近时间段的数据对模型进行训练,进而对该点位进行水质预测,得出预测结果。
9. 根据权利要求8所述的多流域实时智能水质预测系统,其特征在于:所述模型寻优 模块包括: 数据融入模块,用于将天气特征状态量和标准数据融合到输入训练集; 模型优化模块,用于根据输入训练集,通过遗传算法对NARX模型的网络结构和连接权 进行优化,得到能自动寻优运行的GA-NARX模型; 模型存储模块,用于将GA-NARX模型存入GA-NARX模型库中。
10. 根据权利要求8所述的多流域实时智能水质预测系统,其特征在于:所述实时数据 检测模块包括: 数据更新检测模块,用于检测各个点位的实时数据是否有更新,若是,则执行数据超标 检测模块; 数据超标检测模块,用于获取各个点位更新的实时数据,并将其与对应点位所在水功 能区的污染阈值进行对比,判断该点位的实时数据是否超标,若是,则执行污染时间序列模 式匹配模块;反之,则执行结果预测模块; 污染时间序列模式匹配模块,用于根据超标的实时数据,从流域污染特征库中搜索历 史上最相似的污染时间序列模式; 污染时间序列模式训练模块,用于将搜索得到的污染时间序列模式提供至GA-NARX模 型库中的模型进行训练。
【文档编号】G06Q10/04GK104318325SQ201410543016
【公开日】2015年1月28日 申请日期:2014年10月14日 优先权日:2014年10月14日
【发明者】黎如昊, 郭庆荣, 王强, 陈斐 申请人:广东省环境监测中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1