基于最小二乘支持向量机模型的城市短期用水量预测方法

文档序号:8396212阅读:1461来源:国知局
基于最小二乘支持向量机模型的城市短期用水量预测方法
【技术领域】
[0001] 本发明涉及一种城市用水量预测方法,特别是涉及一种基于最小二乘支持向量机 模型的城市短期用水量预测方法。
【背景技术】
[0002] 随着城市化进程的加快,城市规模和人口数量不断增加,生产用水和居民生活用 水的需求越来越大。根据水利部的统计资料,中国660个城市中约有2/3已面临水资源危 机,预计到2030年,全国将会消耗水资源7500亿立方米,约占可用水资源总量的90%。同 时中国也面临着严重的水污染问题,中国地质调查局报告表示,全国90%的地下水资源受 到污染,其中60%污染严重。如何有效的指导并做好水资源开发、城市用水规划以及城市供 水系统的优化调度工作,已成为城市发展亟需解决的问题。城市用水量预测能够对未来一 段时间的用水量进行分析,如今在水资源规划、用水管理以及对供水系统进行科学调度等 方面发挥着越来越重要的指导作用。因此,研宄城市用水量预测技术和方法是实现水资源 可持续利用的重要工作。
[0003] 现阶段水量预测方法主要有时间序列、人工神经网络、回归分析、灰色模型、系统 动力学等方法。时间序列预测方法基于历史水量数据预测未来用水量,存在较为明显的滞 后性,且无法反映气象因素(温度、降水量等)的影响。当气象等因素的突然变化导致用水 量波动较大时,无法及时跟踪水量变化,导致预测效果较差。而人工神经网络存在以下不 足:1)有陷入局部极值的风险,导致训练误差较大;2)算法学习基于经验风险最小,使得算 法的训练误差最小,因而建立的网络模型泛化能力不强;3)网络的结构设计(例如隐含层 的层数和节点数的选择)依赖先验知识和经验。因此,在采用神经网络模型预测城市用水 量时误差较大。回归分析法是根据用水量与影响因素间的关系对应模型,通过分析影响因 素的变化来对用水量的变化情况进行预测,这些影响因素与用水量之间存在稳定的变化关 系,是较为宏观的影响,比如人口规模等。因此,该方法适用于长期预测。由于灰色模型对 数据量的要求不高,系统动力学方法分析过程复杂、工作量大,主要用于预测城市长期用水 量。
[0004] 本领域技术人员致力于提供一种城市短期用水量预测方法,能够需要满足以下几 点基本要求:(1)模型建立过程方便、易行;(2)能够反映气象因素(温度、降水量等)和节 假日对用水量的影响;(3)能够有效处理工程实际数据中数据缺失、数据异常等常见情况; (4) 预测方法精度高、泛化能力好,满足工程应用的要求。而现有预测技术和方法尚未能有 效地解决上述问题。

【发明内容】

[0005] 针对上述预测方法中存在的不足,本发明的目的是提供一种基于最小二乘支持向 量机模型的城市短期用水量预测方法,该方法简单易行,能同时反映用水量自身变化规律、 气象因素(温度、降水量等)和节假日等对用水量的影响,预测误差满足城市供水规划、水 资源开发利用、供水系统科学调度。
[0006] 支持向量机是一种小样本学习方法,实现了高效的从训练样本到预测样本的转导 推理,算法简单,且具有较好的"鲁棒性"。
[0007] 最小二乘支持向量机是支持向量机的扩展,目前已被广泛地推广至预测领域。 LS-SVM系统方法在解决小样本,高维模式识别等问题中有着独特的优势,具有较高的泛化 性能其将模型的训练过程归结为线性方程组求解问题,大大提高了训练的速度,LS-SVM的 正规化参数和核参数影响模型的预测精度和泛化能力,可以兼顾经验风险和置信范围,取 得模型复杂性和学习能力之间的平衡。
[0008] 本发明提供一种基于最小二乘支持向量机模型的城市短期用水量预测方法,包括 以下步骤:
[0009] (1)获取原始数据,原始数据包括历史用水量序列;
[0010] (2)对历史用水量序列进行预处理,以去除历史用水量序列中的异常数据;
[0011] (3)对预处理后的历史用水量序列进行相关性分析;
[0012] (4)采用最小二乘支持向量机方法,建立城市短期用水量预测模型,选取相关系数 大于设定值的一组历史用水量的时间序列组合作为训练样本集,对城市短期用水量预测模 型进行训练;
[0013] (5)采用城市短期用水量预测模型进行实时预测;
[0014] (6)计算预测误差,如果预测误差不满足预测精度要求,对城市短期用水量预测模 型进行改进。
[0015] 进一步地,步骤(1)获取原始数据包括以下步骤:
[0016] (11)获取一个城市供水管网中的一个支线在一个时间段内的历史用水量序列;
[0017] (12)获取时间段内每日的气象数据,包括最高气温和最低气温,计算最高气温与 最低气温的平均值作为日平均气温;
[0018] (13)从日历中判断时间段内每日是否为节假日,获得节假日因子。
[0019] 进一步地,步骤(2)对历史用水量序列进行预处理包括以下步骤:
[0020] (21)异常数据包括突变跳点数据,对历史用水量序列中的突变跳点数据进行处 理。
[0021] 进一步地,步骤(21)对历史用水量序列中的突变跳点数据进行处理包括以下步 骤:
[0022] (211)采用流量阈值约束处理突变跳点数据;
[0023] (212)采用相邻值变化率阈值约束处理突变跳点数据。
[0024] 进一步地,步骤(2)对历史用水量序列进行预处理还包括以下步骤:
[0025] (22)异常数据包括缺失数据,对历史用水量序列中的缺失数据进行处理。
[0026] 进一步地,步骤(22)对历史用水量序列中的缺失数据进行处理包括以下步骤:
[0027] (221)数据缺失率小于设定值,采用统计方法中的前后相邻填充方法进行缺失数 据填补;
[0028] (222)数据缺失率大于或等于设定值,采用关联规则算法的类均值填补算法进行 缺失数据填补,选取相关性最大的三个属性作为标准数据对缺失属性进行分组,然后用各 组的均值去填补相应的缺失数据。
[0029] 进一步地,步骤(4)选取相关系数大于设定值的一组历史用水量,其中设定值 为0. 75, 一组历史用水量包括预测时刻前lh、23h、24h、25h、48h、72h、96h、120h、144h以及 168h的用水量,h为小时。
[0030] 进一步地,原始数据还包括气象数据和/或节假日因子,步骤(4)中作为训练样本 集的时间序列组合还包括气象数据和/或节假日因子。
[0031] 作为训练样本集的时间序列组合还包括气象数据和/或节假日因子,能够综合反 映气象和/或节假日等因素对用水量的影响,从而提高城市短期用水量预测的精度。
[0032] 进一步地,气象数据为日平均温度。
[0033] 进一步地,步骤(6)对城市短期用水量预测模型进行改进为选择最小二乘支持向 量机中核参数〇和正规化参数Y,包括以下步骤:
[0034] (61)采用精英策略kbest,只有较优的粒子会影响其他粒子的位置及速度,加快 收敛速度;
[0035] (62)采用自适应的惯性权重策略,按照粒子与最优粒子的差距自适应地改变位置 及速度,提高搜索能力;
[0036] (63)引入历史最优信息,结合了 PS0的个体历史最优及群体历史最优提高算法的 搜索能力。
[0037] 与现有技术相比,本发明提供的基于最小二乘支持向量机模型的城市短期用水量 预测方法,具有以下有益效果:
[0038] (1)对历史用水量数据进行了充分的预处理(包括修正和填补处理),尽可能使得 用水量序列保持原有的变化规律;
[0039] (2)城市用水系统是一个多变量非线性的动态系统且无法建立精确模型。最小二 乘支持向量机方法对系统采取黑箱模拟的方式,能够实现对任意非线性函数的逼近,很好 地解决了供水系统非线性、无法建立精确模型等问题;且该方法建立在统计学习理论的VC 维理论和结构风险最小原理上,能够兼顾经验风险和置信范围,取得模型复杂性和学习能 力之间的平衡,具有更好的泛化能力;
[0040] (3)采用最小二乘支持向量机模型,输入变量包括历史用水量以及气象数据和/ 或节假日因子,能够综合反映用水量自身变化规律的作用以及气象和/或节假日等因素对 用水量的影响,从而提高城市短期用水量预测的精度。
【附图说明】
[0041] 图1是本发明的一个实施例的基于最小二乘支持向量机模型的城市短期用水量 预测方法的框图;
[0042] 图2是本发明针对高数据缺失率提出的类均值填补算法流程图;
[0043] 图3是本发明预测模型的数据样本流量趋势图;
[0044] 图4是本发明采用类均值填补算法进行缺失数据填补的效果图;
[0045] 图5是本发明城市短期水量预测模型的预测效果图。
【具体实施方式】
[0046] 以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以 充分地了解本发明的目的、特征和效果,但本发明的保护不仅限于此。
[0047] 本发明的一个实施例的基于最小二乘支持向量机模型的城市短期用水量预测方 法,包括以下步骤:
[0048] (1)获取原始数据,原始数据包括历史用水量序列;
[0049] (2)对历史用水量序列进行预处理,以去除历史用水量序列中的异常数据;
[0050] (3)对预处理后的历史用水量序列进行相关性分析;
[0051] (4)采用最小二乘支持向量机方法,建立城市短期用水量预测模型,选取相关系数 大于设定值的一组历史用水量的时间序列组合作为训练样本集,对城市短期用水量预测模 型进行训练;
[0052] (5)采用城市短期用水量预测模型进行实时预测;
[0053] (6)计算预测误差,如果预测误差不满足预测精度要求,对城市短期用水量预测模 型进行改进。
[0054] 步骤⑴获取原始数据包括以下步骤:
[0055] (11)获取一个城市供水管网中的一个支线在一个时间段内的历史用水量序列;
[0056] (12)获取时间段内每日的气象数据,包括最高气温和最低气温,计算最高气温与 最低气温的平均值作为日平均气温;
[0057] (13)从日历中判断时间段内每日是否为节假日,获得节假日因子。
[0058] 步骤(2)对历史用水量序列进行预处理包括以下步骤:
[0059] (21)异常数据包括突变跳点数据,对历史用水量序列中的突变跳点数据进行处 理。
[0060] 突变跳点数据是指:某时刻或时间段的用水量与前后相邻时刻或时间段用水量的 偏差值超过一定阈值,则认为该时刻或时间段用水量为异常数据。
[0061] 本实施例中,设定前后数据的偏差阈值0为平均用水量的10%,若超过这一阈 值,则采取数据修正或数据填补操作。
[00
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1