基于偏差控制机制的Mapreduce化两步法短期负荷预测方法

文档序号:9550305阅读:410来源:国知局
基于偏差控制机制的Mapreduce化两步法短期负荷预测方法
【技术领域】
[0001] 本发明涉及发一种基于大数据的电力负荷预测方法,特别是基于偏差控制机制的 负荷预测方法。
【背景技术】
[0002] 时间序列模型是被认为最经典、最系统、最被广泛采用的一类短期负荷预测方法, 但其有以下缺点:①在电网正常运行、气候等因素变化不大时的预测比较准确,但在随机性 因素变化较大或存在坏数据时,预测结果则不太理想;②不能很好处理其他影响负荷预测 的因素;③在每日的负荷丰谷转折点预测精度差。
[0003] 而一个好的负荷预测方法应满足:①能处理实时气象因素;②根据预测的偏差不 断调整模型的结构与参数,构成了一个闭环反馈。因此应该充分利用时间序列模型预测得 到的相对误差值进行考虑实时气象因素的二次负荷预测,实现对负荷预测偏差的控制。

【发明内容】

[0004] 本发明的目的是提供一种实现偏差控制的两步法短期负荷预测算法,以解决传统 时间序列预测算法在每日的负荷丰谷转折点预测精度差,无法实时处理气象因素、有效利 用模型预测偏差,导致的负荷预测精度低的问题。
[0005] 本发明为解决上述技术问题而提供一种基于偏差控制机制的Mapreduce化两步 法短期负荷预测方法,第一步采用自回归滑动平均模型Autoregressive Moving-Average Model (ARMA)法,不考虑负荷的影响因素,得到预测相对误差;第二步采用支持向量机 Support Vector Machine (SVM)法,考虑第一步的预测相对误差、实时待预测点气温的影响 来进行二次负荷预测,在第一步的预测基础上修正预测值,实现对负荷的实时预测。具体步 骤如下:
[0006] 步骤1、配置Linux运行环境,搭建分布式集群Hadoop平台,配置分布式文件系统 HDFS、并行运算Mapreduce;
[0007] 步骤2、数据采集:从待预测地区供电公司的EMS系统中采集历史负荷数据,从气 象局的数据库中采集历史温度数据,两种数据的样本总数均为M,每天的采样频率均为f, 且采样时刻相同;
[0008] 步骤3、数据预处理:对历史负荷数据、历史温度数据进行归一化处理,将历史负 荷数据划分为负荷训练集:W= {1J,r= 1,2,…Q,以及负荷测试集:Lu= {lu},u= 1,2,… S,其中L与1u为历史负荷数据样本,Q+S=Μ;将历史温度数据划分为温度训练集:?\ = {tj,r= 1,2,…Q,以及温度测试集:Tu={tu},u= 1,2,…S,其中tr与tu为历史温度数 据样本,Q+S=Μ;历史负荷数据和历史温度数据的划分方法相同。
[0009] 步骤4、将自回归滑动平均模型ARMA法Mapreduce化,进行一次负荷预测,具体步 骤如下:
[0010] 4A.负荷训练集分割:确定并行ARMA的数目为N,修改HDFS的配置文件,使得负荷 训练集分割为N个历史负荷数据子集,上传至HDFS文件系统;
[0011] 4B.设计Map函数:采用ARMA法得到模型参数,并作为value值输出;
[0012] 4C.设计Reduce函数:将N个Map任务得到的ARMA模型参数进行平均,得到最终 ARMA模型,对所有的历史负荷进行预测,并按照下式计算相对误差Ei,同时存入HDFS文件 系统:
[0013]
[0014] 其中屯为采用ARMA法得到的待预测负荷的预测相对误差,1F1为采用ARMA法进 行负荷预测得到的负荷预测结果,lRS负荷实际值;
[0015] 步骤5、数据整理:综合训练集4=(Etp1上r= 1,2,…Q,综合测试集:xu= (Elu,tu,lu),u= 1,2,…S,其中lr、1,代表步骤3中历史负荷值,Elr、Elu代表由步骤4得到 的乜对应的相对误差值,t^tu代表U、lu点对应的步骤3中历史温度值;
[0016] 步骤6、将SVM法Mapreduce化,进行二次负荷预测,具体步骤如下:
[0017] 6A.综合训练集分割:确定并行SVM的数目为N,修改HDFS的配置文件,使得综合 训练集数据分割为N个综合子训练集,上传至HDFS文件系统;
[0018] 6B.设计Map函数:选择径向基作为核函数,选定核函数参数与惩罚因子,对综合 子训练集进行SVM模型训练,得到子支持向量,并将其作为Map函数的value输出;
[0019] 6C.设计Reduce函数:汇集N个Map函数输出的子支持向量得到总支持向量集, 再对总支持向量集进行SVM训练,得到最优拉格朗日乘子a*以及最优阈值b%建立进行 负荷预测的SVM回归函数:
[0020]
[0021] 式中,χ^=(XXmy上r= 1, 2, 为训练样本,xu为待预测点的特征值向量;
[0022] 利用SVM回归函数进行负荷预测得到预测结果LFl2,并按照下式计算相对误差:
[0023]
[0024] 其中:E2为采用SVM法得到的待预测负荷的预测相对误差,LF2采用SVM法得到的 为负荷预测值,1RS负荷实际值;将SVM法得到的二次负荷预测结果与相对误差结果存入 HDFS文件系统。
[0025] 与传统技术相比,本发明的有益效果是:
[0026] 传统时间序列预测方法应用于负荷预测时,无法有效考虑影响负荷预测精度的因 素,同时其在每日的负荷丰谷转折点预测精度差,而且现有其他负荷预测方法都没有考虑 充分利用预测误差值,本发明以时间序列预测法的预测误差值与以待预测点的预测温度作 为二次负荷预测SVM法的输入特征,消除了时间序列预测方法在每日的负荷丰谷转折点预 测精度差的问题,同时利用实时温度数据,在Hadoop平台上并行化运行预测方法,在保证 预测速度和预测精度的基础上实现短期实时负荷预测。
【附图说明】
[0027] 图1是本发明基于偏差控制机制的Mapreduce化两步法短期负荷预测方法的流程 图。
[0028] 图2是第一步Mapreduce化的ARMA负荷预测流程图。
[0029] 图3是第二步Mapreduce化的SVM负荷预测流程图。
【具体实施方式】
[0030] 为使本发明更明显易懂,配合附图作详细说明如下,
[0031] -种基于偏差控制机制的Mapreduce化两步法短期负荷预测方法,具体步骤包 括:
[0032] 步骤1、配置Linux运行环境,搭建分布式集群Hadoop平台,配置分布式文件系统 HDFS、并行运算Mapreduce ;
[0033] 步骤2、数据采集:从待预测地区供电公司的EMS系统、气象局的数据库中采集历 史负荷数据、历史温度数据,两种数据的样本总数均为M,每天的采样频率均为f,且采样时 刻相同;
[0034] 步骤3、数据预处理:对历史负荷数据、历史温度数据进行归一化处理,将历史负 荷数据划分为负荷训练集:W= {1J,r= 1,2,…Q,以及负荷测试集:Lu= {lu},u= 1,2,… S,其中L与1u为历史负荷数据样本,Q+S=Μ;将历史温度数据划分为温度训练集:?\ = {tj,r= 1,2,…Q,以及温度测试集:Tu={tu},u= 1,2,…S,其中tr与tu为历史温度数 据样本,Q+S=Μ;历史负荷数据和历史温度数据的划分方法相同。
[0035] 步骤4、采用自回归滑动平均模型ARMA法进行负荷预测,具体步骤如下:
[0036] 4Α.负荷训练集分割:确定并行ARMA的数目为Ν,修改HDFS的配置文件,使得负荷 训练集分割为N个历史负荷数据子集,上传至HDFS文件系统;
[0037]4B.设计Map函数:采用传统ARMA法得到模型参数,并作为value值输出:
[0038]Stepl:对采集的历史负荷数据进行平稳性检验,采用非参数检验法:将电力负 荷数据作散点图,当日该时刻的电力负荷数据大于这段时期该时刻平均电力负荷时用 +1表示,当日该时刻的电力负荷数据小于这段时期该时刻平均电力负荷时用-1表示, γ表示游程数(正负交错数),N表示+1出现次数,Μ表示-1出现次数,则统计量为:
η=Ν+Μ。取显著水平α= 〇· 05,当|Ζ|彡L96 时历史负荷数据为平稳随机序列,否则为非平稳随机序列。
[0039]Step2:若电力负荷序列为非平稳序列,则对该负荷序列进行预处理:平稳化处 理、零化处理;
[0040] 平稳化处理:对负荷数据进行差分处理,一阶差分:AXt=xt-xti,然后按照St印1 判断经处理后序列的平稳性,若不是平稳序列则继续进行差分,直到成为平稳序列。
[0041] 零化处理:当负荷数据序列{xt},t= 1,2, "·Ν的均值非零时,构造零均值序列:yt =xt_Ext,其中 =
[0042]St印3:模型结构辨识:
[0043] ①计算由Step2得到的平稳、零均值的随机序列{yj,t= 1,2,…N的自相关函 数:
[0044]
[0045] L=K.T±
[0046] ②计算偏自相关函数:
[
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1