基于气象相似日及误差校正的短期负荷预测方法与流程

文档序号:11134953阅读:544来源:国知局
基于气象相似日及误差校正的短期负荷预测方法与制造工艺

本发明涉及电力系统调度、运行和规划领域,特别涉及一种基于气象相似日及误差校正的短期负荷预测方法。



背景技术:

般短期负荷预测已成为电力系统调度、运行和规划中的重要组成部分。在我国电力行业走向市场化的趋势下,负荷预测的结果更加成为了电力企业制定生产营销计划、提高经济效益的关键。电力系统的负荷有其自身固有的周期性规律,同时也受到诸多因素的影响,如气候条件、经济发展水平、能源供应方式等。由于各地区之间负荷特性的差异,针对不同地区的负荷预测工作都应该结合当地的实际情况,在负荷特性分析的基础上考虑负荷的影响因素,再选用合适的方法进行预测,以提高预测精度。

气象因素是造成电力短期负荷变化的重要原因之一,气象条件的多变性给电力系统负荷预测工作造成了不小的困扰。目前已有许多文献研究了气象因素的分析处理方法,并基于此开展负荷预测工作。气象因素的处理思路多种多样,概括起来主要有两种:一是从负荷特性的角度入手,采用分解负荷或分层建模的思路。比如将负荷序列分解为基频、低频和高频分量,在低、高频负荷分量预测中引入实时气象因素并采用多种模型;比如根据负荷受气象因素影响程度的不同,采用小波变换将日负荷分解为两部分,分别采用回归神经网络预测模型和线性时间序列ARMA预测模型,提高了预测精度和建模效率;比如同样是将总负荷分解为基础负荷和气象敏感负荷,采用灰色系统模型与多层前馈神经网络模型分别对两种负荷进行预测。第二种处理思路是从预测算法与模型入手,利用算法的有效性将日特征气象因素的影响考虑在内,比如一种基于数据挖掘预处理的支持向量机预测方法,利用数据挖掘技术从气象角度选择相似日,从而精简和优化预测模型的训练数据,以达到更好的预测效果比如通过分析气象因素与电网负荷的对应关系,给出了经验性的修正模型库的建立方法,并对温度、湿度、气压等因素建立修正模型,测试表明该预测模型具有较好的预测精度。

但是基于上述理论,气象条件的多变性还是给电力系统负荷预测工作造成了不小的困扰,气象条件与预测误差数值特性间的内在联系也并未揭露,现有技术中也并未披露影响负荷变化的主要气象因素与负荷之间的联系,这些给电力工作者造成了困扰。



技术实现要素:

本发明所要解决的技术问题是提供一种基于气象相似日及误差校正的短期负荷预测方法,其区别于上述两种主流思路,引入了误差校正的思想,建立历史预测误差数据集,利用统计方法分析气象条件与预测误差数值特性间的内在联系,从而依据气象条件对预测误差进行拟合,以达到对短期负荷进行预测的目的。

为解决上述技术问题,本发明所采取的技术方案是:一种基于气象相似日及误差校正的短期负荷预测方法,其特征在于:其步骤为:

首先建立多元线性回归模型,将历史数据:负荷数据、气象数据,进行数据的预处理,再按照多元线性回归模型对历史数据进行多元逐步回归分析,选出各季节中影响负荷最显著的气象因素,确定各因素的权重并以此作为选择气象相似日的依据;按季节类型建立历史预测误差数据样本集,针对某一预测日,提取其相似日的误差数据样本建立集合,并按季节对其进行概率密度分布拟合;对预测点的误差波动情况进行分析,得到预测误差补偿值,选取最接近预测误差补偿值的误差抽样值作为该时刻的误差拟合值,并叠加到预测值上,作为最终负荷预测结果。

进一步的技术方案在于,所述多元线性回归模型是基于最小二乘法原理建立的,其模型的分析参数为反应回归效果的决定系数、方差分析中的回归效果检验值、其显著性检验值、回归系数的检验值。

进一步的技术方案在于,所述负荷数据为日最高负荷、日最低负荷、日平均负荷;所述气象数据为日最高温度、日最低温度、日平均温度、日相对湿度、日降雨量。

进一步的技术方案在于,所述预测误差补偿值的确定方法为在历史日预测误差中选取多个长期相对误差作为近期相对误差分析的衡量标准,然后计算长期方差水平与拟合直线斜率绝对值,结合二者近似分析近期预测相对误差的波动性,得到预测点相对误差的估计值;最后根据预测点误差与前一时刻误差、划分大误差与小误差的阀值误差的相对大小,确定相对误差补偿值。

进一步的技术方案在于,所述误差抽样值采用系统抽样法在相似日的误差数据样本建立集合中进行抽样;其系统抽样法的步骤如下:

从容量为N的总体中抽取容量为n的样本时,将总体分成均匀的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需的样本;

其中,

1)总体的容量N较大;

2)总体分段的间距要求相等(一般为K=N/n);

3)每一个样本段中采用随机抽样,保证每个样本被抽到的概率相等。

进一步的技术方案在于,所述误差拟合值为根据预测误差补偿值大小对误差抽样值进行排序,选取与预测误差补偿值最接近的误差抽样值作为误差拟合值。

进一步的技术方案在于,所述多元线性回归模型为

y=y′+μ=b0+b1X1+b2X2+...+biXi+...+bkXk (1)

进一步的技术方案在于,所述相对误差的波动性的分析方法为见下表:

其中,σl为长期方差水平,σs为近期相对计算误差的方差,kl为拟合直线斜率绝对值的临界值,,ks为近期相对误差计算的拟合直线的斜率绝对值。

进一步的技术方案在于,所述误差补偿值的确定方法见下表:

其中,δi为预测点误差,δi-1为预测点前一时刻误差,δ0为划分预测点大误差与预测点小误差的阀值误差。

进一步的技术方案在于,所述误差抽样值在抽样时,将相似日误差样本集中的误差数据按照时段进行划分,将一天的24个小时划分为6个时段,保证抽样在各时段内均匀进行;

其中,在各拟合曲线中选取以峰值为中心,概率为85%的部分作为实际抽样区间。

采用上述技术方案所产生的有益效果在于:本发明首先利用SPSS软件进行气象因素回归分析,寻找影响负荷变化的主要气象因素,根据两者的相关关系对影响因素赋以权重,并以此选择气象相似日。然后在历史误差样本集中提取相似日的预测误差建立概率密度分布拟合模型,并结合预测点误差的波动性分析得到该点的误差拟合值,用以对预测值进行校正,得到最终的负荷预测值。以实施例验证了本发明所提预测思路的正确性和有效性。

附图说明

下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1不同季节对应相对误差分布;

图2预测方法流程图;

图3小波神经网络算法程序流程图;

图4A1~A4相对误差拟合结果;

图5A1~A4修正前后预测结果对比。

具体实施方式

下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。

本发明所提供的技术方案在于,基于气象相似日及误差校正的短期负荷预测方法,其步骤如下:

首先建立多元线性回归模型,将历史数据:负荷数据、气象数据,进行数据的预处理,再按照多元线性回归模型对历史数据进行多元逐步回归分析,选出各季节中影响负荷最显著的气象因素,确定各因素的权重并以此作为选择气象相似日的依据;按季节类型建立历史预测误差数据样本集,针对某一预测日,提取其相似日的误差数据样本建立集合,并按季节对其进行概率密度分布拟合;对预测点的误差波动情况进行分析,得到预测误差补偿值,选取最接近预测误差补偿值的误差抽样值作为该时刻的误差拟合值,并叠加到预测值上,作为最终负荷预测结果。

其中,多元线性回归模型可以是基于最小二乘法原理建立的,其模型的分析参数为反应回归效果的决定系数、方差分析中的回归效果检验值、其显著性检验值、回归系数的检验值。

其中,负荷数据多为日最高负荷、日最低负荷、日平均负荷;所述气象数据多为日最高温度、日最低温度、日平均温度、日相对湿度、日降雨量。

其中,预测误差补偿值的确定方法为在历史日预测误差中选取多个长期相对误差作为近期相对误差分析的衡量标准,然后计算长期方差水平与拟合直线斜率绝对值,结合二者近似分析近期预测相对误差的波动性,得到预测点相对误差的估计值;最后根据预测点误差与前一时刻误差、划分大误差与小误差的阀值误差的相对大小,确定相对误差补偿值。

其中,误差抽样值采用系统抽样法在相似日的误差数据样本建立集合中进行抽样;其系统抽样法如下:

从容量为N的总体中抽取容量为n的样本时,将总体分成均匀的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需的样本;

其中,

1)总体的容量N较大;

2)总体分段的间距要求相等(一般为K=N/n);

3)每一个样本段中采用随机抽样,保证每个样本被抽到的概率相等。

其中,误差拟合值为根据预测误差补偿值大小对误差抽样值进行排序,选取与预测误差补偿值最接近的误差抽样值作为误差拟合值。

其中,多元线性回归模型具体为

y=y′+μ=b0+b1X1+b2X2+...+biXi+...+bkXk (1)

其中,相对误差的波动性的分析方法为见下表:

其中,σl为长期方差水平,σs为近期相对计算误差的方差,kl为拟合直线斜率绝对值的临界值,,ks为近期相对误差计算的拟合直线的斜率绝对值。

其中,所述误差补偿值的确定方法见下表:

其中,δi为预测点误差,δi-1为预测点前一时刻误差,δ0为划分预测点大误差与预测点小误差的阀值误差。

其中,误差抽样值在抽样时,需要将相似日误差样本集中的误差数据按照时段进行划分,将一天的24个小时划分为6个时段,保证抽样在各时段内均匀进行;

其中,在各拟合曲线中选取以峰值为中心,概率为85%的部分作为实际抽样区间。

基于上述论述,对于本发明的具体探索、研究如下:

实施例一

1基于SPSS的气象因素回归分析

1.1多元回归分析模型的建立

在现实生活中,人们往往要对某个因变量进行统计分析,但影响该因变量的自变量往往不止一个。例如,需要考虑k个自变量X1,X2,…,Xk与因变量y之间的关系时,利用最小二乘法原理建立多元线性回归模型为:

y=y′+μ=b0+b1X1+b2X2+...+biXi+...+bkXk (1)

由式(1)可以看出,因变量y由两部分组成,第一部分y′为因变量y的估计值,表示能由变量决定的部分;u为残差,表示不由自变量决定的部分。u对于判断当前建立的模型是否成立,是否还有别的变量需要引入模型等一系列问题非常重要。式(1)中b0为常数项,表示方程的截距;bi为偏回归系数,表示当其他自变量不变时,自变量Xi每改变化1个单位时y′的变化量。多元线性回归不仅需要进行回归系数的检验,估计回归系数的置信区间,进行预测与假设检验等方面的讨论,还需要考虑各个自变量之间的关系,如它们之间是否存在共线性的问题。

在利用SPSS进行多元回归分析之前,应首先将数据组织好(负荷数据和气象数据都已进行过数据的预处理),然后在SPSS多元线性回归分析的功能菜单中完成,具体操作如下:

(1)选择菜单Analyze→Regression→Linear;

(2)将因变量选入Dependent(因变量);

(3)将一个或多个自变量选入Independent(自变量)中;

(4)在Statistics选项中选择Part and partial correlations、Collinearity diagnostics(共线性诊断)、Estimates、Model fit(系统默认选项);

(5)在Plots选项中将*ZPRED(概率)选入Y,将*ZRESID(残差)选入X,并同时勾选Histogram和Normal probability plot,绘制回归结果的标准化残差序列直方图和正态分布累计概率图,进行回归精度的分析,点击OK。

由方差分析表中F值和模概述表中R2值确定拟合效果,由回归系数及显著性检验表中的相关性和共线性统计量确定是否存在多重共线问题。如果存在多重共线问题,需要对因变量进行筛选。为了克服共线问题,简化模型,增加预测精确度,本发明首先选择逐步回归方法,实现步骤为:在上述操作基础上,在Method框选择Stepwise(逐步),然后点击OK,输出结果。

输出结果说明:

(1)R2为决定系数,它反映回归效果,越接近1效果越好;

(2)方差分析中F为回归效果检验,F值越大说明回归效果越好;

(3)F检验值Sig.<0.05说明至少有1个自变量的回归系数不为零,所建立的回归模型有统计学意义;

(4)针对回归系数的t检验的显著性决定相应变量能否作为解释变量进入回归方程;

(5)t检验值Sig.<0.05说明相应变量系数具有统计学意义;

1.2气象因素影响分析

对某地区2013-2014年每季度的日最高负荷、日最低负荷、日平均负荷与各气象因素的关系进行了多元逐步回归分析,回归分析参数见表1、表2,各表中的X1、X2、X3、X4、X5分别代表气象因素中的日最高温度、日最低温度、日平均温度、日相对湿度、日降雨量。

表1 2013年分季度多元逐步回归分析结果

表2 2014年分季度多元逐步回归分析结果

注:——代表回归分析结果无统计学意义

综合分析表1、表2回归分析结果中的参数R、F值及其显著性检验值、回归系数t的检验值,可得地区2不同季度下分别影响日最高负荷、日最低负荷、日平均负荷的主要气象因素为:

(1)影响春季日最高负荷和日最低负荷的主要气象因素为最低温度和平均温度,影响春季日平均负荷的主要气象因素为平均温度;

(2)影响夏季日最高负荷的主要气象因素为平均温度和相对湿度,影响夏季日最低负荷的主要气象因素为平均温度和降雨量;

(3)影响秋季日最高负荷的主要气象因素为平均温度和相对湿度,影响夏季日最低负荷的主要气象因素为平均温度和降雨量;

(4)影响冬季日最高负荷的主要气象因素为最高温度和相对湿度,影响日平均负荷的主要气象因素为最高温度。

1.3气象相似日选择方法

由2013-2014年分季度对气象因素进行的多元回归分析结果可以更加明确,不同季度中影响负荷变化的主要气象因素是不同的。结合上文对影响因素的定性分析,本发明采用偏相关系数这一指标对负荷影响因素进行定量分析。

本发明选取了日最高温度、日最低温度、日平均温度、日相对湿度、日降雨量这五个气象指标构成了日特征向量,用来进行相似日的选择。由于各因素对电力负荷的影响程度不尽相同,且各气象因素间也存在一定的相互影响,因此选择偏相关系数作为计算各气象因素权重的重要依据。计算五个指标中每个指标所占的权重,公式如下:

其中,γi为各指标与该地区日平均负荷的偏相关系数。

按季节确定气象因素的权重系数,如表3所示:

表3 气象因素权重系数

得到各因素权重后,采用加权相似度公式来计算第i天的日特征向量与预测日的日特征向量的加权相似度sim(i),公式如下:

其中,pj(i)为第i天第j个影响因素归一化后的数值,ε是一个比较小的数。

计算样本中的所有历史日与预测日的加权相似度,进行降序排列,选择排在前面的历史日作为负荷预测的相似日。

2预测误差抽样值与补偿值的生成

2.1预测误差分布

上文对气象因素的回归分析可以表明该地区的气象因素与负荷变化的显著相关性,同时气象条件的多变性使得各历史日的气象状况互有差异。经统计研究发现,气象条件对预测误差的分布也有一定的影响。根据样本集中的气象数据分析可知,该地区一年四季各有不同的气候特点,对负荷变化的影响也是不同的,使用同一种负荷预测方法产生的误差分布也因气候特点不同而有一定的变化。本发明按季节类型分析了该地区在预测中产生的误差分布特点,建立了历史误差样本集,并按季节进行了误差拟合,容易看出,无论是哪种季节,相对误差的分布图像都近似关于y轴对称,且概率密度函数普遍随|x|的增大而减小,并趋近于x轴。冬夏两季的误差分布最为集中,即方差σ2冬季、σ2夏季最小,图形较“高瘦”,且期望值μ夏季最接近零,冬季期望值μ冬季明显大于零;相较之下,春秋两季分布情况分散,以春季误差分布曲线最为“矮胖”。

2.2预测误差抽样

基于系统抽样法将拟合的各季节下相似日误差样本集中的相对误差概率密度曲线进行抽样。

采用系统抽样法对预测误差进行抽样,系统抽样法的原理如下:

从容量为N的总体中抽取容量为n的样本时,将总体分成均匀的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需的样本。其特征为:

1)总体的容量N较大;

2)总体分段的间距要求相等(一般为K=N/n);

3)每一个样本段中采用随机抽样,保证每个样本被抽到的概率相等。

在抽样时,本发明将相似日误差样本集中的误差数据按照时段进行划分,将一天的24个小时划分为6个时段,保证抽样在各时段内均匀进行。需要注意的是,由于大误差出现概率低,为避免抽样结果过大造成误差过补偿现象,在各拟合曲线中选取以峰值为中心,概率为85%的部分作为实际抽样区间。

2.3基于波动性分析的预测误差补偿

通过分析样本中历史日预测误差的波动方向及幅值的规律性,借助预测手段可以预判误差的变化趋势并产生对应补偿值。

在波动性分析中,选取n个长期相对误差作为近期相对误差分析的衡量标准。定义长期方差水平σl与拟合直线斜率绝对值的临界值kl

式中,k1和k2分别为由拟合模型和置信水平确定的单侧置信区间上下临界值。

获取预测点前3个数据点的相对误差作为近期相对误差的样本值,计算其方差σs及拟合直线的斜率绝对值ks,结合二者便可近似分析近期预测相对误差的波动性,可得预测点相对误差的估计值。具体分析方法如表4所示。

表4 相对误差的波动性分析方法

为了避免波动性分析引入新的误差,建立误差补偿原则。在相对误差估计值的基础上,根据预测点误差δi与前一时刻误差δi-1与划分大误差与小误差的阀值误差δ0的相对大小,确定相对误差的补偿方式,如表5所示。

表5 相对误差补偿方式

基于波动性分析所得补偿误差值大小对概率模型的抽样结果进行排序,选取与波动性分析补偿值最接近的抽样结果作为相对误差的修正值,实现对预测的误差校正,从而可以提高短期预测的精度。

3基于误差校正的短期负荷预测模型

本发明将误差校正的思想引入短期负荷预测研究中,通过对预测误差进行模拟生成误差拟合值,并将其与预测负荷进行叠加,最终得到误差校正后的负荷预测值。

本发明首先基于SPSS对影响该地区负荷变化的主要气象因素进行回归分析,在分析中考虑了气象条件变化的季节特性,以此为基础进行负荷预测工作,具体思路如图2所示。

其中,在建立历史误差样本集的负荷预测环节中,本发明选择了结构简单、具有较好自学习能力和较快收敛速度的小波神经网络预测算法,小波神经网络算法训练步骤如下:

步骤1:网络初始化。在开始训练时,应首先对小波神经网络进行初始化,即初始化小波函数的各项参数。

步骤2:样本分类,其中包括进行网络训练的训练样本和测试精度的测试样本。

步骤3:预测输出。将训练样本输入网络,比较网络预测输出和期望输出之间的误差e。

步骤4:更新权值。得到上一步骤的误差e以后,将小波函数的各项参数及中间层的权值进行进一步的更新,以使预测结果更符合预期。

步骤5:判断预测输出是否与期望值足够接近,若没有结束则返回步骤3。

小波算法程序的流程图如图3所示:

实施例二

为了验证含模拟相对误差的负荷预测原理的适用性,算例采用某地区的负荷数据和气象数据进行预测,并利用MATLAB编程进行仿真。

本实施例选取该地区2014年春夏秋冬四季各一天作为预测日,分别记作A1、A2、A3、A4。针对某一预测日,确定其所属季节,以实时气象数据为选择相似日的依据,进而建立相似日预测误差样本集,基于系统抽样法进行均匀抽样,依照波动性分析将抽样结果进行排序,图4为A1~A4的波动性分析所得的补偿误差结果与排序后的最终拟合误差。

利用拟合相对误差对小波神经网络预测结果进行修正,得到含拟合误差的负荷预测值。图5为A1~A4的最终预测结果,该图显示:与拟合误差结合后,各季节的预测预测结果均能够在一定程度上提高预测精度。结合图4、图5可以看出,相对误差拟合分布抽样值可以有效消除波动性分析中出现的极端取值,避免误差发散及过补偿现象,而波动性分析具备对相对误差的补偿值的初步估计能力,基于其对抽样误差进行排序,能够将负荷预测值与拟合相对误差值准确对应,进而达到对误差的补偿,提高预测精度的效果。

结合实施例可知,本发明首先基于SPSS对不同季节中气象因素与负荷数据的相关性进行分析,并基于此进行相似日的选择,利用相似日的历史预测误差建立相对误差的概率密度函数,通过系统抽样法对历史预测误差样本集进行抽样,并将抽样结果根据波动性分析进行排序,最终得到负荷预测相对误差的拟合值,将其与预测值相叠加可以达到修正预测值,提高预测精度的效果。通过实施例验证了本发明所提方法的实用性和有效性。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1