基于日累计发行电量的短期售电量预测方法及系统与流程

文档序号:11921327阅读:1077来源:国知局
基于日累计发行电量的短期售电量预测方法及系统与流程

本发明涉及电力数据技术领域,更具体地说,涉及一种基于日累计发行电量的短期售电量预测方法,还涉及一种基于日累计发行电量的短期售电量预测系统。



背景技术:

月度售电量预测是电力需求侧管理重要的市场预测技术手段,精准的售电量预测有利于公司制定有效的经营计划,能否准确的预测售电量,对电力公司全年经营管理及全年经济效益有着较大影响。短期售电量由于受天气、经济等外部因素的波动影响较大,在目前外部因素波动难以预测的情况下,短期售电量预测准确性不高,特别是出现外部因素异常时,预测准确度无法满足电力公司的要求,预测不准确容易对决策者造成误导,导致公司效益受损。

目前,对于短期售电量预测,主要有环比预测法与同比预测法两种方法:第一,环比预测法,环比预测法是通过分析两个相邻月份(当月及前一个月)的日累计发行电量数据的比例关系,预测当月售电量的方法。例如,今日为2016年10月22日,公司已获取10月21日的发行电量数据,若要预测2016年10月的月度售电量,记2016年10月21日日累计发行电量为x20161021与2016年9月21日日累计发行电量为x20160921,令K1为二者的比值利用该比值K1,可以预测2016年10月的月度售电量为K1*P201609,其中P201609为2016年9月的月度售电量。该方法的缺点是:1、受天气和节假日天数变化影响较大;2、受各月天数不同影响较大;3、由于预测结果完全依赖于一天的累计电量数据,每天的预测结果波动较大,该方法的预测结果误差也较大。第二,同比预测法,同比预测法是通过分析当月日累计发行电量和去年相同月份的日累计发行电量数据的比例关系,预测当月售电量的方法。例如今日为2016年10月22日,公司已获取10月21日的发行电量数据。若要预测2016年10月的月度售电量,记2016年10月21日日累计发行电量为x20161021与2015年10月21日日累计发行电量为x20151021,令K2为二者的比值利用该比值K2,可以预测2016年10月的月度售电量为K2*P201510,其中,P201510为2015年10月月度售电量。该方法的缺点是:由于预测结果完全依赖于一天的累计电量数据,每天的预测结果波动较大,预测误差也较大。

现有的基于日累计发行电量的短期售电量预测方法,存在的问题如下:1、在数据预处理方面,并没有做异常值剔除、缺失值处理等操作,影响了预测结果的稳定性;2、在预测方法方面,由于仅利用一天的日累计电量数据,同比预测法与环比预测法预测误差较大并且预测结果的波动也较大;3、预测结果的修正方面,目前方法并没有考虑对预测结果进行误差修正。

因此,如何提高基于日累计发行电量的预测短期售电量的准确率是本领域技术人员急需要解决的技术问题。



技术实现要素:

为解决上述技术问题,本发明提供一种基于日累计发行电量的短期售电量预测方法,提高基于日累计发行电量的预测短期售电量的准确率。

为实现上述目的,本发明提供如下技术方案:

一种基于日累计发行电量的短期售电量预测方法,包括:

步骤S1:建立关于预测月份的日累计发行电量与去年同期日累计发行电量的线性函数关系,其中所述预测月份的日累计发行电量作为应变量,所述去年同期日累计发行电量为自变量;

步骤S2:将所述预测月份的首日至预测日的日累计发行电量数据以及去年同期日累计发行电量数据代入所述线性函数关系,计算模型参数;

步骤S3:将所述模型参数代入所述线性函数关系,得到短期售电量线性模型;

步骤S4:将去年同期月份最后一天的日累计发行电量数据代入所述短期售电量线性模型中,得到预测月售电量。

优选的,在上述方法中,所述步骤S2中,采用最小二乘法算法计算所述模型参数。

优选的,在上述方法中,所述步骤S4之后,还包括:

若所述预测日发生了变化,则相应的对建模数据进行更新,得到更新后的短期售电量线性模型。

优选的,在上述方法中,所述步骤S2之前,还包括:

将所述预测月份的首日至预测日的日累计发行电量数据以及去年同期日累计发行电量数据进行异常值识别以及缺失值填补。

优选的,在上述方法中,利用箱线图法对所述预测月份的首日至预测日的日累计发行电量数据以及去年同期日累计发行电量数据进行异常值识别。

优选的,在上述方法中,所述步骤S4之后,还包括:利用马尔科夫链对所述预测月售电量进行误差修正。

本发明提供了一种基于日累计发行电量的短期售电量预测系统,包括:

函数关系建立模块,用于建立关于预测月份的日累计发行电量与去年同期日累计发行电量的线性函数关系,其中所述预测月份的日累计发行电量作为应变量,所述去年同期日累计发行电量为自变量;

计算模块:用于将所述预测月份的首日至预测日的日累计发行电量数据以及去年同期日累计发行电量数据代入所述线性函数关系,计算模型参数;

模型建立模块:用于将所述模型参数代入所述线性函数关系,得到短期售电量线性模型;

预测模块,用于将去年同期月份最后一天的日累计发行电量数据代入所述短期售电量线性模型中,得到预测月售电量。

优选的,在上述系统中,还包括:

更新模块,用于若所述预测日发生了变化,则相应的对建模数据进行更新,得到更新后的短期售电量线性模型。

优选的,在上述系统中,还包括:

数据处理模块,用于将所述预测月份的首日至预测日的日累计发行电量数据以及去年同期日累计发行电量数据进行异常值识别以及缺失值填补。

优选的,在上述系统中,还包括:

误差修正模块,用于利用马尔科夫链对所述预测月售电量进行误差修正。

从上述技术方案可以看出,本发明所提供的一种基于日累计发行电量的短期售电量预测方法,包括:步骤S1:建立关于预测月份的日累计发行电量与去年同期日累计发行电量的线性函数关系,其中所述预测月份的日累计发行电量作为应变量,所述去年同期日累计发行电量为自变量;步骤S2:将所述预测月份的首日至预测日的日累计发行电量数据以及去年同期日累计发行电量数据代入所述线性函数关系,计算模型参数;步骤S3:将所述模型参数代入所述线性函数关系,得到短期售电量线性模型;步骤S4:将去年同期月份最后一天的日累计发行电量数据代入所述短期售电量线性模型中,得到预测月售电量。

利用从每月首日开始至预测日的所有日累计发行电量数据和去年同期月份的日累计发行电量数据进行回归分析,得到短期售电量线性模型,避免了由于一天的电量数据波动较大导致预测结果波动也大的问题,使得每天加入最新日期累计发行电量数据后的预测结果保持稳定。由于日累计电量曲线与去年同期月份的日累计电量曲线相关性较强,有明显的规律,因此将去年同期月份最后一天的日累计发行电量数据代入所述短期售电量线性模型中,得到预测月售电量,能够对电力公司的短期售电量进行准确预测。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种基于日累计发行电量的短期售电量预测方法示意图;

图2为本发明实施例提供的2016年10月日累计售电量发展规律示意图;

图3为本发明实施例提供的一种基于日累计发行电量的短期售电量预测系统的结构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,图1为本发明实施例提供的一种基于日累计发行电量的短期售电量预测方法示意图。

在一种具体实施方式中,为了有足够的样本构建预测模型,从每月16日起利用本发明提出的预测方法进行当月的售电量预测,后续每天增加一个数据样本,随着样本数量增多,售电量预测精度将不断提高。此外,经过调研和对历史数据分析发现,电力公司的抄表例日和电量电费发行日期几乎没有变化,因此本发明将电力公司去年同期月份的发行完日期作为今年预测月份的发行完日期,获得今年发行完日期的日累计电量后,将该电量作为本月的售电量预测值,不再对当月的售电量进行预测。

提供一种基于日累计发行电量的短期售电量预测方法,包括如下步骤:

步骤S1:建立关于预测月份的日累计发行电量与去年同期日累计发行电量的线性函数关系,其中,所述预测月份的日累计发行电量作为应变量,所述去年同期日累计发行电量为自变量。

记预测月份的日累计发行电量数据为yi,这里i为日期,如2016年10月21日的日累计发行电量为y20161021;记去年同期的日累计发行电量数据为xi,这里i为日期,如2015年10月21日的日累计发行电量为x20151021,建立线性模型yi=kxi+b,k和b为常数系数。

步骤S2:将所述预测月份的首日至预测日的日累计发行电量数据以及去年同期日累计发行电量数据代入所述线性函数关系,计算模型参数;

线性回归是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法之一。变量间的相关关系若果存在线性相关关系,则由实验数据所得到的数据点将散布在某一条直线周围,可以用一条直线近似表示。

采用最小二乘法算法估计线性模型中的系数k和b的值,对于线性模型,最小二乘法公式为:

其中n为数据条数,例如,当利用了当月1-21日和去年同期月份1-21日的数据建立线性模型时,n为21,求解方程(1)可得到模型系数为:

若获取了2016年10月1-21日的日累计售电量,则可以利用2016年10月1日至10月21日的日累计发行电量数据和2015年10月1日至2015年10月21日的日

累计发行电量数据进行建模,得到如下所示21组数据对作为训练集建立线性模型:(x20151001,y20161001),(x20151002,y20161002)......(x20151021,y20161021)。

步骤S3:将所述模型参数代入所述线性函数关系,得到短期售电量线性模型。

步骤S4:将去年同期月份最后一天的日累计发行电量数据代入所述短期售电量线性模型中,得到预测月售电量。

得到线性模型后,将同期月份月末日的日累计电量(月末日的累计电量即为该月的售电量)代入线性模型中,记为第i日预测的当月月度售电量数值,这里i为日期,如为利用了2016年10月1-21日的日累计电量数据预测的2016年10月售电量预测结果:

此外,利用构建的线性模型可以对后续每天的日累计电量进行预测,从而得到当月后续几天的日累计售电量发展规律,如图2所示。

进一步的,在上述方法中,所述步骤S2中,采用最小二乘法算法计算所述模型参数。最小二乘法又称最小平方法,通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便的求得未知数据,并使的这些求得的数据与实际数据之间的误差平方和为最小,最小二乘法一般用于曲线拟合。

在上述方法的基础上,所述步骤S4之后,还包括:

若所述预测日发生了变化,则相应的对建模数据进行更新,得到更新后的短期售电量线性模型。

当有新增数据时,进行增量式预测,如新增了2016年10月22日的数据,将最新数据对(x20151022,y20161022)加入模型训练集中,利用更新后的数据重新建立线性模型。得到更新后的线性模型后,将2015年10月31日的发行电量数据代入线性模型中,可更新得到利用了2016年10月1-22日的日累计电量数据预测的月度售电量结果:

每天新增日累计发行电量数据后,通过回归预测可得到从10月16日开始直到发行日期前一天的月度售电量预测序列,发行日期的累计电量数据获取后由于当月电量已经发行完,因此发行日期后不再进行预测。利用本发明提出的方法可以从每月的16号后,每日对月售电量进行预测,采用增量式预测,可以在越接近发行日期时,预测精度越高。以2016年10月为例,利用本发明的预测方法可以得到月度售电量预测序列:

在上述方法的基础上,所述步骤S2之前,还包括:

将所述预测月份的首日至预测日的日累计发行电量数据以及去年同期日累计发行电量数据进行异常值识别以及缺失值填补。

其中,为了避免个别异常值对预测结果产生影响,需要对历史日累计发行电量数据中的异常值进行识别和处理。

用箱型图法进行异常值识别和处理,具体算法过程如下:

设X=x(i)(i为日期)为日累计发行电量数据,其中i为日期,如x(20161010)为第2016年10月10日的日累计发行电量数据。

由于日累计发行电量数据为累计数据,因此肯定有x(i+1)>=x(i),对于不满足该不等式的数据,利用插值法进行替换,如若存在x(i+1)<x(i),则令x(i+1)=(x(i+2)+x(i))/2对x(i+1)进行填补。

对于参与建模的日累计发行数据x(i)进行一阶差分,即得到日发行电量u(i)=x(i)-x(i-1),这里对所有一阶差分数据除去要判断是否为异常值的数据进行分箱,确定其上下边界,即:

up=Q2+1.5*(Q3-Q1) (5)

down=Q2-1.5*(Q3-Q1) (6)

其中,Q2表示u(i)的均值,Q3表示u(i)的上四分位数,Q1表示u(i)的下四分位数。

判断目标差分数据是否在界限内,若存在连续两个差分数据都不在界限内,则判定两个中的第一个差分数据所在时间点的日累计发行电量数据为异常值。识别出异常值后,采用插值法进行替换。

对于数据中缺失值,如若数据x(i)缺失,则令x(i)=(x(i-2)+x(i+1))/2对x(i)进行填补,若第一个数据x(j)(j为序列中第一个数据的日期)缺失,令x(j)=x(j+1)进行填补;若最后一个数据x(k)(k为序列中最后一个数据的日期)缺失,令x(k)=x(k-1)进行填补。

进一步的,在上述方法中,利用箱线图法对所述预测月份的首日至预测日的日累计发行电量数据以及去年同期日累计发行电量数据进行异常值识别。

其中,箱型图又称为箱线图、盒式图,是一种用作显示一组数据分散情况资料的统计图,因形状如箱子而得名,在各种领域中也经常被使用,常见于品质管理。箱型图利用数据中五个统计量:最小值、第一四分位数、中位数、第三四分位数和最大值来描述数据,可以看出数据是否具有对称性,分布的分散情况等信息,也可以直观明了的识别数据中的异常值。

利用箱线图法进行异常值识别,并对异常值和缺失值进行处理,从而提高建模数据质量,避免异常值和缺失值干扰预测结果。当然,需要指出的是,包括但不限于箱线图法对其进行异常值识别,还可以利用其它方法,均在保护范围内。

进一步的,在上述方法中,所述步骤S4之后,还包括:利用马尔科夫链对所述预测月售电量进行误差修正。

其中,马尔科夫链是指数学中具有马尔科夫性质的离散事件随机过程。马尔科夫性质是指在已知当前状态(现在)的条件下,它的未来演变(将来)不依赖于它以前的演变(过去)。

利用马尔科夫链对历史预测误差进行建模,构建误差修正模型,对预测月售电量进行误差修正,从而提升预测准确度。当然,需要指出的是,包括但不限于马尔科夫链对其进行误差修正,还可以利用其它方法,均在保护范围内。

本发明中用马尔科夫进行预测误差修正,具体步骤如下:

步骤1:获取绝对误差序列样本。

对2016年10月a日的售电量预测结果进行修正,首选需要获取2014年9月开始的每个a日的预测误差,记a日的预测结果绝对误差序列为

βa={δ201409a,δ201410a,...,δ201609a} (7)

例如,对于每个月,利用当月日累计发行电量数据和历史同期数据均可以形成对月度售电量的一个预测序列(i为日期),预测序列从每月16日开始直至发行日期前一天:

若需要预测2016年10月的月度售电量,计算从2014年9月至2016年9月的月度预测序列令

这里Pj为j月的月度售电量真实值,j为i日的月份,βi为预测值的误差,根据上述方法可计算得到2014年9月至2016年9月的所有预测值的误差δi

由于每个误差值均是从16日开始直至发行日期前一天结束,因此可按照日期筛选出从16日至发行日期前一天的误差集合:{β16,β17,...,β发行日期-1},这里βa为从2014年9月至2016年9月所有月份a日的误差集合,例如21日的误差集合为:

β21={δ20140921,δ20141021,...,δ20160921} (9)

步骤2:利用均值方差法对预测结果的绝对误差序列状态区间划分;

对于预测结果的绝对误差序列βa,记其均值为均方差为s,利用均值-均方差分级法后,一般可将序列划分为5级:其中a1,a4取值在[1.0,1.5]中取值,a2,a3在[0.3,0.6]中取值。

步骤3:计算马尔科夫预测误差状态概率转移矩阵;

根据马尔科夫理论,考虑样本的绝对误差数据,每一天有多个误差状态可能发生,若误差在Ei的范围内,则事件处于状态Ei;误差从第一天的Ei变成第二天的Ej的概率,也就是状态Ei经过1步变成Ej的概率为:

式中:为样本中预测误差从Ei一步转移到Ej的转移次数;Ni为状态Ei出现的总次数(若Ni=0,则),则1步状态概率转移矩阵为

k步状态概率转移矩阵,Pk=(P(1))k,状态概率转移矩阵是一个n阶方阵,具有两个特点:

矩阵各元素非负性;

即矩阵每行之和为1。

步骤4:根据状态概率转移矩阵计算出未来时刻预测误差的状态概率,得到误差预测值。

以2016年09月a日的预测绝对误差δ201609a所在的状态作为初始状态,计算2016年10月a日的预测误差状态向量,初始状态向量假设δ201609a所在状态为E3,则

误差状态转移一次后的预测绝对误差的状态向量为

误差状态转移两次后的预测绝对误差的状态向量为

分别找到或中概率最大的值:

找到一个概率最大的值所在的位置即是待预测的误差所处的区间,取区间的均值即为误差的预测值,E1取的一半即可,E5同理。若概率最大的值超过1个,那么取误差的预测值为这几个最大值对应区间的均值。

由于日发行电量数据中包含了本月天气、经济等外部因素和售电量的变化信息,本发明提出了一种基于日累计发行电量的短期售电量预测方法,其基本思路分为三步:第一步,选择预测月份的日累计发行电量数据与去年同期日累计发行电量数据,对上述数据进行预处理,包括利用箱线图方法识别异常值,对异常值和缺失值进行处理等。第二步,利用建立关于预测月份的日累计发行电量与去年同期日累计发行电量的线性函数关系,构建短期售电量线性模型,并利用最小二乘法对模型参数进行求解。第三步,利用马尔科夫链误差修正模型对预测结果进行误差修正。避免了由于一天的电量数据波动较大导致预测结果波动也大的问题,使得每天加入最新日期累计发行电量数据后的预测结果保持稳定,能够对电力公司的短期售电量进行准确预测。

下面对本发明实施例提供的一种基于日累计发行电量的短期售电量预测系统进行介绍,下文描述的一种基于日累计发行电量的短期售电量预测系统与上文描述的一种基于日累计发行电量的短期售电量预测方法可相互对应参照。

请参考图3,图3为本发明实施例所提供的一种基于日累计发行电量的短期售电量预测系统的结构框图;

函数关系建立模块100,用于建立关于预测月份的日累计发行电量与去年同期日累计发行电量的线性函数关系,其中所述预测月份的日累计发行电量作为应变量,所述去年同期日累计发行电量为自变量;

计算模块200:用于将所述预测月份的首日至预测日的日累计发行电量数据以及去年同期日累计发行电量数据代入所述线性函数关系,计算模型参数;

模型建立模块300:用于将所述模型参数代入所述线性函数关系,得到短期售电量线性模型;

预测模块400,用于将去年同期月份最后一天的日累计发行电量数据代入所述短期售电量线性模型中,得到预测月售电量。

进一步的,在上述系统中,还包括:

更新模块,用于若所述预测日发生了变化,则相应的对建模数据进行更新,得到更新后的短期售电量线性模型。

进一步的,在上述系统中,还包括:

数据处理模块,用于将所述预测月份的首日至预测日的日累计发行电量数据以及去年同期日累计发行电量数据进行异常值识别以及缺失值填补。

进一步的,在上述系统中,还包括:

误差修正模块,用于利用马尔科夫链对所述预测月售电量进行误差修正。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1