一种基于前导分析和因素补偿的售电量预测方法及装置与流程

文档序号:11200567阅读:634来源:国知局
一种基于前导分析和因素补偿的售电量预测方法及装置与流程

本发明涉及电力领域,尤其涉及一种基于前导分析和因素补偿的售电量预测方法及装置。



背景技术:

售电量预测是国家电网公司一项重要的基础性工作,月度售电量预测对于国家电网公司合理的确定销售电量总定额、分解售电量销售指标、制定有序用电方案、指导发电厂和输配电网的合理运行、推动电力市场发展和建设都具有十分重要的意义。

一般传统的售电量预测方法主要分为直接预测方法和分解预测方法,直接预测方法是指利用一种预测方法直接对售电量进行预测,主要包括灰度系统预测法、时间序列预测法、回归分析预测法。分解预测方法是指对售电量历史数据进行分解,分解成不同子序列,然后对各子序列分别预测并重构。这些方法在一定程度上能够对售电量进行预测,但是这些方法都没有考虑前导因素,无法识别售电量趋势变化的“拐点”;并且未考虑春节对售电量趋势变化的影响,因此得到的预测精度不理想。



技术实现要素:

有鉴于此,本发明实施例公开了一种基于前导分析和因素补偿的售电量预测方法及装置,解决了现有技术中没有考虑前导因素春节因素从而使得预测精度不够的问题。

本发明实施例提供的一种基于前导分析和因素补偿的售电量预测方法,所述方法可以包括:

对历史售电量数据进行预处理,得到预处理后的历史售电量数据,并依据x13季节调整方法将所述预处理后的历史售电量数据分解为趋势项、季节项和随机项三个序列;

获取影响所述趋势项的相关指标,并依据所述趋势项、影响所述趋势项的相关指标以及预设的多种第一机器学习算法建立多个趋势项预测模型,并依据所述多个趋势项预测模型计算待预测时间售电量的趋势项预测值;所述趋势项预测值为多个;所述影响所述趋势项的相关指标包括:前导性指标和即时性指标;或者包括前导性指标;

基于所述季节项和预设的第二机器学习算法建立所述季节项预测模型,并依据所述季节项预测模型计算所述待预测时间售电量的季节项预测值;

依据所述随机项、春节因素和预设的随机项因素,采用预设的剥离和补偿规则以及预设的第三机器学习算法建立随机项的预测模型,并依据所述随机项的预测模型计算待预测时间售电量的随机项预测值;

将所述多个趋势项预测值、季节项预测值和随机项预测值进行加和重构,得到第一售电量预测值;

依据层次分析法ahp对所述第一售电量进行择优处理,得到待预测时间的第二售电量预测值。

可选的,所述前导性指标包括以下指标中的一个或者多个;

前导性指标:业扩净增容量、制造业pmi、非制造业pmi;

所述即时性指标包括以下即时性指标中的一个或者多个:

即时性指标:人均可支配收入、第二产业gdp增速、第三产业gdp增速和工业增加值增速。

可选的,依据所述趋势项、影响所述趋势项的相关指标以及预设的多种第一机器学习算法建立多个趋势项预测模型,并依据所述多个趋势项预测模型计算待预测时间售电量的趋势项预测值,包括:

若获取到了多个影响所述趋势项的相关指标,采用主成分分析法pca计算所述多个影响所述趋势项的相关指标的去相关结果;

依据所述趋势项、所述去相关结果和预设的多个第一机器学习算法建立多个趋势项预测模型,并依据所述多个趋势项预测模型计算待预测时间售电量的趋势项的预测值。

可选的,所述基于所述季节项和预设的第二机器学习算法建立所述季节项预测模型,并依据所述季节项预测模型计算所述待预测时间售电量的季节项预测值,包括:

基于季节项和l1/2稀疏迭代算法建立所述季节项预测模型,并依据所述季节项预测模型计算所述待预测时间售电量的季节项预测值。

可选的,所述依据所述随机项、春节因素和预设的随机项因素,采用预设的剥离和补偿规则以及预设的第三机器学习算法建立随机项的预测模型,并依据所述随机项的预测模型计算待预测时间售电量的随机项预测值,包括:

采用移动假日剥离算法剥离所述随机项中的春节因素,得到剥离春节因素的随机项;

采用箱线图法从所述剥离春节因素的随机项中获取异常月份;依据逻辑回归算法和所述异常月份的异常数据建立异常判断模型;其中,所述异常数据包括:异常月份的温度、节假日和异常售电量情况;

基于所述异常判断模型和预设的随机因素判断所述待预测时间是否异常;

若所述待预测时间异常,依据所述异常判断模型和l1/2稀疏迭代算法以及所述剥离春节因素的随机项建立第一随机项预测模型,并依据所述第一随机预测模型计算待预测时间售电量的随机项第一预测值;

若所述待预测时间不异常,基于混合专家算法和所述剥离春节因素的随机项建立第二随机项预测模型,并依据所述第二随机预测模型计算待预测时间售电量随机项第二预测值。

可选的,所述预设的随机因素包括:

温度因素和节假日因素。

可选的,还包括:

若所述待预测时间在1-3月份之间,获取历史售电量数据中每年春节距每年1-3月份首日天数以及1-3月份中每个月份的占季比;其中,所述每个月份的占季比为各月售电量占季度总电量的比例;

将每年春节距每年1-3月份首日天数和每个月份的占季比进行拟合,得到拟合函数;

获取待预测年的春节距该年1-3月首日的天数,并依据所述待预测年的春节距该年1-3月首日的天数和所述拟合函数计算所述待预测时间的占季比;所述待预测年为所述待预测时间所属年份;

获取所述待预测年第一季度的所述第二售电量预测值;基于所示第二售电量预测值和所述待预测时间的占季比,计算调整后的待预测时间的售电量预测值。

可选的,所述对历史售电量数据进行预处理,得到预处理后的历史售电量数据,包括:

采用分箱法从所述历史售电量数据中识别出预设的异常值,并将识别出的异常值由所述历史售电量均值代替,得到除去异常值的历史售电量数据;

采用分箱法从所述除去异常值的历史售电量数据中筛选出建模数据。

本发明实施例还公开了一种基于前导分析和因素补偿的售电量预测装置,所述装置包括:

预处理单元,用于对历史售电量数据进行预处理,得到预处理后的历史售电量数据,并依据x13季节调整方法将所述预处理后的历史售电量数据分解为趋势项、季节项和随机项三个序列;

趋势项预测单元,用于获取影响所述趋势项的相关指标,并依据所述趋势项、影响所述趋势项的相关指标以及预设的多种第一机器学习算法建立多个趋势项预测模型,并依据所述多个趋势项预测模型计算待预测时间售电量的趋势项预测值;所述趋势项预测值为多个;

季节项预测单元,用于基于所述季节项和预设的第二机器学习算法建立所述季节项预测模型,并依据所述季节项预测模型计算所述待预测时间售电量的季节项预测值;

随机项预测单元,用于依据所述随机项、春节因素和预设的随机项因素,采用预设的剥离和补偿规则以及预设的第三机器学习算法建立随机项的预测模型,并依据所述随机项的预测模型计算待预测时间售电量的随机项预测值;

加和重构单元,用于将所述多个趋势项预测值、季节项预测值和随机项预测值进行加和重构,得到待预测时间的第一售电量预测值;

择优处理单元,用于依据层次分析法ahp对所述第一售电量进行择优处理,得到待预测时间的第二售电量预测值。

可选的,所述随机项预测单元,包括:

剥离子单元,用于采用移动假日剥离算法剥离所述随机项中的春节因素,得到剥离春节因素的随机项;

获取子单元,用于采用箱线图法从所述剥离春节因素的随机项中获取异常月份;

异常判断模型建立子单元,用于依据逻辑回归算法和所述异常月份的异常数据建立异常判断模型;其中,所述异常数据包括:异常月份的温度、节假日和异常售电量情况;

异常判断子单元,用于基于所述异常判断模型和预设的随机因素判断所述待预测时间是否异常;

第一随机项预测子单元,用于若所述待预测时间异常,依据所述异常判断模型和l1/2稀疏迭代算法以及所述剥离春节因素的随机项建立第一随机项预测模型,并依据所述第一随机预测模型计算待预测时间售电量的随机项第一预测值;

第二随机项预测子单元,用于若所述待预测时间不异常,基于混合专家算法和所述剥离春节因素的随机项建立第二随机项预测模型,并依据所述第二随机预测模型计算待预测时间售电量随机项第二预测值。

可选的,还包括:

第一获取单元,用于若所述待预测时间在1-3月份之间,获取历史售电量数据中每年春节距每年1-3月份首日天数以及1-3月份中每个月份的占季比;其中,所述每个月份的占季比为各月售电量占季度总电量的比例;

第一计算单元,用于将每年春节距每年1-3月份首日天数和每个月份的占季比进行拟合,得到拟合函数;

第二计算单元,用于获取待预测年的春节距该年1-3月首日的天数,并依据所述待预测年的春节距该年1-3月首日的天数和所述拟合函数计算所述待预测时间的占季比;所述待预测年为所述待预测时间所属年份;

第二获取单元,用于获取所述待预测年第一季度的所述第二售电量预测值;

第三计算单元,用于基于所示第二售电量预测值和所述待预测时间的占季比,计算调整后的待预测时间的售电量预测值。

本实施例中,首先对原始售电量数据进行预处理,提升了建模数据质量;然后利用x13季节调整算法得到了售电量数据的趋势项、季节项和随机项三个子序列,在利用相关性分析深入研究各子序列影响因素的基础上,通过子序列预测结果加和重构得到售电量预测结果。其中趋势项预测综合考虑了影响趋势项的相关指标并且采用多种机器学习算法分别进行预测,随机项预测考虑了春节因素和一些随机项因素,在外部因素变化异常的情况下也能实现精准的售电量预测;最后,采用基于ahp的综合评价方法在四种加和结果中得到最具预测性能的预测结果。通过本实施例的方法,不仅能够识别出趋势项变化的“拐点”,而且得到的预测结果更加的精确。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1示出了本发明实施例提供的一种基于前导分析和因素补偿的售电量预测方法的流程示意图;

图2示出了本发明实施例提供的一种基于前导分析和因素补偿的售电量预测方法的流程示意图;

图3示出了本发明实施例提供的一种基于前导分析和因素补偿的售电量预测装置的结构示意图;

图4示出了svm回归通过定义硬-ε带超平面示意图;

图5示出了正类点集d+和负类点集d-的二分类示意图;

图6示出了混合专家结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参考图1,示出了本发明实施例提供的一种基于前导分析和因素补偿的售电量预测方法的流程示意图,在本实施例中,所述方法可以包括:

s101:对历史售电量数据进行预处理,得到预处理后的历史售电量数据,并依据x13季节调整方法将所述预处理后的历史售电量数据分解为趋势项、季节项和随机项三个序列;

本实施例中,历史售电量数据中会存在一些异常高或者异常低的数据点,这些点若是直接用于建模会影响模型的泛化能力,造成预测精度下降,因此需要将这些异常数据进行处理,并且,由于经济发展周期或其它影响因素的变化,较早年份的售电量趋势可能和距离现在较近的年份有较大的差异,因此需要对售电量数据进行筛选,因此,对历史售电量数据进行预处理具体可以包括两方面:

第一方面:采用分箱法从所述历史售电量数据中识别出预设的异常值,并将识别出的异常值由所述历史售电量均值代替,得到除去异常值的历史售电量数据;

第二方面:采用分箱法从所述除去异常值的历史售电量数据中筛选出建模数据。

其中,第一方面具体可以包括:

从所述历史售电量数据中确定疑似异常点;将所述疑似异常点作为目标点;

将历史售电量数据中相连的数据点进行差分运算,得到历史售电量数据的差分序列和目标点的两个相关点;其中,所述相关点为与所述目标点与相邻的两个点进行差分的结果;

从所述历史售电量数据的差分序列中除去所述目标相关点,并对除去目标相关点的历史售电量数据的差分序列进行分箱处理,得到售电量数据差分序列的正常范围;

判断两个所述目标相关点是否均不在所述售电量数据差分序列的正常范围内;

若两个所述目标相关点均不在所述正常范围内,则所述目标点为异常值并利用历史均值代替所述目标点,得到除去异常值的历史售电量数据。

举例说明:假设记历史售电量数据记为定义目标点为计算目标点的相关点:得到{u(i)|i=1,2,...,n-1},定义目标点对应的目标相关点为u(i)和u(i-1);对除去目标相关点的历史售电量数据的差分序列进行分箱处理操作,如以下公式1)和公式2):

1)pup=a+1.5*(a-c);

2)pdouw=c-1.5*(a-c);

其中pup为上边界,pdown为下边界,,a为上四分位数,c为下四分位数,即pup和pdown为所述售电数据的正常范围。

判断目标点是否异常:若u(i)和u(i-1)都不在正常范围内,则判定目标点为异常值,否则不是异常值;识别出异常值后,利用历史均值代替该目标点,得到异常值处理后的月度售电量历史数据{q(i)|i=1,2,...,n}。

第二方面具体可以包括:

从所述除去异常值的历史售电量数据中获取各个年份的历史售电量数据;并计算各个年份的历史售电量增长率;

对所述连续n年的增长率进行分箱操作,得到增长率的正常范围;所述连续n年为距离当前年份最近的n年;所述n≥2;

判断第n+p年的增长率是否在所述增长率的正常范围内;p为从1开始递增的正整数;

若连续n+p年的增长率不在所述增长率的正常范围内,将连续n+p年的历史售电量数据筛选出来作为建模数据;

若连续n+p年的增长率在所述增长率的正常范围,将p在当前数值的基础上加1,并返回执行判断第n+p年的增长率是否在所述增长率的正常范围内。

举例说明:本实施例中,假设获取到的连续m+1年的历史售电量数据为2年,则可以计算出1年的增长率,例如:获取的为2016年和2015年这两年的数据,则只可以得到2016年对2015年的增长率。

对于x13季节调整算法要求数据至少3年,因此,在本实施例中假设连续n年的增长率可以为2年;

第一步假设获取到的各个年份的售电量历史数据{y(i)|i=1,2,...,m};m表示为距离当前最近的年份;

采用如下公式3),计算历史年度增长率绝对值{s(i)|i=2,3,...,m}:

3)

第二步利用{s(i)|i=m-1,m}执行分箱,得到连续2年增速的正常范围;假设,距离当前最近的年份为2016年,则连续两年的增长率为:2016年对2015年的增长率和2015年对2014年的增长率。

第三步判断s(m-2)是否在分箱边界内,若不在,则选择近3年售电量数据参与建模;例如:若2014年对2013年的增速不在增速的正常范围内,则参与建模的数据包括:2016年、2015年和2014年;

否则判断s(m-3)是否在分箱边界内,若不在,则选择近四年售电量数据参与建模,以此类推。

记经过数据筛选之后的月度售电量数据为{q(i)|i=1,2,...,n}。

本实施例中,由于月度售电量受经济发展、季节变化、温度和假日等因素的影响,直接预测难度较大。在本实施例中,可以在对历史售电量数据进行了预处理后,采用x13季节调整方法,将该预处理后的历史售电量数据分解为趋势项、季节项和随机项三个序列。

举例说明:采用x13季节调整方法对历史售电量进行分解,可通过如下公式4)进行表示:

4)q(i)=qt(i)+qs(i)+qr(i);

其中,{q(i)|i∈1,2,...n,}表示预处理后的历史售电量数据,{qt(i)|i∈1,2,...,n}为售电量趋势项,{qs(i)|i∈1,2,...,n}为售电量季节项,{qr(i)|i∈1,2,...,n}为售电量随机项。

本实施例中,需要说明的是,从历史售电量数据中分解出的趋势项、季节项和随机项可以理解为,从历史售电量中提取出的趋势项对应的数据、季节项对应的数据和随机项对应的数据。

本实施例中,对售电量进行预测会受到一些因素的影响,而且不同的行业会受到不同因素的影响。通过对分解出的这些子序列和因素数据进行相关性分析,可以得到各行业售电量预测需要考虑的因素,如下图表1所示,

表1

本实施例中,在对分解出的不同序列进行分析时,需要考虑行业相对应的因素。

s102:获取影响所述趋势项的相关指标,并依据所述趋势项、影响所述趋势项的相关指标以及预设的多种第一机器学习算法建立多个趋势项预测模型,并依据所述多个趋势项预测模型计算待预测时间售电量的趋势项预测值;所述趋势项预测值为多个;前导性指标和即时性指标;或者包括前导性指标;

本实施例中,需要说明的是,所述影响所述趋势项的相关指标包括:前导性指标和即时性指标;或者包括前导性指标;可以理解为,对于影响趋势项的相关指标,一定是考虑了前导性指标的,但是是否包括即时性因素,需要根据该趋势项对应的行业进行查询。

其中,

所述前导性指标包括以下指标中的一个或者多个;

前导性指标:业扩净增容量、制造业pmi、非制造业pmi;

所述即时性指标包括以下即时性指标中的一个或者多个:

即时性指标:人均可支配收入、第二产业gdp增速、第三产业gdp增速和工业增加值增速。

但是,对于前导性指标和即时性指标并不限定于以上提到的这些。

其中,历史售电量数据所属的行业对应的前导性因素和即时性因素可以是技术人员预先设置的,例如上表1所示,从表1中可以查询到行业对应的前导性指标和即时性指标。

举例说明:从表1中获取行业对应的前导性指标,记为{g(i)|i∈1,2,...,n},若前导指标包括净增容量和pmi(英文全称:purchasingmanager’sindex,中文全称:采购经理指数)两个前导指标,则g(i)={g1(i),g2(i)|i∈1,2,...,n},这两个前导性指标项具体可以表示为:

业扩净增容量:

pmi:g2(i)={pmi(i-1),pmi(i-2),pmi(i-3)};

其中k为业扩净增容量趋势项前导售电量趋势项的前导值,net(i)为第i月净增容量趋势项,pmi(i)为第i月pmi,其他行业趋势项预测以此类推。

从表1中取得行业对应的即时性指标,记为{e(i)|i∈1,2,...,n},若指标为两个,则e(i)={e1(i),e2(i)|i∈1,2,...,n},如=e1(i)表示第二产业gdp增速,e2(i)表示工业增加值增速。

本实施例中,对于趋势项的前导值的获取可以采用基于动态时间规整的方法。

举例说明:假设前导性指标为净增容量,则:

第一步:分别取净增容量趋势项、售电量趋势项,两者分别记为

第二步:利用动态时间规整计算售电量趋势项与净增容量趋势项之间的最短规整路径d(nt,qt)。

第三步:分别记为前导0个月、前导1月,…,前导m个月,其在最短规整路径中出现的次数分别记为c0,c1,…,cm。取最大的前导月份为12,那么该产业的净增容量的前导月份l=max{ci|i=0,1,...,m}。

通过计算可知净增容量趋势项前导售电量趋势项2至6个月,制造业pmi前导售电量趋势项3个月,非制造业pmi前导售电量趋势项6个月。

本实施例中,获取了影响所述趋势项的相关指标后,还需要依据分解的趋势项、获取到的相关指标以及预设的多种第一机器学习算法建立多个趋势项预测模型,具体的s102可以包括:

若获取到了多个影响所述趋势项的相关指标,,采用pca(英文全称:principalcomponentanalysis,中文全称:主成分分析法)计算所述多个影响所述趋势项的相关指标的去相关结果;

依据所述趋势项、所述去相关结果和预设的多个第一机器学习算法建立多个趋势项预测模型,并依据所述多个趋势项预测模型计算待预测时间的售电量趋势项的预测值。

举例说明:假设获取到的多个影响所述趋势项的相关指标包括:即时性指标和前导性指标,采用pca主成分分析算法得到即时性指标和前导性指标去相关性结果可以表示为:

p(i)=pca(e(i),g(i)),i=1,2,...,n;

本实施例中,所述第一机器学习模型可以是多个,例如可以包括:svm(英文全称:supportvectormachine,中文全称:支持向量机)、l1/2稀疏迭代、回声状态网络和极限学习机等。每一种机器学习算法都可以建立一个趋势项预测模型。

例如:采用svm、l1/2稀疏迭代、回声状态网络和极限学习机四种算法分别建立趋势项预测模型,建立如下趋势项预测模型:

5)

其中,j=1表示svm,j=2表示l1/2稀疏迭代,j=3表示回声状态网络,j=4表示极限学习机;l表示预测步长即待预测时间,其中l为一个月、两个月.....

本实施例中若是获取到了多个影响所述趋势项的相关指标,这些相关指标可以是包括多个前导性指标或者既前导性指标也包括即时性指标,则需要计算多个指标的去相关结果。

s103:基于所述季节项和预设的第二机器学习算法建立所述季节项预测模型,并依据所述季节项预测模型计算所述待预测时间售电量的季节项预测值;

本实施例中,由于售电量的季节项规律性较强,趋势变化较为平稳,因此可以采用l1/2稀疏迭代算法得到售电量季节项预测模型,具体的s103可以包括:

基于季节项和l1/2稀疏迭代算法建立所述季节项预测模型,并依据所述季节项预测模型计算所述待预测时间售电量的季节项预测值。

s104:依据所述随机项、春节因素和预设的随机项因素,采用预设的剥离和补偿规则以及预设的第三机器学习算法建立随机项的预测模型,并依据所述随机项的预测模型计算待预测时间售电量的随机项预测值;

本实施例中,随机项有一定的波动,反映了节假日、温度等因素的影响,技术人员经研究发现,对售电量预测影响较大的季节为春节、夏季和冬季,同时节假日天数也是导致随机项电量异常变化的一个重要原因。

本实施例中,预设的随机因素可以包括温度因素和节假日因素等。

具体的,s104可以包括:

采用移动假日剥离算法剥离所述随机项中的春节因素,得到剥离春节因素的随机项;

采用箱线图法从所述剥离春节因素的随机项中获取异常月份;依据逻辑回归算法和所述异常月份的异常数据建立异常判断模型;其中,所述异常数据包括:异常月份的温度、节假日和异常售电量情况;

基于所述异常判断模型和预设的随机因素判断所述待预测时间是否异常;

若所述待预测时间异常,依据所述异常判断模型和l1/2稀疏迭代算法以及所述剥离春节因素的随机项建立第一随机项预测模型,并依据所述第一随机预测模型计算待预测时间售电量的随机项的第一预测值;

若所述待预测时间不异常,基于混合专家模型和所述剥离春节因素的随机项建立第二随机项预测模型,并依据所述第二随机预测模型计算所述待预测时间售电量的随机项的第二预测值。

举例说明:

第一步:假设售电量随机项记为{qr(i)|i∈1,2,...,n},采用移动假日剥离算法剥离该随机项中的春节因素,得到剥离春节因素的售电量随机项,记为

{qr-(i)|i∈1,2,...,n}。

利用箱线图法,从该剥离春节因素的随机项中得到异常月份,以该异常月份历史同期温度和假日作为输入,异常月历史同期电量异常情况作为输出,采用逻辑回归算法建立历史异常月的异常判断模型(同时也是异常剥离模型或者异常补偿模型),如公式6)所示:

6)a=f(h(i),t(i)),i∈(1,2,...,m);

通过逻辑回归算法得到了h(i)的权重α和t(i)的权重β。a=0表示正常月份,a=1表示异常月份,若i∈(6,7,8,9),t(i)为最高温度{th(i)|i∈1,2,...,n},若i∈(11,12,1,2),t(i)为最低温度{tl(i)|i∈1,2,...,n},若i∈(3,4,5,10),t(i)为平均温度{ta(i)|i∈1,2,...,n}。

第二步利用建立的异常判断模型,结合温度和节假日情报数据,判断待预测时间是否异常,具体的,在异常判断模型中输入了温度和节假日情报数据后,结合异常判断模型中h(i)和t(i)的权重,判断待预测月是否正常;其中,预设的随机因素可以为温度因素和节假日因素。

第三步若预测月正常。利用混合专家算法得到随机项预测模型,每个专家采用svm算法,得到随机项初步预测结果即随机项的第二预测值,如下公式7)所示:

7)

其中节假日天数为{h(i)|i∈1,2,...,n},平均气温数据为{ta(i)|i∈1,2,...,n}。

得到初步的预测结果后,还需要对初步预测结果进行滤波,得到修正好的预测结果,具体的,还可以包括:

对所述随机项的第二预测值进行卡尔曼滤波,得到随机项的第三预测值。

本实施例中,以同期随机项历史值及预测值作为输入,利用卡尔曼滤波算法按待预测时间为周期建立模型,得到预测结果的修正值,即随机项的第三预测值;若待预测时间为一个月,则按照月建立模型。

第四步若预测时间异常。根据异常判断模型中温度和节假日权重剥离历史异常月份的随机项温度、假日影响。并对剥离后的随机项采用l1/2稀疏迭代进行预测,得到异常剥离后的随机项初步预测结果,然后利用异常判断模型中温度和假日权重实现温度和假日补偿作为随机项预测结果。

本实施例中,需要说明的是s102、s103、s104的步骤可以是同时执行的,也可以是依据预设的顺序依次执行的。

s105:将所述多个趋势项预测值、季节项预测值和随机项预测值进行加和重构,得到第一售电量预测值;

本实施例中,经过上述流程,分别得到了待预测时间的趋势项、季节项和随机项的预测值,并且,趋势项包括多个预测值;

假设趋势项包括四种预测结果,通过加和重构的方式得到的第一售电量预测值如公式8)所示:

8)

s106:依据层次分析法ahp对所述第一售电量进行择优处理,得到第二售电量预测值。

本实施例中,对趋势项、季节项、随机项经过预测重构,得到了售电量的多种预测结果,需要从中选择出最优的预测结果。择优的目的就是综合考虑预测误差、预测趋势和预测曲线形态等方面,选择出最具预测性能的预测曲线,本发明采用基于ahp的综合评价方法进行择优。

本实施例中,由于春节通常在第一季度的1月中下旬或者2月,因此春节会对1-3月份的售电量的预测产生影响,因此,若待预测时间在1-3月份之间,还需要考虑春节的影响,参考图2具体的,还可以包括:

s201:若所述待预测时间在1-3月份之间,获取历史售电量数据中每年春节距每年1-3月份首日天数以及1-3月份中每个月份的占季比;其中,所述每个月份的占季比为各月售电量占季度总电量的比例;

s202:将每年春节距每年1-3月份首日天数和每个月份的占季比进行拟合,得到拟合函数;

s203:获取待预测年的春节距该年1-3月首日的天数,并依据所述待预测年的春节距该年1-3月首日的天数和所述拟合函数计算所述待预测时间的占季比;所述待预测年为所述待预测时间所属年份;

s204:获取所述待预测年第一季度的所述第二售电量预测值;

s205:基于所示第二售电量预测值和所述待预测时间的占季比,计算调整后的待预测时间的售电量预测值。

本实施例中,需要说明的是历史售电量数据中每年春节距该年1-3月份首日天数可以理解为,每年春节距离该年1月1号的天数、每年春节距离该年2月1号的天数以及每年春节距离该年3月1号的天数,例如历史售电量数据包括的是2012年和2013年的数据,则历史售电量数据中每年春节距该年1-3月份首日天数可以理解为,2012年春节距离2012年1月1号的天数,2012年春节距离2012年2月1号的天数、2012年春节距离2012年2月1号的天数、2013年春节距离2013年1月1号的天数、2013年春节距离2013年2月1号的天数以及2013年春节距离2013年3月1号的天数。其中,第一季度的第二售电量预测值可以是通过s101-是s106获取到的

举例说明:假设获取到的历史售电量数据中每年春节距每年1-3月份首日天数记为{xk|k=1,2,...m},1-3月份中每个月份的占季比记为{ωk|k=1,2,...m};将每年春节距每年1-3月份首日天数和每个月份的占季比进行拟合后得到的拟合函数表示为ωk=f(xk);将获取到的待预测年春节距该年1-3月份的天数代入到该拟合函数中,得到该待预测年1-3月每个月份的占季比,从而得知待预测时间的占季比,并将该待预测时间的占季比进行归一化后得到通过s101-s106得到该待预测年第一季度售电量的预测值

本实施例中,首先对原始售电量数据进行预处理,提升了建模数据质量。然后利用x13季节调整算法得到了售电量数据的趋势项、季节项和随机项三个子序列,在利用相关性分析深入研究各子序列影响因素的基础上,通过子序列预测结果加和重构得到售电量预测结果。其中趋势项预测综合考虑了影响趋势项的相关指标,并且采用多种机器学习算法分别进行预测,随机项预测考虑了春节因素和一些随机项因素,;最后,采用基于ahp的综合评价方法在四种加和结果中得到最具预测性能的预测结果。通过本实施例的方法,能够识别出趋势项变化的“拐点”,并且考虑了春节因素,使得得到的预测结果更加的准确。

参考图3,示出了本发明实施例提供的一种基于前导分析和因素补偿的售电量预测装置的结构示意图,在本实施例中,所述装置包括:

预处理单元301,用于对历史售电量数据进行预处理,得到预处理后的历史售电量数据,并依据x13季节调整方法将所述预处理后的历史售电量数据分解为趋势项、季节项和随机项三个序列;

趋势项预测单元302,用于获取影响所述趋势项的相关指标,并依据所述趋势项、影响所述趋势项的相关指标以及预设的多种第一机器学习算法建立多个趋势项预测模型,并依据所述多个趋势项预测模型计算待预测时间的售电量趋势项预测值;所述趋势项预测值为多个;所述影响所述趋势项的相关指标包括:前导性指标和即时性指标;或者包括前导性指标;

季节项预测单元303,用于基于所述季节项和预设的第二机器学习算法建立所述季节项预测模型,并依据所述季节项预测模型计算所述待预测时间售电量的季节项预测值;

随机项预测单元304,用于依据所述随机项、春节因素和预设的随机项因素,采用预设的剥离和补偿规则以及预设的第三机器学习算法建立随机项的预测模型,并依据所述随机项的预测模型计算待预测时间售电量的随机项预测值;

加和重构单元305,用于将所述多个趋势项预测值、季节项预测值和随机项预测值进行加和重构,得到待预测时间的第一售电量预测值;

择优处理单元306,用于依据层次分析法ahp对所述第一售电量进行择优处理,得到待预测时间的第二售电量预测值。

可选的,所述前导性指标包括以下指标中的一个或者多个;

前导性指标:业扩净增容量、制造业pmi、非制造业pmi;

所述即时性指标包括以下即时性指标中的一个或者多个:

即时性指标:人均可支配收入、第二产业gdp增速、第三产业gdp增速和工业增加值增速。

可选的,趋势项预测单元包括:

第四计算单元,用于若获取到了多个影响所述趋势项的相关指标,,采用主成分分析法pca计算所述多个影响所述趋势项的相关指标的去相关结果;

趋势项预测子单元,用于依据所述趋势项、所述去相关结果和预设的多个第一机器学习算法建立多个趋势项预测模型,并依据所述多个趋势项预测模型计算待预测时间售电量的趋势项的预测值。

可选的,所述季节项预测单元,包括:

季节项预测子单元,用于基于季节项和l1/2稀疏迭代算法建立所述季节项预测模型,并依据所述季节项预测模型计算所述待待预测时间售电量的季节项预测值。

可选的,所述随机项预测单元,包括:

剥离子单元,用于采用移动假日剥离算法剥离所述随机项中的春节因素,得到剥离春节因素的随机项;

获取子单元,用于采用箱线图法从所述剥离春节因素的随机项中获取异常月份;

异常判断模型建立子单元,用于依据逻辑回归算法和所述异常月份的异常数据建立异常判断模型;其中,所述异常数据包括:异常月份的温度、节假日和异常售电量情况;

异常判断子单元,用于基于所述异常判断模型和预设的随机因素判断所述待预测时间是否异常;

第一随机项预测子单元,用于若所述待预测时间异常,依据所述异常判断模型和l1/2稀疏迭代算法以及所述剥离春节因素的随机项建立第一随机项预测模型,并依据所述第一随机预测模型计算待预测时间售电量的随机项的第一预测值;

第二随机项预测子单元,用于若所述待预测时间不异常,基于混合专家算法和所述剥离春节因素的随机项建立第二随机项预测模型,并依据所述第二随机预测模型计算待预测时间售电量的随机项的第二预测值。

可选的,所述预设的随机因素包括:

温度因素和节假日因素。

可选的,还包括:

滤波单元,用于对所述随机项的第二预测值进行卡尔曼滤波,得到随机项的第三预测值。

可选的,还包括:

第一获取单元,用于若所述待预测时间在1-3月份之间,获取历史售电量数据中每年春节距每年1-3月份首日天数以及1-3月份中每个月份的占季比;其中,所述每个月份的占季比为各月售电量占季度总电量的比例;

第一计算单元,用于将每年春节距每年1-3月份首日天数和每个月份的占季比进行拟合,得到拟合函数;

第二计算单元,用于获取待预测年的春节距该年1-3月首日的天数,并依据所述待预测年的春节距该年1-3月首日的天数和所述拟合函数计算所述待预测时间的占季比;所述待预测年为所述待预测时间所属年份;

第二获取单元,用于获取所述待预测年第一季度的所述第二售电量预测值;

第三计算单元,用于基于所示第二售电量预测值和所述待预测时间的占季比,计算调整后的待预测时间的售电量预测值。

可选的,所述预处理单元,包括:

异常值处理子单元,用于采用分箱法从所述历史售电量数据中识别出预设的异常值,并将识别出的异常值由所述历史售电量均值代替,得到除去异常值的历史售电量数据;

数据筛选子单元,用于采用分箱法从所述除去异常值的历史售电量数据中筛选出建模数据。

通过本实施例的装置,对趋势项的预测考虑了前导性指标和即时性指标,并且采用多种机器学习算法分别进行预测;随机项预测考虑了春节因素和一些随机项因素,并建立了异常判断模型,在外部因素变化异常的情况下也能实现精准的售电量预测。这样,不仅能够识别出趋势项变化的“拐点”,并且得到的预测结果更加精确。

为了更加清楚的对本发明实施例进行解释,现对本发明实施例中涉及到的一些计算方法进行介绍:

1、x13季节调整

季节分解的常规方法如下:首先,对原时间序列用移动平均法计算趋势项;其次,基于3*3移动平均法计算出季节项;最后用原时间序列减去趋势项和季节项之和得到随机项。常规方法仅仅是对时间序列进行了粗略分解,当时间序列变化复杂时,其分解效果往往不再理想。基于此,目前已出现了多种更优秀的季节调整方法,x13法就是其中应用较普遍的一种,其基本思路是采用中心化移动加权平均法逐项分解,与季节调整的常规方法主要区别在于它的各分量序列是通过多次迭代和分解完成的,更能准确地对时间序列进行分解。其中,趋势项反映了时间序列的长期趋势性变动;季节项反映时间序列在不同年份相同月份季节周期变化;随机项反映时间序列非季节项的气象等其他不规律变化。x13季节调整可将月度售电量曲线分解为趋势项、季节项和随机项三个子序列。

2、svm回归算法

svm(英文全称:supportvectormachine,中文全称:支持向量机)回归是支撑向量在函数回归领域的应用。svm回归的样本点只有一类,所寻求的最优超平面是使所有样本点离超平面的“总偏差”最小。这时样本点都在两条边界线之间,求最优回归超平面同样等价于求最大间隔。

给定数据集d:xi∈rm,yi∈r,回归问题的本质是寻找函数f(x),以便推断任一个模式x对应的y值。

svm回归通过定义硬-ε带超平面(如图4所示),即数据集d中所有样本点均满足:-ε≤yi-f(xi)≤ε,i=1,2,...n,将回归问题转换成,寻找最优硬-ε带超平面,如公式9)所示:

9)s.t.-ε≤yi-f(xi)≤ε,i=1,2,...,n;

求解该优化问题,又可以转化成求解正类点集d+和负类点集d-的二分类问题(如图5所示),其中

10)

3、l1/2稀疏性回归

给定数据集:xi∈rm,yi∈r,回归问题的本质是从学习机器f中寻找最优的函数f*以最好的地逼近x,y之间的未知关系,目前比较流行的方法是采用lp正则化框架的方法,如下:

其中l(.,.)为损失函数,当预测值和实际值接近时,损失函数最小。λ为控制机器复杂度的正则化参数。||f||p为解的某种范数,代表了对解的某种期望(如光滑性、稀疏性等)。通常求解回归问题时,经常会遇到过拟合的问题,正则化框架充分考虑了这种情况,通过增加||f||p来对解增加某种约束,降低过拟合的风险。

时,即l1/2稀疏性,一方面保证了可解性,另一方面保证了解的稀疏性。

4、回声状态网络回归

esn(英文全称:echostatenetwork,中文全称:回声状态网络)的核心思想是:使用具有大规模处理单元的随机稀疏网络作为储备池,将输入信号从低维的输入空间映射到高维的状态空间,在高维的状态空间中对网络的部分连接权进行训练,而其他连接权随机产生,并在网络训练过程中保持不变。

假设回声状态网络由k个输入单元、n个储备池处理单元、和l个输出单元构成。则回声状态网络的基本方程为式12)和式13):

12)x(n+1)=f(winu(n+1)+wx(n));

13)y(n+1)=fout(woutu(n+1)+wx(n+1));

式中:u(n),x(n),y(n)分别为esn的输入变量、状态变量和输出变量;f(.)和fout(.)分别为储备池处理单元和输出单元的激活函数向量。输入单元通过win与储备池的处理单元连接,w表示储备池内部处理单元之间的连接权值,wout为储备池与输出单元的连接权值。此外,win和w经初始化后保持不变,wout需要通过训练获得。

5、极限学习机回归算法

elm(英文全称:extremelearningmachine,中文全称:极限学习机)是人工神经网络领域新兴的一种算法,如果激活函数可以无穷可微,只需要在训练之前设置适当的隐含层节点数,为输入权和隐含层偏差进行随机赋值,再通过最小二乘法来得到输出层权值。与传统的神经网络学习方法相比,极限学习机不需要多次迭代,也不需要在迭代中确定参数,计算量和搜索空间都大大降低。

设训练样本的向量为{(x1,y1),(x2,y2),...,(xn,yn)},其中xi∈rn为输入向量即网络训练集,yi∈rm为训练的期望输出向量。隐含层节点数目为激励函数为g(x)的slfn的统一模型为:

14)

其中:ai=[ai1,ai2,...,ain]t是连接第i个单隐层节点和输入节点之间的权重;bi是网络的第i个隐含层节点的偏置值;βi=[βi1,βi2,...,βim]t是第i个隐含层节点和输出节点之间的权重。激励函数g(x)可以是“sigmoid”、“tanh”或“rbf”等。

公式14)的n个方程的矩阵形式可写为hβ=y,即将数据集映射到隐含层的特征空间中。其中h称为极限学习机的隐含层输出矩阵:

15)

进而,可以通过最小二乘法得到方程组的解β=h*y,其中h*是输出矩阵h的moore-penrose广义逆矩阵。求出β后就完成了极限学习机的训练过程。极限学习机算法的步骤可以概括为:

1)随机赋值隐含层和输入层的权重a、隐含层节点的偏置值

2)计算隐含层输出矩阵h;

3)通过β=h*y求出输出层权重。

6、混合专家模型

如图6所示为一个me(英文全称:mixtureofexperts,中文全称:混合专家)模型。它由k个专家网络或是简称专家的监督模块组成,并且有一个信令分配网络(gatingnetwork),在专家网络中充当协调者的角色,负责分散信息(从训练数据中搜集)给不同的专家,使得专家概率产生模型在输入空间不同的区域上达到较好的效果。

专家k的输出是输入向量x和该神经元突触权值wk的内积,即

16)

门阀由单层的k个神经元组成,每个神经元被指派给一个特定的专家,通常其神经元是非线性的,并定义门阀的激活函数如下:

17)

其中,uk是输入向量x和突触权值向量ak的内积,即进一步,令yk代表输入向量为x时第k个专家的输出,则me模型的整体输出是:

18)

对于给定的me模型和训练样本,训练的目的使得式(2-6)整体误差最小:

19)

其中,对于第l个样本x1,yl为网络的实际输出;dl表示期望输出;l为训练样本的个数。

7、移动假日剥离算法

移动假日剥离通过构造虚拟变量,利用回归方法剥离原始序列中的移动假日因素。具体步骤:第一,构造节前、节中和节后的影响权重,假定节前假日效应影响天数共wa天,其影响程度呈线性递增趋势,即节前第wa天的影响权值为以此类推,节前第一天的影响权值为假定节假日天数共wd天,假日期间影响程度保持不变,即每一天的影响权数相同即为1/wd.假定节后假日效应影响天数共wb天,其影响程度呈线性递减趋势,即节后第一天的影响权值为以此类推,节后第wb天的影响权值为第二,根据节前节日期间和节后影响天数落在影响月份的具体天数将各天的影响权数加总得到比例变量

pa(wa),pd(wd),pb(wb),然后对它们分别进行中心化处理,构造代表节前、节日期间和节后春节效应的回归变量xa(wa),xd(wd),xb(wb)。第三、计算剥离假日因素的序列:yi,j=m1xi,j(wa)+m2xi,j(wd)+m3xi,j(wb)+zi,j,其中,yi,j是对应第i年第j月的待调整的序列,zi,j是回归误差。使用迭代广义最小二乘算法估计参数,得到估计的春节效应为从yi,j中减去移动假日因素,即就得到了经过移动假日因素剥离的序列。

8、逻辑回归

逻辑回归算法属于广义线性模型,训练过程包括以下三个步骤:

首先,构造预测函数:

由于hθ(x)可表示结果取1的概率,因此,对于分类结果为类别1和类别0的概率分别可表示为:

20)

然后,构造损失函数,这里采用交叉熵作为损失函数,具体为:

21)

最后,最小化损失函数,求解采用梯度下降法,可得参数的更新规则如下:

22)

不断迭代参数更新规则,直至满足终止条件。

9、主成分分析

主成分分析法是一种常用的降维方法。主成分分析基于正交变换将一组线性相关的变量转换为一组线性无关的变量。pca的基本原理如下:给定输入数据矩阵xm×n(通常m>n),它由一些中心化的样本数据构成,其中xi∈rnpca通过式23)将输入数据矢量xi变换为新的矢量

23)si=utxi;

其中:u是一个n×n正交矩阵,它的第i列ui是样本协方差矩阵

24)

的第i个特征向量。换句话说,pca首先求解如下的本征问题

25)λiui=cuii=1,...,n;

其中λ是c的一个本征值,ui是相应的特征向量。当仅利用前面的p个特征向量时(对应特征值按降序排列),得矩阵s=utx。新的分量s称为主分量。

10、卡尔曼滤波

卡尔曼滤波算法是一种最优自回归数据处理算法,其基本思想是:以最小均方误差为最佳估计准则,采用状态空间模型,利用前一时刻的估计值和当前时刻的观测值来更新对状态变量的估计,求出当前时刻的估计值。

首先引入离散过程系统,包括过程方程和测量方程:

26)

其中,xk为系统状态,a为状态矩阵,uk-1为输入,b为输入矩阵,q为过程噪声,y为观测值,h为测量矩阵,r为测量噪声。基于最小化均方误差,可得到卡尔曼滤波的五个更新方程,包括时间更新:

27)

和状态更新:

28)

其中,为一步估计,为系统误差估计,kk为卡尔曼增益,为修正后的估计值,pk为修正后的系统误差。对于输入数据不断使用上述五个更新公式进行迭代,即可完成整个滤波过程。

11、动态时间规整

dtw(英文全称:dynamictimewarping,中文全称:动态时间规整)是一种衡量两个长度不同的时间序列x=(x1,…,xi,…,xm)和y=(y1,…,yj,…,yn)的相似度的方法。dtw通过把时间序列进行延伸和缩短,来计算两个时间序列之间的相似性。动态时间规整dtw是一个典型的优化问题,求解两模板匹配时累计距离最小所对应的规整函数d(i,j),它表示为序列x上点i和y上的点j之间的规整路径距离:d(i,j)=dist(i,j)+min{d(i-1,j),d(i,j-1),d(i-1,j-1)},其中dist(i,j)为x上点i和y上的点j之间的欧式距离。

12、层次分析法:

根据ahp的层次结构将售电量预测结果择优问题按层次结构分为目标层、准则层及方案层:

目标层:包括1个目标,即选取最具预测性能的预测曲线。

准则层:包括3个评价指标:模型的训练误差、预测趋势相似度和预测趋势可信度。指标含义如下所示:

1)模型训练误差反映了预测模型模拟的趋势和历史售电量数据匹配的程度,即:

29)

其中qj是j时刻的历史值,f(j)是j时刻的拟合值,n是拟合值个数。

2)预测趋势相似度反映了预测模型当前预测结果与历史售电量曲线形态的相似度,即:

30)

其中xj是历史j时刻的历史值,yj是预测模型j时刻的预测值,分别是xj,yj均值。

3)预测趋势可信度是对预测模型当前预测结果符合历史曲线趋势变化的度量,即:

31)

其中r为预测售电量的年度累计与上一年历史累计售电量之比,为历史年度累计比的最小值和最大值构成的区间。

方案层:包括4种方案,即svm、l1/2稀疏迭代、极限学习机以及回声状态网络四种算法下的售电量预测结果。

继而构建目标层对准则层的判断矩阵,并求取权重向量。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1