本发明涉及电价预测方法领域,具体为一种基于经验模态分解与最小门控记忆网络分位数回归的电价预测方法。
背景技术:
在开放的电力市场中,价格机制对市场参与者之间的公平交易和供需互动具有重要的影响。电价的波动性和不确定性为电力市场注入了活力,同时也增加了电价预测难度。精准的短期电价预测能够为电力市场各参与者制定最优市场策略时提供有效的决策指导,提高电力市场中供给与需求之间的匹配度,降低电力需求客户的用电成本,提升供电企业的经济效益,从而保障电力市场稳定运行。
现有的电价预测方法主要分为时间序列模型和机器学习模型两类。整合移动平均自回归(arima)模型和广义自回归条件异方差(garch)模型是时间序列模型中具有代表性的两个方法,然而这类模型都是线性模型,不适用于波动异常剧烈、电价序列间相关性较弱的电力市场。机器学习模型是将非线性的时间序列数据进行特征提取后再通过机器学习方法进行预测,模型比较复杂但准确度较高。特征提取方法中的经验模态分解(emd)方法具有优良的时频聚集性,适用于预测电价这种突变信号。有学者已将emd与机器学习方法中的人工神经网络(ann)、支持向量回归模型(svr)等组合形成不同的混合模型对电价进行预测,较单一算法模型明显提高了预测精度。随着深度学习的飞速发展,适用于处理时间序列数据的循环神经网络(rnn)被广泛应用于电价预测,但由于rnn的长期依赖问题,可预测的步长较短。长期短期记忆网络(lstm)在rnn结构的基础上引入自循环思想,有效解决了梯度消失问题,近年来已开始被应用于电价预测。有学者提出了最小门控记忆网络(mgm),将lstm中的输入门和遗忘门进行耦合,简化了lstm的结构,大幅缩短了风速预测训练时长而没有显著降低预测精度。目前尚未有研究将mgm应用于电价预测。
上述电价预测方法均为点预测方法,缺乏量化预测不确定性的能力。分位数回归(qr)用于研究自变量与因变量的条件分位数之间的关系,不仅可以得到预测区间,还可以通过概率密度估计方法进一步估计概率密度分布,但该方法只适用于线性回归问题。有学者提出了将qr和点预测方法相结合的框架,解决了其非线性回归问题。将qr和点预测方法结合组成的混合模型不仅可以量化预测的不确定性,还能获得电价概率密度函数,为市场参与者制定最优市场策略提供更多有效信息。目前国内外有关电价预测的研究主要还是局限在点预测,电价区间预测和概率密度估计的研究较少。
因此,为了提供更多有效信息给市场参与者制定最优市场策略时参考,有必要研究一种既能提高预测精度又能获得可靠电价概率密度函数的电价预测方法。
技术实现要素:
本发明为了解决目前现有的电力市场电价预测方法用时过长,无法训练更多样本以提高预测精度,且主要局限在点预测,电价区间预测和概率密度估计的研究较少,无法为市场参与者制定最优市场策略提供更多有效信息的问题,建立了一种基于经验模态分解与最小门控记忆网络分位数回归的电价预测方法。
本发明是采用如下技术方案实现的:
一种基于经验模态分解与最小门控记忆网络分位数回归的电价预测方法,包括如下步骤:
(1)、电价序列经验模态分解
采用经验模态分解(emd)方法将复杂的电价时间序列按波动尺度分解为若干个本征模函数(imf)和一个残差序列之和。
具体的分解过程如下:
1.1、确定电价时间序列s(t)的最大值和最小值;
1.2、使用三遍插值运算拟合电价时间序列,形成上包络smax(t)和下包络smin(t),并计算两者均值m(t):
1.3、通过从s(t)减去m(t),得到如下新的电价时间序列:
h1(t)=s(t)-m(t)(2)
1.4、判断h1(t)是否满足imf条件,imf满足如下条件:①无论何时,上下包络线的均值都为0;②相邻零点间只有一个极值点;
若满足,则h1(t)是提取出的一个imf,电价时间序列信号s(t)变为s1(t),如下所示:
s1(t)=s(t)-h1(t)(3)
若不满足,则用h1(t)代替步骤1.1中的s(t)重新分解,直到h1(t)满足imf条件为止;
1.5、不断重复以上步骤提取imf,直至sn(t)变为单调序列或常值序列为止;此时sn(t)即为残差序列r;
最终,原始电价时间序列s(t)被分解为n个imf分量和一个残差序列,如下所示:
(2)、用于电价预测的最小门控记忆网络分位数回归
将分位数回归(qr)和最小门控记忆网络(mgm)结合组成混合模型qr-mgm,将emd分解得到的imf分量和残差序列作为混合模型的输入,在不同分位数下对各个模态分量进行预测,并将预测结果重构得到预测电价的条件分位数,采用核密度估计(kde)估计电价的概率密度函数。
2.1、分位数回归
线性qr模型如下所示:
qyt(τ|xt)=f(xt,β(τ))
=xtβ(τ)t=1,2,…,n(5)
式中:xt是自变量,作为t时刻的历史电价数据;yt是因变量,作为t时刻的电价点预测值;τ是分位点且τ∈(0,1);qyt(τ|xt)是yt的第τ个条件分位数;β(τ)是回归系数;通过最小化损失函数l来获得β(τ)的估计值
式中:
得到
2.2、最小门控记忆网络分位数回归
将qr和mgm结合组成混合模型qr-mgm,估计emd分解所得各个电价模态分量的条件分位数,并将结果进行重构,量化预测不确定性,计算步骤如下所示:
2.2.1、计算遗忘门ft(τ)并耦合输入门it(τ);
ft(τ)=σ(ωh(τ)·ht-1(τ)+ωx(τ)·xt)(9)
it(τ)=1-ft(τ)(10)
2.2.2、计算当前信息状态αt(τ);
αt(τ)=tanh(ωh(τ)·ht-1(τ)+ωx(τ)·xt)(11)
2.2.3、计算隐藏层的输出ht(τ);
ht(τ)=ft(τ)*ht-1(τ)+it(τ)*αt(τ)(12)
2.2.4、计算条件分位数
2.2.5、将n个电价模态分量分别作为输入,重复步骤2.2.1到2.2.4估计条件分位数,并将结果进行重构;
式中:符号·表示矩阵乘法;符号*表示矩阵元素之间的乘法;ωh(τ),ωx(τ)和ωy(τ)为形状分别为[d×d],[d×m]和[1×d]的权重矩阵;
2.3、核密度估计
n个τ从0到1等距分布,每个τi对应一个由qr-mgm获得的qyt(τi|xt),构成一个集合zt;采用kde估计zt的概率密度函数,公式如下所示:
式中:b为窗宽且b>0;n为样本总数;k(·)为非负核函数,使用高斯核函数,公式如下所示:
(3)、评价指标
混合模型qr-mgm的预测评价指标包括点预测评价指标、区间预测评价指标和概率预测评价指标。
3.1、点预测评价指标
选取预测电价条件分位数的中位数作为电价点预测数据,使用均方根误差rrmse和平均绝对百分比误差rmape来评价点预测的准确性,指标越小说明点预测精度越高;计算公式如下所示:
式中:yt和yt分别是预测值和真实值;tv是验证集样本个数;
3.2、区间预测评价指标
使用覆盖概率rcpα和平均宽度百分比rmwpα来评价区间预测的适用性;rcpα定义为在置信度α下真实值落入预测区间内的概率;rmwpα用于测量预测间隔宽度;将间隔预测的综合评价指标定义为rmcα;rmcα越小说明区间预测的适用性越强;计算公式如下所示:
式中:cα是真实值落在预测间隔内的样本数;ut和dt是预测间隔的上限和下限;α取95%;
3.3、概率预测评价指标
使用连续分级概率评分rcrps来评价概率预测的综合性能;rcrps越小说明概率预测的综合性能越好;计算公式如下所示:
式中:p(yt)是yt的概率密度函数;f(yt)是yt的累积分布函数;h(yt-yt)是heaviside函数。
与现有技术对比,本发明所具有的有益效果如下:
1、本发明提出一种基于emd与qr-mgm的电价预测方法,采用经验模态分解将电价序列分解为若干个模态分量,将qr和mgm结合组成混合模型qr-mgm对各个模态分量在不同分位数下进行预测,并对重构后的预测结果采用kde得到电价的概率密度函数。不仅可以量化预测的不确定性,还能获得电价概率密度函数。
2、实验结果表明,相同训练样本的情况下,本发明提出的qr-mgm相比于qr-lstm大幅缩短了训练时长,而没有显著降低电价预测精度;相同训练时长的情况下,qr-mgm比qr-lstm训练了更多的数据,具有更高的短期电价预测精度,还能获得更可靠的电价概率密度函数,为市场参与者制定最优市场策略提供更多有效信息。
本发明设计合理,具有很好的实际应用价值。
附图说明
图1表示本发明的预测方法流程图。
图2表示发明中将qr和lstm结合组成混合模型qr-lstm,然后选取美国ercot电力市场从2019年5月1日至5月31日共744个时间点的日前电力市场电价数据,分别使用qr-mgm和qr-lstm预测6月1日24个时间点的电价数据的点预测和区间预测结果对比。
图3a表示图2中第9个预测时间点的概率密度函数对比。
图3b表示图2中第13个预测时间点的概率密度函数对比。
图3c表示图2中第22个预测时间点的概率密度函数对比。
图4表示本发明选取美国ercot电力市场从2019年4月8日至5月31日共1296个时间点的日前电力市场电价数据,使用qr-mgm预测6月1日24个时间点的电价数据,与图2中训练样本为744个的qr-lstm点预测和区间预测结果的对比。
图5a表示图4中第9个预测时间点的概率密度函数对比。
图5b表示图4中第13个预测时间点的概率密度函数对比。
图5c表示图4中第22个预测时间点的概率密度函数对比。
具体实施方式
下面结合附图对本发明的具体实施例进行详细说明。
一种基于经验模态分解与最小门控记忆网络分位数回归的电价预测方法,具体方案如下:
一、电价序列经验模态分解
电力市场电价是一个具有波动强烈、均值回复性和多周期性等特点的时间序列。本发明中采用经验模态分解(emd)方法将复杂的电价时间序列按波动尺度分解为若干个本征模函数(imf)和一个残差序列之和。
imf需要满足如下条件:①无论何时,上下包络线的均值都为0;②相邻零点间只有一个极值点。
具体的分解过程如下:
(1)、确定电价时间序列s(t)的最大值和最小值;
(2)、使用三遍插值运算拟合电价时间序列,形成上包络smax(t)和下包络smin(t),并计算两者均值m(t):
(3)通过从s(t)减去m(t),得到如下新的电价时间序列:
h1(t)=s(t)-m(t)(2)
(4)判断h1(t)是否满足imf条件,若满足,则h1(t)是提取出的一个imf,电价时间序列信号s(t)变为s1(t),如下所示:
s1(t)=s(t)-h1(t)(3)
若不满足,则用h1(t)代替步骤(1)中的s(t)重新分解,直到h1(t)满足imf条件为止;
(5)、不断重复以上步骤提取imf,直至sn(t)变为单调序列或常值序列为止;此时的sn(t)即为残差序列r。
最终,原始电价时间序列s(t)被分解为n个imf分量和一个残差序列,如下所示:
二、用于电价预测的最小门控记忆网络分位数回归
本发明中将分位数回归(qr)和最小门控记忆网络(mgm)结合组成混合模型qr-mgm,将emd分解得到的imf分量和残差序列作为混合模型的输入,在不同分位数下对各个模态分量进行预测,并将预测结果重构得到预测电价的条件分位数,采用kde估计电价的概率密度函数。
a、分位数回归
传统的回归分析研究自变量与因变量的条件期望之间的关系,而qr则是研究自变量与因变量的条件分位数之间的关系。相较于传统回归分析仅能得到因变量的中央趋势,qr可以进一步推论因变量的条件概率分布。线性qr模型如下所示:
式中:xt是自变量,yt是因变量,在本发明中分别为t时刻的历史电价数据和电价点预测值;τ是分位点且τ∈(0,1);qyt(τ|xt)是yt的第τ个条件分位数;β(τ)是回归系数;可以通过最小化损失函数l来获得β(τ)的估计值
式中:
得到
b、最小门控记忆网络分位数回归
本发明中采用深度学习方法中的mgm对电力市场电价进行点预测。mgm是基于lstm改进的一种时间循环神经网络,将lstm中的输入门和遗忘门进行耦合,简化了lstm的结构,大幅缩短了预测训练时长而没有显著降低预测精度。
将qr和点预测模型相结合的框架总结如下:
a、假设
b、将qr与该点预测模型相结合的混合模型为
c、通过混合模型
本发明中将qr和mgm结合组成混合模型qr-mgm,估计emd分解所得各个电价模态分量的条件分位数,并将结果进行重构,量化预测不确定性。计算步骤如下所示:
(1)计算遗忘门ft(τ)并耦合输入门it(τ);
ft(τ)=σ(ωh(τ)·ht-1(τ)+ωx(τ)·xt)(9)
it(τ)=1-ft(τ)(10)
(2)计算当前信息状态αt(τ);
αt(τ)=tanh(ωh(τ)·ht-1(τ)+ωx(τ)·xt)(11)
(3)计算隐藏层的输出ht(τ);
ht(τ)=ft(τ)*ht-1(τ)+it(τ)*αt(τ)(12)
(4)计算条件分位数
(5)将n个电价模态分量分别作为输入,重复步骤(1)到(4)估计条件分位数,并将结果进行重构;
式中:符号·表示矩阵乘法;符号*表示矩阵元素之间的乘法;ωh(τ),ωx(τ)和ωy(τ)为形状分别为[d×d],[d×m]和[1×d]的权重矩阵;
c、核密度估计
qr-mgm获得的预测结果是一系列有条件的电价分位数,无法直接获得概率密度函数,需要使用这些条件分位数通过概率密度估计方法来估计电价的概率密度函数。n个τ从0到1等距分布,每个τi对应一个由qr-mgm获得的
式中:b为窗宽且b>0;n为样本总数;k(·)为非负核函数,本发明中使用高斯核函数,公式如下所示:
三、评价指标
本发明中将qr和点预测模型mgm结合组成混合模型qr-mgm,既可以得到预测区间,还可以估计概率密度分布,所以发明中预测评价指标包括点预测评价指标、区间预测评价指标和概率预测评价指标。
a、点预测评价指标
本发明中选取预测电价条件分位数的中位数作为电价点预测数据,使用均方根误差(rmse)rrmse和平均绝对百分比误差(mape)rmape来评价点预测的准确性,指标越小说明点预测精度越高。计算公式如下所示:
式中:yt和yt分别是预测值和真实值;tv是验证集样本个数。
b、区间预测评价指标
本发明中使用覆盖概率(cp)rcpα和平均宽度百分比(mwp)rmwpα来评价区间预测的适用性。rcpα定义为在置信度α下真实值落入预测区间内的概率。rmwpα用于测量预测间隔宽度。如果间隔足够宽则很容易满足rcpα=100%,不能提供有关预测不确定性的有效信息。理想的预测间隔应具有较高的rcpα和较低的rmwpα,因此将间隔预测的综合评价指标定义为rmcα。rmcα越小说明区间预测的适用性越强。计算公式如下所示:
式中:cα是真实值落在预测间隔内的样本数;ut和dt是预测间隔的上限和下限;α取95%。
c、概率预测评价指标
本发明中使用连续分级概率评分(crps)rcrps来评价概率预测的综合性能。rcrps越小说明概率预测的综合性能越好。计算公式如下所示:
式中:p(yt)是yt的概率密度函数;f(yt)是yt的累积分布函数;h(yt-yt)是heaviside函数。
具体实施时的预测流程如图1所示。
使用本发明中介绍的框架,将qr和lstm结合组成混合模型qr-lstm,然后选取美国ercot电力市场从2019年5月1日至5月31日共744个时间点的日前电力市场电价数据,分别使用qr-mgm和qr-lstm预测6月1日24个时间点的电价数据的点预测和区间预测结果对比如图2所示。从图中可以看出,相同训练样本的情况下,qr-lstm的点预测准确性比qr-mgm略高,且qr-lstm以更窄的预测间隔宽度覆盖了更多的真实值,区间预测适用性比qr-mgm略强。
图3a、3b、3c分别是图2中第9、13、22个预测时间点的概率密度函数对比。从图中可以看出,相同训练样本的情况下,qr-lstm的概率预测综合性能比qr-mgm略好。本发明经过多次试验发现,当qr-mgm的训练样本为1296个时,训练时长与训练样本为744个的qr-lstm近乎相同。
图4是本发明选取美国ercot电力市场从2019年4月8日至5月31日共1296个时间点的日前电力市场电价数据,使用qr-mgm预测6月1日24个时间点的电价数据,与图2中训练样本为744个的qr-lstm点预测和区间预测结果的对比。从图中可以看出,相同训练时长的情况下,qr-mgm的点预测准确性比qr-lstm高,且qr-mgm以更窄的预测间隔宽度覆盖了更多的真实值,区间预测适用性比qr-lstm强。
图5a、5b、5c分别是图4中第9、13、22个预测时间点的概率密度函数对比。从图中可以看出,相同训练时长的情况下,qr-mgm的概率预测综合性能比qr-lstm好。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明专利技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本发明专利的保护范围。