校准窗口集成与耦合市场特征的双层日前电价预测方法

文档序号:32786401发布日期:2023-01-03 19:05阅读:64来源:国知局
1.本发明属于电力市场
技术领域
:,具体涉及校准窗口集成与耦合市场特征的双层日前电价预测方法。
背景技术
::2.在构建新型电力系统和实现双碳目标的背景下,《关于加快建设全国统一电力市场体系的指导意见》强调要实现电力资源在全国更大范围内共享互济和优化配置,加快形成统一的电力市场体系。电价是电力市场交易的关键要素,准确的日前电价预测对于电力市场参与主体制定计划策略至关重要。3.现有日前电价预测模型主要分为统计模型和人工智能模型两类。统计模型依赖于线性回归,并通过解释变量的线性组合来表示预测结果变量,在处理线性数据时效果较好,但对于非线性数据的处理能力不足。自回归滑动平均(autoregressivemovingaverage,arma)族模型和广义自回归条件异方差模型(generalizedautoregressiveconditionalheteroskedastic,garch)是常用的统计模型。人工智能模型相比于统计模型更擅长处理非平稳非线性数据,特别是深度神经网络算法。极限学习机(extremelearningmachine,elm)、长短时记忆网络(longshorttermmemory,lstm)、门控循环单元(gaterecurrentunit,gru)和卷积时空网络(cnn-lstm)是常用的人工智能算法。为获得更准确的预测结果,许多研究工作和试验从不同的角度以寻求可用于电力系统管理和电力市场的改进电价预测模型。现有技术采用分解算法奇异谱分析将原始电价序列分解为不同的模态分量,证明了对电价分解可以有效提高预测精度。还有采用特征选择算法最大信息系数相关性分析在预测前选定对电价预测重要的特征集,降低了预测模型的复杂度;还有则考虑了空间因素对电价预测的影响,使用图卷积神经网络提取所研究区域周围区域的数据,刻画统一市场内不同价区的相互作用。还有则引入了attention机制,在电价预测过程中突出关键特征的作用,提高了模型预测的速度。还有从混合模型的角度,基于核极限学习机(kelm)和arma提出了一种兼具线性和非线性预测能力的混合电价预测模型。4.以上现有技术都侧重于开发更好的模型结构,以提升算法性能。但忽略了以下几点:1)校准窗口的选择对于电价预测的影响:在计量经济学中,预测模型的性能对校准窗口的选择很敏感,并且结合基于不同长度的校准窗口的预测能有效提高预测精度。2)耦合市场的影响:在电力市场不断发展的同时,耦合市场也不断增长,传统的电价预测通常考虑历史电价、发电量、用电量这些典型特征,而缺乏关注耦合市场特征对于电价预测的影响,尤其是电力市场与耦合市场之间输电网络的影响。技术实现要素:5.本发明目的在于提供校准窗口集成与耦合市场特征的双层日前电价预测方法,用于解决上述现有技术中存在的技术问题。6.为实现上述目的,本发明的技术方案是:7.校准窗口集成与耦合市场特征的双层日前电价预测方法,包括以下步骤:8.s1、内层框架为基于改进自适应噪声完备集合经验模态分解iceemdan的择优预测:通过iceemdan算法将原始电价序列分解为各个子序列后,对每个子序列使用统计模型套索估计自回归模型lear和人工智能模型长期和短期时间序列网络lstnet预测;然后根据评价指标选出每个子序列的最优预测模型并整合得到预测电价;9.s2、外层框架为基于贝叶斯模型平均的校准窗口集成预测:设置一组不同时间长度的校准窗口作为输入数据集中的训练集,在每个校准窗口数据集上训练内层预测模型,然后在测试集上预测并使用bma方法对不同的校准窗口的预测赋予相应权重,整合得到最终预测电价。10.进一步的,步骤s1中iceemdan具体分解步骤如下:11.1)向原始序列x中添加i组白噪声ω(i),构造序列x(i)(i=1,2,…,i):12.x(i)=x+β0e1(ω(i))ꢀꢀꢀꢀꢀꢀ(29)13.式中:β0为添加噪声相对于原信号的信噪比与添加噪声标准差的比值,e1(·)表示emd分解噪声后的第一个模态分量;14.2)利用局部均值分解计算第一组残差r1,并计算第一个模态分量imf1:[0015][0016]imf1=x-r1ꢀꢀꢀꢀꢀꢀ(31)[0017]式中:n(·)表示产生信号的局部均值;[0018]3)继续在第一组残差添加白噪声,构造序列计算第二组残差并计算第二个模态分量:[0019][0020]imf2=r1-r2ꢀꢀꢀꢀꢀꢀꢀꢀ(33)[0021]4)计算第k组残差和第k个模态分量:[0022][0023]imfk=rk-1-rkꢀꢀꢀꢀꢀꢀꢀꢀ(35)[0024]5)重复上述步骤,直到获得所有的模态分量。[0025]进一步的,步骤s1中lear的低频子序列预测具体如下:[0026]lear模型是使用l1正则化估计参数的具有外生输入的arx;arx是一种自回归线性时间序列模型,arx模型中预测的电价pd,h定义为:[0027][0028]式中:pd-i表示前i小时电价,ui表示第i个外生变量,ai和bi分别是自回归参数和外生参数,εd,h是残余噪声;使用l1估计系数的计算公式如下:[0029][0030][0031]式中:θh是参数集,rss是残差的平方和,是预测电价,λ是正则化的参数;[0032]利用坐标下降法进行求解,计算流程如下:[0033]1)初始化参数[0034]2)对于第k轮迭代,对每个参数依次进行迭代,每次迭代以单个参数为变量求得目标函数的最小值,其余固定为常量,最小值通过求导得到;迭代公式如下:[0035][0036]3)若满足迭代终止条件,则得到最优值,否则进行下一次迭代。[0037]进一步的,步骤s1中基于lstnet的高频子序列预测具体如下:[0038]lstnet网络通过设置卷积层用以捕获多维输入变量之间的短期局部依赖模式,同时设置循环神经网络层则捕获复杂的长期依赖模式和循环跳跃层用以捕获特别长期依赖的模式;lstnet通过使用全连接层模拟自回归过程来为预测添加线性分量使输出能够相应输入尺度的变化,同时将最终预测分解为线性部分和非线性部分,线性部分集中在局部尺度问题,非线性部分包含循环的特征;[0039]lstnet各个模块具体如下:[0040]1)卷积模块:[0041]没有池化层的卷积神经网络,提取时间维度中的短期特征和变量之间的局部依赖性;卷积核对输入矩阵进行如下卷积操作:[0042]s=f(wx+b)ꢀꢀꢀꢀꢀꢀꢀꢀꢀ(40)[0043]式中:s为卷积运算得到的特征矩阵,w为权重矩阵,b为偏移向量,w和b为网络学习得到的参数,f为relu函数;[0044]2)循环和循环跳跃模块:[0045]循环跳跃模块是具有时间跳跃链接的循环单元结构,具体就是在当前单元和相邻周期的同一相位的隐藏单位之间添加跳转链接,以扩展信息流的时间跨度;使用rnn的变体lstm网络作为循环单元;lstm网络的基本单元包括遗忘门、输入门和输出门;[0046]遗忘门中的输入xt与状态记忆单元ct-s和中间输出ht-s一起决定状态记忆单元;通过sigmoid和tanh函数改变输入门中的xt来决定在状态记忆单元中的保留信息;中间输出ht由更新后的ht和输出ot决定;循环模块和循环跳跃模块的计算公式统一表示如下:[0047]ft=σ(wt·[ht-s,xt]+bf)ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ(41)[0048]it=σ(wi·[ht-s,xt]+bi)ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ(42)[0049]ot=σ(wo·[ht-s,xt]+bo)ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ(43)[0050][0051][0052]ht=ot·tanh(ct)ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ(46)[0053]式中:ft、it、ot、ht、ct分别为遗忘门、输入门、输出门、中间输出和细胞状态;wf、wi、wo、wc是不同状态门对应的权重;bf、bi、bo、bc分别是不同状态门的偏移量项;s为跳过的隐藏单元个数,当s取值为1时,即为lstm网络;[0054]3)自回归模块:[0055]在lstnet架构中,自回归模块采用自回归ar模型作为线性分量,ar模型由如下公式表示:[0056][0057]式中:为预测ar分量预测结果,和bar为模型的系数,qar为输入矩阵的窗口大小;[0058]lstnet的最终预测结果由循环模块预测和自回归模块模型预测整合得到:[0059][0060]进一步的,步骤s2具体如下:[0061]bma方法根据个体预测的后验模型概率对其进行加权,从而生成一个平均模型;[0062]假定候选模型集合m中存在k个成员模型,y为预测变量,mk表示模型k的预测;基于全概率定律,bma预测模型表示为:[0063][0064]式中:ωk表示第k个模型为最佳模型的后验概率,且pk(y∣mk)为y的后验分布,在bma中,条件分布pk(y∣mk)假定为高斯分布;[0065]使用期望最大化算法最大化对数似然函数来估计后验概率;em迭代算法引入一个非观测变量zk,t,当第k个模型在预测t时刻变量yt时为最佳模型,其值为1,否则为0;在初始化每个模型的权重和方差后,em算法在期望步和最大化步之间反复交替,直到满足收敛标准;[0066]1)期望步:基于当前权重与方差估计zk,t:[0067][0068]式中:n为迭代次数,表示第k个模型于预测yt的条件概率分布,为正态分布,均值为fk,t,标准差为[0069]2)最大化步:基于当前非观测变量更新权重和方差;[0070][0071][0072]将贝叶斯模型平均用于校准窗口的集成预测;基于贝叶斯模型平均的权重表示为:[0073][0074]式中:为校准窗口集,τ为中的校准窗口,bic(τ)是贝叶斯信息准则;[0075][0076][0077]式中:k为特征个数,为预测误差,dave为估计权重时选择的时间长度;[0078]由于k与dave在模型建立时值确定,所以权重表达式简化为:[0079][0080]从式(28)可以看出,由于24dave的幂次的存在,将不准确的预测结果的权重降为零。[0081]与现有技术相比,本发明所具有的有益效果为:[0082]本方案其中一个有益效果在于,本发明提出一种考虑校准窗口集成与耦合市场特征的双层日前电价预测方法。该预测算法为双层框架:内层框架为基于改进自适应噪声完备集合经验模态分解iceemdan(improvedcompleteensembleemd)的择优预测:通过iceemdan算法将原始电价序列分解为各个子序列后,对每个子序列使用本文提出的统计模型套索估计自回归模型lear(thelassoestimatedautoregressivemodel)和人工智能模型长期和短期时间序列网络lstnet(long-termandshort-termtime-seriesnetworks)预测。然后根据评价指标选出每个子序列的最优预测模型并整合得到预测电价。外层算法为基于贝叶斯模型平均(bayesmodelaveraging,bma)的校准窗口集成预测:设置一组不同时间长度的校准窗口作为输入数据集中的训练集,在每个校准窗口数据集上训练内层预测模型,然后在测试集上预测并使用bma方法对不同的校准窗口的预测赋予相应权重,整合得到最终预测电价。相比现有预测算法,本发明所提预测方面更加准确和稳定。附图说明[0083]图1为本发明中一个具体实施方式的lstnet结构图。[0084]图2为本发明中一个具体实施方式的循环跳跃结构图。[0085]图3为本发明中一个具体实施方式的总体流程示意图。[0086]图4为本发明中一个具体实施方式的北欧电力市场耦合概览示意图。[0087]图5为本发明中一个具体实施方式的2016/1/4至2018/1/28系统电价曲线示意图。[0088]图6为本发明中一个具体实施方式的分解后子序列示意图。[0089]图7为本发明中一个具体实施方式的某日预测电价对比示意图。具体实施方式[0090]下面结合本发明的附图1-附图7,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。[0091]实施例:[0092]如图1所示,提供一种基于校准窗口集成与耦合市场特征的双层日前电价预测方法。[0093]内层框架—基于iceemdan的择优预测[0094]内层框架首先使用iceemdan分解算法降低模型预测的复杂度,然后针对分解后不同频率的子序列应用预测线性序列较强的统计模型lear和预测非线性序列较强的人工智能模型lstnet预测子序列。lear模型和lstnet模型分别使用最小绝对与收缩算子(lasso)和卷积层隐式提取特征,隐式特征提取方式在生成隐式的特征交互关系同时可以避免传统显式特征选择算法中复杂的特征提取和数据重建过程。[0095]分解算法—iceemdan[0096]iceemdan是由colominas等人提出的一种自适应信号分解方法,适用于非平稳非线性信号,可以抑制emd中“模态混叠”问题。iceemdan与ceemdan都是由emd改进而来,但不同于ceemdan在分解过程中直接添加高斯白噪声,为了克服ceemdan中残留噪声和伪模态问题,iceemdan选取白噪声被emd分解后第k个固有模态分量(intrinsicmodefunction,imf)来确定原始序列分解后的每个imf分量,从而实现原始信号的频域划分并获得包含不同高低频率的子序列。iceemdan具体分解步骤如下:[0097]1)向原始序列x中添加i组白噪声ω(i),构造序列x(i)(i=1,2,…,i):[0098]x(i)=x+β0e1(ω(i))ꢀꢀꢀꢀꢀꢀꢀꢀ(57)[0099]式中:β0为添加噪声相对于原信号的信噪比与添加噪声标准差的比值,e1(·)表示emd分解噪声后的第一个模态分量。[0100]2)利用局部均值分解计算第一组残差r1,并计算第一个模态分量imf1:[0101][0102]imf1=x-r1ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ(59)[0103]式中:n(·)表示产生信号的局部均值。[0104]2)继续在第一组残差添加白噪声,构造序列计算第二组残差并计算第二个模态分量:[0105][0106]imf2=r1-r2ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ(61)[0107]3)计算第k组残差和第k个模态分量:[0108][0109]imfk=rk-1-rkꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ(63)[0110]4)重复上述步骤,直到获得所有的模态分量。[0111]基于lear的低频子序列预测[0112]lear模型是使用l1(lasso)正则化估计参数的具有外生输入的自回归结构(autoregressivemodelswithexogenousinputs,arx)。arx是一种具有外生变量的参数丰富的自回归线性时间序列模型,能够捕获随机过程中的自回归和外生变量关系。arx模型中预测的电价pd,h定义为:[0113][0114]式中:pd-i表示前i小时电价,ui表示第i个外生变量,ai和bi分别是自回归参数和外生参数,εd,h是残余噪声。当arx模型输入维度较高时,lasso算法可以求解稀疏解对模型进行变量选择。使用l1估计系数的计算公式如下:[0115][0116][0117]式中:θh是参数集,rss是残差的平方和,是预测电价,λ是正则化的参数。使用l1正则化估计参数会使部分学习到的权重为零,从而达到消除冗余回归量和特征选择的目的。参数λ可以通过多种方式进行优化。一种方法是优化一次,然后在整个测试期间保持固定,这种方法计算成本非常低,但由于参数不会随数据集的滑动而改变,模型性能可能会降低。另一种方法是使用交叉验证(cross-validation,cv)定期重新校准参数,这种方法相对准确,但计算成本过高。本发明使用最小角回归(leastangleregression,lars)和赤池信息准则(aic)估计参数。lars可以计算整个lasso的解的路径并得到每次迭代的λ值。aic则在权衡估计模型的复杂度和拟合优良度之间选择最优参数λ。[0118]由于l1正则化损失函数不可导,梯度下降算法无效,因此本文利用坐标下降法进行求解。坐标下降法属于一种非梯度优化的方法,它在每步迭代中沿一个坐标的方向进行线性搜索(线性搜索是不需要求导数的),通过循环使用不同的坐标方法来达到目标函数的局部极小值,这样避免了lasso回归的损失函数不可导的问题。坐标下降法非常擅长求解lasso这类单个维度上有闭式解,但整体维度上没有闭式解的问题。[0119]坐标下降法计算流程如下:[0120]1)初始化参数[0121]2)对于第k轮迭代,对每个参数依次进行迭代,每次迭代以单个参数为变量求得目标函数的最小值,其余固定为常量,最小值可以通过求导得到。迭代公式如下:[0122][0123]3)若满足迭代终止条件,则得到最优值,否则进行下一次迭代。[0124]基于lstnet的高频子序列预测[0125]真实电价序列数据经常存在长期周期性模式和短期非线性模式的混合,传统方法不能有效区分两种模式。lstnet网络通过设置卷积层用以捕获多维输入变量之间的短期局部依赖模式,同时设置循环神经网络层则捕获复杂的长期依赖模式和循环跳跃层用以捕获特别长期依赖的模式。由于卷积和递归分量的非线性特性,神经网络模型的一个主要缺点是输出对输入尺度不敏感。lstnet通过使用全连接层(dense)模拟自回归过程来为预测添加线性分量使输出可以相应输入尺度的变化,同时将最终预测分解为线性部分和非线性部分,线性部分主要集中在局部尺度问题,非线性部分包含循环的特征。lstnet结构如图1所示。[0126]lstnet各个模块具体如下:[0127]1)卷积模块[0128]该层是没有池化层的卷积神经网络,该结构可以提取时间维度中的短期特征和变量之间的局部依赖性。卷积核对输入矩阵进行如下卷积操作:[0129]s=f(wx+b)ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ(68)[0130]式中:s为卷积运算得到的特征矩阵,w为权重矩阵,b为偏移向量,w和b为网络学习得到的参数,f为relu函数。[0131]2)循环和循环跳跃模块[0132]循环跳跃模块是具有时间跳跃链接的循环单元(rnn)结构,具体就是在当前单元和相邻周期的同一相位的隐藏单位之间添加跳转链接,以扩展信息流的时间跨度。本文使用rnn的变体lstm网络作为循环单元。lstm网络的基本单元包括遗忘门、输入门和输出门。循环跳跃单元结构如图2所示。[0133]遗忘门中的输入xt与状态记忆单元ct-s和中间输出ht-s一起决定了状态记忆单元要忘记哪些信息。通过sigmoid和tanh函数改变输入门中的xt来决定在状态记忆单元中保留哪些信息。中间输出ht由更新后的ht和输出ot决定。循环模块和循环跳跃模块的计算公式统一表示如下:[0134]ft=σ(wt·[ht-s,xt]+bf)ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ(69)[0135]it=σ(wi·[ht-s,xt]+bi)ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ(70)[0136]ot=σ(wo·[ht-s,xt]+bo)ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ(71)[0137][0138][0139]ht=ot·tanh(ct)ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ(74)[0140]式中:ft、it、ot、ht、ct分别为遗忘门、输入门、输出门、中间输出和细胞状态;wf、wi、wo、wc是不同状态门对应的权重;bf、bi、bo、bc分别是不同状态门的偏移量项。s为跳过的隐藏单元个数,当s取值为1时,即为lstm网络。[0141]3)自回归模块[0142]在lstnet架构中,自回归模块采用经典的自回归ar模型作为线性分量,ar模型可以由如下公式表示:[0143][0144]式中:为预测ar分量预测结果,和bar为模型的系数,qar为输入矩阵的窗口大小。[0145]lstnet的最终预测结果由循环模块预测和自回归模块模型预测整合得到:[0146][0147]外层框架—基于bma的校准窗口集成预测[0148]现有研究通过对多个不同长度校准窗口预测进行简单平均,证明其效果优于任何单个校准窗口方案。结合短期和长期校准窗口能够捕捉特定的数据行为,在通常情况下,使用较长的校准窗口则可以更精确地估计模型参数。但在市场波动变化剧烈时,若使用较短的校准窗口的模型则会更好地捕捉到价格动态的变化。[0149]贝叶斯模型平均是一般贝叶斯推理方法的延伸,可以有效处理经济计量建模过程中模型不确定性问题,通常应用于模型选择、综合估计和预测问题。贝叶斯分析为经典预测组合方法提供了一种办法,bma方法根据个体预测的后验模型概率对其进行加权,从而生成一个平均模型,性能较好的预测比性能较差的预测具有更高的权重。[0150]假定候选模型集合m中存在k个成员模型,y为预测变量,mk表示模型k的预测。基于全概率定律,bma预测模型可以表示为:[0151][0152]式中:ωk表示第k个模型为最佳模型的后验概率,且pk(y∣mk)为y的后验分布,在bma中,条件分布pk(y∣mk)假定为高斯分布。[0153]bma方法的关键是计算后验概率,本文使用期望最大化算法(em)最大化对数似然函数来估计后验概率。em迭代算法引入一个非观测变量zk,t,当第k个模型在预测t时刻变量yt时为最佳模型,其值为1,否则为0。在初始化每个模型的权重和方差后,em算法在期望步和最大化步之间反复交替,直到满足收敛标准。[0154]1)期望步:基于当前权重与方差估计zk,t:[0155][0156]式中:n为迭代次数,表示第k个模型于预测yt的条件概率分布,为正态分布,均值为fk,t,标准差为[0157]2)最大化步:基于当前非观测变量更新权重和方差。[0158][0159][0160]本文将贝叶斯模型平均用于校准窗口的集成预测。基于贝叶斯模型平均的权重可表示为:[0161][0162]式中:为校准窗口集,τ为中的校准窗口,bic(τ)是贝叶斯信息准则。[0163][0164][0165]式中:k为特征个数,为预测误差,dave为估计权重时选择的时间长度,通常为1天。[0166]由于k与dave在模型建立时值确定,所以权重表达式可以简化为:[0167][0168]从式(28)可以看出,由于24dave的幂次的存在,可以将不准确的预测结果的权重降为零。[0169]案例分析:[0170]实验说明[0171]采用北欧电力市场数据集,如图4所示。[0172]北欧电力市场中日前市场采用“集中竞价,边际出清”的方式,即在每一天中午12点之前,买卖双方根据第二天每小时的交易时段提供报价,电力交易所根据双方报价,形成发电曲线和用电曲线,两曲线交点即为系统电价。系统电价是整个系统的统一出清价格,不考虑市场内部输电线路约束,但是市场与耦合市场之间的输电线路约束会影响电价。[0173]表1数据集包含特征[0174][0175]北欧电力市场与其耦合电力市场之间的传输如图4。挪威有5个招标区(no1,no2,no3,no4,no5),瑞典有4个招标区(se1,se2,se3,se4),丹麦有两个(dk1,dk2),芬兰有1个(fi)。北欧电力市场与德国(de)、荷兰(nl)、立陶宛(lt)、爱沙尼亚(ee)、波兰(pl)和俄罗斯(ru)之间存在跨境传输。实验数据来源于北欧电力市场交易所nordpool。表1展示了数据集中包含的特征。本文选取2016年1月4日至2018年1月28日共756天(108周)的数据集,如图5所示。本文在现有研究基础上,选择三个长校准窗口(728,721,714)和三个短校准窗口(56,84,112)作为集成校准窗口。测试集选取2018年1月1日至2018年1月28日共28天的数据集。[0176]本文采用cnn-lstm、arima、kelm算法作为lstnet和lear的对比预测算法。同时增加长校准窗口集(672,700,728)作为对比长校准窗口集。[0177]算法评价指标与选择指标[0178]平均绝对误差误差(mae)、均方根误差(rmse)和平均绝对百分比误差(mape)是电价预测中常用的评价指标。[0179][0180][0181][0182]式中:nd为测试集天数,yd,h为真实值,为预测值。[0183]但由于本文使用了分解算法iceemdan,使得子序列中样本点存在接近0的值,这会导致mape指标值变得非常大,不能很好地与mae和rmse指标相适应。对称绝对平均百分比误差指标(smape)可以很好解决这个问题,因此本文使用mae、rmse、smape作为算法评价指标。[0184][0185]为了能够综合考量评价指标以选择子序列的最优预测模型,本文提出综合评价指标cei作为模型选择的衡量。cei是基于mae、smape和rmse指标建立。由于各指标间数值相差较大,本文先对各指标标准化后平均得到cei指标。[0186][0187]式中:mae'、smape'、rmse'均为标准化后的值。[0188]超参数优化[0189]本文人工智能算法超参数均由hyperopt超参数优化库调优。hyperopt是一种通过贝叶斯优化来调整参数的工具,该方法调参速度和效果均比较好。本文hyperopt搜索算法采用树形结构parzen估计方法(tpe)。kelm采用径向基函数rbf作为核函数。lstnet主要优化参数为(时窗宽度,跳跃间隔,卷积核个数,lstm单元个数)。cnn-lstm使用两层卷积层和两层lstm层,主要优化参数为(卷积核个数1,卷积核个数2,lstm单元个数1,lstm单元个数2)。kelm主要参数为(正则化系数,核函数参数)。参数优化见表2。[0190]表2超参数优化数据[0191]table2hyperparametertuningdata[0192][0193]预测流程[0194]本文在考虑校准窗口集成和耦合市场特征的背景下,提出了双层日前电价预测框架。该算法外层框架为基于bma的校准窗口集成预测,内层框架为基于iceemdan的择优预测。[0195]本文首先针对每个校准窗口数据集应用本文提出的内层预测框架得到各个校准窗口数据集下的预测电价。然后应用本文提出的外层预测框架为每个校准窗口数据集的预测电价分配权重得到最终预测电价。最后本文通过shap方法分别应用于整个数据集预测过程的电价特征分析和子序列预测过程的特征分析增强模型可解释性。[0196]基于bma的校准窗口集成预测:[0197]1)以与训练集最后一天的时间间隔为校准窗口长度,将原始训练集划分不同长度,并与测试集组成新数据集。[0198]2)针对每个数据集分别应用内层预测框架得到不同校准窗口长度数据集下的预测电价;[0199]3)应用bma方法为每个校准窗口数据集下的预测电价分配权重;[0200]4)集成不同校准窗口数据集下的预测得到最终预测电价。[0201]基于iceemdan的择优预测:[0202]1)应用iceemdan分解单个校准窗口数据集为若干子序列;[0203]2)针对每个子序列,应用lstnet、lear、cnn-lstm、kelm、arima模型,依据综合评价指标选出每个子序列的最优预测模型;[0204]3)将每个子序列的最优预测聚合重构得到该校准窗口数据集下的预测电价。[0205]基于iceemdan的择优预测[0206]本文通过校准窗口为112天的预测进行分析。图6展示了原始电价时间序列经iceemdan分解得到的不同频率的子序列,高频子序列非线性强,低频子序列平稳性强。[0207]分解完成后,针对每个子序列,本文使用lstnet和lear模型以及对比模型cnn-lstm、arima和kelm预测。对于imf1、imf2、imf3和imf4子序列,lstnet模型预测效果优于其他模型。对于imf5、imf6、imf7、imf8和res的子序列,lear模型预测效果优于其他模型。以高频子序列imf1为例,lstnet模型的mae、smape、rmse指标相较cei指标第二的cnn-lstm模型分别下降16.9282%、5.5188%、10.7654%,相较lear模型分别下降24.1097%、13.1024%、12.0424%。以低频子序列res为例,lear模型指标相较cei指标第二的arima模型分别下降16.2739%、74.3013%、20.3047%,相较lstnet模型下降29.5824%、83.7367%、20.3047%。同时可以看出本文所用模型lstnet和lear模型预测效果相较其他对比模型优势显著,随着频率由高至低的变化,cei指标排名前二的模型为(lstnet、cnn-lstm,imf1)、(lstnet、lear,imf2-imf8)、(lear、arima,res)。[0208]针对每个子序列选择最优模型后,整合预测得到112校准窗口下的预测结果。为了证明分解预测和分解择优预测的有效性,本文以lear、lsrnet、cnn-lstm、arima和kelm模型及其对应的iceemdan分解预测模型作对比,预测结果见表3。各模型使用iceemdan分解后的预测效果都有所提升,其中cnn-lstm模型提升最显著,iceemdan-cnn-lstm模型相较cnn-lstm分别下降60.7558%、42.5160%、68.0093%。iceemdan-lear模型提升24.3911%、15.7158%、27.7656%,iceemdan-lstnet模型指标提升20.4687%、23.2363%、23.9672%。本文所提提分解择优预测模型iceemdan-lear-lstnet模型对比其他模型各项指标均为最优,iceemdan-lear-lstnet模型相较iceemdan-lstnet模型提升13.6877%、33.4732%、23.2445%。[0209]表3单校准窗口与校准窗口集成预测[0210][0211][0212]基于bma的校准窗口集成预测[0213]本文对三个短校准窗口(56,84,112)和三个长校准窗口(714,721,728)应用本文所提内层预测框架进行预测,然后对各校准窗口应用bma方法分配权重得到最终预测电价。为了验证本文所提加权方案bma的有效性以及设置的校准窗口组合方案的优势,本文了设置如下三组对比方案:1)(56,84,112,714,721,728)的贝叶斯模型平均方案和简单平均方案:bma1和avg;2)(56,84,112,714,721,728)和(56,84,112,672,700,728)的贝叶斯模型平均方案:bma1和bma2;3)(56,84,112,714,721,728)和(84,112,721,728)的贝叶斯模型平均方案:bma1和bma3。预测结果见表4。[0214]表4单校准窗口与校准窗口集成预测[0215][0216]校准窗口长度的不同导致了预测精度有所差异。在单个校准窗口预测中,长校准窗口预测结果优于短校准窗口预测,728窗口精度最好(mae=0.8109eur,smape=2.2772,rmse=1.3171eur)。avg方案的mae、smape、rmse指标相较728窗口提升8.0404%、6.2401%、2.9459%。bma1方案的mae、smape、rmse指标相较728校准窗口提升18.4486%、19.0146%、14.1219%。[0217]第一组对比中bma1方案mae、smape和rmse指标相较avg方案提升11.3182%、13.6247%、11.5153%,证明了本文所提加权方案bma优于简单平均方案。第二组对比中bma1方案mae、smape和rmse指标相较bma2方案提升2.6784%、7.2101%、6.6441%,证明了在长短校准窗口数相同情况下,本文所用校准窗口组合(56,84,112,714,721,728)优于对比校准窗口组合(56,84,112,672,700,728)。第三组对比中bma1方案mae、smape和rmse指标相较bma3方案提升9.2991%、15.6474%、9.4178%,证明了在长短校准窗口数不同情况下,本文所用校准窗口组合(56,84,112,714,721,728)优于对比校准窗口组合(84,112,721,728)。图7展示了所选算法在测试集上随机选取目标日的日前电价预测效果。[0218]以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1