本发明涉及一种分位数概率性短期电力负荷预测集成方法,属于电力系统分析技术领域。
背景技术:
负荷预测是电力系统规划与运行的基础。高精度的负荷预测能够辅助电力系统做出更优的决策从而有效减小相应的规划和运行成本。传统的点预测只能提供未来负荷的一个估值,不能描述未来负荷存在的不确定性。然而近年来,随着分布式可再生能源的持续增长以及储能、电动汽车的接入,电力负荷表现出更强的不确定性。于是越来越多的学者开展概率性负荷预测的研究。概率性负荷预测能够通过置信区间、概率密度或者分位数的形式表征待预测负荷的不确定性,较点预测而言,能够提供未来负荷确定性的更多信息。
分位数作为概率预测的一种重要表现形式,已经得到了广泛的关注。目前相关的研究主要分为三种:1)直接将负荷预测模型利用分位数回归直接得到最终的概率预测结果,分位数回归模型包括线性分位数回归、随机森林分位数回归、支持向量机分位数回归、神经网络分位数回归等。2)首先利用多套数据训练或多个模型得到众多点预测的结果,再对这些点预测结果进行分位数回归平均(Quantile Regression Averaging),从而得到分位数预测结果。3)通过密度估计、统计历史点预测误差分布等手段先得到概率预测分布,然后将分布转换为分位数结果。
目前存在很多电力负荷预测模型和方法,但对于不同的问题或者数据集,不能保证某一种方法能够在所有数据集上都保证最优。于是,研究人员系统通过综合多种预测模型,构建集成预测方法,提升总体预测模型的泛化性能和预测精度。集成负荷预测就是确定不同预测模型的权重,然后根据确定的权重计算各预测结果的加权平均得到最终的集成预测结果。产生多种预测模型的方法可以针对一个特定的预测模型,对训练数据集进行有放回采样(Bootstrap Sampling)衍生不同的训练集,使得模型的参数具有多样性;也可以针对同一个训练数据集,直接训练线性回归、神经网络、支持向量机等多个预测模型。目前集成预测已经广泛应用于电力负荷的点预测中。在负荷多元化使得负荷不确定性增加的背景下,概率性电力负荷预测模型也越来越多地被提出来,而目前在电力负荷预测领域,还没有对分位数概率预测集成开展相关的研究。
已有的电力负荷预测的集成方法有:
1、分位数回归:分位数回归主要研究自变量与因变量的条件分位数之间的关系,得到的回归模型可以通过自变量估计因变量的条件分位数。分位数回归较传统最小二乘回归而言,不仅可以度量回归变量在分布中心的影响,还可以度量在分布上尾和下尾的影响,为因变量不确定性提供更加详尽的信息。分位数回归可以描述成为一个典型的优化模型,如下式所示:
上式中,i和N分别表示模型训练样本的编号和总数;xi和yi分别表示第i个训练样本的自变量和因变量;q表示待回归的分位数,其取值在0到1之间;β(q)表示q分位数回归模型待估计的参数;ρq表示q分位数回归的损失函数,其具体表现形式为:
通过一定的优化算法可以求解相应的分位数回归模型。特别地,当分位数回归模型β(q)为线性模型时,该分位数回归为传统的线性分位数回归;当分位数回归模型β(q)为神经网络模型、随机森林、渐进梯度回归树(GBRT)等时,该分位数回归则为神经网络分位数回归、随机森林分位数回归、渐进梯度回归树分位数回归等。
2、分位数损失(Pinball Loss)函数:弹球损失函数是衡量分位数概率性负荷预测精度的一个指标,其具体计算形式如下:
上式中,yi和分别表示在第i个负荷点的真实值和q分位数预测值。当一共需要预测N个负荷点的Q个分位数时,可以用平均分位数损失来综合衡量预测结果的精度:
2、线性规划优化求解技术:该技术能够通过计算机求解线性规划优化问题,给出模型的最优解。
技术实现要素:
本发明的目的是提出一种分位数概率性短期电力负荷预测集成方法,解决如何集成综合已有的多个分位数概率性负荷预测的结果,提出一种以最小化弹球损失为目标函数的分位数负荷预测集成方法,进一步提高分位数概率性短期负荷预测精度。
本发明提出的分位数概率性短期电力负荷预测方法,包括以下步骤:
(1)将电力负荷数据长度为T的电力系统历史电力负荷数据D按照设定比例分为长度为T1和T2的两个数据集D1和D2;
(2)对上述电力负荷数据集D1进行有放回采样,形成M个数据集,分别为D11,D12,…D1m,…D1M,m=1、2、3…M;
(3)分别训练上述M个数据集D11,D12,…D1m,…D1M的神经网络分位数回归模型、随机森林分位数回归模型和渐进梯度回归树分位数回归模型,包括以下步骤;
(3-1)对M个数据集中的任意一个数据集D1m,向数据集D1m的神经网络分位数回归模型、随机森林分位数回归模型和渐进梯度回归树分位数回归模型分别输入一个自变量X1t,输出一个因变量y1t,其中:
X1t=[W,h,dt-H,dt-H-1,dt-2H+1,dt-2H,dt-2H-1,dt-3H],y1t=dt,
H表示一天内包括的时段数,h表示待预测电力负荷所在的时段,h=1,2,…,H,W表示待预测负荷所属日类型,定义W=1为工作日,W=0为非工作日,dt表示第t时段的电力负荷值,t=1,2,…,T1;
(3-2)根据上述自变量X1t和因变量y1t,分别优化训练上述三个q分位数预测模型,即神经网络q分位数回归模型g1,m,q、随机森林q分位数回归模型g2,m,q和渐进梯度回归树q分位数回归模型g3,m,q,得到上述三个q分位数预测模型的参数β1,m,q,β2,m,q,β3,m,q;
优化训练的过程为:
其中,q取值在0到1之间,ρq表示q分位数损失函数,计算式如下:
其中,为预测模型在t时刻的与q分位数相对应的电力负荷预测值;
遍历M个数据集中的所有数据集,重复本步骤,得到K=3M个q分位数预测模型;
(3-3)将上述K=3M个q分位数预测模型重新进行编号,得到训练好的分位数回归模型gk,q:
gk,q=gi,m,q
其中,k=m+i×M-M,i表示在每个数据集上训练的三个模型的编号,i=1,2,或3,m=1、2、3…M;
(4)利用上述K=3M个q分位数预测模型,在数据集D2上,建立以分位数损失最小为目标函数的优化模型,确定各种分位数回归模型的权重,计算得到与q分位数相对应的集成负荷预测模型,包括以下步骤:
(4-1)根据上述K=3M个q分位数预测模型,向上述电力负荷数据集D2的K=3M个q分位数预测模型分别输入一个自变量X2t,输出一个因变量y2t,其中:
X2t=[W,h,dt-H,dt-H-1,dt-2H+1,dt-2H,dt-2H-1,dt-3H],y2t=dt,
(4-2)向上述K个在数据集D1上训练好的分位数回归模型gk,q分别输入自变量X2t,计算得到与第k个训练好的分位数回归模型在时段t的q分位数相对应的电力负荷预测值
(4-3)利用上述步骤(4-2)得到的与K个模型的q分位数相对应的电力负荷预测值和电力负荷值y2t,确定各预测方法的权重ωq=[ωq1,ωq2,…ωqk,…ωqK]如下:
其中,表示K个在时段t的q分位数相对应的电力负荷预测值的加权平均值,ωqk表示与q分位数相对应的集成负荷预测模型中第k种预测模型gk,q的权重,表示所有K个预测模型的权重之和为1,ωqk≥0表示所有K个预测模型的权重都非负;
设定一个辅助决策变量,将上式改写为如下线性优化模型:
(4-4)根据上述得到的权重ωq=[ωq1,ωq2,…ωqk,…ωqK],建立q分位数概率性电力负荷预测集成模型如下:
(5)遍历q的取值集合{0.01,0.02,0.03,…0.98,0.99},重复步骤(3)和(4),得到不同分位数q的集成负荷预测方法。
本发明提出的分位数概率性短期电力负荷预测方法,其优点是:
本发明提出的分位数概率性短期电力负荷预测方法,以最小化分位数损失为目标函数的分位数负荷预测集成方法,首先通过训练集有放回采样(Bootstrap Sampling)和不同的回归模型训练得到多个分位数概率预测模型,然后基于训练好的分位数概率预测模型和结果构建分位数预测最优集成模型,确定不同分位数概率预测方法的权重,从而使得最终集成预测模型的弹球损失最小,本方法在最后转化成为一个线性规划问题,可以快速搜索到全局最优集成权重,进一步提高了分位数概率性短期负荷预测精度。本发明在现有各种单一分位数概率性短期负荷预测基础上,建立了一种分位数概率性短期负荷预测集成方法,相比于现有方法,本方法能够快速给各种单一预测方法赋予一定的权重,实现多种预测结果的集成。应用本方法,能够在单一预测模型基础上进一步改善概率性负荷预测精度,跟准确描述未来负荷的不确定性,进而减小电力系统运行的成本,因而具有重要的现实意义和良好的应用前景。
附图说明
图1为本发明提出的分位数概率性短期电力负荷预测方法的流程框图。
具体实施方式
本发明提出的分位数概率性短期电力负荷预测方法,其流程框图如图1所示,包括以下步骤:
(1)将电力负荷数据长度为T的电力系统历史电力负荷数据D按照设定比例分为长度为T1和T2的两个数据集D1和D2,本发明的一个实施例中比例为4:1;
(2)对上述电力负荷数据集D1进行有放回采样(bootstrap采样),形成M个数据集,分别为D11,D12,…D1m,…D1M,m=1,2,3,…,M;
(3)分别训练上述M个数据集D11,D12,…D1m,…D1M的神经网络分位数回归模型、随机森林分位数回归模型和渐进梯度回归树分位数回归模型,包括以下步骤;
(3-1)对M个数据集中的任意一个数据集D1m,向数据集D1m的神经网络分位数回归模型、随机森林分位数回归模型和渐进梯度回归树分位数回归模型分别输入一个自变量X1t,输出一个因变量y1t,其中:
X1t=[W,h,dt-H,dt-H-1,dt-2H+1,dt-2H,dt-2H-1,dt-3H],y1t=dt,
H表示一天内包括的时段数,(该时段可以任意设定,可以为1小时,15分钟等等),h表示待预测电力负荷所在的时段,h=1,2,…,H,W表示待预测负荷所属日类型,定义W=1为工作日,W=0为非工作日,dt表示第t时段的电力负荷值,t=1,2,…,T1;
(3-2)根据上述自变量X1t和因变量y1t,分别优化训练上述三个q分位数预测模型,即神经网络q分位数回归模型g1,m,q、随机森林q分位数回归模型g2,m,q和渐进梯度回归树q分位数回归模型g3,m,q,得到上述三个q分位数预测模型的参数β1,m,q,β2,m,q,β3,m,q;
优化训练的过程为:
其中,q取值在0到1之间,本发明的一个实施例中,q取值集合为{0.01,0.02,0.03,…0.98,0.99},ρq表示q分位数损失函数,计算式如下:
其中,为预测模型在t时刻的与q分位数相对应的电力负荷预测值;
遍历M个数据集中的所有数据集,重复本步骤,得到K=3M个q分位数预测模型;
(3-3)将上述K=3M个q分位数预测模型重新进行编号,得到训练好的分位数回归模型gk,q:
gk,q=gi,m,q,
其中,k=m+i×M-M,i表示在每个数据集上训练的三个模型的编号,i=1,2,或3,m=1,2,3,…,M;
(4)利用上述K=3M个q分位数预测模型,在数据集D2上,建立以分位数损失最小为目标函数的优化模型,确定各种分位数回归模型的权重,计算得到与q分位数相对应的集成负荷预测模型,包括以下步骤:
(4-1)根据上述K=3M个q分位数预测模型,向上述电力负荷数据集D2的K=3M个q分位数预测模型分别输入一个自变量X2t,输出一个因变量y2t,其中:
X2t=[W,h,dt-H,dt-H-1,dt-2H+1,dt-2H,dt-2H-1,dt-3H],y2t=dt,
(4-2)向上述K个在数据集D1上训练好的分位数回归模型gk,q分别输入自变量X2t,计算得到与第k个训练好的分位数回归模型在时段t的q分位数相对应的电力负荷预测值
(4-3)利用上述步骤(4-2)得到的与K个模型的q分位数相对应的电力负荷预测值和电力负荷值y2t,确定各预测方法的权重ωq=[ωq1,ωq2,…ωqk,…ωqK]如下:
其中,表示K个在时段t的q分位数相对应的电力负荷预测值的加权平均值,ωqk表示与q分位数相对应的集成负荷预测模型中第k种预测模型gk,q的权重,表示所有K个预测模型的权重之和为1,ωqk≥0表示所有K个预测模型的权重都非负;
设定一个辅助决策变量,将上式改写为如下线性优化模型:
上式是一个典型的线性规划模型,可以利用单纯形法求解该问题,给出模型的最优解,即K个单一预测模型的最优组合权重。
(4-4)根据上述得到的权重ωq=[ωq1,ωq2,…ωqk,…ωqK],建立q分位数概率性电力负荷预测集成模型如下:
(5)遍历q的取值集合{0.01,0.02,0.03,…0.98,0.99},重复步骤(3)和(4),得到不同分位数q的集成负荷预测方法。