基于分位数梯度提升决策树的负荷区间预测方法及系统与流程

文档序号:26947533发布日期:2021-10-12 20:04阅读:158来源:国知局

1.本技术涉及电力负荷预测技术领域,尤其涉及一种基于分位数梯度提升决策树的负荷区间预测方法及系统。


背景技术:

2.随着智能配电网的建设和大数据技术的快速发展,配电网台区海量数据的采集与存储问题在近年来得以解决,为实现配电网台区精细化管理提供了完备的数据基础和技术条件。然而配电网台区负荷直接与用户用电行为息息相关,相比系统级负荷,具有较高的不确定性,客观上直接影响传统配电网台区负荷预测的准确度,给配电网安全稳定运行造成较大的影响。传统配电网台区负荷预测采用点预测方法,仅仅给出单一的确定性数值,无法计及未来配电网台区负荷可能的概率分布,在涉及负荷不确定性分析的问题上难以满足实际需求。
3.而配电网台区负荷区间预测方法能够得到未来某一时间点上配电网台区负荷的置信区间,实现对负荷不确定性的有效量化,因此在配电网风险预警评估、精准规划与优化调度等方面具有一定的应用价值与研究意义。
4.而现有技术中,多是采用预测误差分布统计法、概率式预测方法或传统分位数回归方法,其中,预测误差分布统计法对历史数据质量要求较高,且划分统计区间存在一定的主观性,而且对参数的设定较为敏感,很大程度上影响构造历史预测误差分布的可靠性;概率式预测方法通常假定配电网台区负荷服从某种特定的分布,然而这种假定的有效性难以通过统计方法得到严格证明,容易与实际分布存在较大的偏差,从而影响配电网台区负荷区间预测的准确性。传统分位数回归方法大多基于浅层的机器学习算法如bp神经网络,容易在模型训练阶段陷入局部最优解,导致模型泛化能力不足。


技术实现要素:

5.本技术提供了一种基于分位数梯度提升决策树的负荷区间预测方法及系统,用于解决上述预测的可靠性和准确性差且泛化能力不足的技术问题。
6.有鉴于此,本技术第一方面提供了一种基于分位数梯度提升决策树的负荷区间预测方法,包括以下步骤:s1、采用集总经验模态对原始配电网台区负荷序列进行分解,得到若干个模态分量,对每个模态分量进行归一化处理;s2、对每个模态分量分别建立分位数梯度提升决策树预测模型,得到各个模态分量在不同分位数条件下的预测值,将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布;s3、采用核密度估计方法在所述预测值在预设的分位点时的条件分布中得到未来配电网台区负荷的概率密度函数;s4、通过所述概率密度函数计算求得满足预定的置信水平下的置信区间,从而输
出配电网台区负荷区间预测结果。
7.优选地,所述步骤s1之前包括:根据预设采样周期采集配电网台区负荷的原始数据,对所述原始数据进行数据清洗,得到原始配电网台区负荷序列,所述原始配电网台区负荷序列具有时序性,所述原始数据包括有功功率。
8.优选地,所述步骤s1具体包括:s101、在所述原始配电网台区负荷序列中加入高斯白噪声得到新的配电网台区负荷序列,利用集总经验模态对所述新的配电网台区负荷序列进行分解,得到若干个模态分量,所述模态分量包括若干个本征模态分量和一个残差分量;s102、重复m次步骤s101,从而每次向所述原始配电网台区负荷序列加入不同的高斯白噪声,以得到m组本征模态分量和残差分量;s103、对m组本征模态分量和残差分量分别求取均值,从而得到若干个本征模态分量均值和一个残差分量均值,其中,所述本征模态分量均值表示为,所述残差分量均值表示为,式中,为第m组第i个本征模态分量,,为第m组残差分量;对每个模态分量通过下式进行归一化处理,式中,、分别表示归一化前和归一化后的模态分量数值,和分别为模态分量数值中的最小值和最大值。
9.优选地,步骤s2具体包括:s201、通过归一化后的若干个所述模态分量选取训练样本和测试样本以分别构建训练集和测试集;s202、假设所述训练样本定义为,其中,和分别为训练样本的属性和标签,,r表示实数域,n表示维度,基于决策树算法对每个决策树依次采用bootstrap策略有放回地随机抽取m个训练样本,则生成由n个决策树组合成的分位数梯度提升决策树,其中,n为预设的决策树数量;s203、随机选择某个待切分属性j,将属性j上所有取值从小到大排序,记为
,通过下式得到属性j上的候选划分点集合,;s204、在候选划分点集合中随机选择某个待切分点s,,根据将训练集切分为两部分;s205、通过下式计算切分后的两部分训练集上对应标签的期望值,作为决策树待选的估计值:选的估计值:式中,表示一部分训练集,也记作,,m1表示对应的模态分量集合,c1表示对应的期望值,表示一部分训练集,也记作,,m2表示对应的模态分量集合,c2表示对应的期望值;s206、在遍历所有可能的解直到找到最优解使得下式对应的目标值最小,将最优解作为划分节点:s207、重复步骤s203~s206直到满足停止分裂条件,从而生成决策树,其中,停止分裂条件为所述目标值小于预设阈值或达到决策树的预设最大深度;s208、采用弹球损失函数作为分位数梯度提升决策树预测模型的预测性能的评价模型,其中,弹球损失函数为,式中,表示弹球损失函数值,为预设的分位点,表示检查函数;s209、假设分位数梯度提升决策树预测模型的输出值为,则的初始化表达式为,
;s210、设迭代次数,通过下式计算迭代t次后第i个训练样本的损失函数负梯度:式中,表示负梯度,表示分位数梯度提升决策树预测模型迭代t

1次时的负荷预测值;s211、将替换为,根据步骤s203~s207将拟合得到第t个决策树,其对应的子叶节点区域为,,其中,为决策树子叶节点的个数;通过下式计算最佳估计值:式中,表示对应的最佳估计值;s212、通过下式更新分位数梯度提升决策树预测模型的输出值:式中,表示为t次迭代时的更新分位数梯度提升决策树预测模型的输出值,表示阶跃函数;s213、训练完成后,得到分位数梯度提升决策树预测模型的最终的输出值为,式中,表示t次迭代时的更新分位数梯度提升决策树预测模型的输出值;s214、假设所述预设的分位点的取值为,当给定第w个模态分量的测试样本时,则对应有模态分量在分位点为时的预测值,将其记为
;s215、通过下式将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布:。
10.优选地,所述概率密度函数为,式中,n为分位点的个数,表示高斯核函数,h为预置窗宽系数,y表示测试样本的标签。
11.优选地,步骤s4具体包括:假设给定置信水平为,α表示显著性水平,α=0.01,0.05或0.1,则在所述概率密度函数中求得置信区间的下限l和上限u满足下式的条件:式中,s.t.表示约束条件,表示y落于置信区间[l,u]中的概率,其中,[l,u]为满足预定的置信水平下的置信区间,并将其作为配电网台区负荷区间预测结果进行输出。
[0012]
第二方面,本发明还提供了一种基于分位数梯度提升决策树的负荷区间预测系统,包括:模态分解模块,用于采用集总经验模态对原始配电网台区负荷序列进行分解,得到若干个模态分量,对每个模态分量进行归一化处理;决策树预测模块,用于对每个模态分量分别建立分位数梯度提升决策树预测模型,得到各个模态分量在不同分位数条件下的预测值,将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布;概率密度计算模块,用于采用核密度估计方法在所述预测值在预设的分位点时的条件分布中得到未来配电网台区负荷的概率密度函数;置信预测模块,用于通过所述概率密度函数计算求得满足预定的置信水平下的置信区间,从而输出配电网台区负荷区间预测结果。
[0013]
第三方面,本发明还提供了一种计算机可读存储介质,其中存储有计算机程序,所述计算机程序被处理器加载执行时,实现如上述的基于分位数梯度提升决策树的负荷区间预测方法的步骤。
[0014]
第四方面,本发明还提供了一种电子设备,包括:处理器及存储器;其中,
所述存储器用于存储计算机程序;所述处理器用于加载执行所述计算机程序,以使所述电子设备执行如上述的基于分位数梯度提升决策树的负荷区间预测方法的步骤。
[0015]
从以上技术方案可以看出,本发明具有以下优点:本发明通过采用集总经验模态对原始配电网台区负荷序列进行分解,得到不同特征的模态分量,降低了后续分位数梯度提升决策树预测模型训练的复杂程度,提高了预测的准确性,并采用核密度估计方法得到概率密度函数,避免构造概率分布的主观性和先验性,提高了配电网台区负荷区间预测的可靠性和准确性,同时,利用决策树采样的随机性确保样本之间学习的多样化,使得分位数梯度提升决策树不易陷入过拟合风险,具有良好的泛化能力。
附图说明
[0016]
图1为本技术实施例提供的一种基于分位数梯度提升决策树的负荷区间预测方法的流程图;图2为本技术实施例提供的一种基于分位数梯度提升决策树的负荷区间预测系统的结构示意图。
具体实施方式
[0017]
为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
[0018]
在现有技术中,多是采用预测误差分布统计法、概率式预测方法或传统分位数回归方法,其中,预测误差分布统计法是根据历史配电网台区负荷预测的误差数据,通过配电网台区负荷水平和统计时段两个维度建立误差概率分布模型,然后以此为根据,结合确定性预测结果进行概率补偿修正,得到区间预测结果,但是,对历史数据质量要求较高,且划分统计区间存在一定的主观性,而且对参数的设定较为敏感,很大程度上影响构造历史预测误差分布的可靠性;概率式预测方法是由贝叶斯理论发展起来的机器学习算法,多以核函数作为回归分析的基础,其中代表性的算法有高斯过程回归。高斯过程回归假定随机变量的方差服从高斯分布,主要用于求出预测量的期望值及其分布状况,进而得到配电网台区负荷任意置信水平下的区间预测结果,但是,通常假定配电网台区负荷服从某种特定的分布,然而这种假定的有效性难以通过统计方法得到严格证明,容易与实际分布存在较大的偏差,从而影响配电网台区负荷区间预测的准确性;传统分位数回归方法大多基于浅层的机器学习算法如bp神经网络,容易在模型训练阶段陷入局部最优解,导致模型泛化能力不足。
[0019]
为此,请参阅图1,本发明提供的一种基于分位数梯度提升决策树的负荷区间预测方法,包括以下步骤:s1、采用集总经验模态对原始配电网台区负荷序列进行分解,得到若干个模态分
量,对每个模态分量进行归一化处理;s2、对每个模态分量分别建立分位数梯度提升决策树预测模型,得到各个模态分量在不同分位数条件下的预测值,将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布;s3、采用核密度估计方法在预测值在预设的分位点时的条件分布中得到未来配电网台区负荷的概率密度函数;s4、通过概率密度函数计算求得满足预定的置信水平下的置信区间,从而输出配电网台区负荷区间预测结果。
[0020]
本发明通过采用集总经验模态对原始配电网台区负荷序列进行分解,得到不同特征的模态分量,降低了后续分位数梯度提升决策树预测模型训练的复杂程度,提高了预测的准确性,并采用核密度估计方法得到概率密度函数,避免构造概率分布的主观性和先验性,提高了配电网台区负荷区间预测的可靠性和准确性,同时,利用决策树采样的随机性确保样本之间学习的多样化,使得分位数梯度提升决策树不易陷入过拟合风险,具有良好的泛化能力。
[0021]
以下为本发明提供的一种基于分位数梯度提升决策树的负荷区间预测方法的实施例的具体描述。
[0022]
本发明提供的一种基于分位数梯度提升决策树的负荷区间预测方法,包括以下步骤:s0、根据预设采样周期采集配电网台区负荷的原始数据,对原始数据进行数据清洗,得到原始配电网台区负荷序列,原始配电网台区负荷序列具有时序性,原始数据包括有功功率。
[0023]
需要说明的是,根据预设采样周期采集配电网台区负荷的原始数据,其原始数据是按时间先后顺序进行采样得到的,可得到负荷时间序列。
[0024]
同时,在采样过程中由于一些原因可能出现数据缺失或异常的情况,通过对原始数据进行数据清洗,即可得到相对完整、正常的负荷时间序列。
[0025]
s100、采用集总经验模态对原始配电网台区负荷序列进行分解,得到若干个模态分量,对每个模态分量进行归一化处理;具体地,步骤s100具体包括:s101、在原始配电网台区负荷序列中加入高斯白噪声得到新的配电网台区负荷序列,利用集总经验模态对新的配电网台区负荷序列进行分解,得到若干个模态分量,模态分量包括若干个本征模态分量和一个残差分量;s102、重复m次步骤s101,从而每次向原始配电网台区负荷序列加入不同的高斯白噪声,以得到m组本征模态分量和残差分量;s103、对m组本征模态分量和残差分量分别求取均值,从而得到若干个本征模态分量均值和一个残差分量均值,其中,本征模态分量均值表示为,残差分量均值表示为,
式中,为第m组第i个本征模态分量,,为第m组残差分量;对每个模态分量通过下式进行归一化处理,式中,、分别表示归一化前和归一化后的模态分量数值,和分别为模态分量数值中的最小值和最大值。
[0026]
s200、对每个模态分量分别建立分位数梯度提升决策树预测模型,得到各个模态分量在不同分位数条件下的预测值,将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布;具体地,步骤s200具体包括:s201、通过归一化后的若干个模态分量选取训练样本和测试样本以分别构建训练集和测试集;一般示例中,按一定比例从数据集(模态分量)中抽取前70%~90%的数据作为训练样本,而其余的数据作为测试样本。
[0027]
s202、假设训练样本定义为,其中,和分别为训练样本的属性和标签,,r表示实数域,n表示维度,基于决策树算法对每个决策树依次采用bootstrap策略有放回地随机抽取m个训练样本,则生成由n个决策树组合成的分位数梯度提升决策树,其中,n为预设的决策树数量;需要说明的是,若当前采样时刻记为t,样本的属性是指模态分量中n个采样时刻为t

p的数据,这里数据一般不唯一,p=1,2,

,k,k为任意自然数;样本的标签是指模态分量中单个采样时刻为t+q的数据,q=1,2,

,k。模态分量中的数据是按时间先后顺序分布的,通过一定的组合方式即可得到样本的属性和标签。
[0028]
s203、随机选择某个待切分属性j,将属性j上所有取值从小到大排序,记为,通过下式得到属性j上的候选划分点集合,;在本实施例中,若当前采样时刻记为t,样本的属性是指模态分量中n个采样时刻为t

p的数据,这里数据一般不唯一,p=1,2,

,k,k为任意自然数。根据数据的数值大小,对属性j上的所有取值进行从小到大的重新排序。
[0029]
s204、在候选划分点集合中随机选择某个待切分点s,,根据将训练集切分为两部分;s205、通过下式计算切分后的两部分训练集上对应标签的期望值,作为决策树待选的估计值:选的估计值:式中,表示一部分训练集,也记作,,m1表示对应的模态分量集合,c1表示对应的期望值,表示一部分训练集,也记作,,m2表示对应的模态分量集合,c2表示对应的期望值;s206、在遍历所有可能的解直到找到最优解使得下式对应的目标值最小,将最优解作为划分节点:s207、重复步骤s203~s206直到满足停止分裂条件,从而生成决策树,其中,停止分裂条件为目标值小于预设阈值或达到决策树的预设最大深度;s208、采用弹球损失函数作为分位数梯度提升决策树预测模型的预测性能的评价模型,其中,弹球损失函数为,式中,表示弹球损失函数值,为预设的分位点,表示检查函数;需要说明的是,采用弹球损失函数可以评价不同分位点条件下模型(分位数梯度提升决策树)的预测值与样本的真实值之间的差异,损失函数表现越好,通常模型的性能越好。
[0030]
s209、假设分位数梯度提升决策树预测模型的输出值为,则的初始化表达式为,
;s210、设迭代次数,通过下式计算迭代t次后第i个训练样本的损失函数负梯度:式中,表示负梯度,表示分位数梯度提升决策树预测模型迭代t

1次时的负荷预测值;s211、将替换为,根据步骤s203~s207将拟合得到第t个决策树,其对应的子叶节点区域为,,其中,为决策树子叶节点的个数;通过下式计算最佳估计值:式中,表示对应的最佳估计值;s212、通过下式更新分位数梯度提升决策树预测模型的输出值:式中,表示为t次迭代时的更新分位数梯度提升决策树预测模型的输出值,表示阶跃函数;需要说明的是,分位数梯度提升决策树模型采用迭代方式训练,下一轮迭代利用负梯度测量前一轮基学习器的性能,通过拟合损失函数负梯度来校正之前出现的错误,最终找到能够无限逼近真实值的输出值。
[0031]
s213、训练完成后,得到分位数梯度提升决策树预测模型的最终的输出值为,式中,表示t次迭代时的更新分位数梯度提升决策树预测模型的输出值;s214、假设预设的分位点的取值为,当给定第w个模
态分量的测试样本时,则对应有模态分量在分位点为时的预测值,将其记为;s215、通过下式将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布:。
[0032]
s300、采用核密度估计方法在预测值在预设的分位点时的条件分布中得到未来配电网台区负荷的概率密度函数;具体地,概率密度函数为,式中,n为分位点的个数,表示高斯核函数,h为预置窗宽系数,y表示测试样本的标签。
[0033]
需要说明的是,可采用经验法则选取合适的窗宽系数。
[0034]
s400、通过概率密度函数计算求得满足预定的置信水平下的置信区间,从而输出配电网台区负荷区间预测结果。
[0035]
具体地,步骤s400具体包括:假设给定置信水平为,α表示显著性水平,α=0.01,0.05或0.1,则在概率密度函数中求得置信区间的下限l和上限u满足下式的条件:式中,s.t.表示约束条件,表示y落于置信区间[l,u]中的概率,其中,[l,u]为满足预定的置信水平下的置信区间,并将其作为配电网台区负荷区间预测结果进行输出。
[0036]
以上为本发明提供的一种基于分位数梯度提升决策树的负荷区间预测方法的实施例的描述,参考图2,本发明还提供了一种基于分位数梯度提升决策树的负荷区间预测系统,包括:模态分解模块100,用于采用集总经验模态对原始配电网台区负荷序列进行分解,得到若干个模态分量,对每个模态分量进行归一化处理;决策树预测模块200,用于对每个模态分量分别建立分位数梯度提升决策树预测模型,得到各个模态分量在不同分位数条件下的预测值,将各个模态分量的预测值进行累加,得到预测值在预设的分位点时的条件分布;概率密度计算模块300,用于采用核密度估计方法在预测值在预设的分位点时的条件分布中得到未来配电网台区负荷的概率密度函数;
置信预测模块400,用于通过概率密度函数计算求得满足预定的置信水平下的置信区间,从而输出配电网台区负荷区间预测结果。
[0037]
需要说明的是,本发明提供的一种基于分位数梯度提升决策树的负荷区间预测系统的工作过程与上述一种基于分位数梯度提升决策树的负荷区间预测方法的流程一致,在此不再赘述。
[0038]
本发明提供的一种基于分位数梯度提升决策树的负荷区间预测系统,通过采用集总经验模态对原始配电网台区负荷序列进行分解,得到不同特征的模态分量,降低了后续分位数梯度提升决策树预测模型训练的复杂程度,提高了预测的准确性,并采用核密度估计方法得到概率密度函数,避免构造概率分布的主观性和先验性,提高了配电网台区负荷区间预测的可靠性和准确性,同时,利用决策树采样的随机性确保样本之间学习的多样化,使得分位数梯度提升决策树不易陷入过拟合风险,具有良好的泛化能力。
[0039]
本发明还提供了一种计算机可读存储介质,其中存储有计算机程序,计算机程序被处理器加载执行时,实现如上述的基于分位数梯度提升决策树的负荷区间预测方法的步骤。
[0040]
本发明还提供了一种电子设备,包括:处理器及存储器;其中,存储器用于存储计算机程序;处理器用于加载执行计算机程序,以使电子设备执行如上述的基于分位数梯度提升决策树的负荷区间预测方法的步骤。
[0041]
在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0042]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0043]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0044]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(英文全称:read

only memory,英文缩写:rom)、随机存取存储器(英文全称:random access memory,英文缩写:ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0045]
以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1