一种基于LSTM-XGBoost实现误差修正机制的电力负荷预测方法与流程

文档序号:35450683发布日期:2023-09-14 06:08阅读:104来源:国知局
一种基于LSTM-XGBoost实现误差修正机制的电力负荷预测方法与流程

本发明涉及电网系统电力负荷预测,提供了一种基于lstm-xgboost实现误差修正机制的电力负荷预测方法。


背景技术:

1、随着能源需求的不断增长和电力市场的不断发展,电力负荷预测工作越来越重要。电力负荷预测是电力生产和电网调度的基础,也是电力市场规划和经营决策的重要依据。然而,电力负荷预测一直是一项具有挑战性的工作,因电力负荷需求总是存在一定的不确定性和随机性,其预测精度受到多种因素的影响,如天气变化、经济发展和社会活动等。当前,电力负荷预测技术主要分为传统的统计学方法和新兴的机器学习方法两种。前者通常是通过建立时间序列回归方程来进行预测,如arima、ets等方法,但这些方法对于非线性和非平稳的数据具有较大的局限性。而机器学习方法,如基于支持向量机、决策树或神经网络的方法,则是基于大量历史数据进行训练,能够更好地表达数据的复杂性和非线性关系,然而,现有的基于机器学习的方法也存在一些局限性,如参数复杂、高内存要求、训练误差传递与积累的问题,如何提高电力负荷预测的准确性和稳定性,为电力生产和市场决策提供可靠依据。


技术实现思路

1、本发明涉及一种基于lstm-xgboost实现误差修正机制的电力负荷预测方法,主要解决现有预测方法存在的准确度不高、稳定性不强、误差传递与积累等问题,为电力生产和市场决策提供可靠的依据。一种基于lstm-xgboost实现误差修正机制的电力负荷预测方法,其特征在于,包括:

2、加载并读入原始数据表,原始数据dorig=[xorig,yorig]为一组多元时间序列,包含电力负荷yorig和节假日、气候等相关外部特征xorig=[xorig1,xorig2,...xorign];

3、对于原始数据dorig,对其进行数据清洗和离差标准化,得到d=[x,y];

4、对于d中的历史电力负荷y列,使用stl时间序列分解法进行分解,得到季节分量seasonal、趋势分量trend和随机分量random三条子序列;

5、对于d中的外部特征x=[x1,x2,...xn]列,使用pcc算法对trend和random进行特征选择,分别得到特征空间ft和fr,满足

6、对于trend和random,使用所构建的lstm-xgboost误差修正预测模块进行分量预测,得到经过误差修正的趋势分量预测值和随机分量预测值

7、对于seasonal,因其在每个周期内的变化规律总是呈现一个固定的模式,故不使用误差修正预测模块进行预测,直接截取历史同期值作为其预测值

8、对于lstm-xgboost输出的和以及季节分量对应的历史同期值将其相加得到一条完整的时间序列,即得到电力负荷预测结果;

9、使用mape指标对模型预测误差进行评估;

10、使用训练好的模型进行电力负荷预测。

11、优选的,对原始数据进行预处理,包括去除重复行、水平处理异常值以及k-均值填充处理缺失值,确保数据的完整性和可用性,为后续模型建模提供可靠的数据保障。离差标准化是一种常用的数据标准化方法,对于给定原始数据x,其最大和最小值分别为max(x)和min(x),通过下式将x映射到[0,1]范围内的数值x':

12、

13、对清洗后的数据进行离差标准化,得到d=[x,y],符合模型数据输入规范。

14、优选的,使用stl算法将电力负荷数据分解为季节分量seasonal、趋势分量trend和随机分量random三条子序列,满足:

15、y=seasonal+trend+random。

16、优选的,trend变化缓慢,其规律性取决于季节变化和经济发展水平等慢变化因素的影响;random受多种因素影响,包括气象、节假日和突发事件等不确定性因素。对于每列外部特征,根据pcc特征相关性分析算法由下式分别计算与trend和random之间的皮尔逊相关性系数:

17、

18、其中,n表示样本数量,xi和yi分别为第i个样本的x和y值,和分别为x和y的平均值,rx,y为x和y之间的相关系数。当rx,y>0,表明x和y之间线性正相关,同理,rx,y<0则线性负相关,rx,y=0则无明显相关关系。相关系数绝对值越大相关性越强,根据相关系数的大小对特征进行排序,选择与目标变量相关系数较大的前k个特征作为筛选出的重要特征,筛选所得的趋势和随机分量特征空间ft和fr满足ft,

19、优选的,seasonal的周期性取决于社会生产生活的周期性,在每个周期内(如:一年、一个月或一周)其变化规律总是呈现一个固定的模式,故无需对其进行特征选择。

20、优选的,对于经过数据预处理和特征选择后所得到的dinput=[trend,seasonal,random,ft,fr],划分最近12个月的数据之前的所有数据作为训练集,用于拟合参数、训练模型;划分最近12个月的数据作为测试集,用于评估模型预测性能。

21、优选的,所构建的lstm-xgboost误差修正预测模块基于stacking ensemble的思想,即若干个基础模型的输出作为下一层预测模型的输入,以实现基于误差修正机制的分量预测。

22、优选的,所构建的误差修正预测模块使用lstm作为趋势和随机分量的第一层预测模型。具体来说,分别将trend和random与其特征空间ft和fr输入到lstm中进行预测,得到两条新的时间序列数据,分别为趋势分量初步预测值t'和随机分量初步预测值r'。t'和r'作为trend和random的新特征列分别加入到ft和fr中,得到各自的新特征空间ft'和fr',即满足ft'=[ft,t'],fr'=[fr,r']。

23、优选的,lstm神经网络预测过程大致如下:

24、设电力负荷数据的时间步为t,输入特征的时间步为t-n,n为滞后期。输入数据包括m个样本和p个输入特征,其中第i个样本的第j个特征在时间步t-n到t-1的值为xi,j,t-n,xi,j,t-n+1,...,xi,j,t-1,则lstm的输入层可以表示为一个三维张量x,其中xi,j,k=xi,j,t-n+k,即:

25、

26、lstm网络由若干个lstm单元组成,每个lstm单元包含不同的门机制,其中,输入门控制输入数据中哪些信息可以进入记忆细胞;遗忘门控制记忆细胞中哪些信息需要被遗忘;记忆细胞用于存储历史信息;输出门控制从记忆细胞中输出哪些信息。其更新公式如下:

27、it=σ(wxixt+whiht-1+bi)

28、ft=σ(wxfxt+whfht-1+bf)

29、

30、ot=σ(wxoxt+whoht-1+bo)

31、

32、其中,xt是当前时刻的输入,ht-1是上一个时刻的隐藏状态,w是对应的权重矩阵,b是偏置项,σ是sigmoid函数,是逐元素乘法,tanh是双曲正切函数,ht是当前时刻的输出。通过门控制以及更新记忆细胞,lstm可以有效地捕捉时间序列的长期依赖关系。

33、优选的,使用adam优化器对lstm进行参数调优。adam优化器可以根据lstm每个参数的梯度情况自适应地调整学习率,其结合了动量概念,可以加速lstm的收敛过程。此外,adam优化器利用梯度的一阶和二阶矩估计来调整每个参数的更新步长,这种适应性可以根据lstm不同参数的特征来调整参数的更新步长,能够更好地应对模型中的序列数据特点,提高模型训练效果。

34、优选的,所构建的误差修正预测模块使用xgboost作为趋势和随机分量的第二层预测模型,即将lstm的趋势和随机分量预测结果作为两分量各自的新特征,将趋势和随机分量及各自的新特征空间输入到xgboost中进行预测。具体来说,分别将trend和random与其新特征空间ft′和fr′输入到xgboost中进行预测,得到经过误差修正的趋势分量预测结果和随机分量预测结果

35、优选的,xgboost树模型预测过程大致如下:

36、xgboost使用一组回归树作为基础分类器,对于每个时刻的电力负荷,都对应一个回归树。假设数据集包含m个样本和n个特征,则xgboost定义为:

37、

38、其中,k为回归树个数,fk为第k棵回归树,x为模型的输入特征向量。

39、xgboost使用梯度提升算法训练模型。对于第k棵回归树,需要学习一组参数θk,使得其能够最小化目标函数:

40、

41、其中,yi为第i个样本的真实值,fk-1(xi)为前k-1棵树的预测结果,l为损失函数,用于度量模型的预测误差,ω(fk)为正则化项,用于控制模型的复杂度。xgboost的损失函数和正则化项为:

42、

43、

44、其中,t为树的叶子节点数,ωj为第j个叶子节点的权重,γ和λ为超参数,用于控制正则化项的强度。

45、优选的,直接截取历史同期值作为季节分量的预测结果因季节分量在每个周期内的变化规律总是呈现一个固定的模式,故无需对其进行误差修正预测。

46、优选的,根据stl加法规则,将三个分量序列预测结果和重建成一条完整的时间序列即得到电力负荷预测结果,满足:

47、

48、优选的,采用mape指标对预测结果进行评估以了解在测试集上的预测性能,mape值越大代表预测误差越大。mape计算如下:

49、

50、其中,n为样本数量,yi为第i个样本真实值,为第i个样本预测值。

51、优选的,在对模型进行充分训练和评估之后,可将模型应用到新数据中,进行实际预测。

52、相比现有的电力负荷预测方法,本发明具有以下优点:

53、1)高效性:本发明采用了stl分解方法将原始电力负荷数据分解成季节性分量和非季节性分量,通过解耦时间序列为后续预测建模提供高质量的数据保障,从而使得预测过程更加高效;

54、2)高精度:本发明融合了lstm和xgboost各自的优势,使得所设计的lstm-xgboost误差修正预测模块既能够捕捉分量的长期变化趋势,又能考虑到非线性因素导致的局部波动,从而获得更加准确的分量预测结果;

55、3)灵活性:本发明可以根据实际情况调整模型的参数和输入特征,使得模型更具适应性和灵活性,可以应用于不同的电力负荷预测场景;

56、4)稳定性:本发明的误差修正预测模块采用堆叠集成学习的思想,能够有效地减少过拟合或欠拟合风险,提高模型的稳定性和泛化能力。

57、因此,本发明具有较高的实用价值和广泛的应用前景,可广泛应用于电力系统负荷分析及预测任务中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1