一种基于Lasso-XGboost-stacking的电能替代潜力预测方法与流程

文档序号:36615263发布日期:2024-01-06 23:14阅读:16来源:国知局
一种基于Lasso-XGboost-stacking的电能替代潜力预测方法与流程

本发明涉及区域电能替代潜力预测,尤其涉及一种基于lasso-xgboost-stacking的电能替代潜力预测方法。


背景技术:

1、电能替代是终端用能再电气化的重要手段,对于促进大气污染防治、推动能源革命意义重大。对未来电能替代量进行预测,可以为电能终端消费市场拓展提供数据依据,有力支持电能替代工作实施。

2、目前,电能替代潜力预测的研究成果,大多根据历史数据直接进行预测,且当前的电能替代潜力预测研究很少对电能替代相关因素的影响进行量化评估,或是无法直观展示各类影响因素在模型中的权重占比,存在着预测精度不高,泛化性低等问题。


技术实现思路

1、本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供一种基于lasso-xgboost-stacking的电能替代潜力预测方法,以提高预测精度和泛化性的目的。为此,本发明采取以下技术方案。

2、一种基于lasso-xgboost-stacking的电能替代潜力预测方法,包括以下步骤:

3、1)将能源、经济数据通过交叉特征构建特征空间矩阵,量化多类影响因素对电能替代的影响;

4、2)基于影响因素与电能替代量数据构建岭回归模型,并根据各类因素在模型中的权重分析因素影响程度;

5、3)基于影响因素与电能替代量数据构建xgboost模型,并采用stacking方法与步骤2)中的岭回归模型进行模型融合,最终构建lasso-xgboost-stacking模型,构建影响因素与电能替代量的映射关系;

6、4)构建arima模型预测各类影响因素趋势,根据模型预测的影响因素数据与步骤3)中的lasso-xgboost-stacking模型实现电能替代潜能预测。

7、本技术方案综合考虑多类影响因素,通过交叉特征构建特征空间矩阵,将能源、经济数据等多类影响因素考虑在内,能够全面分析各类因素对电能替代的影响。而不仅仅依赖于单一的因素,这使得预测结果更准确。

8、通过岭回归模型和xgboost模型的构建,能够有效地建模影响因素与电能替代量之间的关系,分析各类因素在模型中的权重,识别重要的影响因素。通过采用stacking方法将岭回归模型和xgboost模型进行融合,能够充分利用两种模型的优势,提高预测的准确性和稳定性。通过构建arima模型预测各类影响因素的趋势,能够更加准确地预测未来影响因素的变化,从而提高电能替代潜力预测的准确性。

9、lasso回归和岭回归在特征选择和模型构建方面具有优势。lasso回归可以帮助减少模型的复杂度,通过将一些特征的系数压缩为零来消除冗余或噪声特征,而岭回归则可以解决lasso回归中可能出现的偏估计问题。xgboost是一种高效的梯度提升决策树算法,能够处理各种类型的特征,并具有很好的性能和准确性。使用stacking方法可以将多个模型(lasso回归和岭回归)的预测结果结合起来,从而提高预测精度。通过构建arima模型预测各类影响因素的趋势,可以更好地考虑未来可能的趋势变化,使得预测结果更具有前瞻性。

10、作为优选技术手段:步骤1)包括以下步骤:

11、11)获取区域内人均gdp、耗电量、年均电价、能源消耗量、石化能源价格、电力固定资产投资、工业废气、电能替代量数据,并量化经济发展、环保约束、能源价格、政策扶持、技术进步这五类影响因素的影响程度;

12、12)根据步骤11)中的特征数据交叉特征,构建特征空间矩阵表示各类量化影响因素,采用使用人均gdp与电能占比的乘积表示经济发展因素,用单位gdp污染物排放量表示环保约束因素,采用石化能源价格上涨量的和表示能源价格因素,采用省级区域的历年电力固定投资表示政策扶持因素,采用电能在总能耗中的占比与单位gdp的能耗的比值来表示技术进步因素;

13、其中各类量化因素的表达式如下:

14、λei=gdpi×ei,μei=pei,μpi=cpi,μ0i=mei,

15、式中λei为第i年量化后的经济发展因素;gdpi为第i年人均gdp;ei为第i年电能在总能源中的占比;μei为第i年量化后的环保约束因素;pei为第i年工业废气排放总量;μpi为第i年量化后的能源价格因素;cpi为第i年石化能源价格上涨量;μ0i为第i年量化后的政策扶持因素;mei为第i年区域省域电力固定投资;μri为量化后的技术进步因素;ei为第i年能耗;pei为第i年工业废气排放总量;gdppi为第i年gdp总量。

16、本技术方案综合考虑多种因素对电能替代的影响,并且通过对影响因素的量化,可以更准确地评估其对电能替代量的影响程度。同时,该方法还可以根据历史数据预测未来可能的电能替代量,为能源规划和政策制定提供参考。

17、作为优选技术手段:步骤2)包括以下步骤:

18、21)将量化后的各类影响因素进行max-min归一化;

19、22)将s21中的数据与电能替代量一同构建岭回归模型,构成的模型数学表达式为:y=ω0+ω1λe+ω2μe+ω3μp+ω4μ0+ω5μr;

20、式中ω0为常数,ω1、…ω5为各类影响因素的权重,y为电能替代量;

21、23)采用cv准则选择模型正则化惩罚参数,提升22)步骤中模型的泛化能力。

22、综合考虑多种影响因素,通过岭回归模型建立影响因素与电能替代量的映射关系,可以更准确地评估各类因素对电能替代的影响程度。采用max-min归一化方法处理数据,消除量纲差异对模型的影响,提高模型的预测精度。采用cv准则选择模型的正则化惩罚参数,增强模型的泛化能力,防止过拟合现象的出现。基于xgboost和stacking的方法进一步优化模型的性能,提高预测精度。

23、作为优选技术手段:在步骤23)选择模型正则化惩罚参数时,将数据分至训练集和测试集,其中训练集表示为:

24、{(x1,y1),...(xt-1,yt-1),(xt+1,yt+1),...(xn,y)},1≤t≤n

25、测试集为(xt,yt),在训练集上去拟合lasso回归模型,在测试集中求得yt的拟合值为计算这样一直计算n次,得到n个均方误差的均值以此来选择惩罚系数λ。

26、训练集和测试集的划分可以有效地评估模型的拟合能力和泛化能力。将数据分为训练集和测试集是一种常见的评估方法,训练集用于训练模型,测试集用于评估模型的性能。在训练集上拟合lasso回归模型,得到不同的惩罚系数对应的模型参数。通过调整惩罚系数,控制模型的复杂度,防止过拟合。在测试集上求得模型的拟合值,并计算均方误差,评估模型在未见过的数据上的表现。通过计算均方误差的均值,更全面地评估模型的性能。通过交叉验证的方法选择惩罚系数,利用更多的数据来优化模型的参数,提高模型的泛化能力。

27、作为优选技术手段:步骤3)包括以下步骤:

28、31)根据时间段划分量化后的影响因素数据与电能替代数据集为测试集与训练集;

29、32)将31)步骤的数据输入到xgboost模型中,确认模型参数范围,通过五折交叉--贝叶斯法优化模型参数,使得预测模型的精度达到最优,其中模型参数包括树最大深度、学习率、总叶子数;

30、33)根据stacking方法将32)步骤中的xgboost模型与步骤2)中的岭回归模型融合,最终构建lasso-xgboost-stacking模型,构建影响因素与电能替代量的映射关系。

31、采用了lasso回归、xgboost和stacking等多种方法,利用不同方法的优点来提高预测精度。lasso回归可以用于特征选择和参数调整,xgboost可以处理各种类型的特征并具有高效性能,stacking可以结合多个模型的预测结果提高精度。通过交叉验证和贝叶斯法优化模型参数,更好地控制模型的复杂度和拟合能力,提高模型的泛化能力。根据不同的任务和数据集选择适合的模型和方法,灵活地进行模型设计和调整,以满足不同的需求。

32、作为优选技术手段:步骤4)包括以下步骤:

33、41)根据各类影响因素历史数据构建基于arima的时序预测模型;

34、42)使用bic准则确定arima模型的p、q的阶数,最终确定合适的arima模型,预测未来数年各类影响因素数值;

35、43)利用步骤42)中预测出的影响因素数值,根据33)中的lasso-xgboost-stacking对未来的电能替代量进行预测。

36、同时采用了时间序列预测和多元回归的方法,将影响因素的时间趋势和相关关系都考虑到预测模型中,提高预测的准确性和稳定性。arima模型处理具有季节性和趋势性的时间序列数据,适用于许多实际情况。使用bic准则确定arima模型的阶数,更好地选择合适的模型,提高模型的拟合效果和预测精度。通过lasso-xgboost-stacking模型对未来的电能替代量进行预测,利用多种影响因素的信息,提高预测的准确性和稳定性。根据不同的数据集和任务选择适合的模型和方法,灵活地进行模型设计和调整,以满足不同的需求。

37、作为优选技术手段:步骤42)中bic准则全称为贝叶斯信息准则,计算公式如下:

38、bic=kln(n)-2ln(l)

39、式中k为模型参数个数,n为样本数量,l为似然函数。

40、有益效果:

41、(1)本发明量化了多种影响因素,采用交叉特征降低了因素之间的线性关系,提升模型复杂度和可解释性,客观上提升了模型精度。

42、(2)本发明所构建的岭回归模型,能够直观地反映出各类影响因素在模型中的权重占比,有利于分析各类因素对电能替代潜力的重要性。

43、(3)本发明构建的lasso-xgboost-stacking模型融合了lasso的泛化性能和xgboost高精度优点,在保证模型泛化能力的同时,提升模型预测精度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1