本发明涉及人工智能应用于电价预测领域,具体涉及一种基于轻量级梯度提升算法lightgbm(lightgradientboostingmethod)预测电价的系统模型。
背景技术:
随着电力市场改革正式开始.新电改放开了电力市场的售电侧,使我国的电力市场逐渐走向市场化.电能作为电力市场中的一种特殊产品,电价是反映电力市场运营情况、评价电力市场竞争效率的重要指标,是电力市场各博弈方进行科学决策的基础.对电价数据进行准确预测可以帮助售电企业决定市场的日前报价,最大限度地规避风险、提高收益,同时也能够为发电企业的发电扩容提供价格信号.因此,对波动频率较大的电价数据进行准确预测已经成为电力市场各交易方研究的核心问题。本发明提出了一种基于轻量级梯度提升算法lightgbm(lightgradientboostingmethod)来预测电价的系统模型。
技术实现要素:
本发明的目的是提供一种电价预测的系统模型来准确预测电价,能够帮助电力市场博弈方进行风险规避,达到经济收益最大化。其中梯度提升决策树是机器学习中一个长盛不衰的模型,其主要思想是利用弱分类器(决策树)迭代训练以得到最优模型,该模型具有训练效果好、不易过拟合等优点。该方法不仅在工业界应用广泛,支持高效率的并行训练,并且具有更快的训练速度、更低的内存消耗、更好的准确率、支持分布式可以快速处理海量数据等优点。本发明采用了一种基于轻量级梯度提升算法lightgbm(lightgradientboostingmethod)来预测节点电价,可以极大的提高预测准确度,相关流程如图1所示。
附图说明
图1为本发明实施中电价预测系统模块流程图。
图2为本发明实施中样本电力价格曲线图。
图3为本发明实施中电价预测值与历史电价的曲线图。
具体实施方式
为使得本发明的内容、目的、特征及优点能够更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护说明书的范围。
本发明的技术方案具体步骤如下。
1)通过测量或取得历史数据的方式,获得该区域的小时级历史气温,工作日,节假日,小时参数,月参数,年参数,历史用电负荷,包括同一时段上一周的负荷,同一时段昨天的负荷,前二十四小时的平均负荷,以及历史节点电价,包括同一时段上一周的电价,同一时段昨天的电价,前二十四小时的平均电价,前一天的峰值电价,上一周的峰值电价,样本电力价格曲线图如图2所示。
2)由于可能存在的人为误差,我们对于从训练集中删除了异常数据,比如:由于极端高温或极端低温导致的峰值电价,大面积输电堵塞导致的峰值电价等。由于该类数据的出现概率很小,我们采用异常分析的办法,剔除掉1%概率最小的数据。异常分析公式如下:
a.首先计算出每一组数据的多元正态分布:
其中,
b.当
3)采用轻量级梯度提升算法训练模型,具体步骤如下:
a.输入数据:
b.
c.由于第t个树模型的预测值:
d.为了求解该目标函数,我们采用泰勒公式:
原问题转化成:
e.为了确保生成的树模型们不会导致过拟合,目标函数的正则项我们定义为:
其中
f.由于在实际的应用中,数据量大,特征值多。为了提高算法的效率,减少运算时间,首先在每一个生成树模型时,并不通过穷举法找到最优切入点,而是采用贪心算法:
i.从深度为0的树开始,对每个叶节点枚举所有的可用特征;
ii.针对每个特征,把属于该节点的训练样本根据该特征值进行升序排列,通过线性扫描的方式来决定该特征的最佳分裂点,并记录该特征的分裂收益;
iii.选择收益最大的特征作为分裂特征,用该特征的最佳分裂点作为分裂位置,在该节点上分裂出左右两个新的叶节点,并为每个新节点关联对应的样本集
iv.回到第1步,递归执行到满足特定条件为止
g.在每一个树模型生成时的梯度下降时,采用单边梯度抽样算法。在树模型算法的梯度大小可以反应样本的权重,梯度越小说明模型拟合的越好,单边梯度抽样算法利用这一信息对样本进行抽样,减少了大量梯度小的样本,在接下来的计算过程中只需关注梯度高的样本,极大的减少了计算量。单边梯度抽样算法保留了梯度大的样本,并对梯度小的样本进行随机抽样,为了不改变样本的数据分布,在计算增益时为梯度小的样本引入一个常数进行平衡;
h.最后如果对于特征值,我们采用互斥特征捆绑算法。由于高维特征往往是稀疏的,而且特征间可能是相互排斥的(如两个特征不同时取非零值),如果两个特征并不完全互斥(如只有一部分情况下是不同时取非零值),可以用互斥率表示互斥程度。互斥特征捆绑算法指出如果将一些特征进行融合绑定,则可以降低特征数量;
i.在每一个树模型的生成中,我们采用,逐叶(leaf-wise)策略:每次分类增益最大的叶子节点,直到达停止条件。
4)在工程实现中,传统的特征并行算法在于对数据进行垂直划分,然后使用不同机器找到不同特征的最优分裂点,基于通信整合得到最佳划分点,然后基于通信告知其他机器划分结果。传统的特征并行方法有个很大的缺点:需要告知每台机器最终划分结果,增加了额外的复杂度(因为对数据进行垂直划分,每台机器所含数据不同,划分结果需要通过通信告知)。而本发明采用的轻量级梯度提升算法,不进行数据垂直划分,而是采用分散规约的方式将直方图整合的任务分摊到不同机器上,从而降低通信代价,并通过直方图做差进一步降低不同机器间的通信。每台机器都有训练集完整数据,在得到最佳划分方案后可在本地执行划分而减少了不必要的通信。
5)最后预测电价数据结果如图3所示。
本发明通过一种基于轻量级梯度提升算法,考虑多种数据自变量,提出一种对电力价格预测方法。为综合应用新能源发电,保障整体电网用电平稳安全,提供了一套得到有效预测数据的系统。以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变型或替换均包含在本申请权利要求所限定的范围内。