评估光功率预测算法性能优劣的方法及装置与流程

文档序号:12125122阅读:701来源:国知局
评估光功率预测算法性能优劣的方法及装置与流程

本发明涉及光功率预测技术领域,尤其涉及一种评估光功率预测算法性能优劣的方法及装置。



背景技术:

光功率预测是指根据气象条件,通过预测模型,对光伏发电站有功功率进行预报。其中,预测模型是指利用光伏发电站历史数据、执行某种算法从而得到关于历史数据的某种潜在规律。

根据NFL定理(No Free Lunch Theorem,没有免费的午餐),对于离开特定应用场景的算法,所有算法的期望性能都是相同的。只有在特定的应用场景下,不同算法才有性能优劣的差别。

那么,在现有技术中,在光功率预测这一应用场景下,一般把光伏发电站历史数据D简单分为两个互斥的集合,其中一个作为训练集S,另一个作为测试集T,即D=S∪T,S∩T=Φ。用训练集S通过某种算法训练出预测模型,用T来评估其预测的准确度。

这种评估算法方法主要存在的问题在于,通过将数据D简单的分为两个互斥的集合,不同的划分方法会导致不同的评估结果,导致评估结果的保真性不够,评估结果不稳定,使得实际应用场景中算法不是最优,从而得到的预测模型不是最优,从而影响光功率预测系统性能。



技术实现要素:

本发明实施例提供一种评估光功率预测算法性能优劣的方法及装置,能够得到保真性和稳定性比较好的评估结果,从而得到性能较好的光功率预测算法。

第一方面,本发明实施例提供了一种评估光功率预测算法性能优劣的方法,包括:

获取光伏发电站历史数据D,所述历史数据D包含多个样本对应的多个类别的属性数据;

采用待预测的属性数据对每个样本进行标记;

对所述历史数据D进行K次数据划分,得到K组训练数据集和测试数据集,其中K≥2,每组对应的训练数据集和测试数据集中均包含至少一个样本对应的属性数据;

针对每组训练数据集和测试数据集,分别采用待评估光功率预测算法对所述训练数据集进行拟合,得到所述待评估光功率预测算法对应的光功率预测模型,并将对应的测试数据集中除待预测的属性数据之外的属性数据输入所述光功率预测模型中,得到K组所述待预测的属性数据对应的预测值;

根据K组所述待预测的属性数据的真实值和所述预测值对所述待评估光功率预测算法进行评估。

第二方面,本发明实施例提供了一种评估光功率预测算法性能优劣的装置,包括:

数据获取模块,用于获取光伏发电站历史数据D,所述历史数据D包含多个样本对应的多个类别的属性数据;

数据标记模块,用于采用待预测的属性数据对每个样本进行标记;

数据划分模块,用于对所述历史数据D进行K次数据划分,得到K组训练数据集和测试数据集,其中K≥2,每组对应的训练数据集和测试数据集中均包含至少一个样本对应的属性数据;

预测模块,用于针对每组训练数据集和测试数据集,分别采用待评估光功率预测算法对所述训练数据集进行拟合,得到所述待评估光功率预测算法对应的光功率预测模型,并将对应的测试数据集中除待预测的属性数据之外的属性数据输入所述光功率预测模型中,得到K组所述待预测的属性数据对应的预测值;

算法评估模块,用于根据K组所述待预测的属性数据的真实值和所述预测值对所述待评估光功率预测算法进行评估。

本发明实施例采用新的方法对历史数据D进行划分,使得训练集和测试集分布更合理,然后用交叉验证法进行多次评估,最终得到保真性和稳定性都比较好的评估结果。

附图说明

图1A是本发明实施例一中的一种评估光功率预测算法性能优劣的方法的流程图;

图1B是本发明实施例一中的一种评估光功率预测算法性能优劣的方法中数据划分示意图;

图2A是本发明实施例二中的一种评估光功率预测算法性能优劣的方法的流程图;

图2B是本发明实施例二中的一种评估光功率预测算法性能优劣的方法中数据子集划分示意图;

图2C是本发明实施例二中的一种评估光功率预测算法性能优劣的方法中的数据分组示意图;

图3是本发明实施例三中的一种评估光功率预测算法性能优劣的装置的结构图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构,并且不限制于本实施例的步骤顺序。

实施例一

图1A为本发明实施例一提供的一种评估光功率预测算法性能优劣的方法的流程图,本实施例可适用于评估光功率预测算法性能优劣的情况,该方法可以由本发明实施例提供的评估光功率预测算法性能优劣的装置来执行,该装置可采用软件和/或硬件的方式实现,该装置可集成在终端设备中,例如,笔记本电脑、台式电脑等,如图1A所示,该方法具体包括如下步骤:

S110、获取光伏发电站历史数据D,该历史数据D包含多个样本对应的多个类别的属性数据。

其中,一个样本包含多个类别的属性数据。例如,一个样本包含的属性数据可以包含以下至少一种:温度、湿度、辐照度、风速、风向、开机容量和电厂功率等。

具体的,可将{温度,湿度,辐照度,风速,风向,开机容量,电厂功率}作为一个样本。而光伏发电站历史数据D中包含多个这样的样本数据。

S120、采用待预测的属性数据对每个样本进行标记。

为便于步骤S130中光功率预测模型的训练,及步骤S140中属性数据的预测,在本步骤中预先对样本数据进行标记。例如,可选择样本属性数据中{温度,湿度,辐照度,风速,风向,开机容量,电厂功率}的任一类别的属性数据作为待预测的属性数据(例如,电厂功率)对样本进行标记。其中,待预测的属性数据可以为多个。

S130、对所述历史数据D进行K次数据划分,得到K组训练数据集和测试数据集,其中K≥2,每组对应的训练数据集和测试数据集中均包含至少一个样本对应的属性数据。

其中,针对K组训练数据集和测试数据集,每组训练数据集和测试数据集分别包含多个完整的样本数据。其中,K大于等于2。

具体的,如图1B所示,可对历史数据D进行K次划分,每次划分结果中均包含一个训练数据集和一个测试数据集。训练数据集用于根据待评估光功率预测算法得到光功率预测模型,测试数据集用于输入光功率预测模型得到预测属性数据。

S140、针对每组训练数据集和测试数据集,分别采用待评估光功率预测算法对所述训练数据集进行拟合,得到所述待评估光功率预测算法对应的光功率预测模型,并将对应的测试数据集中除待预测的属性数据之外的属性数据输入所述光功率预测模型中,得到K组所述待预测的属性数据对应的预测值。

其中,待评估光功率预测算法可以为一个或多个。

S150、根据K组所述待预测的属性数据的真实值和所述预测值对所述待评估光功率预测算法进行评估。

其中,测试数据集中包含待预测的属性数据对应的真实值。在将测试数据集输入光功率预测模型时,不将该真实值输入其中。

具体的,以样本{温度,湿度,辐照度,风速,风向,开机容量,电厂功率}为例,如果待预测的属性数据为电厂功率,那么将测试数据集中的其余属性数据{温度,湿度,辐照度,风速,风向,开机容量}输入光功率预测模型中,可得到预测的电厂功率,将电厂功率的真实值和预测值进行比较,即可确定待评估光功率预测算法性能的优劣。

本实施例采用新的方法对历史数据D进行划分,使得训练集和测试集分布更合理,然后用交叉验证法进行多次评估,最终得到保真性和稳定性都比较好的评估结果。

在上述实施例基础上,对所述历史数据D进行K次数据划分,得到K组训练数据集和测试数据集包括:

将所述历史数据D划分为M个数据子集,其中,M≥3;

根据所述M个数据子集得到K组训练数据集和测试数据集。

其中,K组训练数据集和测试数据集中,每组的训练数据集和测试数据集中的样本都不相同。

在上述实施例基础上,根据所述M个数据子集得到K组训练数据集和测试数据集包括:

从所述M个数据子集中选取N个数据子集作为测试数据集,其余数据子集作为训练数据集,重复K次,且每次选取的N个数据子集均不相同。

例如,如果M=3,则将历史数据D划分为3个数据子集分别为数据集1、数据集2和数据集3,那么第一次划分可选取数据集1和数据集2作为训练数据集,数据集3作为测试数据集;第二次划分可选取数据集1和数据集3作为训练数据集,数据集2作为测试数据集;或者,第一次划分可选取数据集1和数据集2作为测试数据集,数据集3作为训练数据集;第二次划分可选取数据集1和数据集3作为测试数据集,数据集2作为训练数据集。

在上述实施例基础上,所述M个数据子集互斥。

例如,将所述历史数据D划分为M个数据子集,M个数据子集中两两数据子集间没有交集。

在上述实施例基础上,所述M=K,N=1。

具体的,可将所述历史数据D划分为K个数据子集,其中,K≥3;从所述K个数据子集中选取1个数据子集作为测试数据集,其余数据子集作为训练数据集,重复K次,且每次选取的作为测试数据集的1个数据子集均不相同。

例如,如果M=3,则将历史数据D划分为3个数据子集分别为数据集1、数据集2和数据集3,且数据集1、数据集2和数据集3互斥,那么可进行如下三次划分:第一次划分可选取数据集1和数据集2作为训练数据集,数据集3作为测试数据集;第二次划分可选取数据集1和数据集3作为训练数据集,数据集2作为测试数据集;第三次划分可选取数据集2和数据集3作为训练数据集,数据集1作为测试数据集。

在上述实施例基础上,根据K组所述待预测的属性数据的真实值和所述预测值对所述待评估光功率预测算法进行评估包括:

针对每组所述待预测的属性数据的真实值和所述预测值,分别采用如下公式计算得到待评估光功率预测算法的预测准确度:

其中,Pmi和Ppi分别表示真实值和预测值,Ci表示开机总容量,n为样本数量;

根据K组RMSE对所述待评估光功率预测算法进行评估。

具体的,RMSE表征了待预测的属性数据的真实值和预测值的相似程度,RMSE值越小,则真实值和预测值间的相似程度越高,则说明对应的待评估光功率预测算法的性能越优;否则,RMSE值越大,则真实值和预测值间的相似程度越低,则说明对应的待评估光功率预测算法的性能越差。

在上述实施例基础上,根据K组RMSE对所述待评估光功率预测算法进行评估包括:

求取K组RMSE的平均值;

根据所述平均值的大小对所述待评估光功率预测算法进行评估。

具体的,针对某个待评估光功率预测算法,如果其对应的K组RMSE的平均值较小,则说明对应的待评估光功率预测算法的性能越优;否则,说明对应的待评估光功率预测算法的性能越差。当待评估的光功率预测算法为多个时,可根据每个光功率预测算法对应的K组RMSE的平均值确定较优的光功率预测算法,即K组RMSE的平均值越小的光功率预测算法性能越优。

本实施例采用新的方法对历史数据D进行划分,使得训练集和测试集分布更合理,然后用交叉验证法进行多次评估,最终得到保真性和稳定性都比较好的评估结果。

实施例二

图2A为本发明实施例二提供的一种评估光功率预测算法性能优劣的方法的流程图,本实施例为一优选实施例,用于对上述实施例的方案进行详细说明。具体的,如图2A所示,本实施例的方法包括:

S210、根据数据分布一致性原则将光伏发电站历史数据D为k个互斥的数据子集,采用待预测的属性数据对每个样本进行标记。

如图2B所示,即D=D1∪D2∪…∪Dk,Di∩Dj=Φ(i≠j)。每一个数据子集Di都尽可能的保持一致性,即从D中通过分层采样得到。

S220、分别选取k-1个数据子集作为训练数据集,剩下的一个数据子集作为测试数据集,得到k组训练数据集和测试数据集。

如图2C所示,这种方式下受随机样本划分的影响比较小,能够得到保真性和稳定性都比较好的评估结果。

S230、针对每组训练数据集和测试数据集,分别采用待评估光功率预测算法对所述训练数据集进行拟合,得到所述待评估光功率预测算法对应的光功率预测模型,并将对应的测试数据集中除待预测的属性数据之外的属性数据输入所述光功率预测模型中,得到K组所述待预测的属性数据对应的预测值。

具体的,若数据集中单个样本的属性空间如下{温度,湿度,辐照度,风速,风向,开机容量,电厂功率},样本中“电厂功率”这个属性数据是这个样本的标记。采用光功率预测算法对训练数据集进行拟合,得到光功率预测模型。对光功率预测模型输入测试数据集中除了标记Pmi的样本,即输入{温度,湿度,辐照度,风速,风向,开机容量},获取的结果即为预测的“电厂功率”Ppi。通过均方根误差RMSE来度量预测准确度,n是单个数据子集中样本的数量。

其中,Pmi和Ppi分别表示电厂功率的实际值和预测值,Ci表示开机总容量,RMSE越小表示预测准确度越高。这样可以得到单次数据集评估的RMSE值。对k个训练数据集/测试数据集所得到的RMSE进行平均求值。

所得AVGRMSE即为该光功率预测算法的最终评估值。重复上述步骤获取所有要评估光功率预测算法的最终评估值。

S240、对K组AVGRMSE进行排序,完成对所有待评估光功率预测算法的最终评估。

AVGRMSE值越小说明该光功率预测算法性能越优。

本实施例采用新的方法对历史数据D进行划分,使得训练集和测试集分布更合理,然后用交叉验证法进行多次评估,最终得到保真性和稳定性都比较好的评估结果。

实施例三

图3为本发明实施例三提供的一种评估光功率预测算法性能优劣的装置的结构图,本实施例可适用于评估光功率预测算法性能优劣的情况,该装置可采用软件和/或硬件的方式实现,如图3所示,具体包括:数据获取模块31、数据标记模块32、数据划分模块33、预测模块34和算法评估模块35。

数据获取模块31用于获取光伏发电站历史数据D,所述历史数据D包含多个样本对应的多个类别的属性数据;

数据标记模块32用于采用待预测的属性数据对每个样本进行标记;

数据划分模块33用于对所述历史数据D进行K次数据划分,得到K组训练数据集和测试数据集,其中K≥2,每组对应的训练数据集和测试数据集中均包含至少一个样本对应的属性数据;

预测模块34用于针对每组训练数据集和测试数据集,分别采用待评估光功率预测算法对所述训练数据集进行拟合,得到所述待评估光功率预测算法对应的光功率预测模型,并将对应的测试数据集中除待预测的属性数据之外的属性数据输入所述光功率预测模型中,得到K组所述待预测的属性数据对应的预测值;

算法评估模块35用于根据K组所述待预测的属性数据的真实值和所述预测值对所述待评估光功率预测算法进行评估。

本实施例的评估光功率预测算法性能优劣的装置用于执行上述各实施例的评估光功率预测算法性能优劣的方法,其技术原理和产生的技术效果类似,这里不再赘述。

在上述实施例的基础上,所述数据划分模块33包括子集划分单元331和数据划分单元332。

子集划分单元331用于将所述历史数据D划分为M个数据子集;

数据划分单元332用于根据所述M个数据子集得到K组训练数据集和测试数据集。

在上述实施例的基础上,所述数据划分单元332具体用于从所述M个数据子集中选取N个数据子集作为测试数据集,其余数据子集作为训练数据集,重复K次,且每次选取的N个数据子集均不相同。

在上述实施例的基础上,所述M个数据子集互斥。

在上述实施例的基础上,所述M=K,N=1。

在上述实施例的基础上,所述算法评估模块35包括RMSE计算单元351和算法评估单元352。

RMSE计算单元351用于针对每组所述待预测的属性数据的真实值和所述预测值,分别采用如下公式计算得到待评估光功率预测算法的预测准确度:

其中,Pmi和Ppi分别表示真实值和预测值,Ci表示开机总容量,n为样本数量;

算法评估单元352用于根据K组RMSE对所述待评估光功率预测算法进行评估。

在上述实施例的基础上,所述算法评估单元352具体用于求取K组RMSE的平均值;根据所述平均值的大小对所述待评估光功率预测算法进行评估。

上述各实施例的评估光功率预测算法性能优劣的装置用于执行上述各实施例的评估光功率预测算法性能优劣的方法,其技术原理和产生的技术效果类似,这里不再赘述。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1