本发明涉及光伏发电站功率预测,具体涉及一种光伏发电站功率预测模型的训练、预测方法及装置。
背景技术:
1、现有技术中,对模型的训练需要找到一个比较优异的样本或者数据集,这对于数据的存储、采集和质量都有着较高的要求,同时由于数据的优异性,往往会出现过拟合的现象,导致训练出的模型达不到泛用性,对于发电站功率预测模型可能在这个场站上好用,无法用来预测别的场站的功率。这是由于大部分的数据集都不可避免出现缺失情况,这极大地影响了模型的训练和预测的准确性。无论是简单的删除还是忽略缺失数据都会使原始数据信息量发生变化,为了寻找较为“完美”的数据集又会耗费大量的时间和成本。
技术实现思路
1、为了解决现有技术中的发电站功率预测模型的训练和预测的准确性差的缺陷。本发明提供一种光伏发电站功率预测模型的训练、预测方法及装置,具备高泛用性,涵盖了较多非常规情况,同时对于试点场站的选择具有随机性降低了数据传输成本,得到的功率预测模型具有较高的预测准确性。
2、本发明采取的技术方案为:
3、第一方面,本发明提供了一种光伏发电站功率预测模型的训练方法,包括以下步骤:
4、步骤1:获取以日为采集周期,采集光伏发电站的第一实测数据组,所述第一实测数据组的数据包括:天气状况、温度、装机容量、日累积发电量、日损失电量;
5、步骤2:获取以预设分钟级别为采集周期,采集光伏发电站的第二实测数据组,所述第二实测数据组的数据包括:功率、辐照度、发电量及机组状态;
6、步骤3:基于先验知识和期望最大算法,对第二实测数据组中的功率缺失值进行填充;
7、步骤4:将预设历史时间段的以日为采集周期获取的多个光伏发电站的第一实测数据组,以及以预设分钟级别为获取的多个第二实测数据组中除功率之外的数据作为输入,将填充后的功率数据作为输出,对预设机器学习模型进行训练,得到训练好的模型作为光伏发电站功率预测模型。
8、所述步骤1中,以日为采集周期采集温度数据的过程,包括以下步骤:
9、步骤1.1:根据光伏发电站的地理位置及所处季节,获取每日预设时刻的最高温度和最低温度;
10、步骤1.3:将其余整时时刻的温度进行等差填充,相邻整时时刻之间以所述预设分钟级别相对应的分钟数的温度数据以整时时刻的温度为区间,以随机数进行填充。
11、所述步骤2中,机组状态包括:通讯中断、正常运行、告警运行、限电运行、正常停机、故障停机、维保停机、待机中的任意一种,并使用预设编码的形式表示不同的机组状态。
12、所述步骤3包括以下步骤:
13、步骤3.1:将所述预设历史时间段的采集光伏发电站的功率,利用第一预设聚类算法对正常值、异常值和缺失值进行分类;
14、步骤3.2:利用第二预设聚类算法对得到的正常值进行聚类,得到多个数据集;
15、步骤3.3:对存在功率缺失值的第二实测数据组,根据其缺失时刻对应采集的光伏发电站的辐照度,以及预设先验物理模型中辐照度与功率的对应关系,得到待填充时刻的理论功率;
16、步骤3.4:根据多个数据集包含的多个实测功率数据与理论功率值的距离大小,将所述多个数据集划分多个簇族;
17、步骤3.5:获取存在功率缺失值的第二实测数据组对应簇族的相关参数作为初始值输入到最大期望值算法中,得到的输出值作为功率缺失值对应的填充值。
18、所述步骤3.1中,第一预设聚类算法为st-dbscan聚类算法,所述第二预设聚类算法为k-means聚类算法,所述k-means聚类算法中k值的根据多个评价指标的综合评价结果确定。
19、所述步骤3.4中,将所述多个数据集划分多个簇族,包括:将所述多个数据集划分k个簇族;分别计算k个簇族中所包含实测功率值的方差和平均值,并将包含这两个值的参数作为对应簇族的相关参数。
20、所述步骤4中,所述预设机器学习模型为lstm模型,对lstm模型进行训练时采用adaboost算法进行训练。
21、第二方面,本发明提供了一种光伏发电站功率预测方法,包括以下步骤:
22、s1:获取以日为采集周期,采集目标光伏发电站的第三实测数据组,所述第三实测数据组的数据包括:天气状况、温度、装机容量、日累积发电量、日损失电量;
23、s2:获取以预设分钟级别为采集周期,采集目标光伏发电站的第四实测数据组,所述第四实测数据组的数据包括:辐照度、发电量及机组状态;
24、s3:将目标光伏发电站的第三实测数据组和第四实测数据组,输入到基于所述的光伏发电站功率预测模型的训练方法,得到的伏发电站功率预测模型中,得到目标光伏发电站的功率预测值。
25、第三方面,本发明提供了一种光伏发电站功率预测模型的训练装置,所述装置包括:
26、第一实测数据组获取模块,用于获取以日为采集周期采集光伏发电站的第一实测数据组,所述第一实测数据组的数据包括:天气状况、温度、装机容量、日累积发电量、日损失电量;
27、第二实测数据组获取模块,用于获取以预设分钟级别为采集周期采集光伏发电站的第二实测数据组,所述第二实测数据组的数据包括:功率、辐照度、发电量及机组状态;
28、功率缺失值填充模块,用于基于先验知识和期望最大算法对第二实测数据组中的功率缺失值进行填充;
29、功率预测模型训练模块,用于将预设历史时间段的以日为采集周期获取的多个光伏发电站的第一实测数据组,以及以预设分钟级别为获取的多个第二实测数据组中除功率之外的数据作为输入,将填充后的功率数据作为输出,对预设机器学习模型进行训练,得到训练好的模型作为光伏发电站功率预测模型。
30、所述第一实测数据组获取模块包括:温度采集单元,所述温度采集单元用于以日为采集周期采集温度数据的过程,其包括:
31、最高温度和最低温度采集子单元,用于根据光伏发电站的地理位置及所处季节获取每日预设时刻的最高温度和最低温度;
32、温度填充子单元,用于将其余整时时刻的温度进行等差填充,相邻整时时刻之间以所述预设分钟级别相对应的分钟数的温度数据以整时时刻的温度为区间,以随机数进行填充。
33、所述功率缺失值填充模块,包括:
34、第一聚类单元,用于将所述预设历史时间段的采集光伏发电站的功率,利用第一预设聚类算法对正常值、异常值和缺失值进行分类;
35、第二聚类单元,用于利用第二预设聚类算法对得到的正常值进行聚类,得到多个数据集;
36、理论功率计算单元,用于对存在功率缺失值的第二实测数据组,根据其缺失时刻对应采集的光伏发电站的辐照度,以及预设先验物理模型中辐照度与功率的对应关系,得到待填充时刻的理论功率;
37、簇族划分单元,用于根据多个数据集包含的多个实测功率数据与理论功率值的距离大小,将所述多个数据集划分多个簇族;
38、功率填充值获取单元,用于存在功率缺失值的第二实测数据组对应簇族的相关参数作为初始值输入到最大期望值算法中,得到的输出值作为功率缺失值对应的填充值。
39、一种光伏发电站功率预测装置,所述装置包括:
40、第三实测数据组获取模块,用于获取以日为采集周期采集目标光伏发电站的第三实测数据组,所述第三实测数据组的数据包括:天气状况、温度、装机容量、日累积发电量、日损失电量;
41、第四实测数据组获取模块,用于获取以预设分钟级别为采集周期采集目标光伏发电站的第四实测数据组,所述第二实测数据组的数据包括:辐照度、发电量及机组状态;
42、功率预测模块,用于将目标光伏发电站的第三实测数据组和第四实测数据组,输入到基于所述的光伏发电站功率预测模型的训练方法得到的伏发电站功率预测模型中,得到目标光伏发电站的功率预测值。
43、第四方面,本发明提供了一种计算机设备,包括:
44、存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行所述的光伏发电站功率预测模型的训练方法,或所述的光伏发电站功率预测方法。
45、第五方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行所述的光伏发电站功率预测模型的训练方法,或所述的光伏发电站功率预测方法。
46、本发明一种光伏发电站功率预测模型的训练、预测方法及装置,技术效果如下:
47、1)本发明提供的光伏发电站功率预测模型的训练方法得到的光伏发电站功率预测模型,具备高泛用性,涵盖了较多非常规情况,同时对于试点场站的选择也可以具有随机性,降低了数据传输成本,且具有较高的预测准确性。
48、2)本发明对于温度的处理在降低了温度采集的成本的情况下,可以达到和全量采集温度的模型类似准确度的效果。
49、3)本发明将包含多种机组状态的变量用于模型训练,提高了模型训练及预测的准确度。
50、4)本发明提供的基于先验知识和期望最大的光伏功率缺失值填充方法,可以得到质量较好的样本数据,有利于提供模型训练和预测的准确性。
51、5)本发明通过分两次选取不同的聚类算法,可以得到更准确的功率正常值、异常值和缺失值聚类结果。
52、6)本发明通过将各个簇族所有实测数据所包换的功率值的方差和平均值相关的参数作为最大期望值算法的初始参数充分考虑了与缺失值相关的参数,可以更为准确的得到缺失值对应的填充值。
53、7)本发明通过对比实验验证了使用lstm模型具有准确度高于其他模型的效果。
54、8)本发明通过将目标光伏电站实测的与模型训练时采集的相同数据输入到上述基于光伏发电站功率预测模型的训练方法得到的伏发电站功率预测模型中,即可得到准确率较高的预测结果。