本发明属于新能源光伏发电技术领域,具体涉及一种适用于小样本的光伏功率短期预测方法。
背景技术:
近年来,随着社会经济的发展,能源短缺和环境污染问题日益突出,开发与利用可再生能源成为解决能源和环境问题的有效途径。在新能源发电中,光伏发电由于具有安全可靠、地域限制少、建设周期短等优势而得到快速发展,目前已具备较大的产业规模。但由于天气等因素的影响,光伏输出功率在短时间尺度内存在较大的不确定性,准确有效的光伏预测技术对于系统的安全稳定运行和光伏能源的有效利用具有重要意义。
提前一天的光伏短期预测方法一般都需要充足的历史数据支持,对数据积累时间的要求长达3个月至1年不等,若光伏电站处于投运初期,历史数据积累不足,常规预测方法在应用上会受到很大限制,因此有必要针对小样本情境对常规方法进行改进,得到适用于投运初期光伏发电系统的功率预测方法。
技术实现要素:
为了克服上述现有技术的不足,本发明提供一种适用于小样本的光伏功率短期预测方法,利用各影响因素的自然解耦特性,将预测模型进行拆分,并通过天气类型与云遮程度对应关系的统计分析,将云遮因素有效整合到模型输入量中,简化了网络结构、降低了输入输出之间关系的复杂度,从而减少预测方法对历史数据的需求量。
为了实现上述发明目的,本发明采取如下技术方案:
提供一种适用于小样本的光伏功率短期预测方法,所述方法包括以下步骤:
第一步:历史数据筛选
在历史数据中剔除空气质量不佳、空气湿度大的部分,得到地表太阳辐射值主要受云量影响的样本;
第二步:穿透率统计
利用历史邻近日各时段地表太阳辐射值计算出第j天第i时段穿透率ki,j,结合第i时段历史实测天气类型w,统计得到第i时段各天气类型所对应的穿透率期望;
在单时段穿透率统计的基础上,进行考虑前后时段天气类型的穿透率统计,得到考虑前后时段天气类型的第j天第i时段穿透率期望
第三步:输入量变换
根据待预测时段及其前后时段的天气类型,结合第二步中的统计结果,得到待预测时段的穿透率期望,结合无云天气下对应时段的平均地表太阳辐射值,得到云遮后地表太阳辐射值,完成输入量从天气类型到云遮后地表太阳辐射值的转换;
第四步:神经网络模型训练
利用历史数据进行神经网络模型训练,以历史实测天气类型所对应的云遮后地表太阳辐射值、历史实测空气质量指数、历史实测环境温度为输入量,历史实测光伏出力为输出量,进行模型的训练,所有数据的时间间隔为1h;
第五步:神经网络模型预测
根据待预测日各时段的天气类型预报信息得到相应的云遮后地表太阳辐射值,将其作为天气类型影响因素的输入项,结合气温预报信息、空气质量指数预报信息,得到待预测日各时段的光伏输出功率预测结果,所有数据的时间间隔为1h。
所述第二步中第j天第i时段穿透率ki,j的计算公式为:
ki,j=Ri,j/R0i i=0,1,...,23,j=1,2,...,n
式中,Ri,j示第j天第i时段平均地表太阳辐射值,R0i表示无云天气下对应时段的平均地表太阳辐射值,由n个邻近日对应时段历史数据中的最大地表太阳辐射值近似计算:
R0i≈max{Ri,1,Ri,2,…,Ri,j,…,Ri,n}j=1,2,…,n。
所述第三步中云遮后地表太阳辐射值的计算公式为:
式中,表示第j天第i时段受云量削减后的地表太阳辐射值,表示第j天第i时段及其邻近时段天气类型对应的穿透率期望。
所述第四步中用到的神经网络模型分为两部分,分别代表太阳辐射削减过程与光电转换过程,其中,第一部分神经网络的输入量是待预测日待预测时段云遮后地表太阳辐射值空气质量指数Ai,j,输出量是待预测日待预测时段地表太阳辐射值Si,j;第二部分神经网络的输入量是待预测日待预测时段地表太阳辐射值Si,j、环境温度Ti,j,输出量是待预测日待预测时段光伏功率Pfi,j。
所述第一步中在历史数据中剔除空气质量不佳、空气湿度大的部分的方法为剔除空气质量指数大于100、空气湿度大于80%的部分。
本发明针对小样本情境对常规方法进行改进,得到适用于投运初期光伏发电系统的功率预测方法。
附图说明
图1为预测流程示意图;
图2为神经网络输入输出关系示意图。
图3为对比方法在不同数量样本下的预测结果图。
图4为本发明方法在不同数量样本下的预测结果图。
图5为对比方法与本发明方法的均方根误差图。
具体实施方式
下面结合具体实施方式对本专利的技术方案作进一步详细地说明。
请参阅图1,一种适用于小样本的光伏功率短期预测方法,包括以下步骤:
第一步:历史数据筛选
在历史地表太阳辐射数据、历史光伏功率数据中剔除对应时刻空气质量指数大于100、空气湿度大于80%的部分,得到地表太阳辐射值主要受云量影响的样本。
第二步:穿透率统计
从气象服务类网站中获取历史天气类型,按照网站中所记录的历史天气类型确定天气类型划分,如晴、多云、阴、雨雪等。
利用历史邻近日各时段地表太阳辐射值计算出历史数据中各时段的穿透率,记第j天第i时段的穿透率为ki,j,结合第i时段历史实测天气类型w,可以得到第i时段各种天气类型所对应的穿透率分布,根据穿透率分布计算得到第i时段各天气类型所对应的穿透率期望。
在单时段穿透率统计的基础上,进行考虑前后时段天气类型的穿透率统计,得到考虑前后时段天气类型的穿透率期望。例如当前i时段天气类型为多云、i-1时段天气类型为晴、i+1时段天气类型为阴,则将当前时段的天气类型记作(晴)-多云-(阴)。得到这种形式的考虑前后时段天气情况的天气类型后,结合单时段穿透率,即可得到考虑前后时段天气类型的穿透率分布,根据穿透率分布计算得到考虑前后时段天气类型的第j天第i时段穿透率期望
第三步:输入量变换
根据待预测时段及其前后时段的天气类型,通过查找第二步中的统计结果,得到待预测时段的穿透率期望,并将时刻信息整合到穿透率中,得到云遮后地表太阳辐射值,完成输入量从天气类型到云遮后地表太阳辐射值的转换。
第四步:神经网络模型训练
利用历史数据进行神经网络模型训练,以历史实测天气类型所对应的云遮后地表太阳辐射值、历史实测空气质量指数、历史实测环境温度为输入量,历史实测光伏出力为输出量,进行模型的训练,所有数据的时间间隔为1h。
第五步:神经网络模型预测
根据待预测日各时段的天气类型预报信息得到相应的云遮后地表太阳辐射值,将其作为天气类型影响因素的输入项。结合气温预报信息、空气质量指数预报信息,得到待预测日各时段的光伏输出功率预测结果,所有数据的时间间隔为1h。
第二步中第j天第i时段穿透率ki,j的计算公式为:
ki,j=Ri,j/R0i i=0,1,...,23,j=1,2,...,n
式中,Ri,j示第j天第i时段平均地表太阳辐射值,R0i表示无云天气下对应时段的平均地表太阳辐射值,由n个邻近日对应时段历史数据中的最大地表太阳辐射值近似计算:
R0i≈max{Ri,1,Ri,2,…,Ri,j,…,Ri,n}j=1,2,…,n
第三步中云遮后地表太阳辐射值的计算公式为:
式中,表示第j天第i时段受云量削减后的地表太阳辐射值,表示第j天第i时段及其邻近时段天气类型对应的穿透率期望。
第四步中用到的神经网络模型分为两部分,分别代表地表太阳辐射削减过程与光电转换过程。其中,第一部分神经网络的输入量是待预测日待预测时段云遮后地表太阳辐射值空气质量指数Ai,j,输出量是待预测日待预测时段地表太阳辐射值Si,j;第二部分神经网络的输入量是待预测日待预测时段地表太阳辐射值Si,j、环境温度Ti,j,输出量是待预测日待预测时段光伏功率Pfi,j,请参阅图2。
将未作输入量变换的传统神经网络多步预测方法作为对比方法,在不同数量的训练样本下的预测结果请参阅图3。本发明方法在不同数量的训练样本下的预测结果请参阅图4。本发明方法的预测效果在小样本情况下优于对比方法,随着样本数量的增加,对比方法的预测效果逐渐提升,两者的预测效果趋近。
对比方法与本发明方法在不同数量的训练样本下所有预测日的均方根误差均值,请参阅图5。对比方法对训练样本的依赖较大,随着样本数量的增加,预测误差逐渐减小。本发明方法对小样本的适应性较好,在样本数量从10增加到40的过程中,预测误差变化不大,且均保持在较低水平。