一种基于瞬变气象的超短期光伏出力预测方法

文档序号:33713094发布日期:2023-04-01 01:05阅读:52来源:国知局
一种基于瞬变气象的超短期光伏出力预测方法

1.本发明涉及光伏出力预测技术领域,尤其是涉及一种基于瞬变气象的超短期光伏出力预测方法。


背景技术:

2.随着新能源福利政策的普及以及光伏发电设备成本的降低而且光伏功率预测对于电网调度具有重要意义,光伏出力的预测的需求也愈来愈高。为了提升光伏发电的效益,准确的光伏出力预测成为日益重要的问题。
3.随着“碳达峰”“碳中和”目标的落实,光伏的装机容量和占比会持续上涨。光伏电站包含集中式和分布式两类,其中分布式光伏的装机容量占比逐年上升,发展迅速。分布式光伏往往安装在行政单位、工商业和住宅屋顶等载体之上,与集中式光伏相比,其绿色环保、成本适宜、随发随用的特点得到更好体现,在自发自用的同时,还可以做到余电并网。精准的超短期光伏发电功率预测对于光伏电站的优化运行、光伏电力系统的调度安排以及电网的安全稳定与经济运行发挥着重要作用。
4.目前,实现光伏出力预测的方法主要有2种:一是基于统计学的方法,包含时间序列为代表的建模技术;二是基于人工智能算法的方法,包含卷积神经网络、长短期神经网络等技术。后者因具有良好的非线性处理能力和特征提取能力,近年来在光伏出力预测领域得到了广泛应用。但是现有技术仍存在以下缺陷:
5.(1)基于人工智能算法的方法容易出现过拟合和欠拟合的问题,且需要满足测试数据集与训练数据集独立同分布,而对于光伏出力由于大量的不确定性导致此前提将难以完全满足,进而导致算法精度低。
6.(2)由于分布式光伏安装地点较为分散,装机容量小,为每个分布式光伏系统安装气象量测装置成本高、管理困难,而超短期负荷预测的时间粒度为多为5min、10min或15min,因此极其依赖气象数据进行辅助预测,如果考虑到成本就会导致安装的气象量测装置少,从而缺乏足够的输入数据对光伏出力进行辅助预测,导致算法精确性差。


技术实现要素:

7.本发明的目的就是为了提供一种基于瞬变气象的超短期光伏出力预测方法,既充分考虑了历史光伏出力与气象信息间的关系,又充分考虑了相同天气类型下相似日数据间的相关信息,能够有效、准确的对超短期光伏出力进行预测。
8.本发明的目的可以通过以下技术方案来实现:
9.一种基于瞬变气象的超短期光伏出力预测方法,包括以下步骤:
10.s1:获取历史样本数据并进行预处理,所述历史样本数据包括超短期历史光伏出力数据以及对应的历史气象数据;
11.s2:以历史气象数据的统计指标为聚类指标对历史样本数据进行模糊c均值聚类,将历史样本数据聚类至多个天气类型下,同一天气类型下的样本数据为相似日样本;
12.s3:基于主成分分析法分别对每个天气类型下的历史气象数据进行特征降维得到降维后的气象数据特征;
13.s4:在每个天气类型下随机确定一个参考日样本,并基于相似日样本与参考日样本的气象数据特征之间的余弦距离对相似日样本进行排序;
14.s5:针对每个天气类型分别构建自适应门控循环单元神经网络模型,所述自适应门控循环单元神经网络模型包括分布识别模块和自适应分布匹配模块,其中,所述分布识别模块用于识别相同天气类型下相似日样本的数据分布不同,所述自适应分布匹配模块用于学习相同天气类型下相似日样本间的相关信息;
15.s6:将排序相邻的相似日样本中的历史光伏出力数据分别作为自适应门控循环单元神经网络模型的输入与输出,并基于不确定性加权法平衡预测误差与相关信息误差,对模型进行训练;
16.s7:获取预测日气象数据并确定对应的天气类型,对预测日气象数据进行主成分分析得到预测日气象数据特征,计算预测日气象数据特征与对应的参考日样本气象数据特征之间的预测余弦距离,基于预测余弦距离确定最接近的相似日样本,将所述最接近的相似日样本的历史光伏出力数据作为模型输入,调用与预测日天气类型匹配的自适应门控循环单元神经网络模型,预测得到预测日的光伏出力。
17.所述步骤s1包括以下步骤:
18.s11:获取历史样本数据;
19.s12:利用3σ准则对历史样本数据中的异常值进行检查并剔除;
20.s13:利用拉格朗日插补法对历史样本数据中的缺失值进行插补;
21.s14:对历史样本数据进行归一化处理。
22.所述历史气象数据的统计指标包括调和平均数、几何平均数、变异系数、偏度和峰度。
23.所述天气类型分为5类,分别为晴天、多云、阴天、雨天、极端天气。
24.所述对历史样本数据进行模糊c均值聚类的聚类损失函数为:
[0025][0026]
其中,j(u,v)是聚类损失函数;u
ij
是第i个样本属于第j类的隶属度,u为隶属度矩阵;n为样本数量;v是聚类中心;m是隶属度因子,1≤m<∞;d
ij
是样本数据到聚类中心的距离。
[0027]
基于主成分分析法对气象数据进行特征降维得到气象数据特征具体为:将气象数据构建为一个气象矩阵,对气象矩阵进行主成分分析,得到各个主成分的贡献率,将贡献率最高的主成分作为提取的气象数据特征,其中,各个主成分的贡献率的计算方法为:
[0028][0029][0030]
其中,λi为气象矩阵的协方差矩阵的特征向量,x为n
×
m的气象矩阵,n为样本个
数,m为初始特征维度,ei为气象矩阵的协方差矩阵的特征值,ri为各个主成分的贡献率。
[0031]
所述自适应门控循环单元神经网络模型由一个输入层,两个隐藏层,一个全连接层和一个输出层组成。
[0032]
所述分布识别模块基于最大平均差异法构建,具体为:
[0033][0034]
其中,hs和h
t
分别为两组不同的样本数据,ns和n
t
分别为两组样本数据的数量,k为核函数,i和j表示第i和j个数据。
[0035]
所述自适应分布匹配模块用于学习相同天气类型下相似日样本间的相关信息,具体表示为损失函数的形式:
[0036][0037]
其中,l(θ)代表自适应分布匹配模块的损失函数,l
pred
(θ)为预测误差损失函数,l
ada
为相关信息误差损失函数,λ为平衡预测误差和相关信息误差的平衡项,k是避免过度学习的参数,d
j,i
是第j,i种分布,θ代表模型参数。
[0038]
所述基于不确定性加权法平衡预测误差与相关信息误差具体为:
[0039][0040]
其中,σ1为l
pred
中输出值的标准差,σ2为l
ada
中输出值的标准差。
[0041]
与现有技术相比,本发明具有以下有益效果:
[0042]
(1)本发明既充分考虑了历史光伏出力与气象信息间的关系,又充分考虑了相同天气类型下相似日数据间的相关信息,提高了超短期光伏出力预测的准确性。
[0043]
(2)本发明采用模糊c均值聚类方法对样本进行聚类,能克服需要数据满足正态分布的前提。
[0044]
(3)本发明通过聚类和主成分降维分析,减少了气象数据的冗余信息,实现了对气象数据的更深入的利用,在气象数据输入不足的情况下也能实现有效预测,从而也降低了气象测量装置的安装成本。
[0045]
(4)本发明的uw-adagru模型的自适应分布匹配模块能挖掘所有相似日数据间的相关信息以应对未来可能的未见过的气象信息,进而能应对光伏出力的不确定性,实现在缺乏输入数据的前提下的精确预测。
[0046]
(5)本发明自适应门控循环单元神经网络模型能很好的克服数据的非线性和序列性,其避免过拟合和欠拟合的能力要比传统人工智能算法(bp、cnn等)强。
附图说明
[0047]
图1为本发明的方法流程图。
具体实施方式
[0048]
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案
为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
[0049]
本实施例提供一种基于瞬变气象的超短期光伏出力预测方法,如图1所示,包括以下步骤:
[0050]
s1:获取历史样本数据并进行预处理,所述历史样本数据包括超短期历史光伏出力数据以及对应的历史气象数据。
[0051]
s11:获取历史样本数据;
[0052]
s12:利用3σ准则对历史样本数据中的异常值进行检查并剔除:
[0053]
在3σ原则下,数据不需要服从正态分布,若数据异常值超过3倍标准差,那么可以将其视为异常值,
±
3σ的概率是98.9%,所以距离平均值3σ之外的值出现的概率为p(|x-u|>3σ)=0.011,属于极个别的小概率事件。假设需要检测的历史气象数据和历史光伏出力数据只含有随机误差,对原始数据进行计算处理得到标准差,然后按一定的概率确定一个概率区间,认为误差超过这个概率区间的就属于异常值。在检测出异常值后,对该异常值进行剔除处理。
[0054]
s13:利用拉格朗日插补法对历史样本数据中的缺失值进行插补:
[0055]
原有的数据是存在缺失值的,且在步骤s12中对异常值进行了剔除,进一步增加了缺失值,所以需要对空缺处的值进行插补以得到完整的数据;拉格朗日插补法来自于在数值分析,给定函数f(x)的n+1个互不相同的点xi,对应的函数值为yi,其拉格朗日插值多项式可以写成如下形式:
[0056][0057]
上式中,lk(x)为基函数,其表达式如下所示:
[0058][0059]
s14:对历史样本数据进行归一化处理。
[0060]
s2:以历史气象数据的统计指标为聚类指标对历史样本数据进行模糊c均值聚类(fcm),将历史样本数据聚类至多个天气类型下。
[0061]
s21:确定历史气象数据的统计指标,包括:
[0062]
1)调和平均数
[0063][0064]
其中,h为调和平均数,n为样本数量,xi为第i个变量。
[0065]
2)几何平均数
[0066][0067]
其中,g为几何平均数。
[0068]
3)变异系数
[0069][0070]
其中,cv为变异系数,σ为标准差。
[0071]
4)偏度
[0072][0073]
其中,s为偏度,μ3为3阶中心矩,σ为标准差。
[0074]
5)峰度
[0075][0076]
其中,k为峰度。
[0077]
s22:将天气类型分为5类:晴天、多云、阴天、雨天、极端天气,分别确定各个天气类型下的典型日气象数据,具体为:将天气预报信息(numerical weather prediction,nwp)标注为晴天、多云、阴天、雨天、特殊极端天气的历史气象日样本数据利用平均值法提取典型日气象数据,作为聚类中心的选择依据。
[0078]
s23:按照历史气象数据的五个统计指标通过模糊c均值聚类(fcm)以及确定的聚类中心将历史样本数据聚类至五个天气类型下,同一天气类型下的样本数据为相似日样本。
[0079]
定义对历史样本数据进行模糊c均值聚类的聚类损失函数为:
[0080][0081]
其中,j(u,v)是聚类损失函数,u
ij
是第i个样本属于第j类的隶属度,u为隶属度矩阵;v是聚类中心,即s22中确定的典型日数据;m是隶属度因子,1≤m<∞;d
ij
是样本数据到聚类中心的距离。
[0082]
fcm聚类的策略是不断迭代计算u和v,使聚类损失函数最小。
[0083]
具体的,fcm在本发明所述超短期光伏预测中的具体步骤如下:
[0084]
s231:初始化聚类个数为5个天气类型和隶属度矩阵u
(0)
,并令l表示迭代次数。
[0085]
s232:计算第l次迭代的聚类中心v
(l)

[0086][0087]
s233:更新隶属度矩阵u
(l)
,计算聚类损失函数j
(l)

[0088][0089]
[0090]
其中,
[0091]
s234:给定隶属度终止阈值εu,损失函数终止阈值εj,当达到阈值时停止迭代,否则返回s232。
[0092]
s3:基于主成分分析法分别对每个天气类型下的历史气象数据进行特征降维得到降维后的气象数据特征。
[0093]
主成分分析法(principal component analysi,pca)是目前常用且有效的数据降维方法,由于各种气象因素之间存在冗余,过多的冗余信息会影响计算效率以及降低模型的精度。
[0094]
s31:确定待分析的气象特征维度,本实施例中包括温度、湿度、风速、倾斜散射、水平散射、水平辐射、倾斜散射7个维度。
[0095]
s32:将气象数据构建为一个n
×
m的气象矩阵x,n为样本个数,m为初始特征维度,本实施例中,m=7。
[0096]
s33:计算每一维特征的平均值:
[0097][0098]
其中,为平均值。
[0099]
s34:计算协方差矩阵c:
[0100][0101]
s35:计算c的特征向量ei和特征值λi,i=1,2,

,m:
[0102]
cei=λ
iei
[0103]
即:
[0104][0105]
s36:确定降维后的矩阵z=xe,其中e=[e1,e2,

,ek],k为降维后的维度。
[0106]
s37:确定k的大小,即z中主成分的个数,根据下式计算特征约减后各主成分的贡献率:
[0107][0108]
其中,ei是特征向量,λi是特征值,ri是各主成分的贡献率。
[0109]
本实施例使用主成分分析法对上述所述的7个初始气象特征进行综合分析,得到降维后的气象数据特征。分别取不同的k值(从1~7)对7个主要气象因素进行pca分析,按照季节将数据划分成春、夏、秋、冬。经过计算得到不同季节和全年的7组主成分贡献率如表1所示,可以看出,初始气象特征经过降维,春季、夏季和秋季主成分1的贡献率达到95%以上,其中夏季和秋季可以达到97%以上。综合全年,主成分1可以取得高于96%的贡献率,保留了原始气象数据中的绝大部分信息,因此将主成分1作为降维后的气象数据特征。
[0110]
表1主成分贡献率
[0111][0112]
s4:在每个天气类型下随机确定一个参考日样本,并基于相似日样本与参考日样本的气象数据特征之间的余弦距离对相似日样本进行排序。
[0113]
其中,余弦距离计算方法为:
[0114][0115]
s5:针对每个天气类型分别构建自适应门控循环单元神经网络模型(uw-adagru模型),包括分布识别模块和自适应分布匹配模块。
[0116]
所述自适应门控循环单元神经网络模型由一个输入层,两个隐藏层,一个全连接层和一个输出层组成。
[0117]
所述分布识别模块基于最大平均差异法(maximum mean discrepancy,mmd)构建,用于识别相同天气类型下相似日样本的数据分布不同,具体为:
[0118][0119]
其中,hs和h
t
分别为两组不同的样本数据,ns和n
t
分别为两组样本数据的数量,k为核函数,i和j表示第i和j个数据。
[0120]
所述自适应分布匹配模块(adaptive distribution matching module)用于学习相同天气类型下相似日样本间的相关信息,因此其以损失函数的形式发挥功能,具体表示为:
[0121]
[0122]
其中,l(θ)代表自适应分布匹配模块的损失函数;l
pred
(θ)为预测误差损失函数;l
ada
为相关信息误差损失函数;λ为平衡预测误差和相关信息误差的平衡项,为了避免网络过度学习共享知识而增大误差;k是避免过度学习的参数;d
j,i
是第j,i种分布;θ代表模型参数。
[0123]
l(θ)前一部分作用是能够很好的降低相似日模型学习过程中的误差,后一部分作用是挖掘相似日数据样本间的相关信息以达到自适应应对气象带来的光伏出力不确定性。
[0124]
预测误差损失函数l
pred
(θ)为:
[0125][0126]
其中,x是预测值,y是实际值,m是关于预测值与网络参数的函数关系。
[0127]
s6:将排序相邻的相似日样本中的历史光伏出力数据分别作为自适应门控循环单元神经网络模型的输入与输出,并基于不确定性加权法(uncertainty weighting,uw)平衡预测误差与相关信息误差,反归一化,对模型进行训练。
[0128]
基于不确定性加权法平衡预测误差与相关信息误差核心思想是将l
pred
和l
ada
作为两个任务,通过探寻两个任务的不确定性来获得合适的平衡值,具体为:
[0129]
s61:假设每个任务的真值的后验分布是以预测值为均值的正态分布,方差是噪声,表示了任务的难易程度:
[0130]
p(y|f
θ
(x))=n(f
θ
(x),σ2)
[0131]
其中,p为似然函数,f(x)为神经网络的输出,θ为输入x的权重,σ为标准差,n为正态分布表达式,y为给定输出值。
[0132]
s62:确定两个任务的联合分布:
[0133][0134]
其中,y1、y2分别为两个任务的输出值。
[0135]
s63:将优化目标转换为求上述联合分布的最大似然,等价于最小化其相反数,因此得到最小化目标为:
[0136][0137]
其中,σ1为l
pred
中输出值的标准差,σ2为l
ada
中输出值的标准差。
[0138]
s64:将某一天气类型下排序相邻的相似日样本中的历史光伏出力数据的前者作为对应天气类型的自适应门控循环单元神经网络模型的输入,后者作为模型的输出,对模型进行训练。
[0139]
s7:获取预测日气象数据并确定对应的天气类型,对预测日气象数据进行主成分分析得到预测日气象数据特征,计算预测日气象数据特征与对应的参考日样本气象数据特征之间的预测余弦距离,基于预测余弦距离确定最接近的相似日样本,将所述最接近的相
似日样本的历史光伏出力数据作为模型输入,调用与预测日天气类型匹配的自适应门控循环单元神经网络模型,预测得到预测日的光伏出力。
[0140]
表2展示了从常用的mae、mape、rmse评价指标角度评价本发明与现有方法预测超短期光伏出力的预测结果对比,其中,arma是自回归滑动平均模型,arima是差分整合移动平均自回归模型,svm是支持向量机模型,cnn是卷积神经网络,lstm是长短期记忆神经网络,gru是普通门控循环单元神经网络,fcm-uw-adagru是本发明所述方法。
[0141]
表2预测结果评估
[0142]
方法maemapermsearma17.3412.03%23.04arima16.9711.59%20.58svm13.288.45%17.52cnn12.247.42%18.34lstm10.517.01%15.21gru10.336.45%13.23fcm-uw-adagru8.524.03%10.01
[0143]
根据表2所示结果,本发明所述方法具有更小的mae、mape和rmse,证明了所述方法的有效性和预测准确性。
[0144]
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依据本发明的构思在现有技术的基础上通过逻辑分析、推理、或者有限的实验可以得到的技术方案,皆应在权利要求书所确定的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1