融合聚类与多任务学习的区域多光伏输出预测方法及装置与流程

文档序号:33383346发布日期:2023-03-08 06:57阅读:44来源:国知局
融合聚类与多任务学习的区域多光伏输出预测方法及装置与流程

1.本发明涉及光伏发电系统技术领域,尤其涉及一种光伏融合聚类与多任务学习的区域多光伏输出预测方法及装置。


背景技术:

2.光伏发电功率具有较强的不稳定性和随机性,易受到多种不稳定因素的影响,例如气象因素以及光伏板本身的特性等,其中对于已安装完成的光伏发电站,由于电池板的安装方式等已经固定,光伏发电功率主要取决于来自外界的波动性较强的气象因素。当前光伏发电在电力系统中所占比例逐渐提高,因而对电力系统的供需平衡关系、安全稳定的控制和运行的影响性也随之增大,光伏发电的加入还会给电网带来电能质量的相关问题,因此对光伏发电功率进行预测具有重要的意义。基于光伏发电功率预测可以更为合理地与其他电源统一调度,保证电力系统的稳定性,也可以有效提升效率、节约资源。
3.针对于光伏发电功率预测,现有技术中通常是通过利用被测光伏系统的历史光伏发电数据构建预测模型,基于构建的预测模型对实时的光伏发电量进行预测。如中国专利申请cn 114662807a公开一种基于序列编码重构的多尺度区域光伏出力预测方法及系统,该方法即是通过构建网格化采样模型,确定基准站点;根据所需要的预测时间尺度,重新构建数据集,形成多维出力张量序列;建立编码解码模型,对区域光伏出力进行预测;所述编码解码模型设有编码单元、注意力单元、解码单元;利用样本数据对编码解码模型进行训练,经过不断迭代使编码解码模型达到性能要求,形成可用混合模型。但是上述预测方式仅适用于对单一光伏输出实现预测,若要实现区域多个光伏输出的预测,则需要为区域不同光伏输出分别构建对应的预测模型,需要大量的模型构建与训练时间,因而耗费时间较长、效率较低,无法充分挖掘区域多光伏之间出力特性的相似性,尤其是当需要对光伏集群进行区域批量光伏输出预测时,会大大降低预测效率,训练过程中模型还易于发生过拟合。


技术实现要素:

4.本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种实现方法简单、耗时短、预测效率以及精度高的光伏融合聚类与多任务学习的区域多光伏输出预测方法及装置,能够充分挖掘区域多光伏之间出力特性的相似性,有效提高区域多光伏输出预测的效率以及精度。
5.为解决上述技术问题,本发明提出的技术方案为:
6.一种融合聚类与多任务学习的区域多光伏输出预测方法,步骤包括:
7.s01.获取目标光伏集群的输出数据以及对应的气象信息;
8.s02.以地理环境因素为变量基于模糊聚类算法对目标光伏集群进行区域分类;
9.s03.根据步骤s02的区域分类结果,在不同类型的区域多光伏中选取待预测集,以及从与待预测集相同的区域类型中选取出训练集;
10.s04.使用选取出的训练集训练预先构建的光伏预测模型以用于实现待预测集的
多光伏预测,所述光伏预测模型基于卷积长短期记忆网络并采用底层共享的多任务学习机制构建得到,所述底层共享的多任务学习机制中多个任务之间共享网络的隐藏层构建形成总体目标函数。
11.进一步的,所述步骤s01中还包括对获取的数据进行预处理步骤,所述预处理步骤包括去除指定时段的数据、筛选出离群值并去除、对缺失值进行填补以及对数据进程归一化处理。
12.进一步的,采用基于格拉布斯法筛选出所述离群值,步骤包括:
13.计算被处理数据的偏离值,所述偏离值根据平均值与最大值之差和平均值与最小值之差计算得到;
14.计算被处理数据的偏离值,对序列按大小进行排序,偏离值根据平均值与最大值之差和平均值与最小值之差计算得到;取被处理数据中偏离值超过预设的数据值作为可疑值x
out

15.计算可疑值x
out
的样本标准量g
out
,将所述样本标准量g
out
与格拉布斯表给出的临界值g
p
(n)比较,如果计算的所述样本标准量g
out
大于表中的临界值g
p
(n),则判定对应数据值是异常值,可疑值x
out
的所述样本标准量g
out
具体按下式计算得到:
[0016][0017][0018]
其中,n是样本数量,x是样本均值,s是标准差。
[0019]
进一步的,还包括使用k-最近邻算法对剔除值进行填补,步骤包括:
[0020]
计算含缺失值行的向量与其余向量之间的距离d:
[0021][0022]
式中,x和y均为去除了缺失值维度的向量;
[0023]
通过距离d筛选出k个相邻向量,取缺失值维度的平均值进行填充。
[0024]
进一步的,s201.计算集群下不同光伏的地理环境因素,所述地理环境因素包括太阳赤纬角δ、太阳高度角h和太阳方位角φs;
[0025]
s202.根据不同光伏的所述地理环境因素,对待分类数据集x={x1,x2,

,xn}确定出所需划定的聚类中心数量c,x1,x2,...,xn分别为待分类数据,n为数据数量,开始随机初始化由多个样本隶属度构成的隶属度矩阵u;
[0026]
s203.计算隶属度u
ji
以及聚类中心ai;
[0027]
s204.根据隶属度u
ji
以及聚类中心ai最小化目标函数j;
[0028]
s205.更新隶属度矩阵u;
[0029]
s206.重复s202~s205,直至小于所给定的误差值,即中心点ai已经稳定或者初始化隶属度矩阵u的变化很小,得到区域聚类结果。
[0030]
进一步的,按照下式计算集群下不同光伏的太阳赤纬角δ、太阳高度角h和太阳方位角φs计算为:
[0031][0032]
其中,δ为太阳赤纬角,n为日数,从1月1日开始计算。
[0033][0034]
其中,h为太阳高度角,是地理纬度,δ为太阳赤纬角,ω为时角。
[0035][0036]
其中,φs为太阳方位角,在求解中取正值,ω为时角,δ为太阳赤纬角,h为太阳高度角。
[0037]
进一步的,按照下式分别计算隶属度u
ji
以及聚类中心ai:
[0038][0039][0040]
其中,u
ji
为样本j对于第i个分类的隶属度值;d
ji
=||x
j-ai||为样本j到聚类中心点i的欧几里得几何距离;m为模糊系数,并将m取值为聚类结果数目。
[0041]
进一步的,所述步骤s203中,目标函数j具体为:
[0042][0043]
以及约束条件为:
[0044][0045]
并采用拉格朗日乘数式求取最小值,在目标函数中引入拉格朗日乘子zj,得到最终的目标函数为:
[0046][0047]
进一步的,所述多任务学习机制中总体目标函数具体为:
[0048][0049]
其中,n为任务数量,α
t
为任务的权重系数;为不同任务的损失函数,θ
sh

t
分别是预测值和实际值。
[0050]
进一步的,所述卷积长短期记忆网络中卷积层按照下式进行卷积计算后,将结果输出到长短期记忆网络:
[0051][0052]
其中,表示卷积计算;f表示卷积层的输入数据;w表示卷积核的权重参数;c、wf、hf分别为卷积核的通道数、高度和宽度;
[0053]
所述长短期记忆网络在更新过程中运算如下:
[0054]it
=σ(wi·
[h
t-1
,x
t
]+bi)
[0055]ft
=σ(wf·
[h
t-1
,x
t
]+bf)
[0056]ct
=f
t
·ct-1
+i
t
tanh(wc·
[h
t-1
,x
t
]+bc)
[0057]ot
=σ(wo·
[h
t-1
,x
t
]+bo)
[0058]ht
=o
t
·
tanh(c
t
)
[0059]
其中,i
t
、f
t
、o
t
为t时刻输入门、遗忘门和输出门状态;x
t
、c
t
、h
t
为t时刻输入、细胞状态和输出;c
t-1
、h
t-1
为t-1时刻的细胞状态和输出;wi、wf、wc、wo为权重矩阵;bi、bf、bc、bo为状态偏置项;σ、tanh为激活函数;
·
为哈达玛积运算。
[0060]
一种融合聚类与多任务学习的区域多光伏输出预测装置,所述区域多光伏输出预测装置包括:
[0061]
获取模块,用于获取目标光伏集群的输出数据以及对应的气象信息;
[0062]
区域聚类模块,用于以地理环境因素为变量基于模糊聚类算法对目标光伏集群进行区域分类;
[0063]
训练集选取模块,用于根据区域聚类模块的区域分类结果,在不同类型的区域多光伏中选取待预测集,以及从与待预测集相同的区域类型中选取出训练集;
[0064]
多光伏预测模块,用于使用选取出的训练集训练预先构建的光伏预测模型以用于实现待预测集的多光伏预测,光伏预测模型基于卷积长短期记忆网络并采用底层共享的多任务学习机制构建得到,所述底层共享的多任务学习机制中多个任务之间共享网络的隐藏层构建形成总体目标函数;
[0065]
或所述区域多光伏输出预测装置包括处理器以及存储器,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序以执行如上述方法。
[0066]
与现有技术相比,本发明的优点在于:本发明通过获取目标光伏集群的输出数据以及对应的气象信息,先使用模糊聚类算法对不同的地理因素进行量化划分出不同的区域光伏,以根据区域分类结果选取出与待预测集同区域类型的训练集,基于该训练集进行模型训练可以提高预测精度,再基于底层共享的多任务学习机制使用卷积长短期神经网络构建形成光伏预测模型,结合底层共享的多任务学习机制以及长短期神经网络,可以充分挖掘出同区域不同光伏板间的出力相关性,从而可以快速对区域内多个光伏出力进行预测,同时避免训练过程中模型过拟合,有效提升预测效率及精度。
附图说明
[0067]
图1是本实施例基于区域聚类和多任务学习的区域多光伏输出预测方法流程示意
图。
[0068]
图2是本实施例基于多任务学习的长短期记忆网络实现流程示意图。
具体实施方式
[0069]
以下结合说明书附图和具体优选的实施例对本发明作进一步描述,但并不因此而限制本发明的保护范围。
[0070]
如图1所示,本实施例融合聚类与多任务学习的区域多光伏输出预测方法的步骤包括:
[0071]
s01.获取目标光伏集群的输出数据以及对应的气象信息;
[0072]
s02.以地理环境因素为变量基于模糊聚类算法对目标光伏集群进行区域分类,以划分出不同的区域光伏;
[0073]
s03.根据步骤s02的区域分类结果,在不同类型的区域多光伏中选取待预测集,以及从与待预测集相同的区域类型中选取出训练集;
[0074]
s04.使用选取出的训练集训练预先构建的光伏预测模型以用于实现待预测集的多光伏预测,光伏预测模型基于卷积长短期记忆网络并采用底层共享的多任务学习机制构建得到,底层共享的多任务学习机制中多个任务之间共享网络的隐藏层构建形成总体目标函数。
[0075]
本实施例通过获取目标光伏集群的输出数据以及对应的气象信息,先使用模糊聚类算法对不同的地理因素进行量化划分出不同的区域光伏,以根据区域分类结果选取出与待预测集同区域类型的训练集,基于该训练集进行模型训练可以提高预测精度,再基于底层共享的多任务学习机制使用卷积长短期神经网络构建形成光伏预测模型,结合底层共享的多任务学习机制以及长短期神经网络,可以充分挖掘出同区域不同光伏板间的出力相关性,从而可以快速对区域内多个光伏出力进行预测,同时避免训练过程中模型过拟合,有效提升预测效率及精度。
[0076]
本实施例步骤s01中还包括对获取的数据进行预处理以获得修正数据集步骤,预处理步骤包括去除指定时段的数据、筛选出离群值并去除、对缺失值进行填补以及对数据进程归一化处理。通过对数据集进行数据预处理,可以避免因为不合理的数据以及度量尺度差距等对预测精度造成影响,进一步提高预测精度。
[0077]
本实施例中具体采用基于格拉布斯法(grubbs)筛选出离群值,步骤包括:
[0078]
计算被处理数据的偏离值,对序列按大小进行排序,偏离值根据平均值与最大值之差和平均值与最小值之差计算得到;取被处理数据中偏离值超过预设的数据值作为可疑值x
out

[0079]
计算可疑值x
out
的样本标准量g
out
,将该样本标准量g
out
与格拉布斯表给出的临界值g
p
(n)比较,如果计算的g
p
(n)值大于表中的临界值g
p
(n),则判定对应数据值是异常值。
[0080]
本实施例数据预处理中还包括使用k-最近邻算法(k-nearest neighbor,knn)对剔除值进行填补,步骤包括:
[0081]
计算含缺失值行的向量与其余向量之间的距离d:
[0082]
通过距离d筛选出k个相邻向量,取缺失值维度的平均值进行填充。
[0083]
在具体应用实施例中,进行数据预处理获得修正数据集的具体步骤包括:
[0084]
步骤s101.从样本中剔除夜间数据,对数据做归一化处理,采用最大最小归一化对数据集消除量纲,计算公式如下:
[0085][0086]
式中,其中x
*
是归一化后的结果,x是原样本,x
max
为样本数据的最大值,x
min
为样本数据的最小值。
[0087]
步骤s102.对离群值进行筛选,离群值具体为一组测定值中与平均值的偏差超过两倍标准差的测定值。计算如下:
[0088][0089][0090]
上式中,n是样本数量,x是样本均值,s是标准差。
[0091]
计算偏离值,即平均值与最大值之差和平均值与最小值之差,然后取偏离平均值较大作为可疑值,计算可疑值x
out
的样本标准量g
out
,将g
out
与格拉布斯表给出的临界值g
p
(n)比较,如果计算的g
out
值大于表中的临界值g
p
(n),则能判断该测量数据是异常值,可以剔除。
[0092]
步骤s103.对原数据集中的缺失值进行填补,使用k-最近邻算法对剔除值进行填补,步骤如下:
[0093]
计算含缺失值行的向量与其他向量的距离d:
[0094][0095]
式中,x和y均为去除了缺失值维度的向量;然后通过距离d筛选出k个相邻向量,取缺失值维度的平均值进行填充。
[0096]
模糊均值算法是通过优化目标函数得到每个样本点对所有类中心的隶属度,从而决定样本点的类属以达到自动对样本数据进行分类的目的。本实施例步骤s02利用模糊均值算法,具体以不同光伏太阳赤纬角、太阳高度角和太阳方位角的地理环境因素为变量,对光伏集群进行区域分类,可以将目标光伏集群按光伏太阳赤纬角、太阳高度角和太阳方位角划分为不同区域的光伏。
[0097]
s201.计算集群下不同光伏的地理环境因素,地理环境因素包括太阳赤纬角δ、太阳高度角h和太阳方位角φs;
[0098]
s202.根据不同光伏的所述地理环境因素,对待分类数据集x={x1,x2,

,xn}确定出所需划定的聚类中心数量c,x1,x2,...,xn分别为待分类数据,n为数据数量,开始随机初始化由多个样本隶属度构成的隶属度矩阵u;
[0099]
s203.计算隶属度u
ji
以及聚类中心ai;
[0100]
s204.根据隶属度u
ji
以及聚类中心ai最小化目标函数j;
[0101]
s205.更新隶属度矩阵u;
[0102]
s206.重复s202~s205,直至小于所给定的误差值,即中心点ai已经稳定或者初始化隶属度矩阵u的变化很小,得到区域聚类结果。
[0103]
本实施例步骤s201中,集群下不同光伏的太阳赤纬角、太阳高度角和太阳方位角具体计算公式分别为:
[0104][0105]
其中,δ为太阳赤纬角,n为日数,从1月1日开始计算。
[0106][0107]
其中,h为太阳高度角,是地理纬度,δ为太阳赤纬角,ω为时角。
[0108][0109]
其中,φs为太阳方位角,在求解中取正值,ω为时角,δ为太阳赤纬角,h为太阳高度角。
[0110]
本实施例通过考虑光伏的多种因素(太阳赤纬角δ、太阳高度角h和太阳方位角φs),使用模糊均值聚类方法对不同光伏进行聚类,可以基于不同的地理因素量化划分出不同的区域光伏,从而选取出相适应的训练集,可以充分利用光伏的地理因素提高预测精度。
[0111]
本实施例步骤s203中按照下式计算隶属度u
ji
以及聚类中心ai:
[0112][0113][0114]
其中,u
ji
为样本j对于第i个分类的隶属度值;d
ji
=||x
j-ai||为样本j到聚类中心点i的欧几里得几何距离;m为模糊系数,并将m取值为聚类结果数目。
[0115]
本实施例步骤s204中,目标函数j具体为:
[0116][0117]
以及目标函数的约束条件为:
[0118]
[0119]
由于模糊聚类的计算目标是最小化目标函数式,本实施例具体采用拉格朗日乘数式求取最小值,在目标函数中引入拉格朗日乘子zj,得到最终的目标函数为:
[0120][0121]
本实施例构建预测模型时,具体先构建用于时序预测的卷积长短期记忆神经网络,然后基于目标函数l的底层共享的多任务学习机制,构建出多任务学习与卷积长短期记忆网络的预测模型,以使得能够充分发挥多任务学习与卷积长短期记忆网络的优势,高效实现区域多光伏输出预测。
[0122]
卷积长短期记忆网络由卷积层和长短期记忆网络组成,卷积层用以提取输入特征,对输入数据进行卷积计算,再输入长短期记忆网络。本实施例中,卷积长短期记忆网络中卷积层具体按照下式进行卷积计算:
[0123][0124]
其中,表示卷积计算;f表示卷积层的输入数据;w表示卷积核的权重参数;c、wf、hf分别为卷积核的通道数、高度和宽度。
[0125]
长短期记忆神经网络是由循环神经网络(rnn)发展而来,rnn具有跨多时间步长传递信息的能力,同时rnn具有较强记忆性且图灵完备。利用rnn模型能体现变量点序列之间的时间依赖关系,使得其对于具有关联性的点序列输入具有较好的预测效果。本实施例长短期记忆网络结构如图2所示,长短期记忆网络在更新过程中运算如下:
[0126]it
=σ(wi·
[h
t-1
,x
t
]+bi)
[0127]ft
=σ(wf·
[h
t-1
,x
t
]+bf)
[0128]ct
=f
t
·ct-1
+i
t
tanh(wc·
[h
t-1
,x
t
]+bc)
ꢀꢀꢀꢀ
(14)
[0129]ot
=σ(wo·
[h
t-1
,x
t
]+bo)
[0130]ht
=o
t
·
tanh(c
t
)
[0131]
其中,i
t
、f
t
、o
t
为t时刻输入门、遗忘门和输出门状态;x
t
、c
t
、h
t
为t时刻输入、细胞状态和输出;c
t-1
、h
t-1
为t-1时刻的细胞状态和输出;wi、wf、wc、wo为权重矩阵;bi、bf、bc、bo为状态偏置项;σ、tanh为激活函数;
·
为哈达玛积运算。
[0132]
本实施例中多任务学习机制中总体目标函数具体为:
[0133][0134]
其中,n为任务数量,α
t
为任务的权重系数;为不同任务的损失函数,θ
sh

t
分别是预测值和实际值。
[0135]
本实施例在卷积长短期记忆网络的基础上,引入多任务学习机制,使得神经网络具备预测功能的同时还能够对多个任务进行计算,通过互相学习获得更好的泛化能力以及学习效果,从而使得能够同时快速、精准实现区域多光伏输出预测。
[0136]
本实施例融合聚类与多任务学习的区域多光伏输出预测装置包括:
[0137]
获取模块,用于获取目标光伏集群的输出数据以及对应的气象信息;
[0138]
区域聚类模块,用于以地理环境因素为变量基于模糊聚类算法对目标光伏集群进行区域分类;
[0139]
训练集选取模块,用于根据区域聚类模块的区域分类结果,在不同类型的区域多光伏中选取待预测集,以及从与待预测集相同的区域类型中选取出训练集;
[0140]
多光伏预测模块,用于使用选取出的训练集训练预先构建的光伏预测模型以用于实现待预测集的多光伏预测,光伏预测模型基于卷积长短期记忆网络并采用底层共享的多任务学习机制构建得到,底层共享的多任务学习机制中多个任务之间共享网络的隐藏层构建形成总体目标函数。
[0141]
本实施例融合聚类与多任务学习的区域多光伏输出预测装置与上述融合聚类与多任务学习的区域多光伏输出预测方法为一一对应,在此不再一一赘述。
[0142]
在另一实施例中,本发明融合聚类与多任务学习的区域多光伏输出预测装置还可以为包括处理器以及存储器,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序以执行如上述方法。
[0143]
上述只是本发明的较佳实施例,并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明。因此,凡是未脱离本发明技术方案的内容,依据本发明技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均应落在本发明技术方案保护的范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1