一种基于相似日聚类和多源数据的超短期光伏功率组合预测方法

文档序号:37175527发布日期:2024-03-01 12:27阅读:26来源:国知局
一种基于相似日聚类和多源数据的超短期光伏功率组合预测方法

本发明属于电力系统超短期光伏输出功率的预测,涉及一种基于相似日聚类和多源数据的超短期光伏功率组合预测方法。


背景技术:

1、光伏发电作为一种可再生能源形式,受到了广泛的关注和应用。然而,光伏输出功率具有显著的极端天气、波动性和受天气条件限制的特点,这使得对其产生的电能进行准确的短期预测尤为困难。特别是在超短期(数分钟到数小时)时间尺度内,光伏功率的准确预测对于电力系统的稳定性和安全性至关重要。超短期光伏预测是一项复杂的任务,需要考虑光伏输出功率的瞬时变化与天气条件变化的非线性响应。此外,在高温、寒潮等极端天气下,电力电量平衡问题尤为突出。传统预测技术已经无法满足当前复杂环境下的精度要求,因此需要更先进的技术和方法来改进光伏输出功率的超短期预测准确性,为电网的稳定运行提供算法支撑。在现有光伏预测方法中,普遍存在对波动性较强的天气状况下光伏输出功率预测精度较低的情况。例如:授权公告号为cn109919353b的中国专利,使用时间序列模型arima预测光伏出力。此类方法均存在难以处理非线性关系、非平稳时间序列和突发事件的影响,尤其在超短期内,无法满足准确性和鲁棒性的需求。此外,诸如arima模型类的时间序列建模方法只能对一个单独的序列进行建模和预测,而不是多个输入。因此,该类模型在预测的过程中无法兼顾气象因素对光伏出力曲线的影响。另外,授权公告号为cn111967660b的中国专利,使用回归模型svr预测超短期光伏。此类回归方法均存在难以捕捉光伏发电与影响因素之间的动态时序特性的局限性。此外,回归模型只能从单个时间点学习规则进行连续值预测,这使得很难决定应该删除多少早期信息,从而影响预测模型的准确性和可靠性。另外,上述方法均未顾及在连续的时间序列中,不同天气类型下光伏出力的样本数量对预测效果的影响。对于一些稀缺的天气类型(如雨天、极端天气等)会导致预测模型训练不够充分,从而降低了其性能。由此可见,光伏输出功率预测方法需要继续寻求创新,整合更多的数据源和智能算法,以提高精度并更好地适应不同天气条件,从而为可再生能源的可靠性和可持续性发展做出更大的贡献。


技术实现思路

1、本发明的目的是提供一种基于相似日聚类和多源数据的超短期光伏功率组合预测方法,解决了现有光伏输出功率预测技术难以处理光伏输出功率与气象信息之间的非线性关系,以及非平稳时间序列和突发事件的影响。满足在超短期内,预测的准确性和鲁棒性的需求。

2、本发明所采用的技术方案是,一种基于相似日聚类和多源数据的超短期光伏功率组合预测方法,具体按照以下步骤实施:

3、步骤1、提出了改进的自适应噪声集合经验模态分解(iceemdan)与样本熵(se)的两阶光伏输出功率数据的分解与重构方法,对样本降噪的同时重构出具有显著时序特征的子序列,提高聚类算法的稳定性和准确性;

4、步骤2、提出了自组织映射(som)网络与kmeans两阶光伏输出功率不同天气类型的聚类算法,帮助预测模型更好地理解光伏系统在不同气象条件下的运行规律,提高预测准确性;

5、步骤3、提出了循环生成对抗网络(rnn-gan)方法以平衡不同天气类别状况下光伏输出功率的样本分布,扩大可用数据集,确保模型能够从各种情况中学习足够的示例,提高模型的泛化性,减少过拟合的风险;

6、步骤4、为了更准确预测波动性较强天气情况下的光伏输出功率,提出了相似日样本加权的方法。通过增加聚类获得簇的权重,让模型在训练中更加重视这些天气类型,以更准确地捕捉其特征和模式。

7、步骤5、结合了相似日聚类和多种气象因素,提出了时域卷积双向长短期记忆(tcn-bilstm)模型的多数据源驱动预测方法,更好地理解光伏输出功率数据中的季节性、周期性和不规则模式。

8、本发明的特点还在于:

9、步骤1具体按照以下实施:

10、第一阶段:由iceemdan算法分解输入样本,得到各模态分量。

11、(1).向输入序列x添加高斯白噪声,得到新序列x(i):

12、x(i)=x+β0e1(w(i)) (1)

13、式中,w(i)表示高斯白噪声,β0为噪声系数。

14、(2).计算第j阶imf和残差rj:

15、rj=<m(rj-1+βj-1ej(w(i)))> (2)

16、imfj=rj-1-rj (3)

17、循环计算式(2)、式(3)得到信号所有的模态,完成分解。

18、第二阶段:计算各imfs的se值,将其重构。

19、(3).将各imfs重新定义为n维的连续序列x(1),x(2),...x(n)。

20、(4).定义向量xm(i)与xm(j)之间的距离,即:

21、

22、(5).统计xm(i)与xm(j)之间距离小于等于r的j(1≤j≤n-m,j≠i)的数目,并记作bi。对于1≤i≤n-m,定义bm(r)为:

23、

24、(6).增加维数到m+1,计算xm+1(i)与xm+1(j)距离小于等于r的个数,记为ai。定义am(r)为:

25、

26、(7).计算se值的公式为:

27、sampen(m,r,n)=-ln[ak(r)/bm(r)] (7)

28、其中,m表示嵌入维数,r表示相似容限。

29、最后,计算imfs分量近似熵的平均值。将高于平均值的imfs分量以及残差项叠加视为高频子序列,将低于平均值的imfs分量叠加视为低频子序列。

30、步骤2具体按照以下实施:

31、som神经网络作为第一阶段,将样本数据映射到低维空间,通过降维寻找多维数据的主要统计特征。在第二阶段,利用k-means算法对som网络节点进行聚类分析,提高聚类精确性。步骤如下:

32、第一阶段:由som网络初聚类,得出聚类数目和各类中心点。

33、(1).初始化网络参数,随机生成输入层与映射层之间的权值向量wj(j=1,2,…,n),设初始循环次数t=1。

34、(2).将待聚类的数据导入到输入层的各神经单元中,计算归一化后输入数据xi(i=1,2,…,m)与所有输出神经元wj间的欧式距离dj:

35、dj=||xi-wj|| (8)

36、(3).设g为优胜者,定义ng(t)为优胜者的邻域。将邻域中各个单元对应的权值向量向xi调整,公式如下:

37、

38、式中,η(t)为第t次的学习率,为第i个样本数据的第n个输入节点的输入,j∈ng(t)。

39、(4).对于不同的训练次数t重复步骤3,当网络权值稳定时视为收敛。

40、(5).输出聚类数目n和聚类中心cn。

41、第二阶段:将第一阶段步骤5的输出结果作为k-means算法的初始输入,进行迭代。

42、(6).计算xi与聚类中心cj的距离,将每个数据点划分到离它最近的聚类中心所属类别,得到d个类别{y1,y2,...,yk}。

43、(7).重新计算聚类中心为c’n。

44、

45、以各类别所有样本特征值的均值作为该聚类中心的特征值,计算每个样本到其他类别的距离,若某样本到其他类别的距离小于它到自身所属类别的距离,则重复步骤6-7进行重新归类。

46、(8).循环所有样本,当不再有样本的类别发生变化时输出聚类信息。

47、步骤3具体按照以下实施:

48、本发明提出了循环生成对抗网络(rnn-gan)来生成雨天类型天气下的数据样本。对抗生成网络是一种深度学习架构,由生成器和判别器两个部分组成,它们在训练过程中相互竞争,使生成器能够生成逼真的数据样本。

49、rnn-gan包括以下两个主要组件:

50、生成器:利用rnn生成数据,以尽量逼真地模拟真实数据分布。

51、判别器:利用卷积神经网络(cnn)评估生成器生成的数据的真实性。

52、(1).生成阶段:

53、生成器接收随机噪声,然后生成数据。

54、生成的数据传递给判别器进行评估。

55、生成器的目标是尽量提高生成的数据被判别为真实数据的概率。

56、(2).判别阶段:

57、判别器接收来自生成器和真实数据的样本。

58、判别器的任务是区分哪些样本是真实的,哪些是生成的。

59、判别器的目标是尽量提高它的分类准确性,即正确地将真实数据和生成的数据区分开来。

60、整个训练过程是一个博弈,生成器试图愈发逼真地生成数据,而判别器试图更好地识别生成的数据。这种竞争最终导致生成器生成更逼真的数据。

61、在本发明中,生成器的任务是生成雨天类型天气下光伏输出功率数据及相关气象因素的样本,而判别器的任务是区分真实的数据和生成的伪数据。rnn-gan引入rnn架构作为生成模型,生成器接受一个随机噪声向量作为输入,并通过递归层逐步生成时间序列数据。这种架构的改进,使rnn-gan能够更好地捕捉时间序列数据中的特征和模式,提高了生成的数据的逼真度。

62、步骤4具体按照以下实施:

63、光伏输出功率受天气条件的影响较大。在晴天稳定的光照条件下,光伏输出功率预测相对容易。然而,在雨天和极端天气下,光伏输出功率的波动性较大,预测变得更为复杂。为此依据每个簇内数据点的方差,为较大方差的簇分配更高的权重。计算公式如下:

64、

65、其中wi和var(xi)分别是簇i的权重和方差。

66、步骤5具体按照以下实施:

67、时域卷积网络(tcn)采用残差模块进行堆叠,输入经历1x1卷积滤波器和扩张因果卷积,让网络可以记忆足够长的历史信息。然后对权重进行归一化处理,使用relu函数作为激活函数。最后采用dropout操作,实现避免过拟合和加速模型训练速度的目的。其中,一维扩张因果卷积的运算式为:

68、

69、式中,x为输入序列,f为过滤器,k为卷积核大小;s-di确保对过去的输入单元做卷积操作。

70、长短时记忆(lstm)网络通过引入输入门it、遗忘门ft和输出门ot的机制,解决了传统rnn中的梯度消失和爆炸问题,并具备了更好的长期依赖建模能力。

71、双向长短时记忆(bilstm)网络由两个方向相反的lstm组成的,通过结合前向lstm的输出和后向lstm的输出即为bilstm的输出y,公式如下:

72、

73、

74、

75、为了实现更为精确的光伏出力功率预测,融合时空信息建模和长短时记忆机制的优势。本发明将tcn和bilstm模型进行网络叠加,提出了tcn-bilstm组合模型。具体来说,首先tcn模型接收并处理时间序列数据,利用因果卷积和残差运算,并行提取光伏数据的局部特征,识别不同时间尺度的依赖性。然后,将提取的特征序列输入到bilstm网络中,通过其双向递归结构深入分析时空信息,从而更准确地预测光伏出力功率。随后,串联全连接层对数据规模进行缩放和变换。最后的输出层产生预测值。

76、本发明的有益效果是:首先,iceemdan-se方法对原始光伏输出功率数据进行分解和降噪,重构了具有更显著时序特征的子序列,提高聚类算法的稳定性和准确性。随后,引入som-kmeans两阶段聚类算法,将历史日划分为不同类型的天气,帮助预测模型更好地理解光伏系统在不同气象条件下的运行规律,从而提高预测准确性。此外,提出了一种新的光伏功率预测模型,结合了相似日聚类和多种气象因素,通过tcn-bilstm进行多数据源驱动预测,更好地理解光伏输出功率数据中的季节性、周期性和不规则模式。所提出的tcn-bilstm组合模型在时间序列建模和信息捕获方面表现出强大的能力,更具应对数据复杂性的潜力。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1