技术简介:
本发明针对传统风速预测方法难以处理多时间尺度非平稳特性的问题,提出融合ARIMA模型提取线性特征、CEEMD分解非线性残差、LSTM网络预测的混合模型。通过多模型协同,有效分离风速序列的线性与非线性成分,提升预测精度与稳定性,实现高效率、高准确度的多时间尺度风速预测。
关键词:多时间尺度预测,混合模型
1.本发明涉及电力系统技术领域,尤其涉及一种基于混合预测模型的多时间尺 度风速预测方法及系统。
背景技术:2.本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先 技术。
3.风能作为一种环保且极具大规模发展前景的可再生能源,在优化能源结构、 促进低碳减排方面发挥着越来越重要的作用。然而,风速固有的间歇性、波动性 和随机性特点制约着风电的发展。对此,精准的风速预测不仅可以提高系统的安 全性,还有助于风电并网的合理调度,减少弃风,提高电网运行的可靠性。风速 预测的准确性也被认为是风电场运行与维护的重要依据。但是发明人发现,现有 的风速预测方法和模型未考虑风速的非平稳等特征,且多为单一模型进行风速预 测,误差较大,效率不高,导致最终预测的风速精度较低。
技术实现要素:4.针对现有技术存在的不足,本发明的目的是提供一种基于混合预测模型的多 时间尺度风速预测方法及系统,采用整合移动平均自回归模型(arima)、集合经 验模态分解(eemd)和长短期记忆神经网络模型(lstm)多种模型进行混合预测, 能够对风速序列特征进行全面的分析,实现高精度的风速预测。
5.为了实现上述目的,本发明是通过如下的技术方案来实现:
6.本发明第一方面提供了一种基于混合预测模型的多时间尺度风速预测方法, 包括以下步骤:
7.采集风速数据,对原始数据进行数据预处理及重采样后获得各尺度风速时间 序列;
8.利用整合移动平均自回归模型提取各时间尺度风速时间序列的线性特征,得 到线性趋势时间序列和非线性残差序列;
9.采用集合经验模态分解模型将非线性残差序列分解;
10.对分解的子序列基于长短期记忆神经网络模型进行预测;
11.将预测后的子序列集成并与提取到的线性时间序列相加得到最终预测的风 速时间序列。
12.进一步的,整合移动平均自回归模型将原本不平稳的各时间尺度风速时间序 列经过差分后成为平稳风速时间序列。
13.进一步的,集合经验模态分解模型将非线性残差序列分解的具体步骤为:在 原信号中加入多个小尺度互不相同的白噪声,通过经验模态分解(emd)将混合 信号分解之后,产生的多个互不相关的特征模态函数(imf)组取均值,将噪音 相互抵消,使均值保持在正
常的动态滤波窗口范围内。
14.更进一步的,集合经验模态分解模型的具体分解过程为:
15.将正态分布的白噪声加到原始信号中,得到新的时间序列信号;
16.将加入白噪声的信号作为一个整体,然后进行经验模态分解,得到各特征模 态函数分量和残差序列;
17.重复上述过程,每次加入新的正态分布白噪声序列;
18.将每次得到的特征模态函数分量做集成平均处理后作为最终结果。
19.更进一步的,对每一特征模态函数分量分别输入长短期记忆神经网络模型进 行预测得到预测结果,实现对分解后的子序列的预测。
20.进一步的,对分解的子序列基于长短期记忆神经网络模型进行预测,具体过 程为:
21.通过遗忘门的σ层决定记忆单元中的遗忘信息;
22.决定记忆单元存储信息,输入门的σ层决定更新的i
t
,并在记忆单元中加入 tanh创建一个新的z;
23.分别将i
t
与z相乘、f
t
与c
t-1
相乘,将这两部分相加后更新状态c
t
;
24.通过运行一个σ层来得到o
t
,
25.通过tanh与o
t
相乘,得到输出值h
t
。
26.更进一步的,通过遗忘门的σ层决定记忆单元中的遗忘信息,具体操作为: 查看h
t-1
和x
t
并向记忆单元状态中的每个数输出一个介于0和1之间的数,其中, 1表示完全保留,0表示完全删去。
27.本发明第二方面提供了一种基于混合预测模型的多时间尺度风速预测系统, 包括:
28.数据获取模块,被配置为采集风速数据,获得各尺度风速时间序列;
29.特征提取模块,被配置为利用整合移动平均自回归模型提取各时间尺度风速 时间序列的线性特征,得到线性趋势时间序列和非线性残差序列;
30.序列分解模块,被配置为采用集合经验模态分解模型将非线性残差序列分解;
31.第一预测模块,被配置为对分解的子序列基于长短期记忆神经网络模型进行 预测;
32.第二预测模块,被配置为将预测后的子序列集成并与提取到的线性时间序列 相加得到最终预测的风速时间序列。
33.本发明第三方面提供了一种介质,其上存储有程序,该程序被处理器执行时 实现如本发明第一方面所述的基于数据匹配算法的电基于混合预测模型的多时 间尺度风速预测方法力需求响应方法中的步骤。
34.本发明第四方面提供了一种设备,包括存储器、处理器及存储在存储器上并 可在处理器上运行的程序,所述处理器执行所述程序时实现如本发明第一方面所 述的基于混合预测模型的多时间尺度风速预测方法中的步骤。
35.以上一个或多个技术方案存在以下有益效果:
36.本发明使用整合移动平均自回归模型(arima)提取各时间尺度风速时间序 列的线性特征、使用集合经验模态分解(eemd)将非线性残差序列分解、使用长 短期记忆神经网
络模型(lstm)对分解的子序列进行预测、将预测后的子序列集 成并与提取到的线性时间序列相加得到最终预测的风速时间序列。本发明考虑了 风速的非平稳特征,并通过多种模型基于多时间尺度实现了风速的高效率,高准 确度的预测。
37.本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中 变得明显,或通过本发明的实践了解到。
附图说明
38.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明 的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
39.图1为本发明实施例一中多时间尺度风速预测整体流程图;
40.图2为本发明实施例一中lstm结构图。
具体实施方式
41.应该指出,以下详细说明都是示例性的,旨在对本技术提供进一步的说明。 除非另有指明,本文使用的所有技术和科学术语具有与本技术所属技术领域的普 通技术人员通常理解的相同含义。
42.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限 制根据本技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出, 否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使 用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或 它们的组合;
43.实施例一:
44.本发明实施例一提供了一种基于混合预测模型的多时间尺度风速预测方法, 如图1所示,包括以下步骤:
45.步骤1:采集风速数据,对原始数据进行数据预处理及重采样后获得各尺度 风速时间序列。
46.步骤2:利用整合移动平均自回归模型提取各时间尺度风速时间序列的线性 特征,得到线性趋势时间序列和非线性残差序列。
47.步骤2-1:arima模型,是时间序列预测分析方法之一。arima模型可以 将原本不平稳的各时间尺度风速时间序列经过d次差分后成为平稳风速时间序列。 给定一个时间序列{x
t
,t∈t},称满足(1)式的模型为arima(p,d,q)模型,ar是 自回归模型,p为其阶数;ma是移动平均模型,q为其阶数;d为差分阶数。
[0048][0049]
式中,ε
t
为白噪声序列;φ(b)和θ(b)分别为平稳可逆的arma(p,q)的自回 归系
数多项式和移动平均系数多项式。
[0050]
从arima(p,d,q)模型的定义可以看出,
[0051]
当d=0时,arima(p,d,q)模型即为arma(p,q);
[0052]
当q=0,d=0时,arima(p,d,q)模型即为ar(p);
[0053]
当p=0,d=0时,arima(p,d,q)模型即为ma(q);
[0054]
当p=0,d=1,q=0时,arima(p,d,q)模型即为随机游走模型。
[0055]
步骤2-2:arima模型的定阶:
[0056]
arima模型对时间序列的要求是平稳型。因此,当得到一个非平稳的风速 时间序列时,首先要做的即是做时间序列的差分,直到得到一个平稳时间序列。 如果对时间序列做d次差分才能得到一个平稳序列,那么可以使用arima(p,d,q) 模型,其中d是差分次数。
[0057]
接下来是选择合适的p和q。
[0058]
步骤2-2-1:检查平稳时间序列的自相关图(acf)和偏自相关图(pacf)。
[0059]
acf的作用是测量由移动平均项q所分离的时间序列中观测值之间线性相 关性的程度,pacf的作用主要是确定自回归项p的有效范围。
[0060]
步骤2-2-2:为选择arima模型的最佳参数,再根据赤池信息准则(aic)对 arima模型定阶,aic函数值越小,则说明模型效果越好。
[0061]
步骤2-2-3:最终确定好arima的阶数,对数据进行提取,提取结果包括趋 势及残差部分。
[0062]
步骤3:采用集合经验模态分解模型将非线性残差序列分解。
[0063]
经验模态分解(emd)是一种自适应信号处理方法,用于分解非线性时间序 列,将一个已知复杂的,且具有不同特征尺度的振荡模态构成的时间序列,逐一 分解成一组有规律简单的特征模态函数(imf),它们对应于信号从高到低的不同 频段,每个imf代表一种嵌入在信号中的自然振荡模式。
[0064]
imf应满足的条件为:
[0065]
零点个数与极值点个数相等或至多相差1、信号关于时间轴局部对称。
[0066]
emd具体分解过程如下:
[0067]
①
确定原始信号y(t),并找到所有极值点;
[0068]
②
将所有极小值点连接构造包络线m1,将所有极大值点连接构造包络线m2, 则两条包络线的均值为e1如式(2)所示,残差h(t)如式(3)所示:
[0069][0070]
h(t)=y(t)-e1ꢀꢀꢀ
(3)
[0071]
③
令h1(t)为新的信号y(t),重复步骤
②
,直到满足imf的两个条件,记其为 imf1,为原始y(t)筛选出来的第一阶imf。
[0072]
④
将原始信号y(t)分离出imf1后,计算两者差值r1(t),为
[0073]
r1(t)=y(t)-imf1(t)
ꢀꢀꢀ
(4)
[0074]
然后再把r1(t)作为新信号,重复步骤
②
、
③
,直到第n阶残差信号单调,不 能够在进行分解,筛选出imf分量,此时残差信号记作rn(t)
[0075]
r(t)=rn(t)-hn(t)
ꢀꢀꢀ
(5)
[0076]
⑤
最终原始信号y(t)被分解成n个imf分量和一个余项r(t)。因此y(t)可以被 表示为
[0077][0078]
但是,emd具有局限性,一个单独的imf信号中可能含有不同的时间尺度, 相同时间尺度可能出现不同的imf中。
[0079]
为弥补emd的不足,出现了eemd,eemd能够很好的完善emd中出现 的不足,主要是在原信号中加入多个小尺度互不相同的白噪声,通过emd将混 合信号分解之后,产生的多个互不相关的imf组取均值,可以将噪音相互抵消, 使均值保持在正常的动态滤波窗口范围内。
[0080]
eemd分解的过如下:
[0081]
步骤3-1:将正态分布的白噪声εs(t)加到原始信号y(t)中,得到新的时间序列 信号ys(t)。
[0082]ys
(t)=y(t)+εs(t)
ꢀꢀꢀ
(7)
[0083]
步骤3-2:将加入白噪声的信号作为一个整体,然后进行emd分解,得到各 imf分量和残差序列。
[0084][0085]
式中,为加入白噪声后分解出的各imf分量;为加入白噪声后 分解出的残差序列。
[0086]
步骤3-3:重复步骤3-1、步骤3-2共s次,每次加入新的正态分布白噪声序 列,最终y(t)被分解为s组分量。
[0087][0088]
步骤3-4:将每次得到的imf做集成平均处理后作为最终结果。
[0089][0090]
因此,时间序列可以被分解为l个imf分量(c1(t),c2(t),
…
,c
l
(t))和一个残差 分r
l
(t)。
[0091][0092]
步骤4:对分解的子序列基于长短期记忆神经网络模型进行预测;具体的, 使用lstm模型对分解得到8个imf和1个子残差序列预测。对每一特征模态 函数分量分别输入长短期记忆神经网络模型进行预测得到预测结果,实现对分解 后的子序列的预测。
[0093]
lstm是一种特殊的递归神经网络。这种网络与一般的前馈神经网络不同, lstm可以利用时间序列对输入进行分析,简而言之,lstm合理利用t时刻或 之前的输入来处理t+n时刻的信息显然可以更加合理的运用输入的信息,从而可 以有效的传递或表达长时间序
列中的信息并且不会导致较长时间之前的有用信 息被忽略掉。
[0094]
lstm在训练模型的过程中如图2所示,主要过程为:
[0095]
通过遗忘门的σ层决定记忆单元中遗忘掉哪些信息。查看h
t-1
和x
t
并向记忆 单元状态中的每个数输出一个介于0和1之间的数。其中,1表示完全保留,0 表示完全删去。
[0096]ft
=σ(wf[h
t-1
,x
t
]+bf)
ꢀꢀꢀ
(12)
[0097]
决定向记忆单元中存储哪些新信息,输入门的σ层决定更新的i
t
,可以表示 为:
[0098]it
=σ(wi[h
t-1
,x
t
]+bi)
ꢀꢀꢀꢀ
(13)
[0099]
记忆单元中加入tanh创建一个新的z,表示为:
[0100]
z=tanh(wc[h
t-1
,x
t
]+bc)
ꢀꢀꢀ
(14)
[0101]
分别将i
t
与z相乘、f
t
与c
t-1
相乘,将这两部分相加后更新状态c
t
,表示为:
[0102]ct
=c
t-1
·ft
+i
t
·zꢀꢀꢀ
(15)
[0103]
通过运行一个σ层来得到o
t
,表示为:
[0104]ot
=σ(wo[h
t-1
,x
t
]+bo)
ꢀꢀꢀꢀ
(16)
[0105]
过tanh与o
t
相乘,得到输出值h
t
,表示为:
[0106]ht
=o
t
·
tanh(c
t
)
ꢀꢀꢀ
(17)
[0107]
其中,i
t
、f
t
、o
t
为经过sigmoid函数处理得到的结果,取值为0到1之间的 一个数,分别用于决定需要更新的信息、处理新输入的数据、决定信息的输出; tanh为激活函数;z表示当前节点更新的细胞状态;c
t-1
为上一个节点的细胞状态, c
t
为当前节点细胞状态;h
t
为当前节点的输出,x
t
为当前状态下的数据输入;h
t-1
为上一个节点的输出。
[0108]
上述公式中,wf、wi、wc、wo分别为各部分权重;bf、bi、bc、bo分别为各 部分偏置。
[0109]
最终,对每一特征模态函数分量分别输入长短期记忆神经网络模型进行预测 得到预测结果,实现对分解后的子序列的预测。
[0110]
步骤5:将预测后的子序列集成并与提取到的线性时间序列相加得到最终预 测的风速时间序列。
[0111]
实施例二:
[0112]
本发明实施例二提供了一种基于混合预测模型的多时间尺度风速预测系统, 包括:
[0113]
数据获取模块,被配置为采集风速数据,获得各尺度风速时间序列;
[0114]
特征提取模块,被配置为利用整合移动平均自回归模型提取各时间尺度风速 时间序列的线性特征,得到线性趋势时间序列和非线性残差序列;
[0115]
序列分解模块,被配置为采用集合经验模态分解模型将非线性残差序列分解;
[0116]
第一预测模块,被配置为对分解的子序列基于长短期记忆神经网络模型进行 预测;
[0117]
第二预测模块,被配置为将预测后的子序列集成并与提取到的线性时间序列 相加得到最终预测的风速时间序列。
[0118]
实施例三:
[0119]
本发明实施例三提供了一种介质,其上存储有程序,该程序被处理器执行时 实现如本发明实施例一所述的基于混合预测模型的多时间尺度风速预测方法中 的步骤。
[0120]
实施例四:
[0121]
本发明实施例四提供了一种设备,包括存储器、处理器及存储在存储器上并 可在处理器上运行的程序,所述处理器执行所述程序时实现如本发明实施例一所 述的基于混合预测模型的多时间尺度风速预测方法中的步骤。
[0122]
以上实施例二、三和四中涉及的各步骤与方法实施例一相对应,具体实施方 式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括 一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述 任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发 明中的任一方法。
[0123]
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算 机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而, 可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集 成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。 本发明不限制于任何特定的硬件和软件的结合。
[0124]
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保 护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本 领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的 保护范围以内。