本发明涉及电力系统预测方法领域,更具体地,涉及一种基于混合算法的短期风电功率预测方法。
背景技术:
随着风力发电的发展,风电功率的不确定性对电力系统与电力市场的稳定性、充裕性以及经济性的影响也日益彰显。因而,精确的短期风电功率预测对电力系统的规划和调度具有重要意义。目前,风电预测方法根据使用的数据来源不同主要分为统计学习方法和物理方法。其中,统计学习方法根据风电场历史测量数据及周边测量数据建立统计学习模型,最常用的统计学习模型包括时间序列分析模型、人工神经网络模型、支持向量机模型(supportvectormachine,svm)等机器学习方法。传统的人工神经网络和支持向量机结构较为复杂,参数繁多,而极限学习机(extremelearningmachine,elm)为单隐层前馈神经网络,具有学习速度快、泛化性好等特点。此外,改进的elm模型也相继被提出应用于预测领域,如:鲁棒极限学习机(outlierrobustextremelearningmachine,orelm)相比elm而言能更好地适应训练集中可能出现的离群点,在线极限学习机(onlinesequentialextremelearningmachine,oselm)具有的在线机制能在实际的时变系统中实现更好的预测效果。
目前,数据分解技术已经广泛应用于短期风电功率预测中,利用有效的方式对时间序列进行分解预处理,对于捕捉数据的特征规律以及提高预测精度都具有重要的作用。较为主流的数据分解方法有经验模态分解技术(empiricalmodedecomposition,emd)、集成经验模态分解技术(ensembleempiricalmodedecomposition,eemd)、变模态分解技术(variationalmodedecomposition,vmd)以及小波包分解技术(waveletpacketdecomposition,wpd)等。
目前常用的短期风电功率预测方案主要有:
(1)基于经验模态分解(emd)和极限学习机(elm)的短期风电功率预测模型:
首先利用经验模态分解(emd)将原始风电时间序列分解为一系列的子模态,然后对每个子分量建立elm模型并进行预测,最后通过叠加得到最终的预测结果。
(2)基于集成经验模态分解(eemd)-主成分分析(principalcomponentanalysis,pca)和支持向量机(svm)的组合预测模型:
首先利用集成经验模态分解技术(eemd)对非平稳时间序列进行分解得到一组不同尺度的子模态分量,然后利用pca去除每个子模态中存在的噪声,降低特征维数和冗余度,最后建立svm模型将主分量作为输入变量进行预测。
目前常用的短期风电功率预测方案存在以下不足:
(1)emd分解对取样方式和噪声很敏感,而集成经验模态分解技术(eemd)通过利用零均值高斯白噪声序列具有的统计特性(频率分布服从均匀分布)弥补了emd在分解时容易导致模式混淆的缺陷。
(2)传统的神经网络,如典型的bp神经网络,参数繁杂,收敛速率很慢且容易陷入局部最优解;原始的极限学习机收敛速度很快,但是容易受到训练集中的离群值干扰,而改进的鲁棒极限学习机可以更好的适应样本含有离群值的情况。然而,实际的风电功率属于时变的在线系统,以上的预测模型对于实际时变系统的预测效果仍然不理想。
技术实现要素:
本发明为克服上述现有技术所述的缺陷,提供一种基于混合算法的短期风电功率预测方法。
所述方法包括以下步骤:
s1:利用集成经验模态分解技术(eemd)将原始风电功率分解为一系列本征模函数(intrinsicmodefunction,imf)子模态分量,即imf分量;
s2:利用奇异谱分析(ssa)方法将集成经验模态分解技术(eemd)分解所得的除了第一个imf分量imf1之外的各个imf分量及剩余分量res的主趋势分量提取出来,以获得序列特征更为明显的子模态分量,并得到提取后的剩余分量r;
s3:为了避免直接剔除imf1分量以及奇异谱分析(ssa)提取主趋势分量后的余项而造成信号细节信息的损失,进而造成预测精度降低,对imf1分量和剩余分量r进行保留,并对imf1分量和剩余分量r进行小波包分解,得到一系列较为平稳的新子模态;
s4:利用在线鲁棒极限学习机分别对s1-s3步骤所得到的所有子模态建立预测模型,并通过叠加获得最终的风电功率预测结果。
本发明提出了一种基于混合算法的短期风电功率预测方法,其中,先利用集成经验模态分解技术(eemd)对原始风电功率时间序列进行分解得到一系列imf子模态分量,再利用奇异谱分析(ssa)得到(除imf1外的)各个imf分量的主趋势序列,然后对imf1分量和剩余分量r进行小波包分解以获得更为平稳的新子模态;与单一分解方法相比,具有更好的分解效果,能更好的捕捉序列特征,得到更平稳波动性更小的子模态,有利于提高预测精度;本发明中用到的在线鲁棒极限学习机(osorelm),具有更高的预测精度,且能更好地适应于实际的时变系统。
优选地,所述的步骤s1具体包括以下步骤:
s1.1:给原始风电时间序列x(t)分别加入ng次均值为零,幅值标准差为常数的高斯白噪声ωi(t),获得新的风电时间序列xi(t):
xi(t)=x(t)+ωi(t),i=1,2,…,ng
其中,ng为大于2的整数;ωi(t)的强度取决于高斯白噪声标准差与初始信号标准差之比。
s1.2:对各个信号xi(t)分别进行经验模态分解技术(empiricalmodedecomposition,emd)分解,获得m个本征模函数(intrinsicmodefunction,imf)分量和一个剩余分量ri(t):
其中,imfij(t)是第i次加入高斯白噪声经经验模态分解技术(emd)分解得到的第j个imf分量;
s1.3:对所有imf分量imfij(t)进行均值计算,得到最终的imf分量imfj(t)和剩余分量res(t):
其中,imfj(t)为集成经验模态分解技术(ensembleempiricalmodedecomposition,eemd)分解得到的第j个imf分量;
s1.4:根据上述步骤s1.1-s1.3,由集成经验模态分解技术(ensembleempiricalmodedecomposition,eemd)将原始风电功率时间序列分解为一系列的imf子模态分量。
优选地,所述的步骤s2具体包括以下步骤:
s2.1:分解:选定窗口长度l,其中
其中,m=n-l+1;
s2.2:计算:计算ggt,并进行奇异值分解得到l个特征值:λ1≥λ2≥…≥λl≥0,每个特征值代表了对应的奇异值分解(svd)分量对原信号的能量贡献,每个特征值对应的特征向量分别为u1,u2,…ul,且:
g=g1+g2+…gd
其中,gi表示第i个奇异值分解(svd)分量,
s2.3:重构:选择满足所需条件的奇异值分解(svd)分量构成一个子集{gi},
其中,λj为第j个特征值,uj为第j个特征值对应的特征向量;
令l*=min(l,m),k*=max(l,m),如果l≤m,则
其中,gm,n表示矩阵
s2.4:根据步骤s2.1-s2.3,将集成经验模态分解技术(eemd)分解所得的除了第一个imf1分量之外的各个imf分量及res分量的主趋势分量提取出来,并分别对应得到一个余项rk;
将各个imf分量的余项叠加作为一个总的剩余分量r进行处理,即:
其中,rk对应为第k个imf分量的余项。
优选地,所述的步骤s2.3中如何选择用于重构每个imf分量主趋势分量的奇异值分解(svd)分量子集{gi},具体操作如下:
由于集成经验模态分解技术(eemd)分解所得的第一个imf分量位于最高频段,所含的噪声能量最多,所以通常被全部当成高频噪音处理,剩余每个imf分量中的噪声能量随着次序的增加不断递减,递减规律如下:
其中,enk为第k个imf分量中所含噪声的能量,δ≈0.719,ε≈2.01;
每个分量的总能量可以表示为:
其中,imfk(i)为第k个imf分量的第i个元素。
由en1为第1个imf分量imf1中所含噪声的能量,将imf1全部当成高频噪音,可得到en1=e1,剩余imf分量(k≥2)中信号所占的能量为:
exk=ek-enk
所以,imfk(k≥2)中信号能量所占的比值可计算为:
rk=exk/ek
在此基础上,选择重构时能代表输入信号imfk(k≥2)的奇异值分解(svd)分量,具体方法如下:
当rk≥0.5,说明该imf分量中信号为主要成分,由exk=ek-enk计算出h:
此时,能代表此imf序列的奇异值分解(svd)分量构成的子集为
当rk≤0.5,说明该imf分量中噪声为主要成分,由rk=exk/ek计算出h:
此时,能代表此imf序列的奇异值分解(svd)分量构成的子集为
优选地,所述的步骤s3具体包括以下步骤:
s3.1:选取小波包分解的参数,将分解层数设置为三层,利用小波包分解算法将第2步中得到的se值较大的子模态进行分解,获得一个三层的小波包树,形式为二叉树;
s3.2:分别读取小波包树最底层节点,即八个节点的信号,就可得到二重分解后的新子模态序列;
s3.3:分别得到imf1分量和剩余分量r经过小波包分解技术(wpd)分解后的两组新子模态序列。
优选地,所述的步骤s4具体包括以下步骤:
s4.1:初始化阶段,利用初始训练集
β0为隐含层初始输出权重,e0为初始训练集的训练误差,n0为初始训练集样本量,c为正则化系数;h0为初始隐含层输出矩阵,h0可计算为:
其中,q为隐含层节点数;
该约束条件优化问题可通过增广拉格朗日算子来进行迭代计算,其计算公式为:
其中,μ=2n0/||y0||1为惩罚因子,λk为第k次迭代中的拉格朗日算子;
根据
其中,i为单位矩阵;
s4.2:在线学习阶段,当训练集d的第k+1个样本到来时,利用递归最小二乘法来更新计算隐含层输出权重,计算公式为:
其中,hk+1=[g(w1·xi+b1)…g(wq·xi+bq)];
s4.3:初始化遗忘因子θ为0≤θ0≤1,并根据下式对θ进行迭代更新:
vk+1=θk(vk+1)
其中,νk+1,ηk+1,γk+1均为辅助参量,ρ是一个正数,ν,γ的初始值的取值范围为[0,1];
相关参数可设置为:t0=20,θ0=1,ν0=10-6,γ0=10-3,ρ=0.99。
与现有技术相比,本发明技术方案的有益效果是:本发明具有更好的分解效果、更高的预测精度、更快的计算速度,能更好的适应于实际应用中的时变系统中。
附图说明
图1为基于混合算法的短期风电功率预测方法流程图。
图2为2017年1月原始风电功率时间序列图。
图3为2017年3月原始风电功率时间序列图。
图4为2017年6月原始风电功率时间序列图。
图5为对原始风电功率进行集成经验模态分解技术分解的结果图。
图6为各个imf分量及res分量的主趋势分量结果图。
图7为对imf1分量进行小波分解的结果图。
图8为对剩余分量r进行小波分解的结果图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
本发明为一种基于混合算法的短期风电功率预测方法,其实现流程图如图1所示,本发明技术方案的具体步骤为:
s1.利用集成经验模态分解技术(eemd)将原始风电功率分解为一系列子模态,具体步骤为:
s1.1:给原始风电时间序列x(t)分别加入ng次均值为零,幅值标准差为常数的高斯白噪声ωi(t),获得新的风电时间序列xi(t):
xi(t)=x(t)+ωi(t),i=1,2,…,ng
其中,ωi(t)的强度取决于高斯白噪声标准差与初始信号标准差之比,本实施例中设置nstd=0.5,ng=200。
s1.2:对各个信号xi(t)分别进行emd分解,获得m个本征模函数(intrinsicmodefunction,imf)分量和一个剩余分量ri(t):
其中,imfij(t)是第i次加入高斯白噪声经(emd)分解得到的第j个imf分量。
s1.3:对所有imf分量imfij(t)进行均值计算,得到最终的imf分量imfj(t)和剩余分量res(t):
其中,imfj(t)为集成经验模态分解技术(eemd)分解得到的第j个imf分量。
s1.4:根据上述步骤s11-s13,可由集成经验模态分解技术(eemd)将原始风电功率时间序列分解为一系列的imf子模态分量。
s2:利用奇异谱分析(ssa)方法提取各个imf分量中的主趋势分量,以获得序列特征更为明显的子模态分量,具体步骤如下:
s2.1:分解:选定窗口长度l
其中,m=n-l+1,计算ggt,并进行奇异值分解得到l个特征值:λ1≥λ2≥…≥λl≥0,每个特征值代表了对应的奇异值分解(svd)分量对原信号的能量贡献。每个特征值对应的特征向量分别为u1,u2,…ul,且:
g=g1+g2+…gd
其中,gi表示第i个奇异值分解(svd)分量,
s2.2:重构:选择满足所需条件的奇异值分解(svd)分量构成一个子集{gi},
其中,λj为第j个特征值,uj为第j个特征值对应的特征向量;
其中,
令l*=min(l,m),k*=max(l,m),如果l≤m,则
其中,gm,n表示矩阵
s2.3:其中,如何选择用于重构每个imf分量主趋势分量的奇异值分解(svd)分量子集{gi},具体操作如下:
由于集成经验模态分解技术(eemd)分解所得的第一个imf分量位于最高频段,所含的噪声能量最多,所以通常被全部当成高频噪音处理,剩余每个imf分量中的噪声能量随着次序的增加不断递减,递减规律如下:
其中,enk为第k个imf分量中所含噪声的能量,δ≈0.719,ε≈2.01;
每个分量的总能量可以表示为:
其中,imfk(i)为第k个imf分量的第i个元素;
根据上述理论,可得到en1=e1;剩余imf分量(k≥2)中信号所占的能量为:
exk=ek-enk
所以,imfk(k≥2)中信号能量所占的比值可计算为:
rk=exk/ek
在此基础上,选择重构时能代表输入信号imfk(k≥2)的奇异值分解(svd)分量,具体方法如下:
当rk≥0.5,说明该imf分量中信号为主要成分,由exk=ek-enk计算出h:
此时,能代表此imf序列的奇异值分解(svd)分量构成的子集为
当rk≤0.5,说明该imf分量中噪声为主要成分,由rk=exk/ek计算出h:
此时,能代表此imf序列的奇异值分解(svd)分量构成的子集为
s2.4:根据步骤s2.1-s2.3,将集成经验模态分解技术(eemd)分解所得的(除了第一个imf分量之外的)各个imf分量及res分量的主趋势分量提取出来,并分别对应得到一个余项rk;本实施例将各个imf分量的余项叠加作为一个总的剩余分量r进行处理,即:
其中,rk对应为第k个imf分量的余项。
s3:为了避免直接剔除imf1分量以及奇异谱分析(ssa)提取主趋势分量后的余项而造成信号细节信息的损失,进而造成预测精度降低,故对imf1分量和剩余分量r进行保留,并对imf1分量和剩余分量r进行小波包分解,得到一系列较为平稳的新子模态,具体步骤如下:
s3.1:选取小波包分解的参数,将分解层数设置为三层,利用小波包分解算法将第2步中得到的se值较大的子模态进行分解,获得一个三层的小波包树(形式为二叉树);
s3.2:分别读取小波包树最底层节点(也就是八个节点)的信号,即得到二重分解后的新子模态序列;
s3.3:分别得到imf1分量和剩余分量r经过小波包分解技术(wpd)分解后的两组新子模态序列。
s4:利用在线鲁棒极限学习机分别对上述步骤所得到的所有子模态建立预测模型,并通过叠加获得最终的风电功率预测结果,其具体步骤为:
s4.1:初始化阶段。利用初始训练集
β0为隐含层初始输出权重,e0为初始训练集的训练误差,n0为初始训练集样本量,c为正则化系数;h0为初始隐含层输出矩阵,h0可计算为:
其中,q为隐含层节点数;
该约束条件优化问题可通过增广拉格朗日算子来进行迭代计算,其计算公式为:
其中,μ=2n0/||y0||1为惩罚因子,λk为第k次迭代中的拉格朗日算子;
根据
其中,i为单位矩阵;
s4.2:在线学习阶段。当训练集d的第k+1个样本到来时,利用递归最小二乘法来更新计算隐含层输出权重,计算公式为
其中,hk+1=[g(w1·xi+b1)g(wq·xi+bq)];
s4.3:初始化遗忘因子θ为θ≤θ0≤1,并根据下式对θ进行迭代更新:
vk+1=θk(vk+1)
其中,νk+1,ηk+1,γk+1均为辅助参量,ρ是一个正数。ν,γ的初始值的取值范围为[0,1];
本实施例将对各参数设置为:t0=20,θ0=1,ν0=10-6,γ0=10-3,ρ=0.99。
本实施例选取西班牙sotaventogalicia某风电场提供的2017年的实测风电功率数据(/小时)作为研究对象,分别取一月、三月、六月作为典例进行分析,如图2-4所示。其中,数据采样点为每小时一个点,取其中的前700小时(共700点)作为试验样本,其中,前600个点作为训练样本,后100个点作为测试样本,进行输入维数为6的提前1步(即提前1小时)的风电功率预测试验。
为了定性地评价预测模型的性能,引入平均绝对误差(meanabsoluteerror,mae)和均方根误差(rootmean-squarederror,rmse)作为预测模型的性能评价指标:
其中,yi和
(1)以2017年三月的风电功率时间序列(数据采样间隔为1小时,共744个点)为例,利用集成经验模态分解技术(eemd)将原始风电功率分解为一系列子模态,分解结果如图5所示。
由图5可见,原始风电功率经过集成经验模态分解技术(eemd)的一系列子模态中,imf1分量是最为混乱而无序的,说明imf1分量中所含有的噪声最多,在进行奇异谱分析(ssa)提取主趋势分量时可先将imf1分量全部视为噪声处理。
(2)利用奇异谱分析(ssa)算法将集成经验模态分解技术(eemd)分解所得的(除了imf1分量之外的)各个imf分量及res分量的主趋势分量提取出来,结果如图6所示。
(3)对imf1分量和剩余分量r分别进行小波包分解,并得到两组更平稳波动性更小的子模态,分别记为wpd10~wpd17和wpd20~wpd27;其中,对imf1分量进行小波包分解的结果如图7所示,对剩余分量r进行小波包分解的结果如图8所示。
由图7和图8可见,imf1分量和剩余分量r在经过小波包分解后分别都得到了一组较为平稳的子模态序列,且序列特征更为明显。
(4)将本方法提出的预测基模型(osorelm)和elm、orelm进行对比,各模型的误差评价指标结果分别如表1所示。
表1各模型的误差评价指标结果
从表1可知,本方法提出的预测基模型(osorelm)预测精度明显优于其他模型。
(5)将本方法(记为eemd-ssa-wpd-osorelm)与基于emd、eemd、wpd和vmd分解的预测模型进行对比实验,各模型的误差评价指标结果分别如表4所示。
表2各模型的误差评价指标结果
从表2可知,基于本方法提出的混合方法的预测性能明显优于另外几种分解方法,表明了本方法所提的混合分解方法的优越性。
(6)此外,再选取2017年六月和九月的风电功率时间序列对本方法进行进一步的验证,得到利用eemd-ssa-wpd-osorelm对不同月份风电功率进行预测的误差评价指标结果分别如表3所示。
表3不同月份风电功率预测的误差评价指标结果
从表3可知,本方法对不同月份的预测精度都较高,表明了本方法能够较好的适应不同特性的风电功率预测情况,能较好地适应于实际的时变系统,证明了本方法的有效性。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。