一种基于贝叶斯鲁棒函数回归的多步风速预报方法与流程

文档序号:15492716发布日期:2018-09-21 20:57阅读:540来源:国知局

本发明涉及新能源领域和统计学习领域,特别涉及一种基于贝叶斯鲁棒函数回归的多步风速预报方法。



背景技术:

当前,风电作为一种清洁、可再生的能源受到了越来越多的关注。大规模的风电并网将会在一定程度上缓解能源危机,并且能带来经济效益和减少环境污染。而从风电并网的角度来说,准确的风速和功率预报是保持风电系统稳定性和安全性的重要因素。

当前,有多种风速及功率预报方法,根据建模理论,这些方法大体可分为5类:物理模型、传统的统计模型、基于人工智能的预报方法、空间相关模型以及组合模型。

对于物理模型来说,它需要大规模的运算,并且一些物理数据很难得到。传统的统计模型主要包括自回归(ar)、自回归滑动平均模型(arma)和自回归积分滑动平均模型(arima)等。通常,传统的统计模型主要拟合风速波动中的线性部分,而非线性部分通常用基于人工智能的方法如人工神经网络(ann)和支持向量机(svm))来拟合。因此,结合统计模型和基于人工智能的模型的特点,很多学者构建出基于以上两种模型的组合模型。对于空间相关模型来说,主要是考虑不同位置风速的空间关联性。对于某一特定站点来说,该位置上的风速与其相邻站点的风速具有相似性。因此,对本站点的风速进行预测时,不仅考虑本站点的相关数据,而且考虑相邻站点的风速数据会提高预测精度。

基于空间相关模型的风速预报方法主要是从其相邻的站点挖掘出更多的描述风速波动的解释变量。如果相邻站点没有相关站点,很多学者就转而从本站点搜集更多的相关变量,如气温、气压、湿度以及风向等。然而数据本身的信息并没有得到充分地利用。原始的风速数据的采样间隔为2秒或者5秒,因此我们所收集到的风速数据是高分辨率数据。实际中,通常需要对10分平均风速时间序列进行建模得到提前10分钟或者提前1小时的风速预报结果。这就需要将我们收集的高分辨率数据转换成低分辨率的数据,我们通常采用的方法是将每10分钟内所有的高分辨率数据求取平均,然后得到10分钟平均风速时间序列。然而,这种处理方法会忽略高分辨率数据中所蕴含描述风速波动的相关信息。

此外,由于极端天气等原因,使得我们所收集到的数据里面会包含很多异常风速。这些异常风速会给我们的预测建模带来困扰。研究发现对数据中的异常点进行预处理能提高预测精度。这些预处理方法主要包括两类:异常点检测和信号处理方法。然而,基于数据预处理的预报方法的缺点在于最终的预测结果将依赖于数据预处理后数据的质量。对于异常点检测的异常点处理方法来说,我们并不能确定所有的异常点都去除了。而对于信号处理方法的数据预处理,不论是正常风速还是异常风速都会被处理。我们也并不能保证处理后的数据一定变成了正常点。因此,我们构建的预报模型本身应具有较好的鲁棒性。当前的一些预报算法(如svm和lssvm)缺乏鲁棒性的主要原因是短尾的误差分布假设。

综上所述,当前的风速预报方法的缺陷体现在以下两个方面:一,风速中反映风速波动细节的高分辨率数据并没有得到利用;二,许多预报模型本身缺乏鲁棒性。



技术实现要素:

本发明的目的是解决现有风速预报方法中存在的两大缺陷,导致精度较低误差较大的技术问题,本发明提供一种基于贝叶斯鲁棒函数回归的多步风速预报方法。

本发明解决上述问题采用如下技术方案:

一种基于贝叶斯鲁棒函数回归的多步风速预报方法,包括以下步骤:

1)数据预处理:

将每10分钟内120个5秒风速点看成是一个单元,并存储在matlab中,然后对每个单元中所有的数据求取平均得到10分钟平均风速时间序列,然后根据实际情况确定多步预测的预测步长,低分辨率预测输入的个数以及相应的高分辨率风速输入的个数;

2)构造鲁棒函数回归的多步风速预报模型:

将传统的回归模型和函数回归模型进行融合,构造出能够处理多分辨率数据的函数型回归模型所述的x,y表示模型的输入和输出,函表示低分辨率输入,w、ε表示线性回归系数和误差项,x(t),β(t)是关于t的函数型变量和相应的函数型回归系数;

进行多步预报时,上述模型可转化为所述的ziwj项处理的是低分辨率数据,即10分钟平均的风速数据;所述的项处理的是高分辨率数据,即10分钟内所有的5秒风速数据;

根据函数主成分分析理论,对模型进行近似表示,得到所述的矩阵根据训练数据直接求取,都是待求的参数;

假定每一步风速预报误差都服从多混合高斯分布,将多混合高斯分布用多层生成模型表示为:所述的n(·)表示高斯分布,k表示混合高斯分布中单高斯的个数,表示高斯分布的方差;所述的rijk表示指示变量,m(·)和d(·)分别表示多项式分布和狄利克雷分布,a0表示的是狄利克雷分布中的参数;

给定变量多拉普拉斯先验,以实现函数型变量的自动稀疏:

ρj~ig(ρj|j0,k0)

所述的g(·)和ig(·)分别表示gamma分布和逆gamma分布,h0,i0,j0,k0为逆gamma分布中的先验参数;

给定模型中其它的参数先验表示如下:

τjk~g(τjk|b0,c0

wj~n(wj|0,λj)

λjd~ig(λjd|d0,e0)

ζp~ig(ζp|l0,m0)

所述的λj=diag{λj1,…,λjd},表示测量的函数型变量,μp(t)∈r1×j表示函数型变量的均值,j表示网格的数量,ij×j表示一个j×j的单位矩阵,b0,c0,d0,e0,f0,g0,l0,m0表示先验分布中的先验参数;

3)利用变分贝叶斯优化模型的参数:

根据步骤2)中对鲁棒样条回归模型中各个参数的先验分布,构造最终的联合概率密度函数:

所述p(·)是变量的概率分布,i=1,…,n,j=1,…,t,d=1,…,d,r=1,…,kx,g=1,…,kg,k=1,…,k,p=1,…,p,r={rijk},

根据变分贝叶斯的原理,求出鲁棒样条回归模型中的所有参数的后验分布,

所述的<·>是期望运算,t表示已知数据,

4)根据估计的参数和测试集计算预测值:

根据设定好的kg维b样条基重新估计函数型回归系数然后,最终的第j步的预测结果ypj为

所述的ztest表示测试集中低分辨率风速输入向量,表示测试集中第p个高分辨率风速输入,p表示用函数型变量表示的高分辨率数据风速输入的个数。

本发明具有如下有益效果:本发明的多步风速预报方法由于采用模型的融合,不仅考虑了低分辨率数据,也考虑了高分辨率数据,因此能够处理多分辨率数据;多混合高斯分布的假定使得本发明的模型能实现对于不同预测任务都能有鲁棒的效果,减小了异常点的影响;通过多拉普拉斯先验实现了函数型变量的系数问题,可以解决函数型变量的特征选择,降低冗余的函数型变量对最终结果的影响。本发明的多步风速预报方法精度高、误差小,可进一步提高风速预报的精度。

附图说明

图1为本发明基于贝叶斯鲁棒函数回归的多步风速预报方法的流程图;

图2为本发明实施例中的与低分辨率输入相对应的回归参数w在每步预报中的稀疏效果;

图3为本发明实施例中与函数型变量相对应的函数型回归系数的稀疏性对比;

图4为本发明实施例中各预报模型的预测结果对比图。

具体实施方式

下面结合实施方式和实施例对本发明的技术方案作进一步阐述。

具体实施方式:本实施方式是一种基于贝叶斯鲁棒函数回归的多步风速预报方法,如图1所示,具体步骤如下:

1)数据预处理:

将每10分钟内120个5秒风速点看成是一个单元,并存储在matlab中,然后对每个单元中所有的数据求取平均得到10分钟平均风速时间序列,然后根据实际情况确定多步预测的预测步长,低分辨率预测输入的个数以及相应的高分辨率风速输入的个数;

2)构造鲁棒函数回归的多步风速预报模型:

将传统的回归模型和函数回归模型进行融合,构造出能够处理多分辨率数据的函数型回归模型所述的x,y表示模型的输入和输出,函表示低分辨率输入,w、ε表示线性回归系数和误差项,x(t),β(t)是关于t的函数型变量和相应的函数型回归系数;

进行多步预报时,上述模型可转化为所述的ziwj项处理的是低分辨率数据,即10分钟平均的风速数据;所述的项处理的是高分辨率数据,即10分钟内所有的5秒风速数据;

根据函数主成分分析理论,对模型进行近似表示,得到所述的矩阵根据训练数据直接求取,都是待求的参数;

假定每一步风速预报误差都服从多混合高斯分布,将多混合高斯分布用多层生成模型表示为:rijk~m(rijk|πj),πj~d(πj|a0);所述的n(·)表示高斯分布,k表示混合高斯分布中单高斯的个数,表示高斯分布的方差;所述的rijk表示指示变量,m(·)和d(·)分别表示多项式分布和狄利克雷分布,a0表示的是狄利克雷分布中的参数;

给定变量多拉普拉斯先验,以实现函数型变量的自动稀疏:

ρj~ig(ρj|j0,k0)

所述的g(·)和ig(·)分别表示gamma分布和逆gamma分布,h0,i0,j0,k0为逆gamma分布中的先验参数;

给定模型中其它的参数先验表示如下:

τjk~g(τjk|b0,c0)

wj~n(wj|0,λj)

λjd~ig(λjd|d0,e0)

ζp~ig(ζp|l0,m0)

所述的λj=diag{λj1,…,λjd},表示测量的函数型变量,μp(t)∈r1×j表示函数型变量的均值,j表示网格的数量,ij×j表示一个j×j的单位矩阵,b0,c0,d0,e0,f0,g0,l0,m0表示先验分布中的先验参数;

3)利用变分贝叶斯优化模型的参数:

根据步骤2)中对鲁棒样条回归模型中各个参数的先验分布,构造最终的联合概率密度函数:

所述p(·)是变量的概率分布,i=1,…,n,j=1,…,t,d=1,…,d,r=1,…,kx,g=1,…,kg,k=1,…,k,p=1,…,p,r={rijk},

根据变分贝叶斯的原理,求出鲁棒样条回归模型中的所有参数的后验分布,

所述的<·>是期望运算,t表示已知数据,

4)根据估计的参数和测试集计算预测值:

根据设定好的kg维b样条基重新估计函数型回归系数然后,最终的第j步的预测结果ypj为

所述的ztest表示测试集中低分辨率风速输入向量,表示测试集中第p个高分辨率风速输入,p表示用函数型变量表示的高分辨率数据风速输入的个数。

下面通过具体实施例,对本发明做进一步详细说明,应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

实施例采用中国某风电场的两个数据集(数据集a和数据集b),每个数据集中包含两个测试集,分别属于风速波动平缓期和风速波动频繁期,实际情况中我们利用过去两小时的风速预测未来10分钟、20分钟和30分钟的风速。从而会有12个低分辨率输入ws(t),…,ws(t-11)和相对应的12个高分辨率输入wsf(t),…,wsf(t-11)来预测未来10分钟、20分钟和30分钟的风速,即ws(t+1),ws(t+2),ws(t+3)。

为了说明本发明所提出方法的性能,采用以下三种指标进行结果的比对:平均绝对误差(mae)、均方根误差(rmse)和平均绝对百分比误差(mape)。它们的计算方法定义为:

其中rwi,fwi分别表示真实风速和预测风速,l表示测试样本的个数。另外,为了比较不同预报模型的性能,采用以下五个方法作为对比算法,即线性回归(lr)、基于变分贝叶斯的线性回归(vblr)、多输出的最小二乘支持向量机(mlssvm)、只有混合高斯误差先验而没有多拉普拉斯参数先验的函数回归模型(r-fr)和没有混合高斯误差先验而只有多拉普拉斯参数先验的函数回归模型(s-fr)。本发明提出的贝叶斯鲁棒函数回归模型包含混合高斯误差先验和多拉普拉斯参数先验,这里用sr-fr来表示。在风速波动平缓期和风速波动频繁期的预测结果分别展示在表1和表2中。

表1风速波动平缓期各模型预报结果

表2风速波动频繁期各模型预报结果

从表1和表2可以看出本发明不论是在风速波动平缓期还是风速波动频繁期都能取得良好的多步预报效果。另外,通过对比r-fr和sr-fr的预测结果我们可以看出sr-fr预测结果较好的原因是由于稀疏的函数型变量,sr-fr能够很好的消除冗余函数型变量对预测结果的影响。通过对比s-fr与sr-fr我们可以看出鲁棒的预测模型能取得更好的预测精度。从上述的模型对比可以看出,多混合高斯分布形成的鲁棒特性和多拉普拉斯先验形成的函数型变量稀疏特性确实能够帮助我们提高模型的预测性能。另外,sr-fr模型与其他传统的只考虑10分钟平均风速的预测模型相对,本发明提出的模型较优。上述现象也说明了高分辨率信息确实能够辅助我们获得更好的风速预测结果。

本发明sr-fr模型中与低分辨率输入相对应的回归参数w在每步预报中的稀疏效果如图2所示,与函数型变量相对应的函数型回归系数的稀疏性(数据集b)如图3所示,在图3中,(a)-(c)表示的是参数的稀疏效果,(e)-(g)表示的是函数型回归系数参数的稀疏效果。从图2可以看出,绝大多数的回归系数的值是趋近与0的,说明低分辨率输入中也存在一些冗余变量。从图3可以看出,像素格的稀疏对比非常明显,本发明sr-fr在函数型变量上的稀疏效果比r-fr和s-fr要好很多。以上现象说明本发明sr-fr不论是在低分辨率数据上还是在高分辨率数据上都能取得较好的稀疏性,从而使得本发明能够很好的避免冗余变量对结果的影响。图4表示的是数据集b中各个预测模型的预测结果对比图。从图4也可以看出不论是在风速波动平缓期还是在风速波动频繁期,本发明sr-fr的预测结果较好。

最后应说明的是:以上实施方式和实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施方式和实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施方式和实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施方式和实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1