基于原子分解和交互式模糊满意度的风功率区间预测方法与流程

文档序号:13934885
基于原子分解和交互式模糊满意度的风功率区间预测方法与流程

本发明属于风力发电出力预测领域,涉及一种风功率区间预测方法,尤其是涉及一种基于原子稀疏分解和交互式模糊满意度的多目标风功率区间预测方法。



背景技术:

风电因其清洁无污染的特点得以广泛应用,其在电网中的比重将会越来越大,但它的间歇性和不稳定性给电网的安全稳定运行提出了挑战。对风电场的功率进行准确可靠的预测是帮助减小系统备用容量并且减小风电接入对电网冲击的有效手段之一。目前关于风电预测方法的研究主要可以分为物理方法、统计方法、组合方法等。这些方法大多关注于确定性的点预测,其随机性的误差给预测带来一定的不确定性。与目前广泛使用的点预测方法相比,概率区间预测可以提供更多与风电相关的不确定性量化信息,为机组组合决策和电网调度人员提供更全面的参考。

传统的概率区间预测方法通常需要假设先验误差分布或者复杂的数学计算,上下界估量(Upper and lower bound estimation,LUBE)方法不需要对误差分布做任何假设且计算简单,核极限学习机(kernel extreme learning machine,KELM)训练速度快且具有良好的泛化性能,两者结合建立风功率区间预测模型具有良好的效果。衡量预测区间的性能优劣的准则为可靠性与清晰度,其中可靠性即区间覆盖率(又称置信度)和标称概率(即预先设置的置信水平)应该尽可能接近,清晰度则指区间平均带宽和带宽偏差,三个指标相互矛盾且不可公度,可利用交互式模糊满意度方法来构造多目标函数。教与学优化算法(teaching-learning-based optimization algorithm,TLBO)具有参数少、无需进行参数设定、算法简单、求解速度快、精度高且具有极强的收敛能力等有点,可用来对多目标模型进行寻优得到最优预测区间。

此外,已有风功率预测方法研究中,利用小波分解和聚类经验模态分解(ensemble empirical mode decomposition,EEMD)等将原始风功率序列分解成一系列可以表征局部特性的分量,相比未进行分解的方法获得了较好的效果,原子稀疏分解(atomic sparse decomposition,ASD)方法相比传统的信号分解方法(用一组有限的正交基表示信号,因此表达信号的能力和范围也是有限的)构建一个超完备的展开函数集合,具有较强的非平稳信号跟踪能力,适于提取风功率序列的不平稳特性。



技术实现要素:

为了更好地量化风电出力的不确定性,本发明提出了一种基于原子稀疏分解和交互式模糊满意度的风功率区间预测方法,可以提高风功率区间的可靠性和清晰度。

本发明所采用的技术方案是:一种基于原子分解和交互式模糊满意度的风功率区间预测方法,其特征在于,包括以下步骤:

步骤1:利用改进的原子稀疏分解方法对原始风功率进行分解,以检测风功率曲线的内在特征(非线性和高噪声);

每次迭代时需要扫描整个原子库从而得到此次迭代中与残余信号最为相关的原子,假设D为原子库,x为待分析的信号,gγ为原子库中的原子,利用粒子群算法和双字典集进行搜索,在构建原子集的过程中构建两个字典集,旧字典集D1与新字典集D2,旧字典集由旧原子(即已经选择过的最优原子)构成,新字典集由新原子构成。迭代开始时,原子库里的所有原子都属于D2,接下来的几次迭代过程里被选择的最优原子也大多属于D2,而随着迭代次数的增加,D1中的原子逐渐增多,此时为了达到稀疏性的目的,应该尽可能地从D1中选择原子。

1)利用粒子群优化算法遍历原子库,即对索引参数进行智能搜索。计算每个原子与待分解信号的内积,从中找到内积最大(即与信号x最为匹配)的原子gγ,将该原子作为字典集D2中的最优原子,对应的内积为wD2。目前应用最多的原子库是Gabor原子库,其核函数表达式如下所示。

式中:为高斯函数,索引γ=(s,τ,ξ,φ)中的参数s,τ,ξ,φ分别为尺度参数、位移因子、频率因子及相位因子。

2)计算D1字典集中的原子与待分解信号的内积,找出最大的一个内积为wD1

3)比较wD1与wD2,若|wD1|≥wD2|,则选择wD1对应的原子为本次迭代中的最优原子,否则根据式(2)分别计算采用这两个原子后所得的残余信号yD1和yD2,然后计算r=||yD1-yD2||/||yD2||。

Rnx=Rn-1x-<Rn-1x,gγn>gγn (2)

4)通过阈值函数T来确定全局最优原子,若r≤T,则wD1对应的原子为最优原子,否则wD2对应的为最优原子。其中,T为模拟退火算法中的退火函数T(k)=T0×αk/N,0.6≤α≤1,T0为初始温度,k为迭代次数,N为退火速度因子。

5)从信号x中减去最大内积与对应原子的乘积,形成残余信号Rnx。

6)对残余信号Rnx重复步骤1)和步骤5),直到残余信号能量小于预先设定的阈值。

以上步骤对应的流程图如附图1所示,进行有限n次迭代后,信号x可以表示为

步骤2:计算分解后的每个分量的样本熵,量化每个分量的复杂程度(样本熵值越大,则分量的复杂程度越高),并在此基础上根据分量的不同熵值进行分类与重组以减小计算规模;进行分类的原则是:设置阈值γ,原始序列的样本熵为SampEn,每个分量的样本熵为SEk(k表示分量的序数),满足|SEk-SampEn|<=γ的分量为一组,相加构成循环分量,满足SEk-SampEn>γ的分量为一组,相加构成随机分量,满足SEk-SampEn<-γ的分量为一组,相加构成趋势分量;

样本熵是条件概率的严格自然对数,可用SampEn(N,m,r)表示。其中N为长度,r为相似容限,m为维数,假设时间序列{xi}为x(1),x(2),…x(N)(N为数据总数)。

1)将序列{xi}按顺序组成m维矢量,即X(i)=[x(i),x(i+1),…,x(i+m-1)],其中i=1,2,…,N-m+1;

2)X(i)与X(j)之间的距离dm(X(i),X(j))为两者对应元素差值最大的一个,即:

对于每一个i值计算X(i)与其余矢量X(j)(j=1,2,…,N-m+1,且j≠i)之间的dm(X(i),X(j))。给定相似容限r(r>0),对每一个i值统计dm(X(i),X(j))<r的数目,然后计算其与距离总数N-m的比值,记作即:

式中:i=1,2,…,N-m+1,且j≠i;num为dm(X(i),X(j))<r的数目。该过程称为X(i)模板匹配过程,表示任一个X(i)与模板的匹配概率。

4)的平均值为:

5)增加维数为m+1,重复步骤1)~3),则的平均值为:

6)样本熵定义为:

当N取有限值时,上述得出的是样本熵估计值,为:

SampEn(N,m,r)=-ln(Bm+1(r)/Bm(r)) (9)

SampEn的取值与m和r的值有关,但样本熵具有良好的一致性,其熵值增大与减小的趋势并不受m和r的影响,一般情况下m取为2,r为0.1~0.25SD,SD为时间序列的标准差。

步骤3:利用LUBE和KELM,对每个分量分别进行区间预测,基于交互式模糊满意度方法建立多目标函数,并利用TLBO进行寻优;

步骤3的具体实现包括以下子步骤:

1)输入风功率历史数据,划分训练集、验证集和测试集,将数据归一化到[-1,1]。按照式(10)对训练数据的输出进行处理,形成训练数据的初始输出区间。

设置TLBO算法的最大迭代次数和学生数量的初始值;

Yi=[yi(1-25%R),yi(1+25%R)] (10)

式中:yi为原始输出,Yi为处理后的输出区间,R为[0,1]区间均匀分布的随机数。

2)将第一步得到的训练数据输入到KELM模型中进行训练,得到初始输出权重β。其中KELM的输出模型为:

式中:I为对角矩阵,C为惩罚系数,ΩELM为核矩阵,T为输出目标矩阵。核函数K(μ,ν)通常使用RBF核K(μ,ν)=exp[-(μ-ν2/σ)]。

3)将训练数据训练好的模型应用于验证数据集,将验证数据的预测结果与实际值进行比较,计算出预测区间的三个指标,然后计算目标函数。具体指标和目标函数计算方法如下:

预测区间覆盖率(prediction interval coverage probability,PICP)

式中:当预测目标值ti∈[Ui,Li]时,ci为1,反之为0,Li和Ui分别对应预测区间的下边界和上边界;N为预测点数目,i=1,2,…N。

归一化预测区间平均带宽(prediction interval normalized average width,PINAW)

式中:R表示预测目标值的取值范围,用来将带宽归一化。

归一化累积偏差(normalized accumulated deviation,NAD)

式中:εi的表达式为:

计算上述三个指标的值以后,再基于交互式模糊满意度方法构造目标函数。

首先,确定各个目标函数的隶属度函数,利用模糊隶属度函数将各个目标函数模糊化,得到的数值即代表决策者对这个目标的满意度。本发明中的指标IPICP越靠近预先设定的额定置信度水平(PIs with nominal confidence,PINC)越好,而指标IPINAW和INAD越小越优,因此首先构造一个指标ICPE=|IPINC-IPICP|将目标转换成越小越优的形式,然后构造越小越优型隶属度函数,隶属度函数数学表达式如式(16)所示。

式中:x为决策变量,u[fi(x)]为目标值fi(x)对应的隶属度,即第i个目标的满意度,fimax(x)和fimin(x)分别为目标的上下限。

然后对各目标设定一个参考隶属度值μref,i,再把各目标函数的隶属度与参考隶属度之差的最大绝对值最小化作为优化准则,就可把多目标问题转化为如式(17)所示的单目标问题进行求解:

F(x)=min{max|μref,i-μ[fi(x)]|},i=1,2,…n (17)

最后,决策者对求出的解进行满意度判断,如果对当前解不满意,即可通过不断交互的方式,重新设定参考隶属度值,进行再次求解。

本发明不依赖于这些参数的准确值,如果标准不满足,决策者可以在[0,1]之间调整参考隶属度的值来达到最优的区间。

4)利用TLBO算法进行寻优,反复利用训练数据集训练模型并应用于验证数据集,将得到的预测区间用来计算目标函数,从而获取最优的KELM模型,即得到最优输出权重β。

其中TLBO算法的步骤如下:

a、初始化班级,班里的每个学生(j=1,2,…,NP)在d维空间随机生成。

式中:和分别表示学生成绩的上下限。

b、老师教学阶段,每个学生根据老师和学生平均值之间的差异进行学习。

difference=ri×(Xteacher-TFi×mean) (20)

式中:和分别表示第i个学生学习前后的值,老师由成绩最优的学生担任,mean是所有学生的均值,教学因子TFi=round[1+rand(0,1)],学习步长ri=rand(0,1)。

c、“教学”阶段完成后,对比学习前后的成绩,更新学生。

d、“学习”阶段,每一个学生Xi在班级里随机选取一个学习对象Xj,通过自己与学生之间的差异进行学习。

式中:ri=U(0,1)表示第i个学生的学习因子。

e、更新学生,判断是否满足终止条件,满足则结束,否则转入步骤b。

5)将得到的最优模型应用于测试数据集进行预测,输出风功率区间预测结果。

步骤4:将每个分量的预测结果组合即得出最终的预测结果,区间预测结果则是具有一定置信水平的区间。

相对于现有技术,本发明的有益效果是:

1、利用改进的原子分解方法能更有效地提取风功率信号的非平稳特性,因为该方法通过构建一个超完备的展开函数集合来更全面地表达信号,同时对该方法的改进能够有效降低计算量,改进前每次计算的复杂度为O(52(Nslog2Ns+Ns-1))(其中Ns为样本个数),改进后的计算复杂度为O(S+MS+ND1)(其中S和M分别代表算法的种群数量和总迭代次数,为常数,ND1为旧字典集中原子的个数),改进前复杂度与待分解的信号样本数相关,样本越多,规模越大,改进后与Ns无关,可大大降低计算复杂度,虽然ND1随着迭代次数的增加而增加,但个数仍然非常有限;

2、提出基于交互式模糊满意度的多目标预测方法计及了多个指标,能更全面预测风功率的不确定性,且利用交互式模糊满意度方法构建目标函数能避免各指标的权重分配问题。

附图说明

图1为本发明实施例中原始风功率进行分解流程图;

图2为本发明实施例中的子序列样本熵分布图;

图3为本发明实施例中的重组后的子序列分布图;

图4为本发明实施例中的风功率概率区间预测结果分布图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。

本实施例中采用matlab编程仿真平台,使用某个风电场连续半年的实测风功率数据进行测试,该风电场采样时间间隔为15min。每组试验选取风电场正常运行时连续一个月的数据进行仿真,其中训练集、验证集和测试集的样本个数分别为2080、400和400。算法的参数设置如下:TLBO算法的最大迭代次数为200,学生数量为30;IPINAW的最大最小值分别设置为0.4和0.1,INAD的最大最小值分别为0.25和0.05,这两个指标的最小值可以根据经验设置,最大值一般为最小值的2-4倍,三个指标的初始参考满意度值均设置为0.9。

请见图1,本发明首先利用改进ASD对原始风功率序列进行分解,然后计算各个子序列的样本熵值,样本熵分布如附图2所示,其中实线代表原始序列的样本熵。

根据样本熵将子序列按照下列规则进行分类重组:明显低于原始序列的子序列为一组构成趋势分量,即图中子序列1-3、5;样本熵明显高于原始序列的子序列构成随机分量,即图中子序列10;原始序列样本熵值附近阈值γ内的子序列构成循环分量,即图中子序列4、6-9,其中γ的值根据样本熵分布的具体情况确定,图中为0.1。

经过处理,重组后的子序列分布图如附图3所示(这里以3天的数据进行说明)。可以看出,经过处理的子序列具有一定的规律性,趋势分量反映了原始序列的整体走向,循环分量具有一定的周期性,而随机分量则反映了风功率的随机波动情况。

对于每一个子序列,利用技术方案中步骤3所述方法进行预测,然后将所有子序列的预测结果相加即可得到最终预测概率区间,预测概率区间分布如附图4所示。由附图4可以看出,本发明方法能有效预测出风功率波动区间,即大部分实测数据都位于预测区间以内,具体的可靠性和清晰度是多少则需要进行详细的指标分析。表1给出了风电场六个月份的数据仿真结果,其中参考置信水平为80%。

表1不同月份数据的预测结果

从表1可以看出本发明方法的整体置信水平比较接近预设的置信水平,其中2月份的置信度等于额定置信水平,说明本方法的可靠性较优。从PINAW和NAD两个指标来看,区间宽度的平均值为0.250,且归一化偏差平均值仅为0.004,说明预测区间清晰度较好。为了进一步验证本发明的稳定性和优越性,用一个季度的数据进行了多组仿真,表2给出了不同方法在不同预测时间尺度以及不同参考置信水平下的仿真结果。

表2不同置信水平多步预测结果

由表2可以看出:从指标IPICP来看(指标越接近PINC越好),本发明方法均非常接近PINC,说明可靠性较高;指标IPINAW和INAD(指标均为越小越好)的平均值分别为0.208和0.005,清晰度良好。此外,还可以看出PINC越高,则PINAW越大,NAD越小,这是因为一般区间覆盖概率越大,相应的区间宽度也就越宽,对应的区间累计误差通常越小。

应当理解的是,本说明书未详细阐述的部分均属于现有技术。

应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

再多了解一些
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1