一种基于自适应多变量非参数核密度估计的多风电场出力相关性建模方法与流程

文档序号:11583118阅读:353来源:国知局
一种基于自适应多变量非参数核密度估计的多风电场出力相关性建模方法与流程

本发明一种基于自适应多变量非参数核密度估计的多风电场出力相关性建模方法,属于多维变量相关性研究技术领域。



背景技术:

随着我国风电能源的日益普及,大规模的风电并网已成趋势,随之带来的是大量的不确定性因素。受地区、环境特性的影响,多个风电场的出力特性可能存在一定程度的概率相关性。因此,在电力系统运行控制过程中,有必要考虑多个风电场之间的相关性,并对其进行联合概率建模,以提高系统的运行效率及安全稳定性。

由于可用于表征多个随机变量之间的概率相关特性,copula理论是目前研究多个风电场出力相关性最常用的方法。从现有研究来看,基于copula函数的多风电场出力相关性建模方法本质上是一种参数估计方法。然而,这种参数估计方法过分依赖于对概率密度函数形式的先验界定:一方面,一旦模型选择错误,则无论参数估计如何精确都无法得到准确的建模结果,虽然有学者为提高建模精度对所有形式的copula函数都进行参数估计计算,然后从中选取最精确的风电场联合概率模型,但这种做法无疑增加了建模方法的复杂程度;另一方面,现在风电场数量众多,且不同风电场的联合概率特性有可能服从不同的概率密度形式,而这种基于copula函数的建模方法难以保证其普遍适用性。



技术实现要素:

针对现有技术的不足,本发明提供一种基于自适应多变量非参数核密度估计的多风电场出力相关性建模方法,这种方法无需对多风电场联合概率服从何种标准的分布形式进行先验判断,因而具有更高的建模精度和实用性。而基于最优带宽矩阵调整模型的自适应改进策略,较好的解决了现有多变量非参数核密度估计局部精度较低的问题,进一步提高了建模精度。

本发明采取的技术方案为:一种基于自适应多变量非参数核密度估计的多风电场出力相关性建模方法,包括以下步骤:

步骤1,风电场多变量非参数核密度估计模型的建立:

已知m个风电场在采样周期内,每个风电场均有n个出力数据样本,且第i采样点的有功功率向量xi:

xi=[xi1,xi1,…,xim]t(1)

m个风电场的出力随机变化x:

x=[x1,x1,…,xm]t(2)

它们的联合概率密度函数为:

f(x)=f(x1,x1,…,xm)(3)

则此联合概率密度函数的多变量核密度估计模型为:

式中:h称为带宽矩阵,是一个m×m维的对称正定矩阵,n表示样本个数,x表示风电场的历史出力随机变化,k()表示多变量核函数,并且必须满足下列条件:

式中:r是实数集合,i是整数集合。

对于多变量非参数核密度估计建模而言,带宽矩阵选取是直接影响建模精度的最重要因素,而带宽矩阵一般通过构建带宽优化模型进行求解,由于带宽矩阵中的元素数目较多,因此计算复杂性远远大于单变量核密度估计,为减小计算复杂程度,对公式(4)作如下简化:

式中:h1,h2,…,hm是每个样本点对应的带宽。h(x)的具体形式如公式(7)所示:

步骤2,带宽优化模型的建立:

多变量非参数核密度估计模型中,带宽矩阵h的选择会直接影响所建模型的精度和平滑性,若h值过大,则可能导致概率密度函数平滑性过高,从而引起较大估计误差;若h值过小,虽然可以提高估计精度,但可能导致概率密度函数的波动性(尤其是概率密度曲线的尾部)过高。

综上,本发明提出了两种带宽评价指标:欧式距离和最大距离。前者主要用于评估模型的精确性,后者则是用于评估其平滑性。

设f(x)是风功率样本的累积分布函数,欧式距离定义为

式中:dji(h)为第i个样本点的几何距离,是第i个样本点的核密度函数值,f(xi)是第i个样本点的累积分布函数值。

最大距离定义为

结合公式(6)和(7),构建兼顾模型精确性和平滑性的带宽优化模型:

minr(h)=min[do(h)+dm(h)](10)

式中:r(h)是多变量非参数核密度估计的适应度函数。

步骤3,构建基于序优化的风电场自适应多变量非参数核密度估计模型带宽求解方法。

步骤1包括以下步骤:

步骤1.1:对样本区间的适应度进行判别,在利用带宽优化模型求得最优带宽矩阵hz后,对于样本区间的适应度进行判别,对于任意样本区间l∈[l1,l2](其中l2>l1且l1,l2∈[1,n]),如果满足以下不等式,则称该样本区间存在局部适应性问题,

式中:djl(hz)为任意样本区间l内的几何距离,为整个样本空间的平均几何距离,λ为调节系数。λ越小,即筛选越严格,所需调节的区间也越多,虽然提高了建模精度但会极大增加模型的求解复杂度;λ越大,则会降低求解复杂度,但模型精度也会随之下降,具体取值可根据实际测试情况确定。

其中平均几何距离的数学表达方式为:

步骤1.2:针对上述存在局部适应性问题的区间,构建带宽调整模型,对带宽矩阵进行修正:

式中:hl为l样本区间的带宽,nl为样本区间内样本的个数,dj(hz)mid为样本区间内几何距离的中位数,δ为核函数阀值。

步骤1.3:构建风电场自适应多变量非参数核密度估计模型:

式中:需要调整的样本区间个数为k,为区间lk的修正带宽矩阵。h(x)的具体形式与式(7)类似。ωi为量测权重。本发明采用如下的量测权重ωi公式:

式中:α为一很小的正数;si为第i个量测标准差;为全部量测标准差的几何平均值。

步骤3包括以下步骤:

步骤3.1:在带宽矩阵h的解空间中,依照均匀分布,抽取n个带宽矩阵构成求解空间ω,n的个数与解空间的大小密切相关,研究表明,在解空间小于108时,n的个数一般选1000;

步骤3.2:以式(8)为粗糙模型,对n个可行解进行评价,并根据评估结果进行排序,构造可行解曲线。

步骤3.3:利用公式(14)确定观测解集s中解的个数s,

式中:s为观测解集s中解的个数;t表示选定集合中至少有t个真实足够好解;g代表了n个可行解中足够好解子集中的真实足够好解数;ε、μ、η是对应opc曲线和误差分布下的回归参数,具体值由可行解曲线试验得出。

步骤3.4:以公式(10)的目标函数为精确模型,对解集s中的解进行序比较,选取前t个解为真实足够好的解;

步骤3.5:根据式(11)查找模型中精度低的区间,并利用之前求出来的最优解和式(13)对局部带宽进行调节。

本发明一种基于自适应多变量非参数核密度估计的多风电场出力相关性建模方法,优点在于:

1:通过对局部样本区间的带宽进行自适应调整,可以有效提升多变量非参数核密度估计方法的整体建模精度。

2:多变量非参数核密度估计方法,比传统参数估计方法具有更好的精确性和适应性,其原因是前者无需对样本数据的分布形式进行先验判断,而直接利用样本数据对其概率特性进行建模。

3:本发明提出的求解算法,可以有效保证自适应多变量非参数核密度估计模型带宽求解的计算效率和精度,具有较高的有效性。

附图说明

图1为风电场1号风电场历史数据曲线图。

图2为风电场2号风电场历史数据曲线图。

图3为风电场3号风电场历史数据曲线图。

图4为风电场4号风电场历史数据曲线图。

图5为风电场5号风电场历史数据曲线图。

图6为风电场6号风电场历史数据曲线图。

图7为1号风电场的联合频率直方图和联合概率函数图。

图8为2号风电场的联合频率直方图和联合概率函数图。

具体实施方式

一种基于自适应多变量非参数核密度估计的多风电场出力相关性建模方法,包括以下步骤:

步骤1,风电场多变量非参数核密度估计模型的建立:

已知m个风电场在采样周期内,每个风电场均有n个出力数据样本,且第i采样点的有功功率向量xi:

xi=[xi1,xi1,…,xim]t(17)

m个风电场的出力随机变化x:

x=[x1,x1,…,xm]t(18)

它们的联合概率密度函数为:

f(x)=f(x1,x1,…,xm)(19)

则此联合概率密度函数的多变量核密度估计模型为:

式中:h称为带宽矩阵,是一个m×m维的对称正定矩阵,n表示样本个数,x表示风电场的历史出力随机变化,k()表示多变量核函数,并且必须满足下列条件:

式中:r是实数集合,i是整数集合。

对于多变量非参数核密度估计建模而言,带宽矩阵选取是直接影响建模精度的最重要因素,而带宽矩阵一般通过构建带宽优化模型进行求解,由于带宽矩阵中的元素数目较多,因此计算复杂性远远大于单变量核密度估计,为减小计算复杂程度,对公式(4)作如下简化:

式中:h1,h2,…,hm是每个样本点对应的带宽。h(x)的具体形式如公式(7)所示:

步骤2,带宽优化模型的建立:

多变量非参数核密度估计模型中,带宽矩阵h的选择会直接影响所建模型的精度和平滑性,若h值过大,则可能导致概率密度函数平滑性过高,从而引起较大估计误差;若h值过小,虽然可以提高估计精度,但可能导致概率密度函数的波动性(尤其是概率密度曲线的尾部)过高。

综上,本发明提出了两种带宽评价指标:欧式距离和最大距离。前者主要用于评估模型的精确性,后者则是用于评估其平滑性。

设f(x)是风功率样本的累积分布函数,欧式距离定义为

式中:dji(h)为第i个样本点的几何距离,是第i个样本点的核密度函数值,f(xi)是第i个样本点的累积分布函数值。

最大距离定义为

结合公式(6)和(7),构建兼顾模型精确性和平滑性的带宽优化模型:

minr(h)=min[do(h)+dm(h)](26)

式中:r(h)是多变量非参数核密度估计的适应度函数。

步骤3,构建基于序优化的风电场自适应多变量非参数核密度估计模型带宽求解方法。

步骤1包括以下步骤:

步骤1.1:对样本区间的适应度进行判别,在利用带宽优化模型求得最优带宽矩阵hz后,对于样本区间的适应度进行判别,对于任意样本区间l∈[l1,l2](其中l2>l1且l1,l2∈[1,n]),如果满足以下不等式,则称该样本区间存在局部适应性问题,

式中:djl(hz)为任意样本区间l内的几何距离,为整个样本空间的平均几何距离,λ为调节系数。λ越小,即筛选越严格,所需调节的区间也越多,虽然提高了建模精度但会极大增加模型的求解复杂度;λ越大,则会降低求解复杂度,但模型精度也会随之下降,具体取值可根据实际测试情况确定。

其中平均几何距离的数学表达方式为:

步骤1.2:针对上述存在局部适应性问题的区间,构建带宽调整模型,对带宽矩阵进行修正:

式中:hl为l样本区间的带宽,nl为样本区间内样本的个数,dj(hz)mid为样本区间内几何距离的中位数,δ为核函数阀值。

步骤1.3:构建风电场自适应多变量非参数核密度估计模型:

式中:需要调整的样本区间个数为k,为区间lk的修正带宽矩阵。h(x)的具体形式与式(7)类似。ωi为量测权重。本发明采用如下的量测权重ωi公式:

式中:α为一很小的正数;si为第i个量测标准差;为全部量测标准差的几何平均值。

步骤3包括以下步骤:

步骤3.1:在带宽矩阵h的解空间中,依照均匀分布,抽取n个带宽矩阵构成求解空间ω,n的个数与解空间的大小密切相关,研究表明,在解空间小于108时,n的个数一般选1000;

步骤3.2:以式(8)为粗糙模型,对n个可行解进行评价,并根据评估结果进行排序,构造可行解曲线。

步骤3.3:利用公式(14)确定观测解集s中解的个数s,

式中:s为观测解集s中解的个数;t表示选定集合中至少有t个真实足够好解;g代表了n个可行解中足够好解子集中的真实足够好解数;ε、μ、η是对应opc曲线和误差分布下的回归参数,具体值由可行解曲线试验得出。

步骤3.4:以公式(10)的目标函数为精确模型,对解集s中的解进行序比较,选取前t个解为真实足够好的解;

步骤3.5:根据式(11)查找模型中精度低的区间,并利用之前求出来的最优解和式(13)对局部带宽进行调节。

实施例:

本发明以湖北省某地六个风电场同一时间段内风电出力的4773个采样序列作为算例,依次编号[1,4773]。采样时间间隔为10min,采样周期为2009年3月17日19:40至2009年4月19日23:00。在matlab环境下进行算例仿真。分别针对其中的2个、3个风电场构建其3维、4维联合概率密度函数,并进行对比分析。

由图1~图6可知,大部分时间段内,1、2、3三个风电场风电出力存在不稳定的相关特性,且正相关性较强,即同增同减。在4、5、6三个风电场中,风电场4和风电场6存在较强的正相关性,而风电场5只在前1300个采样点内与它们存在较强的正相关性。可见,1、2、3三个风电场的联合分布情况和4、5、6三个风电场的联合分布情况存在一定的差异。1号、2号风电场的出力具有尾部相关性,下尾相关性较弱,即风电出力同时较小的概率较小,上尾相关相对较强,即风电出力同时较大的概率较大。从所构建模型的函数曲线可以看出,所构建的概率密度模型较好的拟合了1、2号风电场的联合分布情况。

利用本发明提出的自适应多变量非参数核密度估计方法,构建1号、2号风电场的联合概率密度函数,并将其与基于样本数据的累积分布直方图进行对比,如图7、图8所示。详细计算结果如表1所示。

表11号、2号风电场联合建模的运行结果

tab.1theoperationresultsofjointmodelingofwindfarmno.1andno.2

由表1可知,采用本发明方法构建的1、2号风电场联合概率密度模型具有较低的建模误差,总体适应度仅为0.0932。由此可见,本发明所提方法对于2个风电场的联合概率密度函数具有较高的建模精度。

为保证算例结果的一般性,本发明构造针对三个风电场的4维联合概率密度函数,并在此基础上进行对比性研究。

1)多变量非参数核密度估计改进前后的有效性分析:

为验证本发明方法与传统多变量非参数核密度估计法的区别,利用改进前后的方法分别对1、2、3号风电场的联合概率密度进行建模,其结果如表2所示。

表21号、2号、3号风电场联合建模的运行结果

tab.2theoperationresultsofjointmodelingofwindfarmno.1、no.2andno.3

由表2可知,利用本发明方法,所建模型的欧式距离较传统方法减少了0.008,最大距离减少了0.0016,总体适应度降低了9.8%,可见,本发明提出的改进方法有效提升了多变量非参数核密度估计方法的建模精度。

进一步分析可以发现,与传统方法不同,本发明提出的方法对第1-473号样本和4300-4773号样本的带宽进行了自适应修正,从而使相应样本区间的欧式距离分别下降0.003和0.005,由于本发明方法修正了两个误差较大的样本区间,从而促使模型的最大距离较传统方法下降了0.0016。由此可见,通过对存在局部适应性问题的样本区间的带宽进行自适应调整,可以有效提升多变量非参数核密度估计方法的总体建模精度。

2)自适应多变量非参数核密度估计和copula参数估计的精确性对比:

为验证本发明方法的精确性,利用综合copula法对1、2、3号风电场进行联合概率密度建模,并将其结果与本发明方法的建模结果对比,详细结果如表3所示。其中最优综合copula函数由gumbelcopula、claytoncopula和frankcopula组成。

表31号、2号、3号风电场联合建模的运行结果

tab.3theoperationresultsofjointmodelingofwindfarmno.1、no.2andno.3

由表3可知,利用本发明方法,所建模型的欧式距离较综合copula方法减少了0.031,最大距离减少了0.013,总体适应度降低了27.2%,可见,本发明提出的自适应多变量非参数核密度估计方法与copula函数法相比具有更高的建模精度。其原因是,由于本发明方法是基于样本数据直接对联合概率分布进行建模,无需提前选择样本分布的具体形式,而建模精度仅和带宽选择有关,不依赖于先验分布形式的选择结果。

3)自适应多变量非参数核密度估计和copula参数估计的适用性对比:

为验证本发明方法的适用性,依次利用本发明方法和文献[10]的综合copula法对4、5、6三个风电场进行联合概率密度建模。最优综合copula函数依然由gumbelcopula、claytoncopula和frankcopula组成。详细的结果对比如表4所示。

表44号、5号、6号风电场联合建模的运行结果

tab.4theoperationresultsofjointmodelingofwindfarm4,no.5andno.6

由表4可知,针对不同的风电场,本发明提出的方法依然保持了较高的建模精度,相对于1、2、3号风电场的建模结果,总体适应度小幅增加了0.0041。而综合copula法的误差增加较多,为0.044,增加幅度为本发明方法的10.73倍。可见,本发明所提方法与copula参数估计法相比具有较高的适用性。其原因是由于后者需要对联合概率分布的形式进行先验界定,而不同的风电场的联合概率分布可能服从不同的分布形式,如果利用相同的分布函数来对不同风电场的联合概率分布进行参数估计建模,则有可能出现较大的误差。

4)基于序优化的带宽求解算法的有效性分析。

为分析本发明提出的序优化算法的计算效率,分别采用ga、pso和序优化算法对本发明的带宽优化模型进行求解,其计算结果如表5所示。

表54号、5号、6号风电场联合建模的运行结果

tab.5theoperationresultsofjointmodelingofwindfarm4,no.5andno.6

由表5可知,本发明提出的求解算法和传统的ga和pso算法相比,计算精度差别较小,但在计算效率方面具有显著优势。可见本发明提出的求解算法可以有效保证自适应多变量非参数核密度估计模型带宽求解的计算效率和精度,具有较高的有效性。

本发明按照优选实施例进行了说明,但上述实施例不以任何形式限定本发明,凡采用等同替换或等效变换的形式所获得的技术方案,均落在本发明技术方案的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1