本发明属于新能源发电领域,具体涉及一种区域风电功率概率预报方法及系统。
背景技术:
风能资源具有波动性和间歇性的特点导致对其预测的精度有限,因此需要在电力市场和电力调度的决策当中考虑风电变量不确定性分布以得到更加经济合理的结果。因此,能反映功率预报不确定性的概率预报方法得到了广泛的研究。当研究对象是区域多个风电场的预报功率时,高维随机向量中的各个随机变量之间存在着复杂的相关关系,如何精确的拟合这一相关结构关系到了随机向量的多元分布的拟合效果,进而影响到提取的条件概率预报的准确度。
传统的相关建模方法采用gaussiancopula模型进行构建,但是其选用的拟合函数单一,对于复杂相关性的建模精度不足。
传统的概率预报方法,在进行区域总功率概率预报时,满足目标点条件的样本数量有限,概率预报的效果不佳。
技术实现要素:
本发明选择r-vinecopula函数进行相关性建模,提高建模精度,并根据相关性模型得到联合概率分布模型用于风电场功率的概率预报中来,提高工作效率。
本发明提供的一种区域风电功率概率预报方法,包括:
采集目标时刻风电场的预报功率;
从基于预先构建的联合概率分布模型得到的模拟样本集中筛选出符合目标时刻风电场预报功率等级的条件样本集;
对所述条件样本集进行拟合得到条件概率分布函数;
基于所述条件概率分布函数提取概率预报区间和分位数预报集合。
所述联合概率分布模型的构建,包括:
基于风电场的历史数据,构建随机向量;
对随机向量的随机变量进行边缘分布拟合,得到边缘累积分布函数;
根据边缘累积分布函数和随机向量得到相关性向量;
根据相关性向量,确定r-vinecopula模型;
根据r-vinecopula模型和各随机变量的边缘累积分布函数得到的联合概率分布模型;
所述历史数据包括:历史预报功率和历史预报误差。
所述基于风电场的历史数据,构建随机向量,包括:
以所述历史数据中的同一时刻的数据为一行构建包括t个时刻数据的矩阵,将所述矩阵用随机向量表示。
所述根据相关性向量,确定r-vinecopula模型,包括:
计算相关性向量中两两变量间的kendall秩相关系数;
选择满足kendall秩相关系数总和最大化生成树结构;
为生成树中每个边确定二元copula函数并进行参数估计。
所述基于预先构建的联合概率分布模型得到模拟样本集,包括:
任意生成满足均匀分布的独立随机向量;
根据所述独立随机向量结合所述r-vinecopula模型生成相关性的随机向量;
根据边缘累积分布函数的反函数,从相关性的随机向量求得目标随机向量,以所述目标随机向量为模拟样本集。
对所述条件样本集进行拟合、以及对所述随机向量的随机变量进行边缘分布拟合均采用核密度估计的方法。
本发明提供的一种区域风电功率概率预报系统,包括:
模型构建模块,用于预先构建联合概率分布模型;
采集模块,用于采集目标时刻的风电场的预报功率;
条件样本模块,用于从基于预先构建的联合概率分布模型得到的模拟样本集中筛选出符合目标时刻风电场预报功率的条件样本集;
拟合模块,用于对所述条件样本集进行拟合得到条件概率分布函数;
预报模块,用于基于所述条件概率分布函数提取概率预报区间和分位数预报集合。
所述模型构建模块,包括:
随机向量单元,用于基于风电场的历史数据,构建随机向量;
边缘分布拟合单元,用于对随机向量的随机变量进行边缘分布拟合,得到边缘累积分布函数;
相关性向量单元,用于根据边缘累积分布函数和随机向量得到相关性向量;
r-vinecopula模型单元,用于根据相关性向量,确定r-vinecopula模型;
联合概率分布模型单元,用于根据r-vinecopula模型和各随机变量的边缘累积分布函数得到的联合概率分布模型;
所述历史数据包括:历史预报功率和历史预报误差。
所述条件样本模块,包括:
第一生成单元,用于任意生成满足均匀分布的独立随机向量;
第二生成单元,用于根据所述独立随机向量结合r-vinecopula模型生成相关性的随机向量;
样本确定单元,用于根据边缘累积分布函数的反函数,从相关性的随机向量求得目标随机向量,以所述目标随机向量为模拟样本集;
筛选单元,用于从所述模拟样本集中筛选出符合目标时刻风电场预报功率的条件样本集。
所述r-vinecopula模型单元,包括:
系数计算子单元,用于计算相关性向量中两两变量间的kendall秩相关系数;
生成树子单元,用于选择满足kendall秩相关系数总和最大化生成树结构;
模型确定子单元,用于为生成树中每个边确定二元copula函数并进行参数估计。
与最接近的现有技术比,本发明提供的技术方案具有以下有益效果:
本发明提供的技术方案,根据建立联合概率分布模型,提取满足风电功率概率预测条件的条件样本集,根据条件样本集构建条件概率分布函数,大大降低了计算难度,提高了工作效率;
本发明提供的技术方案,采用r-vinecopula函数可以实现高维相关结构的拆分以及多种二元copula函数的选取拟合,从而提高相关性建模的灵活性和精确度。
附图说明
图1为本发明一种区域风电功率概率预报方法流程图;
图2为本发明实施例一种区域风电功率概率预报方法整体流程图。
具体实施方式
下面结合附图对本发明做进一步详细的说明:
实施例一:
图1为本发明一种区域风电功率概率预报方法流程图,如图1所示,本发明提供的一种区域风电功率概率预报方法,可以包括:
采集目标时刻风电场的预报功率;
从基于预先构建的联合概率分布模型得到的模拟样本集中筛选出符合目标时刻风电场预报功率等级的条件样本集;
对所述条件样本集进行拟合得到条件概率分布函数;
基于所述条件概率分布函数提取概率预报区间和分位数预报集合。
所述联合概率分布模型的构建,包括:
基于风电场的历史数据,构建随机向量;
对随机向量的随机变量进行边缘分布拟合,得到边缘累积分布函数;
根据边缘累积分布函数和随机向量得到相关性向量;
根据相关性向量,确定r-vinecopula模型;
根据r-vinecopula模型和各随机变量的边缘累积分布函数得到的联合概率分布模型;
所述历史数据包括:历史预报功率和历史预报误差。
所述基于风电场的历史数据,构建随机向量,包括:
以所述历史数据中的同一时刻的数据为一行构建包括t个时刻数据的矩阵,将所述矩阵用随机向量表示。
所述根据相关性向量,确定r-vinecopula模型,包括:
计算相关性向量中两两变量间的kendall秩相关系数;
选择满足kendall秩相关系数总和最大化生成树结构;
为生成树中每个边确定二元copula函数并进行参数估计。
所述基于预先构建的联合概率分布模型得到模拟样本集,包括:
任意生成一个满足均匀分布的独立随机向量;
根据所述独立随机向量结合所述r-vinecopula模型生成相关性的随机向量;
根据边缘累积分布函数的反函数,从相关性的随机向量求得目标随机向量,以所述目标随机向量为模拟样本集。
对所述条件样本集进行拟合、以及对所述随机向量的随机变量进行边缘分布拟合均采用核密度估计的方法。
实施例二:
基于相同的发明构思,本发明提供的一种区域风电功率概率预报系统,可以包括:
模型构建模块,用于预先构建联合概率分布模型;
采集模块,用于采集目标时刻的风电场的预报功率;
条件样本模块,用于从基于预先构建的联合概率分布模型得到的模拟样本集中筛选出符合目标时刻风电场预报功率的条件样本集;
拟合模块,用于对所述条件样本集进行拟合得到条件概率分布函数;
预报模块,用于基于所述条件概率分布函数提取概率预报区间和分位数预报集合。
所述模型构建模块,包括:
随机向量单元,用于基于风电场的历史数据,构建随机向量;
边缘分布拟合单元,用于对随机向量的随机变量进行边缘分布拟合,得到边缘累积分布函数;
相关性向量单元,用于根据边缘累积分布函数和随机向量得到相关性向量;
r-vinecopula模型单元,用于根据相关性向量,确定r-vinecopula模型;
联合概率分布模型单元,用于根据r-vinecopula模型和各随机变量的边缘累积分布函数得到的联合概率分布模型;
所述历史数据包括:历史预报功率和历史预报误差。
所述条件样本模块,包括:
第一生成单元,用于任意生成满足均匀分布的独立随机向量;
第二生成单元,用于根据所述独立随机向量结合r-vinecopula模型生成相关性的随机向量;
样本确定单元,用于根据边缘累积分布函数的反函数,从相关性的随机向量求得目标随机向量,以所述目标随机向量为模拟样本集;
筛选单元,用于从所述模拟样本集中筛选出符合目标时刻风电场预报功率的条件样本集。
所述r-vinecopula模型单元,包括:
系数计算子单元,用于计算相关性向量中两两变量间的kendall秩相关系数;
生成树子单元,用于选择满足kendall秩相关系数总和最大化生成树结构;
模型确定子单元,用于为生成树中每个边确定二元copula函数并进行参数估计。
所述随机向量单元包括:
以同一时刻的数据为一行构建包括t个时刻数据的矩阵,将所述矩阵用随机向量表示。
实施例三:
一种区域风电功率概率预报方法,可以包括:
构建r-vinecopula模型和基于r-vinecopula模型进行风电功率概率预报;
图2为一种区域风电功率概率预报方法整体流程图,如图2所示,所述构建r-vinecopula模型,可以包括:
步骤1-1:输入d维样本[x1,...,xd]=[p1,...,pn,e1,...,en];
步骤1-2:对样本中的元素进行边缘拟合得到拟合的边缘累积分布函数;
步骤1-3:去除[x1,...,xd]中边缘分布的影响得到d维样本数据[u1,…,ud];
步骤1-4:基于d维样本数据[u1,…,ud],根据相关系数最大化原则筛选出最大生成树,并得到树中的相关变量对;检验相关变量对是否独立,是则判断所有树是否都生成了,否则筛选出树需要的二元copula函数并进行参数估计后判断所有树是否都生成了,若所有树都生成,则r-vinecopula模型构建完成,若未完成所有树的生成则重复此步骤,直至所有树都生成。
在所有树都生成之后,可以基于r-vinecopula模型进行风电功率概率预报步骤,其中,所述基于r-vinecopula模型进行风电功率概率预报,可以包括:
步骤2-1:基于r-vinecopula模型,通过随机采样的方法得到模拟样本集s;
步骤2-2:根据概率预报条件在s中筛选符合预报目标点的样本;
步骤2-3:对筛选出的样本进行条件概率密度分布拟合,输出条件概率密度函数。
具体的:
步骤1-1:输入d维样本[x1,...,xd]=[p1,...,pn,e1,...,en]中的d维样本的生成可以包括:
需要建模的对象是区域内各个风电场的预报功率p以及预报误差e,(5-1)给出了n个风电场的示例,其中矩阵中每一行对应同一时间的数据,根据样本集大小共有t个时刻的数据,每一列对应的随机变量由大写的p和e表示,为了表述方便统一表示为d维的随机向量x=(x1,…,xd)。
步骤1-2:对样本中的元素进行边缘拟合得到拟合的边缘分布模型,可以包括:
考虑到各边缘变量难以确定一个统一的参数分布且经验分布函数是非连续的,本方法采用核密度估计的非参数分布进行边缘分布的拟合,拟合的概率密度函数如式(5-2)所示。
其中,h为带宽,k表示核函数,此处本发明采用高斯核,表达式如式(5-3)所示,n表示样本量,x表示样本数据。
步骤1-3:去除[x1,...,xd]中边缘分布的影响得到d维样本数据[u1,…,ud],可以包括:
相应的根据估计的边缘累积分布函数
通过边缘累积分布函数将x转化为u,剥离边缘分布的影响,仅考虑相关结构如式
其中,
步骤1-4:基于d维样本数据[u1,…,ud],根据相关系数最大化原则筛选出最大生成树,并得到树中的相关变量对,检验相关变量对是否独立,是则判断所有树是否都生成了,否则筛选出树需要的二元copula函数并进行参数估计后判断所有树是否都生成了,若所有树都生成,则r-vinecopula模型构建完成,若未完成所有树的生成则重复此步骤,直至所有树都生成,可以包括:
根据上一步中得到的u,确定相应的r-vinecopula需要完成以下三项工作:
1.选择r-vine结构,即给出各树的约束条件集合{j(e),k(e)d(e)}。
2.给r-vine中每个边e对应的二元随机变量选择合适的二元copula类型。
3.估计各二元copula函数的参数。
以上三项在实际应用中常常是结合在一起进行的,根据逐次法来逐棵树的实现对r-vinecopula的构建。其算法流程如下:
基于模型计算成本的考虑,在进行二元copula拟合和参数估计之前,引入独立性检验,对于接近独立的随机变量对则直接采用独立的copula函数,根据显著程度的大小控制对应模型的计算复杂度和精确度。
具体的,基于r-vinecopula模型进行风电功率概率预报可以包括:
根据r-vinecopula模型得到联合概率分布函数,联合概率分布函数虽然是连续解析的数学表达式,然而,在进行区域总功率概率预报时,计算的对象需要经过多重积分计算得到,而在积分函数复杂的情况下进行积分计算难度很大,不具备工程实用意义,因此,考虑根据所得的联合概率分布函数生成足够数量的数据样本来拟合出满足条件的条件概率密度结果。
首先,由计算机任意生成一个满足均匀分布u(0,1)d的d维独立随机向量w:=(w1,...,wd)。
然后通过(5-4)生成相关性的随机向量
最后,根据拟合的各边缘累计分布函数的反函数,即
根据r-vinecopula模型得到联合概率分布函数,可以包括:
规则藤(regularvine,r-vine)v是d个元素的规则藤,它的边的集合表示为e(v)=e1∪…∪ei∪…∪ed-1,其中ei,i=1,…,d-1代表了第i棵树ti的边的集合。规则藤需要满足以下三个条件:
4)v={t1,…,td-1},即d-1个树构成的集合。
5)t1的节点集合为n1={1,…,d},边集合为e1;而对于i=2,…,d-1,ti的节点集合为ni,边集合为ei,需要满足条件ni=ei-1。
6)(邻近原则)对于i=2,…,d-1,{a,b}∈ei,#(a△b)=2,其中△表示计算集合的对等差分,#表示计算集合的势。
7)维度为d的规则藤v由d-1棵树{t1,…,td-1}构成,其节点集合为{n1,…,nd-1},其中集合n1={1,…,d},在相关性建模中对应初始的d个随机变量的编号。v的边集合表示为{e1,…,ed-1},树ti的边集合ei中的一个边e可以表示为e=j(e),k(e)|d(e)的形式,其中{j(e),k(e),j(e)≠k(e)}称为conditioned集合,而d(e)称为conditioning集合,这两个集合中的元素由{1,…,d}构成。根据邻近原则,e由ei-1中对应的两个边a=j(a),k(a)|d(a),b=j(b),k(b)|d(b)决定,a和b在ti-1中有一个公共的节点,则三个边的关系就表述成了如下两个关系
d(e):=u(a)∩u(b)(3-4)
{j(e),k(e)}:=u(a)∪u(b)\d(e),(3-5)
其中,u(e):={j(e),k(e),d(e)}表示e所含元素的全集,囊括了conditioning集合和conditioned集合中的所有元素。此外,对于e1中的边来说,其形式为e=j(e),k(e),因为此时的conditioning集合d(e)是空集。
当边的标记规则明确后,则e对应的二元copula密度就可以表示为cj(e),k(e)|d(e)。
结合上述内容,给出规则藤结构描述的多维联合密度分布的公式:
其对应d维随机变量x:=(x1,...,xd),边缘累积分布函数为fk,k=1,...,d,xd(e)表示x由d(e)规定的子集。其中,公式里第i棵树中的某一个二元copula中的变量——条件分布函数f(xj(e)|xd(e))和f(xk(e)|xd(e))可以通过第i-1棵树中已经估计好参数的copula函数c和相应的条件分布函数f计算得到。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用于说明本发明的技术方案而非对其保护范围的限制,尽管参照上述实施例对本申请进行了详细的说明,所属领域的普通技术人员应当理解:本领域技术人员阅读本申请后依然可对申请的具体实施方式进行种种变更、修改或者等同替换,但这些变更、修改或者等同替换,均在申请待批的权利要求保护范围之内。