一种结合神经网络和参数估计的光伏功率区间预测方法与流程

文档序号:16253014发布日期:2018-12-12 00:12阅读:604来源:国知局
一种结合神经网络和参数估计的光伏功率区间预测方法与流程

本发明属于光伏发电功率预测技术领域,特别涉及一种结合深度循环神经网络和参数估计的光伏功率区间预测方法。

背景技术

光伏系统发电由于受天气情况、昼夜交替和季节变化等外界环境因素的影响而具有波动性和周期性,光伏发电系统大规模接入电网,会对电力系统的安全、稳定运行带来较大的、周期性的冲击。精确的光伏功率预测是保证光伏并网发电安全稳定运行的前提,同时也是对光伏系统发电进行合理分配和调度的重要依据。目前,光伏功率的预测主要分为两个方向:确定性预测和不确定预测。确定性预测的目的是为了得到具体的光伏功率预测值,是一种单点预测。不确定性预测在确定性预测的基础上,提供预测结果的可能变化范围及可信度信息,是一种概率预测。

在确定性研究方向,主要的研究方法可以概括为以下2类:一类是以时间序列法为代表的传统方法,如自回归移动平均模型(autoregressiveintergratedmovingmodel,arima);另一类是以人工神经网络法为代表的新型人工智能方法如人工神经网络(artificialneuralnetwork,ann)、极限学习机(limitlearningmachine,elm)等;机器学习方法主要有支持向量机(supportvectormachine,svm)、随机森林(randomforest,rf)等。目前的这些确定性预测方法都存在着一些不足,对于时间序列法来说,该方法虽然能在一定程度上反映出光伏功率随时间变化的规律,但是无法利用到影响光伏功率变化的外界因素,当外界环境因素变化较大时,预测会存在较大的误差;对于传统的神经网络方法来说,模型的参数过多,模型训练困难;对于机器学习方法来说,该方法通过大量历史数据建立输入变量与输出变量之间的非线性关系,将动态时间建模问题变为静态空间建模问题。但是实际上,作为典型的时间序列,光伏功率不但具有非线性,而且具有动态特性即每一时刻的光伏功率的变化不仅依赖于当前时刻的模型输入,而且与模型过去的输入也有关。具体的可以参考(1)申请号:201510750464.9,名称为一种超短期光伏预测方法;(2)申请号:201610069803.1,名称为一种光伏发电系统的功率预测方法;(3)申请号:201410163590.x,名称为基于复合数归模据源自回型光伏发电功率超短期预测方法;

在不确定性研究方向,光伏功率的区间预测主要有两种思路:一种是统计分析模型的预测误差序列后,对预测误差概率分布进行假设(如正态分布,贝塔分布,柯西分布等),进而得到输出功率在一定置信水平下的波动区间,这种参数估计的方法简单、直观,应用广泛。但是这种方法的预测精度取决于真实的误差分布是否与假设分布一致。另一种方法是给出某一置信水平,研究预测值在该置信水平下的置信区间,用来估计预测值的波动范围,属于非参数统计方法。非参数统计方法,包括分位数回归,bootstrap方法,极限学习机等。分位数回归方法虽避免了对误差分布函数的假设,但仍需要构建复杂的误差预测模型,且变量之间存在高维非线性关系,模型自身误差将增大结果误差,无法反映预测情况。bootstrap方法是一种重采样统计方法,也无需对分布进行假设,但是该方法仅仅利用原始样本数据复制观测信息来进行统计推断,在参数估计上的精度不够高。而且由于要进行大量的重复采样,计算量相对于参数估计的方法偏大。极限学习机虽然运行高效,但是由于只具有单层结构,模型的输出易出现随机波动,稳定性和泛化能力不强。具体地,可参考(4)申请号:cn201611022040.1,名称为一种计及需求响应措施的负荷区间预测方法;(5)申请号:cn201510525036.6,名称为一种基于核极限学习机模型的功率区间预测方法。

首先,为了更全面和准确的反映光伏功率预测结果情况,向电力系统规划的决策者提供更为可靠的决策依据,本发明对确定性和不确定性预测都展开了研究。

其次,为了进一步提高光伏功率的确定性预测精度,本发明提出了一种利用长短期记忆网络的光伏发电功率预测方法。由于长短期记忆网络每一个网络层的参数是共享的。相比传统的神经网络,这种参数共享的方式大大降低了网络中需要学习的参数,在保证精度的前提下极大地缩短了训练时间。其次,该方法相对传统的时间序列方法,在捕捉光伏功率数据序列特征的同时还可以利用到影响光伏功率变化的外界因素。最后,相对于上述所有的确定性预测方法,该方法将当前时刻的光伏功率变化和以前光伏功率的变化之间建立了联系,实现了时间序列数据的动态建模,能更加充分的反映光伏功率的变化规律,实现更为精确的光伏功率预测。

最后,鉴于区间预测方法存在的不足,本发明提出了一种结合深度循环神经网络和参数估计的光伏功率区间预测方法。该方法基于误差数据进行分析,无需构建复杂的误差预测模型,因此避免了其他方法(如分位数回归等)因误差预测模型而引入额外的概率预测误差。同时在方法实现方面,该方法较其他方法更容易操作,具有较强的实用性和较高的推广价值。相比常用的bootstrap方法,该方法不需要进行大量的重复采样,直接基于原有的误差样本进行统计分析,因此该方法运行效率更高,特别是当样本容量很大时,该方法的优势更加明显。



技术实现要素:

本发明的目的是提出一种结合神经网络和参数估计的光伏功率区间预测方法,其特征在于,利用长短期记忆网络的光伏发电功率预测的方法进行提前一天的短期光伏功率预测,其特征向量为[积日,环境温度,环境湿度,风速,太阳辐照度],其中积日从1月1号开始记为1,以此类推12月31日记为365。数据的时间分辨率为一小时,模型目标是输入预测日之前30天每天24个整点时刻的光伏功率数据和天气数据,由预测模型输出预测日当天24个整点时刻对应的光伏功率值和预测值对应的置信区间;具体流程如下:

步骤1:输入数据选取:本方法首先选取预测日之前30天每天24个整点时刻的积日、环境温度、环境湿度、风速、太阳辐照度数据作为光伏功率预测的原始数据;

步骤2:基于辐照度指数进行天气类型聚类:以辐照度指数作为天气类型聚类指标,将辐照度指数记为k,其计算公式如下:

式(1)中,s理论辐照度记为理论辐照度日曲线与坐标轴所围成的面积,s实测辐照度记为实测辐照度日曲线与坐标轴所围成的面积;由式1计算出每天的辐照度指数,利用辐照度指数对预测日之前30天的数据进行聚类,使用k-means聚类算法进行聚类。将预测日前30天的数据进一步聚类为晴天、雨雪天和多云天气三种天气类型;

步骤3:数据归一化:当使用多变量时间序列进行光伏功率预测时,为了消除不同变量之间量纲,数值差别对实验结果的影响,实验中对输入数据进行最大最小值归一化,经过预测模型得到光伏功率预测数据后,再进行反归一化处理使其具有物理意义;

步骤4:建立长短期记忆网络预测模型:长短期记忆网络(long-shorttermmemory,lstm)是一种特殊的循环神经网络(recurrentneuralnetwork,rnn),鉴于普通循环神经网络存在的记忆能力有限问题,因此采用长短期记忆网络作为预测模型,其在保持循环神经网络结构的基础上重新设计了计算单元,每个lstm单元中存在一个细胞cell,cell被视为是lstm的记忆单元,用于描述lstm单元的当前状态;每个lstm单元存在3个控制门,分别是输入门,输出门和遗忘门,三个门分别控制网络的输入、输出以及cell单元的状态;

步骤5:滚动预测:重复前面四个步骤,以次日预测点前30天每天24个整点时刻的光伏功率值和天气数据作为原始数据,进行该预测点的功率预测;

步骤6:计算功率预测的误差序列:基于步骤5得到光伏功率确定性预测的结果,采用相对误差来对确定性预测误差进行统计;

步骤7:对误差的分布特性进行分析,确定误差所服从的分布:根据步骤6进行计算就得到了预测点的逐点相对误差,进而可以统计出晴天、多云和雨雪天三种天气类型下的误差频数统计直方图;

步骤8:根据直方图,假设误差基本上符合正态分布;利用极大似然估计对误差分布的参数进行估计:最大似然估计又称为极大似然估计,是一种重要的参数估计方法,其基本理论是极大似然原理,极大似然估计求解参数的基本过程如下:

(1)写出似然函数;

(2)对似然函数取对数,并整理;

(3)对对数似然函数求导数;

(4)解似然方程;

步骤9:计算在给定置信水平下误差的置信区间,得到置信区间上限和下限以及对应的误差值;在实际应用中,在计算光伏发电系统预测功率的置信区间时,置信度取值过高无实际意义,取值过低则影响预测的精度,所以取值在80%-95%;

步骤10:针对每个时刻的功率预测值,根据误差区间得到预测值置信区间的上下限;

步骤11:将每个时刻的功率预测值的置信区间的上下限分别联结即形成上下2条包络线,得到光伏功率的预测区间。

所述步骤4中鉴于普通循环神经网络存在的记忆能力有限问题是普通的循环神经网络包括输入层、隐藏层、输出层,在隐藏层中有输入到下一时间隐藏层的连接,按时间展开后,能发现当前时刻隐藏层的输入包括两部分,即当前时刻的输入层输入和上一时刻的隐藏层输入;其中,w1,w2,w3分别为输入到隐藏层、隐藏层到隐藏层、隐藏层到输出的权重。对于标准的循环神经网络架构来说,在实践中可联系的“上下文”十分有限,即循环神经网络的记忆能力有限,无法捕捉到较长时间之前的输入和本时刻输入之间的依赖关系,因此循环神经网络存在的记忆能力有限问题。

所述步骤4中记忆单元状态通过非线性函数的运算和输出门的动态控制形成lstm单元的输出,各变量之间的计算公式如下:

ft=σ(wf·[ht-1,xt]+bj)(3)

ot=σ(wo·[ht-1,xt]+bo)(4)

上述式(2)-(8)中:it、ft和ot分别为遗忘门、输入门和输出门;是记忆单元的候选状态值,ct为记忆单元的状态更新值;wi、wf、wc和wc分别对应t时刻输入门it、遗忘门ft、输出门ot以及候选状态值的的权值矩阵。bi、bc、bf、bo为偏置向量;ht为t时刻的隐层状态;σ为激活函数,通常为双曲正切函数或s型曲线函数。

所述步骤5:滚动预测:重复前面四个步骤,以次日预测点前30天每天24个整点时刻的光伏功率值和天气数据作为原始数据,进行该预测点的功率预测;采用均方误差(meansquarederror,mse)作为损失函数,将预测得到的光伏功率结果与真实功率值进行对比,计算损失,其中损失函数均方误差的计算公式如下:

式(9)中pfi为光伏功率的预测值,pi为光伏功率的实测值,n为样本数目

所述步骤6:计算功率预测的误差序列:基于步骤5得到光伏功率确定性预测的结果,本发明采用相对误差来对确定性预测误差进行统计。将相对误差定义为光伏功率的真实值和预测值的差与历史最大功率的比值,如式(10)所示。

式中,p是实际功率值,pr预测功率值,pmax历史功率最大值。

所述步骤8极大似然估计求解,基于步骤6采用相对误差来对确定性预测误差进行统计,所求出的误差分布都不是标准的正态分布,通过最大似然估计求解符合某一种分布的分布参数;假设样本集合d中的数据之间相互独立并且都服从正态分布,现估计参数向量θ,将样本集合d记为:

d={x1,x2,…,xn}(11)

则联合概率密度函数p(d|θ)称为相对于样本集合d的θ的似然函数;

如果是参数空间中能使似然函数l(θ)最大的θ值,则是θ的极大似然估计量。;下面给出如何求解使得样本出现概率最大的θ值。

实际中为了便于分析,定义了对数似然函数:

h(θ)=logl(θ)(14)

在似然函数满足连续可导的条件下,则最大似然估计量就是如下方程的解。

在不同天气类型下的预测相对误差分布均接近正态分布,所以选择正态分布对光伏功率预测误差分布进行拟合;

正态分布又称高斯分布,是一个在各个领域都非常重要的概率分布;若随机变量x服从一个数学期望为μ、方差为б2正态分布,记为x~n(μ,б2);

它的概率密度函数为:

随机变量x服从的正态分布记为x~n(μ,б2)。当μ=0,б2=1时,正态分布就成为标准正态分布,记作x~n(0,1);

其中x是非标准正态分布下的参数,μ为数学期望,б为方差。

所述步骤9计算在给定置信水平下误差的置信区间,在求出误差分布参数后,根据在概率论与数理统计第四版的附表2标准正态分布表,查询到正态分布中85%、90%和95%置信度所对应的区间范围,通过以上计算就能够获得在85%、90%和95%置信水平下,误差的上下限,进而根据误差的上下限,确定光伏功率预测值的波动区间。而且确定实际值是有85%、90%或95%的概率落在该预测区间中的。

本发明有益效果是该方法不需要进行大量的重复采样,直接基于原有的误差样本进行统计分析,将当前时刻的光伏功率变化和以前光伏功率的变化之间建立了联系,实现了时间序列数据的动态建模,能更加充分的反映光伏功率的变化规律,运行效率更高,特别是当样本容量很大时,该方法的优势更加明显;实现更为精确的光伏功率预测。容易操作,具有较强的实用性和较高的推广价值。

附图说明

图1为结合深度循环神经网络和参数估计的光伏功率区间预测方法流程。

图2为循环神经网络结构。

图3为lstm单元的内部结构。

图4为长短期记忆网络预测模型框架。

具体实施方式

本发明提出一种结合神经网络和参数估计的光伏功率区间预测方法,下面结合附图予以说明。

图1所示结合深度循环神经网络和参数估计的光伏功率区间预测方法流程.,本发明利用长短期记忆网络的光伏发电功率预测的方法进行提前一天的短期光伏功率预测,其特征向量为[积日,环境温度,环境湿度,风速,太阳辐照度],其中积日从1月1号开始记为1,以此类推12月31日记为365。数据的时间分辨率为一小时,模型目标是输入预测日之前30天每天24个整点时刻的光伏功率数据和天气数据,由预测模型输出预测日当天24个整点时刻对应的光伏功率值和预测值对应的置信区间。具体流程如下:

步骤1:输入数据选取:本方法首先选取预测日之前30天每天24个整点时刻的积日、环境温度、环境湿度、风速、太阳辐照度数据作为光伏功率预测的原始数据。

步骤2:基于辐照度指数进行天气类型聚类:本发明利用辐照度指数作为天气类型聚类指标,将辐照度指数记为k,其计算公式如下:

式中,s理论辐照度记为理论辐照度日曲线与坐标轴所围成的面积,s实测辐照度记为实测辐照度日曲线与坐标轴所围成的面积。由式1计算出每天的辐照度指数,利用辐照度指数对预测日之前30天的数据进行聚类。本发明使用k-means聚类算法进行聚类。将预测日前30天的数据进一步聚类为晴天、雨雪天和多云天气三种天气类型。

步骤3:数据归一化:当使用多变量时间序列进行光伏功率预测时,为了消除不同变量之间量纲,数值差别对实验结果的影响。实验中对输入数据进行最大最小值归一化,经过预测模型得到光伏功率预测数据后,再进行反归一化处理使其具有物理意义。

步骤4:建立长短期记忆网络预测模型:长短期记忆网络(long-shorttermmemory,lstm)是一种特殊的循环神经网络(recurrentneuralnetwork,rnn),循环神经网络的结构如图2所示。

循环神经网络包括输入层、隐藏层、输出层,在隐藏层中有输入到下一时间隐藏层的连接。按时间展开后,可以发现当前时刻隐藏层的输入包括两部分,即当前时刻的输入层输入和上一时刻的隐藏层输入。其中,w1,w2,w3分别为输入到隐藏层、隐藏层到隐藏层、隐藏层到输出的权重。对于标准的循环神经网络架构来说,在实践中可联系的“上下文”十分有限,即循环神经网络的记忆能力有限,无法捕捉到较长时间之前的输入和本时刻输入之间的依赖关系。

鉴于循环神经网络存在的记忆能力有限问题,本发明采用长短期记忆网络作为预测模型,其在保持循环神经网络结构的基础上重新设计了计算单元。其单元结构如图3所示:每个lstm单元中存在一个细胞(cell),通常被视为是lstm的记忆单元,用于描述lstm单元的当前状态。图3中存在3个控制门,分别是输入门,输出门和遗忘门,三个门分别控制网络的输入、输出以及cell单元的状态。具体地,lstm单元的工作流程如下:每个时刻,lstm接收到输入信息后,每个门将对不同来源的输入进行运算,决定输入信息是否通过。输入门的输入经过非线性函数的变换后,与遗忘门处理的记忆单元状态进行叠加,形成新的记忆单元状态。最终,记忆单元状态通过非线性函数的运算和输出门的动态控制形成lstm单元的输出。各变量之间的计算公式如下:

it=σ(wi·[ht-1,xt]+bi)(2)

ft=σ(wf·[lt-1,xt]+bf)(3)

ot=σ(wo·[ht-1,xt]+bo)(4)

ot=σ(wo·[ht-1,xt]+bo)(7)

式子中:it、ft和ot分别为遗忘门、输入门和输出门;是记忆单元的候选状态值,ct为记忆单元的状态更新值;wi、wf、wo和wc分别对应t时刻输入门it、遗忘门ft、输出门ot以及候选状态值的的权值矩阵。bi、bc、bf、bo为偏置向量;ht为t时刻的隐层状态;σ为激活函数,通常为双曲正切函数或s型曲线函数。

确定性预测模型的框架如图4所示,首先将每个整点时刻的数据结构化为一个五维向量[积日,环境温度,环境湿度,风速,太阳辐照度],将一天24个整点时刻对应的24个五维向量组成输入矩阵,输入到长短期记忆网络预测模型中。

图4长短期记忆网络预测模型框架模型训练过程中采用均方误差(meansquarederror,mse)作为损失函数,将预测得到的光伏功率结果与真实功率值进行对比,计算损失,并使用自适应动量估计(adaptivemomentestimation,adam)优化器与沿时间轴的反向传播算法bptt(backpropagationthrongtime)方法相结合对参数进行更新。其中损失函数均方误差的计算公式如下:

式中pfi为光伏功率的预测值,pi为光伏功率的实测值,n为样本数目。

步骤5:滚动预测:重复前面四个步骤,以次日预测点前30天每天24个整点时刻的光伏功率值和天气数据作为原始数据,进行该预测点的功率预测。

步骤6:计算功率预测的误差序列:基于步骤5得到光伏功率确定性预测的结果,本发明采用相对误差来对确定性预测误差进行统计。将相对误差定义为光伏功率的真实值和预测值的差与历史最大功率的比值,如公式10所示。

式中,p是实际功率值,pr预测功率值,pmax历史功率最大值。

步骤7:对误差的分布特性进行分析,确定误差所服从的分布:根据步骤6进行计算就得到了预测点的逐点相对误差,进而可以统计出晴天、多云和雨雪天三种天气类型下的误差频数统计直方图。根据直方图,假设误差基本上符合正态分布。

步骤8:利用极大似然估计对误差分布的参数进行估计:最大似然估计又称为极大似然估计,是一种重要的参数估计方法,其基本理论是极大似然原理。

极大似然估计求解参数的基本过程如下:

(1)写出似然函数;

(2)对似然函数取对数,并整理;

(3)对对数似然函数求导数;

(4)解似然方程。

下面具体说明如何通过最大似然估计求解符合某一种分布的分布参数。假设样本集合d中的数据都是独立同分布,现估计参数向量θ,将集合d记为:

d={x1,x2,…,xn}(11)

则联合概率密度函数p(d|θ)称为相对于集合d的θ的似然函数。

数学期望为μ、方差为б;如果是参数空间中能使似然函数l(θ)最大的θ值,则是θ的极大似然估计量。下面给出如何求解使得样本出现概率最大的θ值。

实际中为了便于分析,定义了对数似然函数:

h(θ)=logl(θ)(14)

在似然函数满足连续可导的条件下,则最大似然估计量就是如下方程的解。

下面给出利用极大似然原理求解光伏功率预测相对误差分布参数的具体求解过程:首先,通过步骤7对功率预测误差分布特性的分析,可知不同天气类型下的预测相对误差分布均接近正态分布,所以选择正态分布对光伏功率预测误差分布进行拟合。

正态分布又称高斯分布,是一个在各个领域都非常重要的概率分布;若随机变量x服从一个数学期望为μ、方差为б2正态分布,记为x~n(μ,б2);它

的概率密度函数为:

随机变量x服从的正态分布记为x~n(μ,б2)。当μ=0,б2=1时,正态分布就成为标准正态分布,记作x~n(0,1);由此可知,预测相对误差样本服从正态分布n(μ,б2),其对应的似然函数为:

由式(17)得到式(18)

对式(18)两边取对数得到式(19)

式(19)对μ和б2求导可得到如下的方程组,求解式(19)得到式(20):

将误差序列带入式(20),即可得到预测误差所服从的正态分布参数,

步骤9:计算在给定置信水平下误差的置信区间,得到置信区间上限和下限以及对应的误差值;在实际应用中,在计算光伏发电系统预测功率的置信区间时,置信度取值过高无实际意义,取值过低则影响预测的精度,所以一般取值在80%-95%。

在步骤8中求出误差分布参数后,可以根据概率论与数理统计第四版的附表2标准正态分布表中,查询到正态分布中85%、90%和95%置信度所对应的区间范围,当所求出的误差分布不符合标准的正态分布时,还需要根据式(12)转化为标准的正态分布:

其中x是非标准正态分布下的参数,通过式21可将其转化为标准正态分布中的参数。

通过以上计算就可获得在85%、90%和95%置信水平下,误差的上下限,进而根据误差的上下限,可以确定光伏功率预测值的波动区间。而且可以确定实际值是有85%、90%或95%的概率落在该预测区间中的。

步骤10:针对每个时刻的功率预测值,根据误差区间得到预测值置信区间的上下限。

步骤11:将每个时刻的功率预测值的置信区间的上下限分别联结即可形成上下2条包络线,得到光伏功率的预测区间。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1