一种光伏概率预测方法与流程

文档序号:16935440发布日期:2019-02-22 20:39阅读:499来源:国知局
一种光伏概率预测方法与流程
本发明属于电气工程
技术领域
,更具体地,涉及一种光伏概率预测方法。
背景技术
:随着全球范围内能源紧缺和环保问题的日益突出,可再生能源的利用引起广泛的重视。光伏发电作为一种重要的可再生能源形式,它是目前可再生能源中技术最具规模化开发条件和商业化发展前景的发电方式之一。目前大规模的光伏发电系统已经在国内外大量建成。但是由于光伏发电系统的输出受到太阳辐照强度和天气因素的影响,其发电量的变化是一个非平稳的随机过程,同时由于日照的昼夜周期性,光伏电站只能白天发电,是一种典型的间歇式电源。但是,目前对于光伏发电的随机性以及光伏发电预测技术的研究不多,而这正是光伏发电大规模应用的难点之一。因此,加强光伏阵列发电预测的研究对于电网安全经济调度、电力市场及光伏发电系统运行都有重要意义。技术实现要素:针对现有技术的缺陷,本发明的目的在于提供了一种光伏功率概率预测方法,旨在解决由于现有光伏电站系统的输出存在随机性而导致光伏出力难以预测的问题。为实现上述目的,本发明提供了一种光伏概率预测方法,具体包括如下步骤:s1,收集光伏电站历史数据并对光伏出力进行序列分解。优选地,所述历史数据为同一光伏电站历史出力数据及与出力数据对应的历史天气数据,其中历史天气数据包括天气类型和日最高气温。完成数据收集后对历史出力数据进行序列分解,优选地,将光伏出力数据分解为理想出力归一化曲线、幅值参数和随机成分三部分,如式(1)所示:pi=kisi,regular+pi,random(1)其中:pi为第i天的实际光伏出力;si,regular为当天的理想出力归一化曲线,主要表征大气上界太阳辐射变化;ki为幅值参数,代表实际中每日光伏出力峰值;pi,random云层对光伏出力短时扰动形成的随机分量。需指出的是,由于光伏出力的时间范围是从日出时刻到日落时刻,夜间出力全部为零。因此,在对历史数据分析时剔除了夜间光伏出力时间序列。优选地,对历史出力数据的序列分解具体包括如下步骤:s1.1对理想出力归一化曲线的提取理想出力归一化曲线是指不考虑云层扰动情况下光伏站日间出力曲线形状,并将幅值与时间跨度均归一化的曲线。本发明从历史数据中抽取典型日数据,进行一系列变换后得到更精确的理想出力归一化曲线。提取归一化曲线的步骤如下:s1.1.1选取典型日典型日为全天出力曲线平滑的采样日,曲线平滑说明当天未受到云层扰动影响,典型日选取的依据是全天出力序列二阶差分的绝对值均小于一定阈值d:max{|(p(t+2)-p(t+1))-(p(t+1)-p(t))|}<d(2)其中,p(t)为第t个采样点的光伏出力功率,本发明中d为0.05pu,若因实测数据较少等原因导致不存在典型日,可适当增大阈值d来放宽选取标准。s1.1.2典型日出力曲线的归一化由于每日光伏出力峰值和日出日落时间均有不同,为提取统一的理想出力曲线形状,需将每日有出力部分的功率范围和时间范围归一化,即每一时刻光伏功率值除以全天最大出力值max{pi(t)},同时,出力时刻按当日日间时长ti,day进行压缩,如式(3)所示:pi*(t*)=pi(t)/max{pi(t)}(3)其中:pi(t)表示第i天第t个出力点的功率值;pi*(t*)表示第i天第t个出力点归一化后的功率值;t*=t/ti,day定义域为[0,1],ti,day为第i天的光照小时数。s1.1.3典型日出力曲线的解析化对归一化后的典型日出力曲线进行快速傅里叶变换(fft),保留前五次谐波,实现解析化,进而得到由fft系数表示的典型日对应的理想出力归一化曲线方程。s1.1.4拼接每天的理想出力序列根据上述获得的典型日出力曲线的fft结果,利用加权合成的方式确定出样本中每天的fft系数,并通过傅里叶逆变换还原出每天的理想光伏光伏出力序列si,ideal(t)。s1.2幅值参数的定义与计算理想出力归一化序列si,ideal描述了每日无云层扰动时光伏出力曲线的形状,其幅值取值范围是[0,1]。而实际中每日光伏出力峰值还取决于大气上界太阳辐射峰值以及受当日总体天气条件影响的大衰减情况,本发明采用幅值参数ki予以表征。幅值参数的计算采用最小二乘拟合法,如式(4)所示,幅值参数越大说明大气衰减越小,当日可用太阳辐射量越大。s1.3光伏出力随机分量的确定随机分量序列的表达式如式(5)所示,是由实测光伏出力序列减去当天理想出力归一化曲线经过幅值参数拉伸后的序列所得。pi,random(t)=pi(t)-kisi,regular(t)(5)s2,随机生成输入层-隐层权重及偏置一般单隐层神经网络采用elm方法可以随机初始化输入权重和偏置并通过网络训练得到相应输出权重的特点,基于所述elm方法,本发明采用单隐层神经网络模型对光伏出力区间进行预测,首先对用于拟合光伏出力预测区间上界及下界的单隐层神经网络,通过随机赋值的方式进行输入层-隐层权重及偏置的初始化,实现单隐层神经网络结构的初步确定。本发明中,建立样本数为n的光伏出力数据集(xi,pi),其中xi=[xi1,xi2,…xin]t∈rn,是网络模型的输入样本,包含预测日前一天理想出力曲线小时级均值、预测日前一天随机出力小时级均值、预测日前一天的温度与天气类型信息、预测日的温度与天气类型信息等数据,pi=[pi1,pi2,…pim]t∈rm,是网络模型的输出样本,为预测日的光伏出力实际值,当网络隐层节点数为l时,其第i个样本对应的网络拟合输出,即预测日光伏出力预测值oi可以表示为:其中,g(x)为激活函数,wj=[wj,1,wj,2,…wj,n]t为输入权重,βj为输出权重,bj是第j个隐层单元的偏置。wj·xi表示wj和xi的内积。网络训练过程的目标是使得输出的误差最小,具体如下:即计算βi,wi和bi,使得:矩阵表示为:hβ=p(9)其中,h是隐层节点的输出,β是输出权重,p为期望输出。训练过程就是对h和β迭代寻优的过程,其目标是使网络对训练样本的拟合误差最小,即最小化损失函数为:在elm算法中,由于输入层权重及偏置采用随机确定的方法进行赋值,所以,训练单隐层神经网络将转化为求解一个线性系统hβ=p,并且输出权重β也可以被确定。其中是h的moore-penrose广义逆。s3,设定概率预测区间期望覆盖率定义样本中某一天t时刻光伏实测出力为p(t),以如下方式定义带有比率参数λ(λ∈[0,1])的光伏出力预测区间pi(predictioninterval)的分位数pi给出了一对以确定的期望覆盖率包含实际光伏出力值的出力上下边界。t时刻期望覆盖率为1-α(α∈[0,1])的出力预测区间可以表示为:其中,和分别表示pi的上下边界。通常有:s4,训练网络,确定输出层权值使用不对称最小损失函数来唯一近似求取光伏预测区间分位数如下式:其中,n是训练样本数,l(·)是不对称绝对值函数,且由于elm算法中,采用随机确定方法对隐层的输入权重和偏置进行赋值,网络的训练过程变成了求解一个线性系统的最小二乘解,因此在本发明中借用了elm算法的随机赋值思路。由式(15)-(18),构建如下求解出力预测区间的数学模型:其中,pi,max是归一化出力的最大值,此处取1即可,xi是第i天的网络模型输入数据,包含预测日前一天理想出力曲线小时级均值、预测日前一天随机出力小时级均值、预测日前一天的温度与天气类型信息、预测日的温度与天气类型信息等数据,ft(xi,βα)和分别为利用分位数回归模型求取pi上下边界的elm线性系统,且βα和是elm的决策变量,式(20)确保了预测所得上界高于下界且预测区间位于[0,yi,max],在归一化后。通过引入辅助变量将该模型转化为如下等效线性优化问题形式以方便求解:式(22)-(25)所表示的模型可通过线性规划算法有效求解。以预测日前一天光伏出力数据经序列分解所得的理想出力归一化曲线、随机分量曲线以及天气类型数据为网络输入,以预测日的光伏出力作为网络输出,并利用对应的同一个光伏发电站历史数据作为训练数据,即可通过求解上述模型完成网络训练,实现对决策变量βα和的求解。s5,给定输入数据并输出出力预测区间在按照s1~s4完成对历史数据的收集和网络训练后,即可由符合网络输入结构的数据作为网络输入,并获得与之对应的光伏出力预测区间。通过本发明所构思的以上技术方案,与现有技术相比,能够取得如下有益效果:(1)以统计得到的光伏电站历史出力作为模型输入,解决了光伏阵列的安装位置随机性和光伏阵列的使用时间等对转换效率的影响,提高预测准确性。(2)对历史数据进行序列分解,可更有效判别不同因素对出力的影响,增强数据特征。(3)引入极限学习机elm思想进行网络构建,在保证精度的同时大幅提升训练速度。(4)以分位数回归模型对光伏出力区间进行概率预测,对调度计划的制定有更强的参考价值。附图说明图1为本发明计算流程图;图2为理想出力曲线形状示意图;图3为理想光伏光伏出力序列示意图;图4为实施例中所用神经网络结构图;图5为实施例采用本方法进行光伏概率预测所得的拟合结果图;具体实施方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。为了解决光伏电站系统的输出存在随机性而导致光伏出力难以预测的问题,本发明提供了一种光伏功率概率预测方法,具体方法流程如图1所示,包括以下步骤:步骤一:收集光伏电站历史数据并对光伏出力进行序列分解收集的光伏电站历史数据包括:同一光伏电站历史出力数据及与出力数据对应的历史天气数据,其中,历史天气数据包括天气类型和日最高气温。完成数据收集后对历史出力数据进行序列分解,将光伏出力数据依次分解为理想出力归一化曲线、幅值参数和随机成分三部分,如式(1)所示。pi(t)=kisi,regular(t)+pi,random(t)(1)其中,pi(t)为第i天的实际光伏出力;si,regular为当天的理想出力归一化曲线,主要表征大气上界太阳辐射变化;ki为幅值参数,代表每日光伏出力峰值;pi,random为随机分量,对应云层带来的短时扰动。由于光伏出力的时间范围是从日出时刻到日落时刻,夜间出力全部为零。因此,在进行历史数据分析时对光伏出力时间序列的夜间部分进行了剔除。优选地,在具体实施方案中,对澳大利亚墨尔本大学的光伏电站出力数据及当地当时的天气数据进行收集,收集时段为2017年2月1日-2017年3月31日。其中2月份数据作为训练集,3月份数据作为测试集,对光伏序列夜间部分进行剔除后保留了早上5点到下午6点的光伏出力数据。(1.1)理想出力归一化曲线提取:理想出力归一化曲线是指保留了不考虑云层扰动情况下光伏站日间出力曲线形状,并将幅值与时间跨度均归一化的曲线。虽然该理想曲线可以通过日地运行模型计算得出,但光伏电站的出力还受到所在地的气候特点以及光伏面板朝向的调整影响,因此单纯的理想出力计算曲线存在较大的误差。为此,本发明采用一种基于统计的理想出力归一化曲线的计算方法:从历史数据中抽取典型日数据,进行一系列变换后得到更精确的理想出力归一化曲线。提取归一化曲线的步骤如下:(1.1.1)选取典型日典型日指的是全天出力曲线平滑的采样日,曲线平滑说明当天未受到云层扰动影响。对应的,非典型日是除典型日外其他采样日。典型日选取的依据是全天出力序列二阶差分的绝对值均小于一定阈值d:max{|(p(t+2)-p(t+1))-(p(t+1)-p(t))|}<d(2)其中,p(t)为第t个采样点的光伏出力功率。本实施例中d取0.05pu,若因实测数据较少等原因导致不存在典型日,可适当增大阈值d来放宽选取标准。(1.1.2)典型日出力曲线的归一化由于每日光伏出力峰值和日出日落时间均有不同,为提取统一的理想出力曲线形状,需将每日有出力部分的功率范围和时间范围归一化,即每一时刻光伏功率值除以全天最大出力值max{pi(t)},同时,出力时刻按当日日间时长ti,day进行压缩,如式(3)所示:pi*(t*)=pi(t)/max{pi(t)}(3)其中:pi(t)表示第i天第t个出力点的功率值;pi*(t*)表示第i天第t个出力点归一化后的功率值;,t*=t/ti,day定义域为[0,1],ti,day为第i天的光照小时数。图2为按照上述数据及式(2)中的依据,获得的一条归一化典型日出力曲线。(1.1.3)典型日出力曲线的解析化典型日出力曲线通过快速傅里叶变换,保留前五次谐波,实现解析化。从而得到由fft系数表示的典型日对应的理想出力归一化曲线方程,按照上述数据,所获得的两条典型日出力曲线的快速傅里叶变换(fft)分解结果前五次谐波系数如表1所示:表1谐波系数0次1次2次3次4次典型日10.6235-0.2405-0.0187i-0.0617-0.0075i-0.0092-0.0040i-0.0023-0.0008i典型日20.6013-0.2419-0.0357i-0.0509-0.0232i-0.0084-0.0034i0.0000-0.0012i(1.1.4)拼接出每天的理想出力序列图3为两个典型日的理想出力序列,可根据(1.1.3)中获得的典型日出力曲线fft结果,利用加权合成的方式确定出整个训练样本对应的fft系数,并通过傅里叶逆变换还原出如图3所示的每天的理想光伏出力序列si,ideal(t)。(1.2)幅值参数的定义与计算:理想出力归一化序列si,ideal(t)描述了每日无云层扰动时光伏出力曲线的形状,其幅值取值范围是[0,1]。而实际中每日光伏出力峰值还取决于大气上界太阳辐射峰值以及受当日总体天气条件影响的大衰减情况,本发明采用幅值参数ki予以表征。幅值参数的计算采用最小二乘拟合法,如式(4)所示,幅值参数越大说明大气衰减越小、当日可用太阳辐射量越大。式中ti,day代表全天光伏数据采样点数。按照上述数据,所获得的所收集时段对应的出力幅值参数如表2所示:表2序号12345678910幅值系数0.95710.9559410.6613760.771880.8225610.9683530.7343090.7415340.7201840.817763序号11121314151617181920幅值系数0.9934470.9935870.6629030.4488580.5090580.6679970.8087730.9079390.5937470.775011序号21222324252627282930幅值系数0.7341190.6504980.7224850.7589940.7242090.6629830.6320760.5967060.7266830.542063序号31323334353637383940幅值系数0.7365190.5146740.7512560.6899880.9325720.5907210.7665370.8686780.8475520.78589序号41424344454647484950幅值系数0.4010190.3673740.4458620.6577140.7036710.6236210.3872130.3862310.6031090.496156序号515253545556575859幅值系数0.5029750.5080890.642370.9248270.4927090.8164760.426160.2945010.805808(1.3)光伏出力随机分量:光伏出力的随机性主要来源于云层扰动,这种扰动通常表现为分钟级光伏出力变化。本文主要从随机分量的概率分布和持续时间分布两方面分析光伏出力的随机分量。根据式(1),随机分量序列的表达式如式(5)所示,是由实测光伏出力序列减去当天理想处理归一化曲线经过幅值参数拉伸后的序列所得。pi,random(t)=pi(t)-kisi,regular(t)(5)步骤二:随机生成输入层-隐层权重及偏置本发明采用单隐层神经网络进行光伏出力区间的预测,利用elm可以随机初始化输入权重和偏置并通过网络训练得到相应输出权重的特点,分别对用于拟合光伏出力预测区间上界及下界的单隐层神经网络通过随机赋值的方式进行输入层-隐层权重及偏置的初始化,进行单隐层神经网络结构的初步确定。本发明中,设定样本数为n的光伏出力数据集(xi,pi),其中xi=[xi1,xi2,…xin]t∈rn,是网络模型的输入样本,包含预测日前一天理想出力曲线小时级均值、预测日前一天随机出力小时级均值、预测日前一天的温度与天气类型信息、预测日的温度与天气类型信息等数据,pi=[pi1,pi2,…pim]t∈rm,是网络模型的输出样本,为预测日的光伏出力实际值,当网络隐层节点数为l时,其第i个样本对应的网络拟合输出,即预测日光伏出力预测值oi可以表示为:其中,g(x)为激活函数,wj=[wj,1,wj,2,…wj,n]t为输入权重,βj为输出权重,bj是第j个隐层单元的偏置。wj·xi表示wj和xi的内积。网络训练过程的目标是使得输出的误差最小,具体如下:即寻找βi,wi和bi,使得:矩阵表示为:hβ=p(9)其中,h是隐层节点的输出,β是输出权重,p为期望输出。训练过程就是对h和β迭代寻优的过程,其目标是使网络对训练样本的拟合误差最小,即最小化损失函数为:在elm算法中,由于输入层权重及偏置采用随机确定的方法进行确定性赋值,所以,训练单隐层神经网络将转化为求解一个线性系统hβ=t,并且输出权重β也可以被确定。其中是h的moore-penrose广义逆。在本发明中,以预测日前一天光伏出力数据经序列分解所得的理想出力归一化曲线、随机分量曲线,以及预测日前一天和预测日当天的数值化天气数据为网络输入,以预测日的光伏出力作为网络输出,网络结构如图4所示,包括32个输入节点、6个隐含层节点以及14个输出层节点。优选地,网络包含32个输入节点,其中,节点1-节点14:预测日前一天理想出力曲线小时级均值;节点15-节点28:预测日前一天随机出力小时级均值;节点29-30:预测日前一天的温度与天气类型信息;节点31-32:预测日的温度与天气类型信息。优选地,14个输出层节点为预测日的光伏出力预测值。采用elm思想对网络的隐含层权重w及偏置b进行随机赋值的方式进行确定,按照上述数据,训练样本数n=28,网络输入节点数n=32,网络输出节点数m=14,通过比较不同l下的训练效果,确定网络隐层节点数l=6,经随机化赋值所得的隐层权重矩阵w及偏置b分别如表3和表4所示。表3表4序号123456值0.018933-0.060640.059218-0.0578-0.065120.022768步骤三:设定概率预测区间期望覆盖率定义样本中某一天t时刻光伏实测出力为p(t),以如下概率函数的方式定义带有比率参数λ(λ∈[0,1])的光伏出力预测区间pi(predictioninterval)的分位数pi给出了一对以确定的期望覆盖率包含实际光伏出力值的出力上下边界。t时刻期望覆盖率为1-α(α∈[0,1])的pi(设为)可以表示为:其中,和分别表示pi的上下边界。通常有:在本实施例中,设定出力概率预测区间期望覆盖率1-α=90%。步骤四:训练网络,确定输出层权值使用不对称最小损失函数来唯一近似求取光伏预测区间分位数如下式:其中,n是训练样本数,l(·)是不对称绝对值函数,且由于elm算法中,采用随机确定方法对隐层的输入权重和偏置进行赋值,网络的训练过程变成了求解一个线性系统的最小二乘解,因此在本发明中借用了elm算法的随机赋值思路。由式(15)-(18),构建如下求解出力预测区间的数学优化模型:其中,pi,max是归一化出力的最大值,此处取1即可,ft(xi,βα)和分别表示利用分位数回归模型求取pi上下边界的elm线性系统,且βα和是elm的决策变量,式(20)确保了预测所得上界高于下界且预测区间位于[0,pi,max],在归一化后。通过引入辅助变量将该模型转化为如下等效线性优化问题形式以方便求解:式(22)-(25)所表示的模型可通过线性规划算法有效求解。以预测日前一天光伏出力数据经序列分解所得的理想出力归一化曲线、随机分量曲线以及天气类型数据为网络输入,以预测日的光伏出力作为网络输出。并利用对应的历史数据作为训练数据,即可通过求解上述模型完成网络训练,实现对决策变量βα和的求解。根据上述数据,利用商业求解器cplex对该线性问题进行求解后所得的βα和如表5和表6所示。表5表6步骤五:给定输入数据并输出出力预测区间在按照步骤一至步骤四完成对历史数据的收集和网络训练后,即可由符合网络输入结构的数据作为网络输入,并获得与之对应的光伏出力预测区间。根据上述数据,采用测试集数据对网络进行拟合测试,其中3月16日所得拟合结果如图5所示,观察图5可知,由本神经网络模型拟合所得的光伏出力预测区间实现了对实际出力值的较好覆盖,基本符合本实施例中设定的90%覆盖率,且预测区间上下界较为紧凑,具有较好的拟合效果。本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1