基于形状参数置信区间的光伏发电预测方法与流程

文档序号:14872415发布日期:2018-07-07 01:31阅读:285来源:国知局

本发明属于光伏发电技术领域,,尤其涉及一种基于形状参数置信区间的光伏发电预测方法。



背景技术:

随着能源需求量的不断增长,能源的使用由化石能源主导型结构向清洁能源转变,包括可再生能源在内的新能源迅速发展,基于可再生能源的分布式发电已成为实现可持续发展能源战略规划的重要组成部分。太阳能作为一种清洁可再生能源,具有资源丰富、转化效率高、产业化基础好、经济优势明显、环境影响小等优点,具备大规模开发的条件,己成为我国主要的可再生能源发展方向之一。

在电网中接入光伏电源,会使电力系统的负荷预测、规划和运行与过去相比有更大的不确定性。由于大量的用户会安装太阳能电池为其提供电能,使得配电网规划人员更加难以准确预测负荷的增长情况,从而影响后续的规划。电网规划必须能够准确评估光伏电源对所在电网的影响,使其在电网的逐步渗透过程中不会破坏电网运行的安全性和经济性。

光伏发电功率预测模型需要拟合的映射关系在不同的天气状态下存在明显差异,采用单一模型实现多种不同天气状态下发电功率的准确预测非常困难。现有的光伏发电预测分析方法主要是对发电数据进行分类进而计算出每类发电数据的输出功率。对于发电数据自身形状参数的规律未能深入挖掘,且未能给出光伏电源发电数据的分布类型及统计意义下的描述。



技术实现要素:

本发明就是针对现有技术存在的缺陷,提供一种基于形状参数置信区间的光伏发电预测方法,其根据光伏电源并网点监测到的发电数据及历史天气预报,采用天气打分机制将天气分类从而将发电数据分类,使用核密度函数求出每类数据的概率密度函数估计,以给出发电数据统计意义上的分布规律。在此基础上继续挖掘各类发电数据概率分布的规律,求出其形状参数的置信区间,实现预测。以2015沈阳电站光伏出力数据进行了实证分析,验证了所提出方法对光伏出力预测估计的有效性及准确性。

为实现上述目的,本发明采用如下技术方案,包括以下步骤:

步骤1、从光伏电厂获取发电数据,对数据进行清洗,检查并纠正发电数据文件中的错误,检查数据一致性,处理无效值和缺失值,将无效数据剔除,选取其中一部分数据(90%)作为样本数据,选取另一部分数据(10%)作为检验数据;

步骤2、对样本数据进行假设检验,通过假设检验得到发电数据分布规律,将数据初步分为beta分布和weibull分布两类;

其中weibull分布对应数据量较少,且对应天气均为较恶劣天气,因此将符合weibull分布的发电数据归为一类,并拟合出该类的概率分布模型,计算出其形状参数,使用核密度函数对形状参数进行拟合,从而计算出weibull分布类形状参数的置信区间;

对符合beta分布的数据,求出beta分布的形状参数a、b;

步骤3、对天气类型进行打分,建立词典,该词典规则为{'中雨':5,'雷阵雨':4,'中到大雨':6,'小到中雨':4,'中雪':5,'阵雪':3,'阵雨':3,'小到中雪':4,'阴':2,'晴':0,'大雪':6,'多云':1,'小雪':3,'雨夹雪':4,'霾':6,'小雨':3,'雾':2,'阵雨':3};

按照打分进行分类:分数为在0-2分为a类晴好天气,3-8分为b类阴雨天气,8分以上为c类恶劣天气;分类表表1如下所示:

表1天气分类

按照天气分类将符合beta分布的发电数据分成三类,对每类进行概率分布拟合;

步骤4、分别对每类发电出力数据进行分析,求出每种天气下的发电数据模型,使用核密度函数进行拟合,从而求出每类出力模型的置信区间;

步骤5、利用校验数据进行检验,验证预测准确性。

进一步地,所述步骤2中求得beta分布的形状参数a、b包括以下几步:

步骤2-1、根据beta分布的密度函数的数学表达式为:

式中:x(0≤x≤1)为被统计的随机变量;a、b(a>0,b>0)为beta分布的形状参数;b(a,b)为以a、b为参数的beta函数;求得b(a,b)如下式:

步骤2-2、根据beta分布的性质,利用集合均值和方差来计算beta分布形状参数a、b;

由发电量数据beta函数,求该函数的均值和方差为:

同时,根据beta分布的性质,beta分布的期望值和方差可表示为:

对式子(5)、(6)联立求解,导出利用期望值和方差计算beta分布形状参数a、b的方程式:

根据式(7)、(8)的结果,利用式(3)、(4)计算集合的均值和方差,得到beta分布模型的参数a、b。

进一步地,所述步骤4包括以下几个步骤:

步骤4-1、根据步骤三分类的结果及步骤二中的公式(7)(8),求出每类发电数据中每天beta分布的参数a、b;

步骤4-2、使用核密度函数对形状参数a、b进行拟合,求出a、b参数符合的概率分布模型,

步骤4-3、求出a、b参数的置信区间。

进一步地,所述步骤5包括以下步骤:

步骤5-1、将检验数据进行beta分布拟合;

步骤5-2、求出检验数据的形状参数a、b;

步骤5-3、根据天气情况将检验数据对应样本数据求得的发电数据类,比较检验数据的a、b参数是否包含在样本数据置信区间中,若是,则验证所求预测模型准确。

与现有技术相比本发明有益效果。

本发明提供的基于形状参数置信区间的的光伏发电预测分析方法,以统计学角度出发,挖掘发电数据形状参数的规律,对影响光伏发电最为显著的天气参数建立数据字典,进行打分操作,从而得出不同天气状况下发电数据形状参数的置信区间,对形状参数进行置信区间的求取来代替发电数据置信区间的求取,使预测结果更准确;提出的分析方法能根据观测样本预测光伏发电的置信区间,可以准确预测出不同天气下的光伏发电情况。

附图说明

下面结合附图和具体实施方式对本发明做进一步说明。本发明保护范围不仅局限于以下内容的表述。

图1是本发明发电样本数据挖掘流程图。

图2是本发明发电数据预测流程图。

图3-a、3-b、3-c是本发明使用matlab绘制的形状参数a的拟合分布效果图。

图4是本发明光伏发电数据图。

图5是本发明发电概率密度分布图。

具体实施方式

如图1-5所示,本发明提供了一种基于形状参数置信区间的光伏发电预测方法,根据光伏电源并网点监测到的发电数据及历史天气预报,旨在研究光伏出力的分布规律。首先对天气类型进行打分,将不同天气类型分类,其次使用核密度函数对每类发电数据进行拟合,从而推导出每发电数据对应的形状参数值,最后求出形状参数的概率分布,得出形状参数的置信区间,实现对光伏出力数据的预测,为涉及新能源出力分布的实际问题提供方法参考和技术支持。

算法首先对获取的发电数据进行数据预处理,剔除数据中的无效值和缺失值,保证数据的准确性,选取其中百分之九十数据作为样本数据,百分之十作为检验数据,为数据挖掘做准备。

其次使用假设检验的的方式初步将发电数据分为beta分布类和weibull分布类,求取weibull分布的置信区间,并对beta分布进行进一步分析。

第三步由期望和方差求出所有beta分布的参数a、b,构建光伏发电数据及历史天气情况样本,对天气类型进行打分分类,拟合每类天气情况下发点数据的概率密度函数。

第四步对每类的参数a和b进行核密度函数拟合,从而求出形状参数a、b的概率分布,求出参数置信区间。

具体步骤如下:

(1)根据步骤三分类的结果及步骤二中的公式(7)(8),求出每类发电数据中每天beta分布的参数a、b。

(2)使用核密度函数对a、b进行拟合,求出a、b参数符合的概率分布模型。

(3)求出a、b参数的置信区间。

当采用抽样的方法对总体参数进行估计和假设时,因所抽取样本存在着随机性的特点,最终通过估计和假设而得到的测量结果总是不确定的。而对于一个确定的测量结果来说,通常希望能够以较高的可靠程度相信它确实包含真值,如果从概率的角度来表达个体信念合理性的强弱,则可以用概率来描述该测量结果准确可靠性的程度。这里用来描述该测量结果可靠程度的概率值,叫做置信度。因此,用置信度可以来描述光伏发电出力曲线的估计可靠性。

设某一待估参数为θ,给定一个数值α,使得0<α<1。若有统计量t1、t2,θ∈ω,使p(t1≤θ≤t2)=1-α,则称1-α为置信度,[t1,t2]分别称为θ在该置信度下的置信下限和置信上限。置信度反映的是估计可靠性,其值越大,估计值的可靠程度就越高;置信区间代表着估计准确度,其值越小,估计值的准确度就越高。由定义,置信度1-α越大,即p(t1≤θ≤t2)越大,而对于一个确定的概率分布来说,概率值越大,其对应的最小置信区间[t1,t2]也越大。因此,估计可靠度越高,估计准确度反而越小。

在本发明中,对参数θ作出估计时,需要同时保证估计可靠性和估计准确度。为了保证估计的可靠性,必须要求概率值p(t1≤θ≤t2)尽可能大,也就是说,θ要尽可能被包含在区间[t1,t2]内,而为了保证估计的准确度,却必须要求置信区间尽可能小,也就是说θ被包含在区间[t1,t2]内的可能性也就越小。

最后使用检验数据进行检验,将检验数据根据天气情况拟合分布模型,求出对应的参数值a、b,比较其是否在置信区间内,若在,则表示预测模型准确。

综上所述,本发明提供基于形状参数置信区间的光伏发电预测方法。所述的方法可以对光伏发电数据、天气数据进行分析,估计出光伏发电数据的概率密度函数,进而求解置信区间,实现预测。

具体地,获取发电数据后首先对数据进行清洗,使待处理数据均为有效数据。

对属于weibull分布类的数据,发现其数量较少且对应天气情况均为恶劣天气,因此不再进行进一步分类,将weibull数据类统一处理。反之,服从beta分布对应天气类型较为复杂,因此需要进一步挖掘数据规律。对服从beta分布类的发电数据按照天气情况进行分类,具体实施方法为:对天气类型进行打分操作,规则是{'中雨':5,'雷阵雨':4,'中到大雨':6,'小到中雨':4,'中雪':5,'阵雪':3,'阵雨':3,'小到中雪':4,'阴':2,'晴':0,'大雪':6,'多云':1,'小雪':3,'雨夹雪':4,'霾':6,'小雨':3,'雾':2,'阵雨':3}。每天的天气类型为两种,如晴/晴、多云/晴等,将两种类型的分数相加,即得到每天的天气分数,分数为在0-2分为晴好天气,3-8分为阴雨天气,8分以上为恶劣天气。

根据天气情况对发电数据进行分类后,针对每类数据,根据期望和方差求出形状参数a、b,再分别使用核密度函数对beta分布类的参数a、b进行拟合,得出形状参数a、b的数学模型,从而求出形状参数a、b的置信区间,针对不同天气拟合发电模型,且针对形状参数进行分析,使预测模型更具有现实意义。

其中,发电样本数据挖掘流程如图1所示,发电数据预测流程如图2所示。

图3-a、3-b、3-c是使用matlab绘制的形状参数a的拟合分布效果图。图中,横坐标为样本数据的期望,纵坐标为样本数据方差,曲线为拟合分布结果。图3-a表示晴好天气下形状参数a的概率密度,3-b表示阴雨天气下参数a的概率密度,3-c表示恶劣天气下参数a的概率密度。

使用核密度函数拟合分布。核密度估计,是一种用于估计概率密度函数的非参数方法,采用平滑的峰值函数(“核”)来拟合观察到的数据点,从而对真实的概率分布曲线进行模拟。x1,x2,...,xn为独立同分布f的n个样本点,设其概率密度函数为f,核密度估计为以下:

k(.)为核函数。其特点为:非负、积分为1,符合概率密度性质,均值为0。h>0为一个平滑参数,称作带宽。

表2所示为每类发电数据对应的部分形状参数b值。得到形状参数b的过程为:对发电数据进行预处理后,将发电数据按照天气情况分成三类。对每类进行beta分布拟合,beta分布的概率密度为:

再通过期望和方差求出对应的形状参数a、b。

表2每类对应形状参数b值

以光伏历史出力数据为例,样本数据每隔15分钟进行一次采样。以天为单位绘制发电功率数据如图4所示,其对应概率分布如图5所示。

对图4中的原始数据进行求解,得出发电出力原始数据的概率密度直方图如图5中的柱状图,再使用核密度函数进行平滑处理,如图5中深灰色曲线(平缓曲线)所示,最终得到拟合的beta分布曲线,如图5中浅灰色曲线(u形曲线)所示。

可以理解的是,以上关于本发明的具体描述,仅用于说明本发明而并非受限于本发明实施例所描述的技术方案,本领域的普通技术人员应当理解,仍然可以对本发明进行修改或等同替换,以达到相同的技术效果;只要满足使用需要,都在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1