一种光伏发电功率预测方法与流程

文档序号:16001350发布日期:2018-11-20 19:29阅读:767来源:国知局
本公开涉及新能源发电
技术领域
,尤其涉及一种光伏发电功率预测方法。
背景技术
:随着风光伏新能源出力在电力系统发电量中渗透率的逐年提升,在缓解能源紧张、环境恶化的同时,由于光伏发电的间歇性和不稳定性,也给电网安全、可靠、经济运行带来极大挑战。准确的光伏发电功率预测对未来一定时间内的光伏出力进行预测,可为电网自动发电控制、电网调度提供科学决策依据,从而有效降低大规模光伏接入对电力系统的影响,保障电网安全和经济运行。目前对光伏发电功率预测一般需要包含关键气象因素与辐照度的数值天气预报,并采用神经网络、分类回归、时间序列、小波分析等光伏发电功率预测算法进行预测。其中,由于神经网络算法具有鲁棒性高,非线性逼近能力强等特点,被普遍运用在在光伏发电功率预测中,但是其预测性能与输入维数、训练样本密切相关。而目前对气象因素的选择缺少理论性分析,从而导致提前确定得到的光伏发电功率误差大。因此,如何提供一种预测精度高的光伏发电功率预测方法成为本领域技术人员亟待解决的技术问题。技术实现要素:本发明实施例中提供了一种光伏发电功率预测方法,以解决现有技术中功率预测精度低的问题。本发明实施提供的光伏发电功率预测方法,具体包括:利用7点二阶算法前推差分算式剔除初始历史样本中的野值点;利用三次样条插值方法对所述野值点进行补正,得到历史样本;利用模糊聚类与粗糙集理论,对所述历史样本进行聚类,计算出聚类后各类的类中心和气象因子影响权重;分别计算出待预测日与所述聚类后各类的类中心之间的包含气象因子影响权重的加权欧式距离,选取加权欧式距离最小的类作为训练样本;对所述训练样本中的数据进行预测模型输入特征提取,得到特征提取值;将所述特征提取值输入到广义回归神经网络模型进行模型训练,得到训练后的广义回归神经网络模型;将从所述待预测日中提取的特征值输入到所述训练后的广义回归神经网络模型,得到所述待预测日的功率预测值。可选地,利用模糊聚类与粗糙集理论,对所述历史样本进行聚类,计算出聚类后各类的类中心和气象因子影响权重,包括:将历史样本中所选取的气象因子作为样本特征属性;利用基于F-统计量方法的模糊聚类分析,对所述样本特征属性进行最佳模糊聚类,将历史样本分成k类,得到某决策属性的等价集,并计算簇中心记为其中,i=1,2,...k、j=1,2,3,4,t=1,2,...,m;对所述历史样本中依次删除其中一个气象因子后,再进行基于F-统计量方法的模糊聚类分析,得到去掉某一属性的等价集;利用粗糙集原理,计算样本特征属性对决策属性的依赖度并归一化,得到各所述气象因子影响权重。可选地,将历史样本中所选取的气象因子作为样本特征属性,包括:选取历史样本中地表辐照度、温度、湿度、风速四个气象因子,作为样本特征属性。可选地,分别计算出待预测日与所述聚类后各类的类中心之间的包含气象因子影响权重的加权欧式距离,包括:利用相似度计算公式计算待预测日与所述聚类后各类的类中心之间的包含气象因子影响权重的加权欧式距离di,其中,为t时刻所选取的气象因子组成的日特征向量,为t时刻历史样本进行模糊聚类分成的k类簇中心,为气象因子t时刻对光伏发电影响权重。可选地,对所述训练样本中的数据进行预测模型输入特征提取,得到特征提取值,包括:选取所述训练样本中的上下午时段的辐照度均值、辐照度波动率的均值和极大值、风速均值、气压均值、湿度均值,作为特征提取值。可选地,将所述特征提取值输入到广义回归神经网络模型进行模型训练,得到训练后的广义回归神经网络模型;将提取的上下午时段的辐照度均值、辐照度波动率的均值、极大值,及风速均值、气压均值、湿度均值作为广义回归神经网络模型输入,将8:00至18:00间隔30min光伏发电功率数值作为所述广义回归神经网络模型的输出值进行模型训练,得到训练后的广义回归神经网络模型。可选地,所述上下午时段的辐照度均值的计算公式分别为:其中,m为上午时段采样点个数,n为总采样点个数,分别表示上、下午时段的辐照度均值。可选地,所述辐照度波动率的均值和极大值的计算公式分别为:其中,上午时段有效波动率序列下午时段有效波动率序列l、q分别表示上午与下午时段有效波动次数,T=1时各式表示上午时段各指标,T=2时表示下午时段各指标。本申请的有益效果如下:本实施例提供的光伏发电功率预测方法,首先对采集的历史样本进行野值踢除与补正,然后计算不同时刻气象因子影响权重来优化传统相似日样本选取方案,再接着对相似样本进行有效特征提取以降低输入维数,最后基于广义神经网络(GRNN)算法对发电功率进行短期预测。利用上述方法,由于考虑不同时刻气象因子加权选取相似样本聚类更加科学,进而增强了预测模型泛化能力和预测精度。另外,通过特征提取降低输入维数,进而在降低预测时间。最后,相比传统神经网络如BP算法,本实施例采用的GRNN算法非线性逼近能力更强,进而可以增加预测精度。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种光伏发电功率预测方法的流程示意图;图2为本申请实施例提供的辐照度野值识别与补正的示意图;图3为本申请实施例提供的功率野值识别与补正的示意图;图4为本申请实施例提供的辐照度数值曲线中的有效波动示意图;图5为本申请实施例提供的广义回归神经网络模型的结构示意图;图6为本申请实施例提供的利用不同方法进行功率预测的结果示意图。具体实施方式为了使本
技术领域
的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。由于神经网络算法具有鲁棒性高、非线性逼近能力强等特点,被普遍运用在在光伏发电功率预测中,然而其预测性能与输入维数、训练样本密切相关。为了提高预测精度,本实施例提出一种考虑不同时刻气象因子对发电功率影响权重的改型相似日样本选取方法和对相似样本特征提取降低输入维数的光伏功率预测方法,该方法首先对采集样本进行野值提除与补正;然后计算不同时刻气象因子影响权重优化传统相似日样本选取方案;再接着对相似样本进行有效特征提取;最后基于广义神经网络(GRNN)算法对一日发电功率进行短期预测。基于上述原理,下面将结合附图对本实施例提供的方法进行详细介绍。图1为本申请实施例提供的一种光伏发电功率预测方法的流程示意图。如图1所示,该方法具体包括如下步骤:步骤S110:利用7点二阶算法前推差分算式剔除初始历史样本中的野值点。地表辐照度及光伏发电功率等物理量是时变数据,具有较大的分散性,因此,对坏数据的定义是一个难点,无法从统计原理上给出置信度水平和置信区间将位于区间之外的数值辨识为野值。而低阶多项式拟合方法可以有效剔除野指,其中7点二阶算法前推差分算式可以避免野值逆转将正常值误判为野值,其模型对野值辨识性较好,其计算公式如下其中i=7,8...,N,yi为未处理数据,为7点二阶算法前推差分算式拟合数据。先检验前6个点是正常点,用公式(1)和(2)按时间顺序逐点计算经验表明,满足下列公式即为野值:通常采集得到数据中连续跳点的值都比较近,可用公式(4)剔除连续跳点。当k点为野值时,则满足式(4)的点也是野值:在采集数据中出现连续跳点基本不超过4个,因此本实施例取m=3,当满足式公式(4)的点超过3,则认为yk,yk+1,...yk+m皆为正常值。步骤S120:利用三次样条插值方法对所述野值点进行补正,得到历史样本。根据公式(1)至(4)判别出的野值点进行剔除,然后采用三次样条插值方法用于野值的补正。利用步骤S110和S120提供的野值剔除与补正方法,对2017年3月1日至2018年4月14日8:00-18:00时数据以间隔15min进行采样,每日均得到40个数据并将其预处理,以辐照度、功率为例,采用上述算法进行野值识别与补正,如图2为本申请实施例提供的辐照度野值识别与补正的示意图,图3为本申请实施例提供的功率野值识别与补正的示意图。从图2和3可以验证本实施例所提方法的有效性。进一步的,现有研究大多通过人工智能算法挖掘数据关联信息进行光伏功率预测,选取历史数据进行数据挖掘大致分为两类,第一类是将33种气象专业天气类型通过对历史气象数据特征提取划分成四种广义天气类型,分别搭建四种预测子模型;第二类是将预测日气象信息与历史日气息信息进行相似性度量,选取相似性大的样本划分为一类预测模型。而研究表明,同一广义天气类型下,光伏出力特性差异性较大,预测效果不理想,采用基于相似日选取的光伏功率预测方法取得较好效果。而计算日特征向量欧式距离或者灰色关联度确定相似日,没有考虑不同气象因素对光伏发电重要程度的差异性,所选相似日样本相似度差。因此本实施例提出基于模糊聚类与粗糙集理论的气象因子影响权重计算方法,计算出不同气象因子不同时刻对光伏发电功率重要度,改进预测因子相似度计算。步骤S130:利用模糊聚类与粗糙集理论,对所述历史样本进行聚类,计算出聚类后各类的类中心和气象因子影响权重。首先,介绍模糊聚类分析理论:由于客观事物呈现复杂性,人类对其认识具有模糊性,传统聚类分析方法以精确性为基础,难以处理复杂对象间关系。使用模糊聚类理论进行对象间关系的辨识,推理与决策,更符合客观性。设X={x1,x2,...,xn}为待分类样本集合,集合中每个样本有m个特征为xi=[xi1,xi2,...,xim](i=1,2...,n),从而可以得到数据矩阵记为U:模糊聚类分析的求解步骤如下:1)数据正规化。不同特征之间量纲和数量级不同,造成某些特征对分类效果影响显著,需要对数据矩阵值进行归一化处理,使用极值标准化公式:其中,i=1,2...,n,j=1,2,...,m。2)建立模糊关系矩阵R。计算分类对象xi与xj相关系数rij,i,j=1,2,...,n,rij为模糊矩阵关系R元素。3)聚类。由“传递闭包”求出模糊等价矩阵Rk。根据λ值对Rk进行截割,得到Rk的λ-截矩阵。不同λ值得到不同截矩阵,使用F-统计量方法选取最优λ值下的截矩阵。将截矩阵行向量值相同的归为一类,向量值不同归为不同类。然后,介绍粗糙集理论。粗糙集是波兰数学家Z.Pawlak1982年提出,以等价关系为基础揭示条件属性相对决策属性的重要程度。设是非空有限对象集合称为论域;R为论域内对象的属性集合;V为属性值集合;f为的一个信息函数,将R内每个属性赋数值,属性值相同的两个样本之间关系形成等价关系。某几种属性组成集合A∈R,在属性A下具有等价关系的集合称为等价集。设X为论域上子集,所有包含在X中的基本集的并集组成X的下近似,数学定义如下:其中,x是论域内元素,[x]p为上按等价关系p划分形成包含x的等价集。设C,D是论域内两个等价关系,是等价关系D将论域划分成互不相交的子集,D的C正域表示为POSC(D)。a∈C,属性a对D重要度记为SFG(a,C,D)。属性D对属性C的依赖度记为γC(D),公式如下式(8):a∈C,属性a对D重要度记为SFG(a,C,D),γC-{a}(D)是属性集C缺少属性a后,属性D对属性C依赖度。SFG(a,C,D)=γC(D)-γC-{a}(D)公式(9)本实施例依据地表辐照度、温度、湿度、风速四个气象因子作为样本特征属性,利用F-统计量方法对特征属性进行最佳模糊聚类,将其看作某种决策属性的分类,可得到某决策属性的等价集。使用相同方法,依次删除单个属性在进行F-统计量方法的模糊聚类,将其看作某种决策属性的分类,得到去掉某一属性的等价集;最后,利用粗糙集原理计算特征属性对决策属性的依赖度,并归一化得到各气象因素权重。具体步骤如下:步骤S131:将历史样本中所选取的气象因子作为样本特征属性。为待分类日t时刻历史样本集合,集合每个元素有m个日特征气象因子(i=1,2...,n)组成,本文选取地表辐照度、温度、湿度、风速四个物理量作为气象因子。步骤S132:利用基于F-统计量方法的模糊聚类分析,对所述样本特征属性进行最佳模糊聚类,将历史样本分成k类,得到某决策属性的等价集,并计算簇中心记为其中,i=1,2,...k、j=1,2,3,4,t=1,2,...,m。步骤S133:对所述历史样本中依次删除其中一个气象因子后,再进行基于F-统计量方法的模糊聚类分析,得到去掉某一属性的等价集。步骤S134:利用粗糙集原理,计算样本特征属性对决策属性的依赖度并归一化,得到各所述气象因子影响权重。具体的,得到气象因子t时刻对光伏发电影响权重记为(i=1,2...,n),(j=1,2,3,4),(t=1,2,...,m)。步骤S140:分别计算出待预测日与所述聚类后各类的类中心之间的包含气象因子影响权重的加权欧式距离,选取加权欧式距离最小的类作为训练样本。利用相似度计算公式计算出待预测日与所述聚类后各类的类中心之间的包含气象因子影响权重的加权欧式距离di,其中,为t时刻所选取的气象因子组成的日特征向量,为t时刻历史样本进行模糊聚类分成的k类簇中心,为气象因子t时刻对光伏发电影响权重。利用上述步骤提供的方法,本实施例选取地表辐照度、温度、湿度、风速四个气象因子作为样本特征属性,从2017年3月1日至2018年4月14日8:00时随机选取20个样本数据并对样本进行编号:1,2,...,20。使用上述介绍的基于F统计量的模糊聚类方法对20个样本进行划分,当λ=0.8254时,为7类:{1,2,7,8,9,10,19},{4,5,6,11,12,13,20},{14},{15},{16},{17,18},将此种划分当作某种决策属性等价集。依次删去地表辐照度、温度、湿度、风速,分别进行基于F统计量模糊聚类,聚类结果如下:删除地表辐照度后分类为:{1,2,3,4,5,6,7,8,9,10,11,12,13,19,20},{14,16},{15},{17,18}。删除温度后分类为:{1,2,3,7,8,10},{4,5,6,11,12,20},{9,17,18,19},{13},{14},{15,16}删除湿度后分类为:{1,2,7,8},{3,4,5,6},{9,10,15},{11,12,16,20},{13,14},{17,18},。删除风速后分类为:{1,2,7,8,9,10,19},{4,5,6,11,12,13,20},{14,15},{16,17,18}。根据述粗糙集理论可得地表辐照度的重要程度:SFG(a,C,D)=1-γC-{a}(D)=1-3/20=17/20同样的,依次计算温度、湿度,风速重要度分别是:13/20,14/20,5/20。最后,进行归一化得到地表辐照度、温度、湿度、风速影响权重分别是:(0.35,0.26,0.29,0.1)。同理可得9:00-18:00钟四个气象因子影响权重,如下表一所示:表一:进一步的,针对光伏功率预测模型输入维数高,目前有提出基于特征提取方法降低输入维数,使用辐照度均值,方差和三阶方差特征指标刻画辐照度整体特性。由于地表辐照度受云层、气溶胶,水汽等影响,其值具有随机性与波动性特点,上述提出的特征指标仅从整体上刻画辐照度特性掩盖了局部特性,因此本实施例提出辐照度指标描述体系,对辐照度进行科学描述。步骤S150:对所述训练样本中的数据进行预测模型输入特征提取,得到特征提取值。一天中辐照度数值曲线本身呈现抛物线形的波动,这是其本身固有的波动特性,受到云层遮挡等方面的影响,会在固有波动的基础上产生随机波动,若仍采用普通统计指标提取其出力波动性特征,则难以区分固有波动特性与随机波动特性,因此本实施例提出有效波动率的概念来对光伏出力的波动水平进行描述。图4为本申请实施例提供的辐照度数值曲线中的有效波动示意图。如图4所示,本实施例定义辐照度数值曲线中,与固有波动方向相反的出力曲线波动为有效波动,每次有效波动的极小值点与其相邻最近的极大值点辐照度度差值的绝对值为该次波动的有效波动量,记为则日平均有效波动率η可以按下式计算:其中,N为有效波动的次数。日平均有效波动率是表征光伏电站当日辐照度波动情况的重要特征,间接反映天气状态的变化情况。该特征的值越小,表示光伏电站出力的当日平均有效波动性越小,天气状态越稳定。另外,本实施例还提出子时段辐照度均值概念,可以分时段确定辐照度曲线大致的幅值大小,有助于实现对多天气状态下辐照度特性精确化的科学描述。(1)子时段辐照度均值其中,m为上午时段采样点个数,n为总采样点个数,分别表示上、下午时段的辐照度均值。子时段辐照度均值描述不同时段辐照度平均值大小。(2)子时段辐照度波动率的均值、极大值式中,Q1,Q2分别表示上午与下午时段有效波动率序列。l、q分别表示上午与下午时段有效波动次数。子时段波动率的均值、极大值可分别表示为:其中,T=1时各式表示上午时段各指标;T=1时表示下午时段各指标。表示子时段的平均有效波动率。若某时段平均有效波动率较高,说明在此时段光伏电站受云层移动等天气变化的影响整体较大。可以描述子时段波动的最大程度,该特征值越大,说明该时段辐照度的波动对电网的冲击越大。另外,本实施例还选取风速均值、气压均值、湿度均值作为样本特征提取值。步骤S160:将所述特征提取值输入到广义回归神经网络模型进行模型训练,得到训练后的广义回归神经网络模型。广义回归神经网络(GRNN)归属径向基神经网络类别,具有非线性映射能力强、网络鲁棒性高,且小样本量前提下预测精度高等优点,算法实质是求非独立变量相对独立变量最大概率条件下的非线性回归。设X,Y分别是随机变量x,y样本观测值,y相对X的预测值其中,Xi,Yi是随机变量x和y样本观测值,σ为光滑因子、可以人为选取。图5为本申请实施例提供的广义回归神经网络模型的结构示意图。如图5所示,GRNN网络有四层结构,分别是输入层、模式层、求和层和输出层。X=[x1,x2,...,xn]T为网络输入向量,Y=[y1,y2,...,yk]T为网络输出向量;模式层和输入层神经元个数相等,模式层神经元传递函数如下:求和层包含两类单元,一类是对模式层所有神经元累加,公式如下:另一类对模式层所有神经元赋权重求和,公式如下:输出层神经元个数和网络输出向量Y维数相等,第j个神经元输出值为第j个元素:利用上述模型,上将选取的下午时段的辐照度均值、辐照度波动率的均值、极大值,及风速均值、气压均值、湿度均值、共9个物理量作为GRNN网络模型输入,选取8:00-18:00间隔30min光伏发电功率数值共21个物理量GRNN作为模型输出值,进行模型训练。步骤S170:将从所述待预测日中提取的特征值输入到所述训练后的广义回归神经网络模型,得到所述待预测日的功率预测值。利用训练好的模型,对待预测日进行样本数据特征值日趋,并将提取的特征值输入到所述训练后的广义回归神经网络模型,进而得到所述待预测日的功率预测值。为验证本实施例所提方案可行性,选取云南大理西村光伏电站2017年3月1日至2018年4月14日实测数据,采样时间间隔15分钟,采样时间8:00-18:00。利用MATLAB预测一日中8:00至18:00间隔30min光伏发电功率,GRNN输入神经元个数9个,输出神经元21个,采用交叉验证方式训练GRNN神经网络,并循环找出最佳光滑因子σ值。考虑样本量对预测网络的影响,将聚类数限制在3-6类,基于F统计量进行模糊聚类,结果表明最优化分为5类,将待预测日特征向量与类中心求取欧式加权聚离,结果表明与第三类最为相似,样本数为60,为了对本文所提方案进行对比,首先使用传统欧式距离选取相似样本,相似样本数量取为60,带入BP、GRNN网络进行预测。图6为本申请实施例提供的利用不同方法进行功率预测的结果示意图。如图6所示,本实施例提供的GRNN网络预测结果要优于BP网络,同时,本实施例进行样本特征提取后,预测精度与未降维前。进一步的,采用均方根误差、平均相对误差和运算时间进行方案性能对比,结果如下表二所示:表二:神经网络比较BPGRNN特征提取GRNN运算时间20.3s12.6s8.1s均方根误差20.8915.0210.95平均相对误差0.500.290.32通过上述仿真结果表明,本文提出的基于GRNN光伏功率预测模型具有以下优点,由于考虑不同时刻气象因子加权选取相似样本聚类更加科学,进而增强了预测模型泛化能力和预测精度。另外,通过特征提取降低输入维数,进而在降低预测时间,有利于在线预测,且预测精度与未降维前相当。最后,相比传统神经网络如BP算法,本实施例采用的GRNN算法非线性逼近能力更强,进而可以增加预测精度。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。以上仅是本发明的具体实施方式,应当指出,对于本
技术领域
的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1