一种短期光伏功率预测方法与流程

文档序号:16539326发布日期:2019-01-08 20:12阅读:364来源:国知局
一种短期光伏功率预测方法与流程

本发明属于新能源发电和智能电网技术领域,具体涉及一种使用关联规则、核主成分分析和elman神经网络的混合预测方法对短期光伏功率进行预测。



背景技术:

随着社会经济的不断发展,人类对于能源的依赖和需求也越来越大,能源问题越来越成为制约人类社会发展的瓶颈。太阳能因其取之不尽、用之不竭及没有污染的特性成为最理想、也是发展最为迅速的绿色能源之一。作为太阳能开发利用的重要方式,光伏发电具有无燃料消耗、无污染物排放、应用形式灵活等优点,有着非常广阔的应用前景。然而,光伏发电易受变化多端的太阳辐射强度和环境因素影响,其输出具有波动性和间歇性,这势必会严重影响其并网后,电力系统的稳定性和可靠性。因此,急需找到一种准确可靠的光伏发电功率预测方法,来减轻光伏发电系统并网所造成的不利影响,确保整个电力系统的规划和稳定运行。

准确预测的核心在于对历史样本数据的处理,然而这些数据往往是十分庞大的,如何从中选取合理有效的数据作为训练样本是预测的一个重要环节。灰色关联分析作为数据挖掘技术中的一种方法,其复杂度低,对大数据集有较高的处理效率。用其作为处理历史数据的方法,可以提取到合理有效的样本数据。

考虑到光伏输出功率的影响因素较多,各变量间存在着一定的相关性,用此数据作为训练样本,难以达到较高的预测精度。为了去除输入变量间存在着的冗余信息,主成分分析(principalcomponentanalysis,pca)方法被广泛采用。然而,它仅涉及在数据的原始空间上进行线性化处理。与这种方法相比,核主成分分析(kernelpca,kpca)方法能有效地在高维核特征空间上进行数据的非线性特征提取,从而提高提取非线性信息的全面性、有效性以及运行速度。

在预测工具的选取上,目前传统静态前馈神经网络方法只能实现静态非线性映射功能,容易陷入局部最小化;支持向量机对参数的选取敏感,并且训练速度缓慢。为了克服上述缺点,j.l.elman于1990年针对语音处理问题提出了具有动态递归性能的elman神经网络,该网络能够在有限的时间内逼近任意函数,其训练速度也有了非常大的提升。

光伏发电波动性较大,是一个非平稳的随机过程,有限样本训练的神经网络结构往往是不完全稳定的。由于状态概率转移矩阵具有追踪变量随机波动的能力,将其用于对神经网络的预测结果修正,可以提高预测模型的预测精度。



技术实现要素:

本发明目的在于提供一种短期光伏功率预测方法,该方法基于数据挖掘、核主成分分析和elman神经网络进行混合预测,其预测精确度较高。

为实现上述目的,本发明采用了以下技术方案:

一种短期光伏功率预测方法,该方法是基于数据挖掘、核主成分分析和elman神经网络的混合预测方法,以提高预测精度。其中灰色关联分析是一种数据挖掘方法,它通过判断系统中各因素的关联程度,抽取与预测日高度关联的若干历史发电功率日,组成具有高度相似特征的数据序列作为训练样本;为了去除输入变量间存在的冗余信息,核主成分分析法被用于对训练样本进行特征提取,以较少输入代替原始大量输入;elman神经网络作为一种具有动态记忆功能的精确预测工具,被用于对光伏功率进行初步预测;最后针对预测模型在功率波动的峰值处预测误差较大及预测精度存在波动性,采用马尔科夫方法对初步得到的预测值进行修正,得到最终的预测结果。

本发明所述预测方法的内容包括如下步骤:

步骤1:收集历史数据,包括功率数据和相关气象数据,得到训练样本时间序列,并进行数据预处理;

步骤2:根据预测日的季节和天气类型预报信息从样本库中挑选出相同季节和日天气类型的历史发电日组成初步样本;

步骤3:采用灰色关联分析法确定与预测日气象最接近的若干相似日;

步骤4:基于核主成分分析法提取光伏数据特征;

步骤5:利用蚁群算法训练神经网络的权值和阈值,采用训练好的神经网络对光伏功率进行预测;

步骤6:采用马尔科夫方法对初步得到的预测值进行修正,得到最终的预测结果。

进一步的,步骤3中,所述采用灰色关联分析法确定与预测日气象最接近的若干相似日,就是在步骤2简单分类的基础上,确定与预测日气象最接近的若干相似日,其具体内容包括如下步骤:

步骤3.1:选取每日气象特征向量:

xi=[thi,t1,tli,t2,tai,rh,ri](1)

其中,thi,tli,tai分别为第i日的日最高气温、最低气温和平均气温,单位为℃;t1和t2分别为日最高气温和最低气温出现的时刻;rh为相对湿度,用%(百分比)表示;ri为日降雨量,单位为mm;

步骤3.2:记预测日的气象特征向量为x=[x(1),x(2),…,x(n)]t,则第i个历史日的气象因素特征向量记为xi=[xi(1),xi(2),…,xi(n)]t,其中,n为特征向量分量的个数;

对第i个历史日,第k个气象特征向量分量进行归一化处理:

其中,xi(k)为第i个历史日的第k个气象特征向量分量;xi,max(k)和xi,min(k)分别为第k个气象特征向量分量的最大值和最小值;

步骤3.3:计算预测日和第i个历史日第k个气象特征向量分量的关联系数为:

其中,x'(k)和x'i(k)分别为归一化后的预测日和第i日第k个气象特征向量分量;ρ是分辨系数,通常取ρ=0.5;

步骤3.4:计算第i日和预测日的总关联度为:

从最临近的历史日开始,逐一计算与预测日的相似度,并按日期顺序排列,选取相似度fi≥0.85的a天作为预测日的相似日。

进一步的,步骤4中,所述基于核主成分分析法提取光伏数据特征,就是根据核主成分分析法提取光伏数据特征,其具体步骤如下:

步骤4.1:对于每日n个采样点的发电功率预测,假设共m个样本,则可以得到初始输入变量矩阵xm×n;

步骤4.2:计算中心化后核矩阵k的特征值λi和相应的正交单位化特征向量ei;

步骤4.3:计算特征值之后,按照数值大小对其进行排列,如λ1≥λ2≥…≥λm;

步骤4.4:计算特征值的贡献率ηi以及累计贡献率ησ(i),确定主成分个数以及主成分分量yi。

进一步的,步骤5中,所述利用蚁群算法训练神经网络权值和阈值,其权值和阈值的计算步骤如下:

步骤5.1:设置初始条件;

步骤5.2:启动所有蚂蚁,每只蚂蚁k从第1个集合开始,按照路径选择规则依次在每个集合中选择一个元素;

步骤5.3:重复步骤5.2,直到蚁群中的所有蚂蚁全部到达食物源;

步骤5.4:当所有蚂蚁在每个集合中都选择了一个元素,并按照原路径返回蚁巢,设该过程经历n个时间单位,则所选择元素的信息素按下式做调整:

τj(ipi)(t+n)=ρτj(ipi)(t)+δτj(ipi)(5)

式中,参数ρ(0<ρ<1)表示信息素的残留程度,则1-ρ表示信息素的消逝程度;表示第k只蚂蚁在本次循环中,在集合ipi的第j个元素pj(ipi)上留下的信息素,可用下式计算:

式中,q是常数,用于调节信息素的调整速度,ek是将第k只蚂蚁选择的一组元素作为神经网络的权值和阈值时,训练样本集后的最大输出误差:

式中,s为样本数目,on和oex分别是神经网络的实际输出和期望输出,故ek越小,相应信息素的增加就越多;

步骤5.5:当所有蚂蚁全部收敛到一条路径或迭代次数n≥nmax,则迭代结束,输出最优解;否则转步骤5.2。

进一步的,步骤6中,所述采用马尔科夫方法对初步得到的预测值进行修正,得到最终的预测结果,其具体步骤如下:

步骤6.1:根据神经网络的预测值,计算预测相对误差δ;

步骤6.2:计算当状态eik次后转移到状态ej时的概率

步骤6.3:将测试样本预测值的相对误差δ所处的不同上下阈值作为状态划分值域,建立状态划分标准;根据残差状态计算状态转移概率矩阵;

步骤6.4:根据光伏发电预测模型预测的误差数据,确定初始状态向量x(0),并计算出第k步的状态转移结果;

步骤6.5:根据得到的马尔科夫预测相对误差,计算修正后的光伏功率值p。

本发明提供了一种考虑光伏发电功率影响因素之间存在的冗余信息,以及预测模型初步预测结果存在误差的准确可靠的预测方法,减轻了光伏发电系统并网所造成的不利影响,从而确保了整个电力系统的规划和稳定运行。

由于采用上述技术方案,本发明提供的一种短期光伏功率预测方法,与现有技术相比具有这样的有益效果:

1、本发明通过数据挖掘算法的使用能够更好的从大量历史数据中挖掘有效信息,并且灰色关联分析法的使用使得整个过程非常省时高效。

2、本发明引入核主成分分析法对训练样本的输入个数进行降维优选,使降维后的数据相关性降低,提高了预测精度。

3、本发明采用具有动态记忆功能的elman神经网络作为预测工具,该方法克服传统静态前馈神经网络训练速度慢和泛化能力差的缺点,进一步提高了预测精度。

4、大多数的预测都是直接以模型的输出作为最终的预测结果,本发明引入马尔科夫链对模型的初步预测误差进行补偿修正,得到最终的预测结果,提高了预测精度。

附图说明

图1为所述预测方法的流程框图;

图2为本发明所采用的预测工具elman神经网络的结构图;

图3为本发明晴天的预测相对误差对比图;

图4为本发明晴天24-h光伏预测结果;

图5为本发明雨天的预测相对误差对比图;

图6为本发明雨天24-h光伏预测结果。

具体实施方式

下面结合附图与具体实施方式对本发明作进一步详细描述:

本发明的一种短期光伏功率预测方法,由于光伏发电的随机性和波动性较大,直接预测势必会导致预测效果变差,本发明方法中首先将原历史数据中的异常值替换,并引用在处理大数据量方面具有独特优势的数据挖掘技术,寻找与预测日同等气象类型的多个历史功率日,组成具有高度相似特征的数据序列;其次,利用核主成分分析法对训练样本的输入个数进行降维优选,提取出主成分序列;然后,利用蚁群算法优化的elman神经网络对数据进行预测;最后,针对elman神经网络预测模型在功率波动的峰值处预测误差较大及预测精度存在波动性,采用马尔科夫方法对初步得到的预测值进行修正,得到最终的预测结果。使用关联规则和核主成分分析的elman神经网络短期光伏功率预测的流程图如图1所示,其具体步骤如下:

步骤1,收集历史数据,包括功率数据和相关气象数据,得到训练样本时间序列,并进行数据预处理。

首先,历史数据中往往包含着很多不合理的超出正常范围的数据,这些数据会对预测造成不良影响,因此采用平均值法替代这些数据:

其中,pi,mean(t)、pi-1(t)和pi-2(t)分别是第i日、第i-1日和第i-2日同一t时刻的光伏发电功率。

步骤2,确定光伏系统发电功率的主要影响因素,根据预测日的季节和天气类型预报信息从样本库中挑选出相同季节和日天气类型的历史发电日,形成初步样本:

单位面积的光伏发电系统输出功率计算公式为:

ps=ηsi[1-0.005(t0+25)](10)

其中,η为光伏电池转换效率,以%(百分数)表示;s为光伏阵列面积,单位为m2;i为太阳辐照强度,单位为kw/m2;t0为环境温度,单位为℃。

根据式(10)可知,影响光伏系统发电功率的主要因素是天气类型、太阳辐照强度、环境温度、光伏电池的转换效率和阵列面积。对于同一光伏发电系统,η和s等影响因素已经包含在历史发电数据中,不再考虑。气象部门提供的天气信息,基本包括天气类型、温度、湿度和风力。

根据预测日的季节和天气类型预报信息从样本库中挑选出相同季节和日天气类型的历史发电日组成初步样本。

步骤3,采用灰色关联分析法确定与预测日气象最接近的若干相似日,具体步骤如下:

(1)选取每日气象特征向量如下:

xi=[thi,t1,tli,t2,tai,rh,ri](11)

其中,thi,tli,tai分别为第i日的日最高气温、最低气温和平均气温,单位为℃;t1,t2分别为日最高气温和最低气温出现的时刻;rh为相对湿度,以%(百分数)表示;ri为日降雨量,单位为mm;

(2)记预测日的气象特征向量为x=[x(1),x(2),…,x(n)]t,则第i个历史日的气象因素特征向量记为xi=[xi(1),xi(2),…,xi(n)]t,其中,n为特征向量分量的个数;

对第i个历史日,第k个气象特征向量分量进行归一化处理:

其中,xi(k)为第i个历史日的第k个气象特征向量分量;xi,max(k)和xi,min(k)分别为第k个气象特征向量分量的最大值和最小值;

(3)计算预测日和第i个历史日第k个气象特征向量分量的关联系数为:

其中,x'(k)和x'i(k)分别为归一化后的预测日和第i日第k个气象特征向量分量;ρ是分辨系数,通常取ρ=0.5;

(4)计算第i日和预测日的总关联度为:

从最临近的历史日开始,逐一计算与预测日的相似度,并按日期顺序排列,选取相似度fi≥0.85的a天作为预测日的相似日。

步骤4,根据核主成分分析法提取光伏数据特征,具体步骤如下:

(1)对于每日n个采样点的发电功率预测,假设共m个样本,则可以得到初始输入变量矩阵xm×n,即:

(2)对输入变量矩阵xm×n的主分量的搜索就等于是计算中心化后核矩阵k的特征值λi和相应的正交单位化特征向量ei;

(3)计算特征值之后,按照数值大小对其进行排列,如λ1≥λ2≥…≥λm;

(4)根据设定的提取率确定主成分个数以及主成分分量yi;依据是计算特征值的贡献率ηi以及累计贡献率ησ(i):

步骤5,利用蚁群算法训练神经网络的权值和阈值,采用训练好的神经网络对光伏功率进行预测。

其中所述蚁群算法训练神经网络权值和阈值,其权值和阈值的计算步骤如下:

(1)设置初始条件:令时间t=0和迭代次数n=0,设置最大迭代次数为nmax,蚂蚁的数目为l,令集合ipi(1≤i≤m)中的每个元素在初始时刻的信息素τj(ipi)(0)=0,且δτj(ipi)=0,将全部蚂蚁置于蚁巢;

(2)启动所有蚂蚁,每只蚂蚁k从第1个集合开始,按照下述路径选择规则依次在每个集合中选择一个元素;

路径选择规则:对于集合ipi,任意一只蚂蚁k(k=1,2,…,l)根据计算的概率p随机地选择它的第j个元素:

(3)重复步骤(2),直到蚁群中的所有蚂蚁全部到达食物源;

(4)当所有蚂蚁在每个集合中都选择了一个元素,并按照原路径返回蚁巢,设该过程经历n个时间单位,则所选择元素的信息素按下式做调整:

τj(ipi)(t+n)=ρτj(ipi)(t)+δτj(ipi)(20)

式中,参数ρ(0<ρ<1)表示信息素的残留程度,则1-ρ表示信息素的消逝程度;表示第k只蚂蚁在本次循环中,在集合ipi的第j个元素pj(ipi)上留下的信息素,可用下式计算:

式中,q是常数,用于调节信息素的调整速度,ek是将第k只蚂蚁选择的一组元素作为神经网络的权值和阈值时,训练样本集后的最大输出误差:

式中,s为样本数目,on和oex分别是神经网络的实际输出和期望输出,故ek越小,相应信息素的增加就越多;

(5)当所有蚂蚁全部收敛到一条路径或迭代次数n≥nmax,则迭代结束,输出最优解。否则转步骤(2)。

步骤6,采用马尔科夫方法对初步得到的预测值进行修正,得到最终的预测结果,其具体步骤如下:

(1)根据神经网络的预测值,计算预测相对误差δ:

式中,pex为神经网络预测发电量,pn为实际发电量;

(2)当状态eik次后转移到状态ej时,概率为:

式中,为样本状态从ei到ej的转移次数,ai为状态出现的总次数;

(3)将测试样本预测值的相对误差δ所处的不同上下阈值作为状态划分值域,建立状态划分标准;根据残差状态计算状态转移概率矩阵p(k)

式中,n为分级后的状态个数;

(4)根据光伏发电预测模型预测的误差数据,确定初始状态向量x(0),并由状态转移公式(27)计算出第k步的状态转移结果:

x(k)=x(0)p(k)(27)

(5)根据得到的马尔科夫预测相对误差,计算修正后的光伏功率值p:

式中,δh、δl为所处误差状态区间的上下阈值。

下面通过实例对本发明进行说明,这里光伏发电的数据来自美国新能源实验室。以晴天为例,对其进行光伏功率预测。首先采用灰色关联分析法确定与预测日相似度最高的5天,其相关系数由高到低分别为:0.93,0.92,0.90,0.87,0.85。接下来,选取影响光伏发电功率的14个主要影响因素:与预测日相似度最高的5天同一时刻的功率值、与预测日相似度最高的1天该时刻前后2个时刻的功率值、预测日的最高温度、最低温度、平均温度、相对湿度、降雨量,预测日该时刻的温度、太阳辐照强度。然后,对得到的这14个主要影响因素采用kpca方法进行降维处理,核函数采用径向基核函数,计算得到的特征值、方差贡献率及累计方差贡献率列于下面表1中:

表1

取方差累计贡献率上限为95%,从表1可以看出,前3个主成分的方差累计贡献率达到95.4707%,说明这3项主成分可以代替原来的14个影响因素。

将提取特征后的主成分作为训练集,使用elman神经网络进行预测,并对初步得到的预测结果进行马尔科夫残差修正,将得到的预测结果与其他方法进行对比。图2所示是本发明所使用的预测工具elman神经网络的结构图。方法1是本发明方法,方法2是未经马尔科夫残差修正的预测方法,方法3是采用未经核主成分提取的样本作为elman神经网络输入量的预测方法。三种预测方法在晴天和雨天的预测相对误差对比图如图3和图5所示。晴天和雨天24-h两种具有代表性的光伏功率预测结果曲线如图4和图6所示。由此可见本发明预测方法能有效提高预测精度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1