一种用于光伏功率预测的天气类型识别方法和装置与流程

文档序号:14250118阅读:197来源:国知局
一种用于光伏功率预测的天气类型识别方法和装置与流程

本发明涉及新能源技术领域,具体涉及一种用于光伏功率预测的天气类型识别方法和装置。



背景技术:

目前,由于能源危机和环境恶化,太阳能成为化石能源的重要替代品。作为太阳能利用的重要技术路径,光伏发电系统近年来发展迅速。2015年,中国成为全球光伏发电装机容量最大的国家。但是,由于光伏电站的大规模开发建设,电网的稳定和电能质量受到严重影响,光伏消纳已成为光伏产业进一步发展的重要障碍,而功率预测又是解决光伏消纳问题的有效途径。一方面,功率预测可以提供重要的瞬态功率信息,用于协调控制和电网优化调度,另一方面,功率预测可以提高光伏消纳能力,增加光伏电站投资回报率。

光伏发电系统的输出功率与周围气象条件,特别是辐照强度有着密切的联系。而辐照强度会受到地理位置、季节因素、云层遮盖等影响,在不同的天气状况下呈现不同的波动性,其预测精度难以提高。当前,关于光伏功率预测的研究有好多,一般都通过建立子模型提高光伏功率预测模型的泛化能力,从而提升光伏功率预测精度。一般情况下,子模型采用相似性较高的数据,也就是说先将历史数据按照相似度分为若干类,然后每一类数据建立子模型。天气类型识别的主要作用就是将气象条件类似的数据样本归为一类,建立子模型以排除干扰因素,提高预测精度。当前,天气类型识别主要来源于天气预报。现有技术关于光伏功率预测方面的研究较多,相关研究分析了影响光伏出力的气象因素,结合光伏系统实际运行数据和气象信息,提出基于天气类型聚类和ls-svm的光伏出力预测模型。选取太阳辐照时间、温度、相对湿度等作为气象特征向量,通过计算各向量的加权欧氏距离,筛选出最佳聚类集合,确定训练样本,使样本数据能更好地反映待预测日的实际气象信息。取最佳聚类日气象特征、相应光伏出力及待预测日气象特征输入训练好的ls-svm模型,输出为待预测日对应时刻的光伏出力。但是基于天气类型聚类和ls-svm的光伏出力预测方法中该天气类型繁多且过于精细,增加了光伏出力预测模型的复杂程度,计算效率低,实时性差。除了上述研究,现有技术中还以光照强度和温度作为输入量,分季节建立了基于lvq-ga-bp神经网络预测系统,通过学习向量量化(learningvectorquantization,lvq)神经网络对天气类型进行分类和识别。基于lvq-ga-bp神经网络光伏电站出力短期预测方法中天气类型分类过于关注气象信息,对气象数据波动性关注不多,导致光伏功率预测结果不准确。



技术实现要素:

为了克服上述现有技术中天气类型繁多、过于精细以及光伏功率预测结果不准确的不足,本发明提供一种用于光伏功率预测的天气类型识别方法和装置,先对光伏气象站的历史数据进行清洗,并根据清洗后的历史数据确定每日气象特征库,然后对每日气象特征库中的气象特征样本进行k-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签,最后通过反向传播神经网络模型实现预测日天气类型的识别。

为了实现上述发明目的,本发明采取如下技术方案:

本发明提供一种用于光伏功率预测的天气类型识别方法,包括:

对光伏气象站的历史数据进行清洗,并根据清洗后的历史数据确定每日气象特征库;

对每日气象特征库中的气象特征样本进行k-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签;

通过反向传播神经网络模型对预测日天气类型进行识别;

所述反向传播神经网络模型通过对最终聚类结果和类别标签进行训练得到。

所述历史数据包括光伏气象站收集的气象信息和电力计量装置收集的功率信息;

所述气象信息包括辐照强度和温度。

所述对光伏气象站的历史数据进行清洗包括:

采用支持向量回归法对历史数据进行拟合,得到如下式的历史数据的光伏功率残差:

rei=|pi-pi′|

其中,rei表示第i个历史数据的光伏功率残差,pi表示第i个历史数据的实时功率,pi′表示第i个历史数据拟合后的实时功率;

将历史数据的光伏功率残差与残差阈值进行对比,并将超过残差阈值的历史数据进行排除。

所述每日气象特征库包括气象特征样本;

所述气象特征样本对应的气象特征包括气象指标和辐照波动指标;

所述气象指标包括最大辐照强度irmax和最高温度tmax;

所述辐照波动指标包括最大波动diffirmax、波动标准差stdir、波动均值mvir和波动三阶导数mvir;其中diffirmax按下式确定:

diffirmax=max(diffiri)

其中,diffiri表示第i个历史数据的一阶差分,且diffiri=iri+1-iri,i=1,2,...,n-1,iri+1表示第i+1个历史数据的辐照度,iri表示第i个历史数据的辐照度。

所述气象特征样本的格式为[irmax,tmax,diffirmax,stdir,mvir,tdirmax]。

所述对每日气象特征库中的气象特征样本进行k-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签,包括:

根据最大值特征[irmax,tmax,diffirmax,tdirmax]对气象特征样本进行第一次聚类,并通过第一轮廓系数对第一次聚类结果进行优化,得到优化结果;

根据优化结果对统计特征[stdir,mvir]进行第二次聚类,并通过第二轮廓系数对第二次聚类结果进行优化,得到最终聚类结果和类别标签。

所述通过反向传播神经网络模型对预测日天气类型进行识别,包括:

利用反向传播神经网络对最终的聚类结果和类别标签进行训练,得到反向传播神经网络模型;

将预测日的气象特征输入反向传播神经网络模型,得到预测日的天气类型。

本发明还提供一种用于光伏功率预测的天气类型识别装置,包括:

清洗模块,用于对光伏气象站的历史数据进行清洗,并根据清洗后的历史数据确定每日气象特征库;

聚类模块,用于对每日气象特征库中的气象特征样本进行k-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签;

识别模块,用于通过反向传播神经网络模型对预测日天气类型进行识别;

所述反向传播神经网络模型通过对最终聚类结果和类别标签进行训练得到。

所述历史数据包括光伏气象站收集的气象信息和电力计量装置收集的功率信息;

所述气象信息包括辐照强度和温度。

所述清洗模块具体用于:

采用支持向量回归法对历史数据进行拟合,得到如下式的历史数据的光伏功率残差:

rei=|pi-pi′|

其中,rei表示第i个历史数据的光伏功率残差,pi表示第i个历史数据的实时功率,pi′表示第i个历史数据拟合后的实时功率;

将历史数据的光伏功率残差与残差阈值进行对比,并将超过残差阈值的历史数据进行排除。

所述每日气象特征库包括气象特征样本;

所述气象特征样本对应的气象特征包括气象指标和辐照波动指标;

所述气象指标包括最大辐照强度irmax和最高温度tmax;

所述辐照波动指标包括最大波动diffirmax、波动标准差stdir、波动均值mvir和波动三阶导数mvir;其中diffirmax按下式确定:

diffirmax=max(diffiri)

其中,diffiri表示第i个历史数据的一阶差分,且diffiri=iri+1-iri,i=1,2,...,n-1,iri+1表示第i+1个历史数据的辐照度,iri表示第i个历史数据的辐照度。

所述气象特征样本的格式为[irmax,tmax,diffirmax,stdir,mvir,tdirmax]。

所述聚类模块具体用于:

根据最大值特征[irmax,tmax,diffirmax,tdirmax]对气象特征样本进行第一次聚类,并通过第一轮廓系数对第一次聚类结果进行优化,得到优化结果;

根据优化结果对统计特征[stdir,mvir]进行第二次聚类,并通过第二轮廓系数对第二次聚类结果进行优化,得到最终聚类结果和类别标签。

所述识别模块具体用于:

利用反向传播神经网络对最终的聚类结果和类别标签进行训练,得到反向传播神经网络模型;

将预测日的气象特征输入反向传播神经网络模型,得到预测日的天气类型。

与最接近的现有技术相比,本发明提供的技术方案具有以下有益效果:

本发明提供的用于光伏功率预测的天气类型识别方法中,先对光伏气象站的历史数据进行清洗,并根据清洗后的历史数据确定每日气象特征库,然后对每日气象特征库中的气象特征样本进行k-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签,最后通过反向传播神经网络模型实现预测日天气类型的识别,识别过程简单,且识别出的天气类型比较稀少,能够保证光伏功率预测结果的准确性;

本发明提供的用于光伏功率预测的天气类型识别装置包括用于对光伏气象站的历史数据进行清洗并根据清洗后的历史数据确定每日气象特征库的清洗模块,用于对每日气象特征库中的气象特征样本进行k-means聚类并对聚类结果进行优化的聚类模块以及用于通过反向传播神经网络模型对预测日天气类型进行识别的识别模块,最终实现预测日天气类型的识别;

本发明提供的技术方案采用光伏气象站的历史数据,包括光伏气象站收集的气象信息和电力计量装置收集的功率信息,能够反映光伏电站的实际天气变化情况;

本发明提供的技术方案采用了支持向量回归法对光伏气象站的历史数据进行清洗,提高了数据的可靠性;

本发明提供的技术方案采用了最大辐照强度、最高温度、最大波动、波动标准差、波动均值和波动三阶导数组成的混合的气象特征用于区分不同的天气类型,着重强调辐照波动性对光伏输出的影响,更适合光伏功率预测;

本发明提供的技术方案采用了分层的k-means聚类,综合光伏最大出力状况和波动状况,分类合理,更加能够反映现场实际情况。

附图说明

图1是本发明实施例1中用于光伏功率预测的天气类型识别方法流程图;

图2是本发明实施例1中光伏气象站的历史数据清洗流程图;

图3是本发明实施例1中气象特征样本的k-means聚类流程图;

图4是本发明实施例1中反向传播神经网络基本结构示意图;

图5是本发明实施例2中数据清洗前的svr拟合残差分布示意图;

图6是本发明实施例2中数据清洗后的svr拟合残差分布示意图。

具体实施方式

下面结合附图对本发明作进一步详细说明。

实施例1

本发明实施例1提供一种用于光伏功率预测的天气类型识别方法,该方法的具体流程如图1所示,具体包括以下步骤:

s101;对光伏气象站的历史数据进行清洗,并根据清洗后的历史数据确定每日气象特征库;

s102;对s101确定的每日气象特征库中的气象特征样本进行k-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签;

s103;通过反向传播神经网络模型对预测日天气类型进行识别,其中的反向传播神经网络模型通过对s102得到的最终聚类结果和类别标签进行训练得到。

上述s101中的历史数据包括光伏气象站收集的气象信息和电力计量装置收集的功率信息,其中气象信息包括辐照强度和温度。

上述s101中,对光伏气象站的历史数据进行清洗具体流程如图2所示,具体过程如下:

1)采用支持向量回归法对历史数据进行拟合,得到如下式的历史数据的光伏功率残差:

rei=|pi-pi′|

其中,rei表示第i个历史数据的光伏功率残差,pi表示第i个历史数据的实时功率,pi′表示第i个历史数据拟合后的实时功率;

2)将历史数据的光伏功率残差与残差阈值进行对比,并将超过残差阈值的历史数据进行排除。

上述s101确定的每日气象特征库包括多个气象特征样本,每个气象特征样本对应的气象特征包括气象指标和辐照波动指标;

其中的气象指标包括最大辐照强度irmax和最高温度tmax;

其中的辐照波动指标包括最大波动diffirmax、波动标准差stdir、波动均值mvir和波动三阶导数mvir;其中diffirmax=max(diffiri),diffiri表示第i个历史数据的一阶差分,且diffiri=iri+1-iri,i=1,2,...,n-1,iri+1表示第i+1个历史数据的辐照度,iri表示第i个历史数据的辐照度。

上述气象特征样本的格式为[irmax,tmax,diffirmax,stdir,mvir,tdirmax]。

上述s102中,对每日气象特征库中的气象特征样本进行k-means聚类(具体的k-means聚类流程如图3所示),并对聚类结果进行优化,得到最终聚类结果和类别标签,具体过程如下:

1)根据最大值特征[irmax,tmax,diffirmax,tdirmax]对气象特征样本进行第一次聚类,并通过第一轮廓系数对第一次聚类结果进行优化,得到优化结果;

2)根据优化结果对统计特征[stdir,mvir]进行第二次聚类,并通过第二轮廓系数对第二次聚类结果进行优化,得到最终聚类结果和类别标签。

s103中,通过反向传播神经网络模型对预测日天气类型进行识别的具体过程如下:

1)利用反向传播神经网络对最终的聚类结果和类别标签进行训练,得到反向传播神经网络模型,反向传播神经网络基本结构如图4所示,其中x1-xk为k个输入,y1-ym为y个输出,φ1-φk为k个中间量。计算过程由正向计算过程和反向计算过程组成。正向传播过程,输入模式从输入层经隐单元层逐层处理,并转向输出层,每一层神经元的状态只影响下一层神经元的状态。如果在输出层不能得到期望的输出,则转入反向传播,将误差信号沿原来的连接通路返回,通过修改各神经元的权值,使得误差信号最小。

2)将预测日的气象特征输入反向传播神经网络模型,得到预测日的天气类型。

基于同一发明构思,本发明实施例1还提供了一种用于光伏功率预测的天气类型识别装置,这些设备解决问题的原理与上述的用于光伏功率预测的天气类型识别方法相似,本发明实施例1提供的用于光伏功率预测的天气类型识别装置包括清洗模块、聚类模块和识别模块,下面分别对上述三个模块的功能进行详细说明:

其中的清洗模块,用于对光伏气象站的历史数据进行清洗,并根据清洗后的历史数据确定每日气象特征库;

其中的聚类模块,用于对每日气象特征库中的气象特征样本进行k-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签;

其中的识别模块,用于通过反向传播神经网络模型对预测日天气类型进行识别,其中的反向传播神经网络模型通过对最终聚类结果和类别标签进行训练得到。

上述的历史数据包括光伏气象站收集的气象信息和电力计量装置收集的功率信息,气象信息又包括辐照强度和温度。

上述的清洗模块对光伏气象站的历史数据进行清洗的具体过程如下:

1)采用支持向量回归法对历史数据进行拟合,得到如下式的历史数据的光伏功率残差:

rei=|pi-pi′|

其中,rei表示第i个历史数据的光伏功率残差,pi表示第i个历史数据的实时功率,pi′表示第i个历史数据拟合后的实时功率;

2)将历史数据的光伏功率残差与残差阈值进行对比,并将超过残差阈值的历史数据进行排除。

上述每日气象特征库包括多个气象特征样本,每个气象特征样本对应的气象特征包括气象指标和辐照波动指标;

其中的气象指标包括最大辐照强度irmax和最高温度tmax;

其中的辐照波动指标包括最大波动diffirmax、波动标准差stdir、波动均值mvir和波动三阶导数mvir;其中diffirmax=max(diffiri),diffiri表示第i个历史数据的一阶差分,且diffiri=iri+1-iri,i=1,2,...,n-1,iri+1表示第i+1个历史数据的辐照度,iri表示第i个历史数据的辐照度。

上述气象特征样本的格式为[irmax,tmax,diffirmax,stdir,mvir,tdirmax]。

上述聚类模块对每日气象特征库中的气象特征样本进行k-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签,具体过程如下:

1)根据最大值特征[irmax,tmax,diffirmax,tdirmax]对气象特征样本进行第一次聚类,并通过第一轮廓系数对第一次聚类结果进行优化,得到优化结果;

2)根据优化结果对统计特征[stdir,mvir]进行第二次聚类,并通过第二轮廓系数对第二次聚类结果进行优化,得到最终聚类结果和类别标签。

上述识别模块通过反向传播神经网络模型对预测日天气类型进行识别,具体过程如下:

1)利用反向传播神经网络对最终的聚类结果和类别标签进行训练,得到反向传播神经网络模型;

2)将预测日的气象特征输入反向传播神经网络模型,得到预测日的天气类型。

实施例2

本发明实施例2提供了一种用于光伏功率预测的天气类型识别方法,具体包括以下步骤:

步骤一、对光伏气象站的历史数据进行清洗,并根据清洗后的历史数据确定每日气象特征库:

所采用的历史数据包括2016年4月和2017年2月中国江苏省吴江区光伏电站31397个有效数据,时间跨度为9个月295天。

首先,将辐照强度iri和温度ti最为输入,并将实时功率pi作为输出,建立svr(支持向量回归)模型,并通过交叉验证方法优化参数。svr模型的惩罚参数c=194.02,内核参数g=0.0098。

然后,通过svr模型拟合计算残差:

rei=|pi-pi′|

其中,rei表示第i个历史数据的光伏功率残差,pi表示第i个历史数据的实时功率,pi′表示第i个历史数据拟合后的实时功率;

最后,将残差超过阈值thr的历史数据排除。阈值thr的确定方法是:残差按照大小降序排列,前5%的历史数据被认为是异常数据,后95%的历史数据是合格数据。清洗的历史数据为1570条。确定thr=175kw。

为了评估光伏实时功率的拟合精度,选择平均绝对百分比误差εmape衡量全局误差,并选择均方根误差εrmse衡量本发明实施例2中预测值和实际值之间的差异,设n为历史数据总数,εmape和εrmse分别按下式计算:

清洗前后残差分布的直方图分别如图5和图6所示,数据清洗前后的εmape和εrmse如表1:

表1

可见,经过数据清洗,异常数据被排除,拟合精度明显提升,拟合残差的分布更为合理。数据清理后,建模数据集的价值密度有所提高。

气象特征样本[irmax,tmax,diffirmax,stdir,mvir,tdirmax]包含261个有效的气象特征样本,如表2,这些特征样本将通过k-means聚类为建模数据提供类别标签。

表2

步骤二、对每日气象特征库中的气象特征样本进行k-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签:

一般来说,如果聚类数太大,聚类的意义将会下降。因此,最大聚类数设置为kmax=15。在聚类结果优化中,两层模型(分别使用[irmax,tmax,diffirmax,tdir]和[stdir,mvir])中的聚类数的区间都设置为2-15。通过校核轮廓系数,两层的最优聚类数都为2。因此,所有的特征样本最终将被分为四类(a,b,c和d),最终聚类结果如表3:

表3

步骤三、通过反向传播神经网络模型对预测日天气类型进行识别:

261个气象特征样本由k-means聚类分为四类(a,b,c和d)。这些气象特征样本将用于建立天气类型识别的多分类反向传播神经网络模型。选择70%的气象特征样本(183个)作为训练样本,剩余的30%(78个)用作测试样本。天气类型测试的结果如表4:

表4

可见,所有的78个测试样本中有四个样本被错误分类,反向传播神经网络的分类精度达到94.87%。此外,在四类样本中只有b类样本被错误分类。这表明反向传播神经网络分类器的识别准确度足够高,可用于天气识别。因此,该反向传播神经网络模型用于确定预测日的天气类型较为合适。

为了描述的方便,以上所述装置的各部分以功能分为各种模块或单元分别描述。当然,在实施本申请时可以把各模块或单元的功能在同一个或多个软件或硬件中实现。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,所属领域的普通技术人员参照上述实施例依然可以对本发明的具体实施方式进行修改或者等同替换,这些未脱离本发明精神和范围的任何修改或者等同替换,均在申请待批的本发明的权利要求保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1