一种短期风电功率预测方法及系统与流程

文档序号:16857193发布日期:2019-02-12 23:28阅读:374来源:国知局
一种短期风电功率预测方法及系统与流程

本发明涉及风电功率预测,具体涉及一种短期风电功率预测方法及系统。



背景技术:

目前,风电作为一种清洁能源,已成为继火电与水电之后的第三大电力能源。然而,风速的间歇性、随机性与波动性的特点使其不能像火电一样可以灵活调节,这给电力系统的安全稳定运行带来了挑战。随着风电规模的不停扩大以及装机容量的不断增长,风电消纳已成为影响风电行业健康可持续发展的重要问题,弃风限电问题较为突出。风电场功率预测作为增加风电接入容量、提高电力系统运行安全性与经济性的有效手段,近年来成为研究的热点。其中,短期风电功率预测通过对时间尺度在24~72小时内的风电场功率进行预测,用于经济调度,能够增强消纳能力,提高系统的安全稳定性。

风电的功率预测方法包括时间序列模型和基于数值天气预报(nwp)的预测模型两大类。时间序列模型以历史数据作为预测的主要依据,没有考虑气象因素对风电功率的影响。基于nwp的预测模型充分考虑风速、风向、气温、气压等实时数据,利用数据挖掘方法或统计方法建立预测模型,是短期功率预测所采用的主要方法。

目前,风电功率预测领域所面临的主要问题在于预测的精度不高。对于nwp预测模型,主要问题表现在气象数据波动性较大,工况复杂,导致预测模型泛化能力不足。

目前短期风电功率预测领域还存在较大的空白,在实际应用中,受到较多方面的影响,包括:一、短期风电功率预测影响因素及对风电功率的影响程度还未能明确界定;二、风电功率预测影响因素的特征量种类多,信息量大,数据处理复杂;三、风电功率智能预测的准确度有待提高。

因此,发明一种具有较高精度与可靠性的短期风电功率预测方法成为亟需解决的课题。



技术实现要素:

本发明提供一种短期风电功率预测方法,包括:

采集预测气象数据;

将所述预测气象数据输入预先创建的短期风电功率预测模型,得到风电功率预测值;

所述短期风电功率预测模型的训练数据集是将基于与所述风机输出总功率相关的历史气象数据作为建模数据、并对所述建模数据进行pca主元提取后得到的。

创建所述短期风电功率预测模型包括:

采集风机输出总功率以及与所述风机输出总功率相关的历史气象数据作为建模数据;

对所述建模数据进行预处理,消除风机输出总功率和所述历史气象数据的数据量纲;

对所述历史气象数据进行pca主元提取;

基于所述主元构建训练数据集,将所述训练数据集进行分类;

将各类训练数据分别建立各自相应的svr回归拟合模型;

将分类好的训练数据建立多分类svm模型。

所述气象数据的特征参数包括风向、风速、空气的温度、湿度、大气压强;

所述气象数据从数值天气预报nwp中提取。

将所述训练数据集进行分类包括:

通过kfcm算法将训练数据集进行聚类,根据kfcm算法的核参数确定聚类数范围,并通过vxb指标确定最优聚类数。

所述通过vxb指标确定最优聚类数的计算式如下所示:

其中,c为聚类数,c为所述聚类数范围内的任意聚类数,n为样本个数,xj为第j个样本,νi、νj、νk分别为第i,j,k个聚类中心,选择在聚类数范围内vxb指标最小的聚类数为最优聚类数。

通过z-score标准化公式所述消除风机输出总功率和所述历史气象数据的量纲,公式如下所示:

式中,yi为消除了数据量纲的新数据序列,xi为样本数据序列,为样本均值,σ为样本标准差。

在所述消除风机输出总功率和所述历史气象数据的数据量纲之前还包括:

通过pearson相关系数计算所述历史气象数据中各特征参数与风机输出总功率的关联度,并对各关联度进行比较,去除对应关联度最低的特征参数。

将所述预测气象数据输入短期风电功率预测模型,得到风电功率预测值包括:

将所述预测气象数据输入多分类svm模型得到所述预测气象数据的类别属性,将预测气象数据按照其类别属性输入对应的svr回归模型,得到功率预测值,再对所述功率预测值进行反归一化处理,得到最终功率预测值。

本发明提供一种短期风电功率预测系统,其特征在于,包括:

采集模块:采集预测气象数据;

模型模块:包括短期风电功率预测模型;

预测模块:将所述预测气象数据输入预先创建的短期风电功率预测模型,得到风电功率预测值;

所述模型模块包括主元提取单元,用于对建模数据进行pca主元提取,所述建模数据为与所述风机输出总功率相关的历史气象数据。

所述模型模块还包括:

历史数据采集单元:采集风机输出总功率以及与所述风机输出总功率相关的历史气象数据作为建模数据;

预处理单元:对所述建模数据进行预处理,消除风机输出总功率和所述历史气象数据的数据量纲;

分类单元:基于所述主元提取模块提取的主元构建训练数据集,将所述训练数据集进行分类;

建模单元:将各类训练数据分别建立各自相应的svr回归拟合模型和根据分类好的训练数据建立多分类svm模型。

与最接近的现有技术比,本发明提供的技术方案具有以下有益效果:

本发明提供的技术方案,利用pca实现主元提取,在保证数据质量的前提下降低数据维度,提高运算效率;

本发明提供的技术方案,从数值天气预报nwp中提取与风电场功率有关的气象数据,气象数据样本易于取得且包含较为全面的信息;

本发明提供的技术方案,构建短期风电功率预测模型是利用关联度分析实现有效数据的提取,排除干扰因素;

本发明提供的技术方案,利用kfcm进行数据分类,实现数据的分类建模,提高建模精度。

附图说明

图1为一种短期风电功率预测方法流程图;

图2为本发明实施例一种短期风电功率预测方法流程图;

图3为本发明实施例中vxb指标变化趋势图;

图4为本发明实施例中svr模型拟合曲线图;

图5为本发明实施例中svr模型风电功率预测曲线图。

具体实施方式

下面结合附图对本发明做进一步详细的说明:

如图1所示,本发明提供一种短期风电功率预测方法,包括:

采集预测气象数据;

将所述预测气象数据输入预先创建的短期风电功率预测模型,得到风电功率预测值;

所述短期风电功率预测模型的训练数据集是将基于与所述风机输出总功率相关的历史气象数据作为建模数据、并对所述建模数据进行pca主元提取后得到的。

所述短期风电功率预测模型包括:

采集风机输出总功率以及与所述风机输出总功率相关的历史气象数据作为建模数据;

对所述建模数据进行预处理,消除风机输出总功率和所述历史气象数据的数据量纲;

对所述历史气象数据进行pca主元提取;

基于所述主元构建训练数据集,将所述训练数据集进行分类;

将各类训练数据分别建立各自相应的svr回归拟合模型。

具体的短期风电功率预测方法流程图如图2所示,包括:

步骤一,nwp数据影响因素关联度分析:

由nwp得出与风机输出总功率相关历史气象数据,所述气象数据的特征参数包括风向、风速、空气的温度、湿度、大气压强,利用pearson相关系数来考察风机输出总功率与上述特征参数间的相关程度,并去除关联度最低的特征参数。

步骤二,建模数据的读取与预处理:

特征数据包括输出总功率,风速与风向,地面气压与相对湿度。通过z-score标准化消除数据量纲。对于向量[x1,x2,…,xn]来说,公式如下:

为均值,σ为标准差。所得新数据序列yi消除了数据量纲,均值为0,标准差为1。

步骤三,多区域气象nwp数据的pca主元提取:

将监测区域各自的风速与风向数据进行pca主元提取,作为模型的部分特征数据,构建约简数据集。

步骤四,训练数据的分类:通过kfcm算法将pca约简后的训练集进行聚类,根据kfcm算法的核参数确定聚类数范围,并利用vxb指标进行最优聚类数校核。公式如下:

其中,c为聚类数,c为所述聚类数范围内的任意聚类数,n为样本个数,xj为第j个样本,νi、νj、νk分别为第i,j,k个聚类中心。vxb指标越小,说明聚类的效果越好,所以选vxb指标最小的聚类数为最优聚类数。

步骤五,分类svr建模:利用svr将各类建模训练数据分别建立各自相应的回归拟合模型,通过交叉验证方法确定最优化svr参数。

步骤六,svm归类模型建立:将分类好的建模训练数据建立多分类svm模型。随后,测试数据输入多分类svm模型得到测试数据的类别属性并标记。

步骤七,功率预测:将归类好的每一类训练数据按照其类别标记输入各自对应的svr回归模型,得到该类数据的功率预测值,输出最终的结果。

进一步地,本发明步骤四中,kfcm算法的描述如下:

相对于传统的硬聚类(hcm)与模糊聚类(fcm)方法,kfcm通过将输入样本xk(k=1,2,…,n)利用非线性映射变换为φ(xk),以突出样本的特征差异。再通过优化目标函数得到每个样本点对所有类中心的隶属度,从而决定样本的类属。聚类目标函数为:

若定义核函数k(xi,xj)=φ(xi)tφ(xj),核空间的欧式距离表示为:

||φ(xk)-φ(νi)||2=k(xk,xk)+k(νi,νi)-2k(xk,νi)(4)

νi(i=1,2,…,c)为输入空间聚类中心;c为类别数;uik为第k个样本对第i个类别的隶属度;m为加权指数。uik满足0≤uik≤1且隶属度约束条件为:

将式(4)代入式(3),并在约束条件下用拉格朗日乘子法寻优,得到隶属度及目标函数:

一般情况下,核函数的选择中高斯核函数k(xk,νi)=exp[-||xk-vi||/(2σ2)]较多,其中σ为高斯核参数。

步骤五和步骤六中,svm和svr算法描述如下:

svm作为一种机器学习算法,目前广泛应用于数据分类与故障诊断方面,其核心思想在于构建分类超平面,并且保证离超平面距离最近的样本与超平面之间的距离最大。对于两分类问题:(xi,yi),i=1,2,...,l,xi∈rn,yi∈{-1,+1},被最优分类超平面w·x+b=0完全无误地分为两个类别。因此,构造最优超平面问题转化为优化问题:

约束条件为:

yi((w·xi)+b)≥1-ξi,i=1,2,...,l(9)

w为最优超平面法向量,b为阈值,c为惩罚参数,ξi为松弛变量。可以利用拉格朗日乘子法对上述问题求解。若扩展到非线性问题,可以利用映射φ(x)将低维空间中的样本映射为高维空间中,定义核函数同kfcm,此时目标函数为:

αi为拉格朗日乘子。

svr则是svm的一种,其核心思想也是将线性不可分的输入样本空间映射到高维空间实现线性回归,得到非线性回归函数同样可以利用拉格朗日乘子法进行求解。核函数的选择同kfcm。

实施例:

本发明以某风电场约一个月的功率以及nwp气象数据作为建模数据。风电场包含5个nwp典型区域,每个典型区域有各自实时的风速与风向数据,采样点为15分钟记录一次,数据量为2777个。每个采样点特征参数包括实时输出功率、温度、5个监测区域各自的风速与风向、地面气压以及相对湿度。如表1所示。

表1风电场nwp建模数据

如上表所示,每组数据的数据向量格式定义为[pi,ti,si1,di1,...,si5,di5,spi,rhi],包含14个参数。为消除数据量纲,将总功率pi,温度ti,地面气压spi,相对湿度rhi进行z-score标准化。si1~si5为监测区域风速数据,风向di1~di5为风向,取其正弦值与余弦值。标准化后数据包含19个特征参数。为构建较为合理与精确的数学模型,必须首先确定输出功率与实际建模nwp数据间的关联情况。本发明利用pearson相关系数来考察总功率与上述特征参数间的相关程度,结果如表2所示。

表2风电场输出功率与特征参数关联度

表2中的建模数据,风速数据相关性较强,气压与风向数据相关性一般,温度与湿度的相关性较弱。同时,由于温度数据显著性水平较差,故本发明在建立模型时去除温度数据,保留其他数据。

为验证kfcm-svr短期功率预测模型的有效性。取其中前2681个数据作为建模训练数据,后96个(一天内)数据作为测试数据。对于svr回归模型及svm多分类模型来说,现有的特征参数过多。同时,由于风电场总功率是由单台风机独立输出功率之和。气象监测区域越多,越能够反映风电场整体的气象状况,模型预测精度越好。因此,回归建模必须考虑每一个监测区域中风力发电机出力对整体功率的影响。特征参数的数量与监测区域的数目成正比。对于多个监测区域来说,特征参数的增加使得算法模型臃肿,计算效率与计算精度大为降低。采用pca方法降维能够在保证主要因素被保留下来的前提下,降低数据维度。本发明中对监测区域风速si1~si5以及风向di1~di5分别进行pca提取主元。结果如表3和表4所示。

表3风速pca主元提取贡献率

表4风向pca主元提取贡献率

从表中可以看出,对于风速数据和风向数据,前两个主元的累计贡献率都达到了95%以上,一般情况下,可以认为代表了整体的数据信息。再通过pearson相关系数考察各主元的相关性情况,结果如表5所示。

表5风速与风向pca主元关联度

可见,上述数据中,风速与风向的主元2关联度不高。风速主元2显著性较差,数据建模中予以排除;而风向主元2尽管关联度与显著性水平不高,但是主元贡献率较大,予以保留。通过主元的提取,原始数据从18个特征参数减少到6个,作为svr模型的训练数据较为合适。

取数据表1中前2677个数据作为kfcm分类模型的训练数据,输入数据格式被定义为[p'i,s'i1,d'i1,d'i2,sp'i,rh'i],其中总功率p'i,即标准化后的总功率数据;s'i1为风速数据主元,d'i1、d'i2为风向数据主元。sp'i、rh'i为地面气压spi与相对湿度rhi标准化后数据。按照图2中的流程,首先利用kfcm算法进行数据聚类,用vxb指标进行最优聚类数校核。通过变步长方法优化核参数,核参数选择σ=20.01。聚类数c范围选择2~20。其vxb指标变化趋势如图3所示(c=19,20时vxb指标过大,未予显示)。可见,当聚类数c为4时,vxb指标最小。因此,可认为训练数据分为4类最为合理,此处是为了举例说明,在此种情况下,分为4类最为合理的,但在其他情况下,可以分为其他数量的类型;并不是限制为只能分为4类。

按照kfcm结果将训练数据集分为四类,并做类别标签和序号。每一类数据分别建立各自的svr回归模型,并通过交叉验证方法得到最优的svr模型参数,即惩罚参数c与rbf核参数γ。分档结果及最优参数配置如表6所示。模型输出结果为每一类训练数据集的回归结果,按照序号进行整理,得到模型的回归拟合曲线,如图4所示。svr回归拟合模型的平均绝对误差为2.59%,均方根误差为0.97%。可见,svr模型具有很高的精度,拟合效果较好。

表6svr模型数据及参数

对于96个测试数据,按照图2的流程,需要预先确定其所属的类别,即表6中的类别,之后将数据输入对应的svr预测模型,得到预测功率。本发明中通过建立svm多分类模型对测试数据进行归类。同样采用交叉验证方法得到最优参数c=36.7583与rbf核参数γ=6.9644。测试数据被归于四类,数目分别是:26,17,9,44。于是,将归类好的数据分别输入四个svr模型,得到各类数据对应的功率预测值,再通过反归一化过程,得到各类数据对应具体的功率值。预测结果如图5所示。

从图中可以看出,功率预测曲线与实际曲线趋势较为吻合,预测效果较好。均方根误差(rmse=0.1228)与平均绝对误差(mae=0.0989)。可以看出,svm方法以其良好的泛化能力,用于预测方面相对于传统的回归方法有一定的优势。svm预测曲线较为平缓,在反映功率波动方面有缺陷,这是由于用全部数据进行模型训练,最优超平面的建立中需要考虑所有的建模数据,受到的干扰较大。通过kfcm方法进行数据分类后建立多个子模型,类内数据较为近似,最优超平面从单一变为多个,受干扰较小,反映曲线波动较为合理。反映在功率预测上,其精度也有了明显的提升。

基于相同的构思,本发明提供一种短期风电功率预测系统,包括:

采集模块:采集预测气象数据;

模型模块:包括短期风电功率预测模型;

预测模块:将所述预测气象数据输入预先创建的短期风电功率预测模型,得到风电功率预测值;

所述模型模块包括主元提取单元,用于对建模数据进行pca主元提取,所述建模数据为与所述风机输出总功率相关的历史气象数据。

所述模型模块还包括:

历史数据采集单元:采集风机输出总功率以及与所述风机输出总功率相关的历史气象数据作为建模数据;

预处理单元:对所述建模数据进行预处理,消除风机输出总功率和所述历史气象数据的数据量纲;

分类单元:基于所述主元提取模块提取的主元构建训练数据集,将所述训练数据集进行分类;

建模单元:将各类训练数据分别建立各自相应的svr回归拟合模型和根据分类好的训练数据建立多分类svm模型。

所述特征参数包括风向、风速、空气的温度、湿度、大气压强。

所述分类模块通过kfcm算法将约简训练数据集进行聚类,根据kfcm算法的核参数确定聚类数范围,并通过vxb指标进行最优聚类数校核。

所述预处理单元通过z-score标准化公式所述消除风机输出总功率和所述历史气象数据的量纲;

所述z-score标准化公式如下所示:

式中,yi为消除了数据量纲的新数据序列,xi为样本数据序列,为样本均值,σ为样本标准差。

所述vxb指标如下所示:

其中,c为聚类数,c为聚类数范围内的任意聚类数,n为样本个数,xj为第j个样本,νi、νj、νk分别为第i,j,k个聚类中心,选择vxb指标最小的聚类数为最优聚类数。

所述预处理单元还包括数据优化子单元:在消除风机输出总功率和所述历史气象数据的数据量纲之前通过pearson相关系数计算所述历史气象数据中各特征参数与风机输出总功率的关联度,并对各关联度进行比较,去除对应关联度最低的特征参数。

所述预测模块包括:将所述预测气象数据输入多分类svm模型得到所述预测气象数据的类别属性,将预测气象数据按照其类别属性输入对应的svr回归模型,得到功率预测值,再对所述功率预测值进行反归一化处理,得到最终功率预测值。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应当说明的是:以上实施例仅用于说明本发明的技术方案而非对其保护范围的限制,尽管参照上述实施例对本申请进行了详细的说明,所属领域的普通技术人员应当理解:本领域技术人员阅读本申请后依然可对申请的具体实施方式进行种种变更、修改或者等同替换,但这些变更、修改或者等同替换,均在申请待批的权利要求保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1