风电场短期风速预测方法、系统及电子设备与流程

文档序号:21988304发布日期:2020-08-25 19:27阅读:166来源:国知局
风电场短期风速预测方法、系统及电子设备与流程

本发明涉及机器学习领域,特别是一种风电场短期风速预测方法、系统及电子设备。



背景技术:

在全球能源转型逐渐成为趋势,风电作为电力市场化改革的重要内容以及信息技术快速发展的背景下,短期风速预测的研究具有更重要的意义。准确的风速预测不仅有助于辅助风电场控制电能质量,优化调度运行管理,充分发挥系统接纳风电潜力,而且对于区域发电计划和统筹协调,配合蓄热式电锅炉等储能设备追踪风电发电情况,减少大规模“弃风”的产生,提升风电资源的实际利用率,从而提高电力系统运行的经济性具有重要战略意义。并且,对于一些危险气体引发的特殊安全事故的预警和应急防护具有重要的现实意义。

针对不同时空尺度的风速特征以及不同的应用需求,风速预测方法通常分为物理法、统计法和学习法三类。物理方法通过对风电场所处空间的地形、海拔、粗糙度等环境信息建立空气动力学模型,推理获得风电场风电机组的风速,但在实际应用中,物理法难以建立准确的数学模型描述风电场的地形和大气变化,过程中容易产生误差累积。统计法通过分析大量的历史数据,研究历史风速数据与未来短期风速之间的映射关系,以此为基础建立风速预测数学模型,统计法直接的问题是无法有效的反映风速的随机性,预测误差会随着预测时间的增加而增加。学习法利用智能学习算法通过历史数据以及影响因素拟合风速序列中存在的非线性关系,达到良好的预测效果,但随之而来的,是学习算法中对于大量样本数据普遍存在的训练速度慢、过欠拟合、陷入局部最优和泛化能力差等问题。

风速序列内在的随机性与波动性严重的影响了模型的准确性,难以通过原始数据集直接预测获得理想的预测效果。信号处理算法是一种将时序风速序列按不同的中心频率分解为具有规律性的子序列,通过提取子序列的显著特征进行预测重构能够有效降低风速数据的波动性,降低模型复杂度,改善预测精度。传统的经验模态分解(emd)存在模态分量频率分布不均造成的模态混叠问题。

在风速预测现有的方法中,物理法、统计法、学习法都具有各自的优势和局限性,充分利用这些方法的特点构建组合预测模型,减小预测误差,扩展预测时间范围是风速预测的重要发展趋势。不同的模型利用的数据特征信息不尽相同,造成了风速预测模型之间具有不同的预测精度,但是预测精度往往有限。常用的平均加权法存在着预测性能优越的模型被掩盖的问题,无法有效利用其中的特征信息,造成数据信息无法充分利用,影响其预测能力。



技术实现要素:

本发明所要解决的技术问题是,针对现有技术不足,提供一种风电场短期风速预测方法、系统及电子设备,提高短期风速预测的准确度。

为解决上述技术问题,本发明所采用的技术方案是:一种风电场短期风速预测方法,包括以下步骤:

1)获取风场历史风速数据的风速序列;

2)分解所述风速序列,得到一系列具有不同中心频率的模态分量;;

3)将每个模态分量分别作为机器学习方法的输入,得到多个第一预测风速;

4)叠加所有第一预测风速;

5)提取所述风速序列的相关特征,根据这些相关特征构建特征集;将叠加后的第一预测风速作为新的特征加入所述特征集;

6)将所述特征集作为机器学习模型的输入,得到第二预测风速;

7)通过信息熵融合步骤4)得到的叠加的第一预测风速和步骤6)得到的第二预测风速。

本发明分解风速序列,可以降低风速序列的波动性与随机性,相比于直接对风速序列进行预测,分解后的模态分量使得预测模型能够更加准确地表达该风速序列,避免风速序列可能的剧烈变化造成的误差,特征集可以辅助预测模型分析风速序列,并根据这些特征避免模型陷入局部最优,提高其泛化性;训练集中加入了叠加后的第一预测风速,保留了第一预测风速的相关信息,充分利用了风速序列的特征信息,本发明最终的预测风速能够保留不同模型间的预测精度,使得预测准确的模型分配更大的权重,提高融合后的模型预测准确度。

步骤1)获取的风速序列可能包含空数据、错误数据等异常数据,需要对所述风场历史风速数据进行异常数据清洗,得到完整的风速序列,避免异常数据造成的不正常波动性影响预测准确度。

优选地,对所述风场历史风速数据进行清洗的具体实现过程包括:利用下式对t时刻的异常风速数据进行清洗:其中,n为风速序列长度。

步骤2)中,利用变分模态分解法分解所述风速序列,变分模态分解法具有自适应迭代分解模态分量和中心频率的特性,相比传统的分解方法,不会造成模态混叠导致分解不完全,不会影响预测精度,同时可以减小风速序列波动性和随机性对预测精度的影响,其中第k个模态分量获取过程的具体实现步骤包括:

i)将所述风速序列按中心频率分解为k个模态分量,获取每个模态分量的单侧频谱,将模态分量变换至频域,获得频域下的k个模态分量:其中,dk(ω)为频域下的第k个模态分量,ωk为分解后的第k个模态分量的中心频率,dk(t)为分解后的第k个模态分量,为模态分量的单边频谱,δ(t)为狄拉克分布;

ii)将频域下的第k个模态分量和其中心频率根据傅里叶等距变换转化为如下形式:

其中,为偏导数计算,d'k(ω)为傅里叶等距变换变换后的第k个模态分量;ω'k为傅里叶等距变换后的第k个模态分量d'k(ω)的中心频率;为α为平衡参数;f(t)为风速序列;λ为拉格朗日乘子;

iii)对步骤ii)中的模态分量和中心频率在非负频域进行二次优化,得到对应模态分量的最优解,然后通过傅里叶逆变换得到中心频率的局部最优解:

其中,为优化后的第k个模态分量,为第k个模态分量的优化中心频率,f(ω)为频域下的风速序列;

iv)更新拉格朗日乘子其中τ为分解保真噪声;

v)重复步骤ii)~步骤iv),直至获得最终的第k个模态分量;其中,ε为设定的分解精度值。

步骤3)中,所述多个第一预测风速的具体获取过程包括:对每个所述模态分量针对不同的自回归项数p和滑动平均项数q进行aic准则计算。通过aic准则选取模型参数,降低了人工测试模型参数带来的时间成本,避免了经验和直觉等主观因素对预测精度的影响,为参数选择提供更好的依据。获取最小aic值对应的自回归项数p和滑动平均项数q,利用所述最小aic值对应的自回归项数p和滑动平均项数q建立累积式自回归移动平均模型;将所述模态分量作为所述累积式自回归移动平均模型的输入,得到第一预测风速。

步骤5)中,提取所述风速序列的相关特征的具体实现过程包括:风速是一个连续变化的过程,可以通过一段时间的历史数据来预测下一时刻的风速,通过具有一定相关性特征的历史数据进行预测,相比直接风速预测拥有更好的预测效果,降低预测模型的输入复杂度。因此可以计算某一时间段的风速序列与该时间段的上一时间段的风速序列之间的相关性,当相关性大于设定阈值时,则这两段风速序列之间具有强相关性,输出该时间段的风速数据;重复该过程,直至输出所有符合相关性要求的风速数据,所有输出的风速数据构成所述特征集;其中自相关分析的表达式为:

其中,xt-k、xt为风速序列,xt-k={x1,x2,...,xt-k};xt={xt-k+1,xt-k+2,...,xt};cov为协方差;d为方差。

步骤7)的具体实现过程包括:引入信息熵反映第一预测风速和第二预测风速的信息贡献度,并以所述信息贡献度确定第一预测风速的权重和第二预测风速的权重,并按第一预测风速的权重和第二预测风速的权重对所述第一预测风速和第二预测风速进行加权组合,得到最终的预测风速。相较于简单的等权平均,信息熵能够更好地反映不同模型的预测精度,为预测精度高的模型分配更大的权重,减小最终预测结果的误差。

一种风电场短期风速预测系统,其包括:

数据采集模块,用于获取风场历史风速数据的风速序列;

分解模块,用于分解所述数据采集模块输出的风速序列,得到一系列具有不同中心频率的模态分量;

第一预测模块,用于将每个模态分量分别作为机器学习方法的输入,得到多个第一预测风速,并叠加所有第一预测风速;

第二预测模块,用于提取所述风速序列的相关特征,构建特征集,并将叠加后的第一预测风速作为新的特征加入所述特征集,基于所述特征集构建训练集,将所述训练集作为机器学习模型的输入,得到第二预测风速;

融合模块,用于融合叠加后的第一预测风速和第二预测风速,得到最终的预测风速;

第二预测模块中,可以将特征集拆分为训练集和测试集,利用训练集对预测模型进行训练,并通过测试集测试整个预测系统的合格性,当预测精度达到期望精度时,认为预测系统合格,进一步提高预测精度。

优选地,所述分解模块利用变分模态分解法分解所述数据采集模块输出的风速序列,降低风速序列的波动性与随机性,相比于直接对风速序列进行预测,分解后的模态分量使得预测模型能够更加准确地表达该风速序列,避免风速序列可能的剧烈变化造成的误差。

所述数据处理模块包括:

采集单元,用于采集风场历史风速数据;

数据预处理单元,用于对所述风场历史风速数据进行异常数据清洗,得到完整的风速序列;

输出单元,用于将所述风速序列输出至所述分解模块。

优选地,所述数据预处理单元利用线性插值法对所述异常数据进行清洗。

所述第一预测模块包括:

累积式自回归移动平均模型,用于对所述多个模态分量分别进行处理,得到多个第一预测风速;

叠加单元,用于叠加所有第一预测风速。

优选地,所述累积式自回归移动平均模型的建立过程包括:对每个所述模态分量针对不同的自回归项数p和滑动平均项数q进行aic准则计算,获取最小aic值对应的自回归项数p和滑动平均项数q,利用所述最小aic值对应的自回归项数p和滑动平均项数q建立所述累积式自回归移动平均模型。

所述第二预测模块包括:

提取单元,用于计算某一时间段的风速序列与该时间段的上一时间段的风速序列之间的相关性,当相关性大于设定阈值时,则这两段风速序列之间具有强相关性,输出该时间段的风速数据;重复该过程,直至输出所有符合相关性要求的风速数据,所有输出的风速数据构成所述特征集;

构建单元,用于将叠加后的第一预测风速作为新的特征加入所述特征集,基于所述特征集构建测试集;

xgboost模型,以所述测试集为输入,输出第二预测风速。

本发明还提供了一种用于预测风电场短期风速的电子设备,其特征在于,包括:数据采集终端,用于获取风场历史风速数据的风速序列;

处理器,与所述数据采集终端连接,并执行包括如下步骤的方法:

1)分解所述风速序列,得到一系列具有不同中心频率的模态分量;

2)将每个模态分量分别作为机器学习方法的输入,得到多个第一预测风速;

3)叠加所有第一预测风速;

4)提取所述风速序列的相关特征,构建特征集,并将叠加后的第一预测风速作为新的特征加入所述特征集;

5)基于步骤4)得到的特征集,构建训练集和测试集,将所述训练集和测试集作为机器学习模型的输入,得到第二预测风速;

6)融合步骤3)得到的叠加的第一预测风速和步骤5)得到的第二预测风速,得到最终的预测风速。

本发明中提到的“短期”,是指72小时内。

与现有技术相比,本发明所具有的有益效果为:

1)本发明将风速序列分解为一系列具有不同中心频率的模态分量,可以降低风速序列的波动性与随机性,相比于直接对风速序列进行预测,分解后的模态分量使得预测模型能够更加准确地表达该风速序列,避免风速序列可能的剧烈变化造成的误差,特征集可以辅助预测模型分析风速序列,并根据这些特征避免模型陷入局部最优,提高其泛化性;训练集中加入了叠加后的第一预测风速,保留了第一预测风速的相关信息,充分利用了风速序列的特征信息,本发明最终的预测风速能够保留不同模型间的预测精度,使得预测准确的模型分配更大的权重,提高融合后的模型预测准确度;

2)本发明训练速度快,计算量相对较小。附图说明

图1为本发明中vmd-arima-xgboost短期风速预测方法的流程图;

图2为本发明实例中对风速数据自相关分析结果图;

图3为本发明实例中4种模型在不同部分时段的风速预测结果图;

图4为本发明实例中4种模型在不同部分时段的风速预测结果图;

图5为本发明实例中4种模型在不同部分时段的风速预测结果图。

图6为本发明实例中预测系统的结构框图;

图7为本发明实例中数据处理模块结构框图;

图8为本发明实例中第一预测模块结构框图;

图9为本发明实例中第二预测模块结构框图;

图10为本发明实施例电子设备结构框图。

具体实施方式

本发明提出一种基于vmd-arima-xgboost的风电场短期风速预测方法,下面结合附图对本发明的具体实施方式作进一步说明。选取某风电场2016年1月1日至2016年6月30日的风速检测数据,原始数据时间分辨率为10分钟,其中1月1日至6月23日的25200个风速数据作为训练样本,将6月24日至6月30日的1008个实测数据作为测试样本。图1为基于vmd-arima-xgboost加权组合模型的风电场短期风速预测方法流程图,具体包括如下步骤:

步骤一:对风场历史风速数据进行清洗与自相关分析,数据清洗通过线性插值法去除异常数据(异常数据包括缺失的数据(空值)、超过采集设备上限值的数据以及负值数据)。其中,线性插值法表达式为:

其中,xt为t时刻的风速数据。当t时刻的数据异常时,用上式计算得到的t时刻数据替代异常数据即可。

步骤二:通过变分模态分解法将风速序列进行分解,变分模态分解法记为vmd,通过自适应迭代搜寻模态函数的中心频率,避免了模态重叠导致的风速序列分解不完全问题,得到12个具有不同中心频率的模态分量bimf和一个残余分量res(残余分量res被舍去,不参与后续计算)。其中,变分模态分解法的具体过程如下:

(1)将所述风速序列按中心频率分解为12个模态分量(k=12),获取每个模态分量的单侧频谱,将模态分量变换至频域,获得频域下的12个模态分量:其中,dk(ω)为频域下的第k个模态分量,ωk为分解后的第k个模态分量的中心频率,dk(t)为分解后的第k个模态分量,为模态分量的单边频谱,δ(t)为狄拉克分布;

(2)引入增广拉格朗日方程,将频域下的第k个模态分量和其中心频率根据傅里叶等距变换转化为如下形式:

其中,为偏导数计算,d'k(ω)为傅里叶等距变换变换后的第k个模态分量;ω'k为傅里叶等距变换变换后的第k个模态分量d'k(ω)的中心频率;为α为平衡参数,用于保证重构信号精度,本发明实施例中α=5000;f(t)为风速序列;λ为拉格朗日乘子;

(3)对步骤(2)中的模态分量和中心频率在非负频域进行二次优化,得到对应模态分量的最优解,然后通过傅里叶逆变换得到中心频率的局部最优解:

其中,为优化后的第k个模态分量,为第k个模态分量的优化中心频率,f(ω)为频域下的风速序列;

(4)更新拉格朗日乘子其中τ为分解保真噪声;

(5)重复步骤ii)~步骤iv),直至获得最终的第k个模态分量;其中,ε为设定的分解精度值。

步骤三:累积式自回归移动平均模型的参数包括自回归项数p、差分阶数d和滑动平均项数q,首先对步骤二得到的每个模态分量进行aic准则计算,由于分解后的模态分量已经是平稳序列,因此d=0,而累积式自回归移动平均模型一般不超过8阶,因此从p=0,q=0至p=8,q=8的64个aic值计算,其中以最小aic值对应的p、q参数建立累积式自回归移动平均模型,并以此对各子序列(即模态分量)进行预测,得到相应预测结果(第一预测风速)。aic准则的表达式为:

其中,σα为模态分量的极大似然估计,n为风速序列中数据个数(即风速序列长度)。

步骤四:对所有子序列(模态分量)的预测结果进行叠加,得到vmd-arima模块的预测结果(第二预测风速);

步骤五:通过特征工程提取步骤一清洗后的风速序列的相关特征,选取1月1日的风速数据为例进行自相关分析,其中自相关系数大于0.6可以认定为具有强相关性,由图2可以确定当前风速数据与过去120分钟的风速数据之间存在的强相关性,可以通过这些历史的风速来预测当前时刻的风速,因此将这些数据作为当前风速数据的强相关性特征加入特征集合,同时本发明为了充分利用vmd-arima模型提取的信息,将步骤四的预测序列作为新的特征序列加入特征集合,构建短期预测风速特征集。其中自相关分析的表达式为:

其中,xt-k为风速序列{x1,x2,...,xt-k};xt为风速序列{xt-k+1,xt-k+2,...,xt};cov为协方差;d为方差。

步骤六:基于步骤五建立的特征集将其中1月1日至6月23日的25200个风速数据作为训练样本,将6月24日至6月30日的1008个实测数据作为测试样本,以预测输出和期望输出的损失函数最小化为目标,建立xgboost模型,并通过贝叶斯优化模型参数,得到xgboost短期风速预测模型的核心参数为,学习速率为0.1,决策树迭代次数为150,决策树的最大深度为6,叶子节点最小样本权重为7,gamma参数为0。根据步骤一的自相关分析,选择时间步长为12,即以时间分辨率为10分钟的历史120分钟特征数据为输入,得到xgboost模块的预测结果;

步骤七:本发明为了更好的保留两种预测模型提取的风速特征,通过引入信息熵反映arima模块和xgboost模块对于组合模型的信息贡献度,并以此确定两种预测模型的权重,通过加权组合的方式得到最终的预测结果。为了证明本发明的有效性,将四种方法的在不同时间段内的误差指标记于表1,其中组合模型为本发明提出的预测方法。信息熵的表达式如下:

h=ωaha+ωxhx

其中,sc为第c个模型的信息熵,ect为第c个模型在t时刻的误差值,ωc为模型c的权重,h为最终的预测结果,ωa为arima模型通过信息熵确定的权重,ha为vmd-arima模块的预测结果,ωx为xgboost模块通过信息熵确定的权重,hx为xgboost模块的预测结果。

表14种模型短期风速预测结果对比

为了直观地展示不同模型之间的预测结果差异,将4种模型在6月25日,6月27日,6月29日的预测结果误差绘制于图3至图5。可以看出,本发明提出的基于vmd-arima-xgboost的风电场短期风速预测方法在风速平稳变化和风速剧烈变化的时段能够依然能有效准确地拟合真实的风速曲线变化,保留风速序列历史相关性和波动性的同时保持较好的预测精度。mape和rmse分别为9.76%和0.57米/秒,在4种模型中均是最优值,相比arima、vmd-arima、xgboost的mape分别降低了9.01%、1.62%、3.06%,rmse分别降低了0.89米/秒、0.26米/秒、0.31米/秒,证明该模型在短期风速预测中,有效的融合了预测模型之间的优势并降低了预测误差,采用的组合方法的预测精度优于各个单一的预测模型。本发明在arima模型的基础上引入vmd对原始风速序列进行分解处理,降低了风速序列的非线性,同时通过信息熵将arima模块与xgboost模块进行有效结合,将风速的影响因素也作为预测特征,能够有效提高短期风速预测精度。如图6,本发明的另一种实施例提供了一种风电场短期风速预测系统,其包括:数据采集模块,用于获取风场历史风速数据的风速序列;

数据处理模块,用于对风速序列进行清洗;

分解模块,用于分解所述数据采集模块输出的风速序列,得到一系列具有不同中心频率的模态分量;

第一预测模块,用于将每个模态分量分别作为机器学习方法的输入,得到多个第一预测风速,并叠加所有第一预测风速;

第二预测模块,用于提取所述风速序列的相关特征,构建特征集,并将叠加后的第一预测风速作为新的特征加入所述特征集,基于所述特征集构建测试集,将所述测试集作为机器学习模型的输入,得到第二预测风速;

融合模块,用于融合叠加后的第一预测风速和第二预测风速,得到最终的预测风速(最终输出结果)。

本实施例的分解模块利用前述的变分模态分解法分解所述数据采集模块输出的风速序列,具体分解过程如前所述,此处不再赘述。

如图7,本实施例数据处理模块包括:

采集单元,用于采集风场历史风速数据;

数据预处理单元,用于对所述风场历史风速数据进行异常数据清洗,得到完整的风速序列;

输出单元,用于将所述风速序列输出至所述分解模块;

数据预处理单元利用线性插值法对所述异常数据进行清洗,其中,线性插值法表达式为:

其中,xt为t时刻的风速数据。当t时刻的数据异常时,用上式计算得到的t时刻数据替代异常数据即可。

如图8所示,本实施例的第一预测模块包括:

累积式自回归移动平均模型(arima),用于对所述多个模态分量分别进行处理,得到多个第一预测风速;

叠加单元(图8中的数据叠加),用于叠加所有第一预测风速;

本实施例的累积式自回归移动平均模型的建立过程包括:对每个所述模态分量针对不同的自回归项数p和滑动平均项数q进行aic准则计算,获取最小aic值对应的自回归项数p和滑动平均项数q,利用所述最小aic值对应的自回归项数p和滑动平均项数q建立所述累积式自回归移动平均模型。

累积式自回归移动平均模型的参数包括自回归项数p、差分阶数d和滑动平均项数q,首先对步骤二得到的每个模态分量进行aic准则计算,由于分解后的模态分量已经是平稳序列,因此d=0,而累积式自回归移动平均模型一般不超过8阶,因此从p=0,q=0至p=8,q=8的64个aic值计算,其中以最小aic值对应的p、q参数建立累积式自回归移动平均模型,并以此对各子序列(即模态分量)进行预测,得到相应预测结果。

如图9所示,本实施例的第二预测模块包括:

提取单元,用于计算某一时间段的风速序列与该时间段的上一时间段的风速序列之间的相关性,当相关性大于设定阈值时,则这两段风速序列之间具有强相关性,输出该时间段的风速数据;重复该过程,直至输出所有符合相关性要求的风速数据,所有输出的风速数据构成所述特征集;

构建单元,用于将叠加后的第一预测风速作为新的特征加入所述特征集,基于所述特征集构建测试集;

xgboost模型,以所述测试集为输入,输出第二预测风速。

为了更好的保留两种预测模型提取的风速特征,本发明的融合模块通过引入信息熵反映arima模块和xgboost模块对于组合模型的信息贡献度,并以此确定两种预测模型的权重,通过加权组合的方式得到最终的预测结果。

如图10所示,本发明的另一实施例为用于预测风电场短期风速的电子设备,包括:

数据采集终端,用于获取风场历史风速数据的风速序列;

处理器,与所述数据采集终端连接,并执行本发明实施例的短期风速预测方法。本发明实施例的数据采集终端,可以是风电场测风塔或者是风速传感器。处理器可以是arm等。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1