一种基于主元分析和机器学习的风电功率超短期预测方法与流程

文档序号:17223902发布日期:2019-03-27 12:21阅读:309来源:国知局
一种基于主元分析和机器学习的风电功率超短期预测方法与流程
本发明涉及电力系统
技术领域
,尤其涉及一种基于主元分析和机器学习的风电功率超短期预测方法。
背景技术
:近年来,随着新能源发电技术的发展,风机装机容量在2017年底已经达到了近540gw。风能是一种波动较大的能源,大量的风机上网对电网的安全性、稳定性和经济性造成了极大影响。风电功率的有效预测,可以更大程度削弱由风电功率不稳定性所带来的危害,从而实现电网能够处于良好的运行状态。目前,风电功率预测方法可分为两类,一类是基于数值天气预报模式的物理方法,结合风电场的实际描述生成风电机组高度所在处的风速,再依据风力发电机的风速-风电功率曲线,转化为风电功率。另一类是基于统计学的方法,通常采用传统的统计方法做预测,如自回归滑动平均(auto-regressiveandmovingaverage,arma)预测,现在基于机器学习的预测方法逐渐引起关注,通过对风电场历史数据的分析与挖掘,找出数据之间所存在的数学意义,从而实现风电功率的预测。风电功率预测的物理方法,适用于在建的风电场。而基于机器学习方法下的风电功率预测,对实现短期预测意义非常大。首先,机器学习在完成对样本的合理训练之后,仅根据过去几个时刻的风电历史数据,就可以预测出下一个时刻以及相近几个时刻的风电功率。其次,机器学习方法不需要依据风机的风速和风电功率关系求解风电功率,所以解决了不同型号风机的风速与功率曲线不一致的问题,同时也解决了风速与风电功率之间的转换误差的问题。技术实现要素:本发明要解决的技术问题是针对上述现有技术的不足,提供一种基于主元分析和机器学习的风电功率超短期预测方法,实现对风电功率的超短期预测。为解决上述技术问题,本发明所采取的技术方案是:一种基于主元分析和机器学习的风电功率超短期预测方法,包括以下步骤:步骤1、在风电场数据的采样频率为t*下,构成n组数据的风电数据样本集合,并对缺失值采用插值方式进行处理;所述风电数据样本集合包括截止到t时刻的n个风电功率数据(w)=(wt-n,wt-(n-1),…,wt-1),其中,wt-1为t-1时刻的风电功率,wt-n为t-n时刻的风电功率,以及影响风电功率大小的影响因子矩阵其中,xi1,xi2,…,xim分别表示风电功率各类影响因子的数据,i=1,2,…,n和m分别代表样本集中的第i个样本以及第m类影响因子;所述影响风电功率大小的影响因子包括风速、风向正弦值、风向余弦值、气温、气压以及湿度这些气象特征数据;步骤2、将步骤1所得的影响因子矩阵x进行主元分析(principalcomponentanalysis,即pca),根据累计贡献率的大小来确定变换后的主成分数据,具体方法为:步骤2.1、对步骤1中所得的影响因子矩阵x进行z-score标准化处理:首先求出影响因子矩阵的各列影响因子的均值其中,为第j类影响因子的均值,j=1,2,…,m;再求出各列影响因子的标准偏差,第j类影响因子的标准偏差记为最后将各影响因子做标准化变换得到标准化的影响因子均值矩阵x*,其中,影响因子xij的标准化值步骤2.2、根据2.1进行z-score标准化后得到的标准化的影响因子均值x*,计算得到其相关系数矩阵r,r的对角线上的数值为1;相关系数矩阵r的表达式为其中,r中的参数rjk如下公式所示:步骤2.3、分别计算相关系数矩阵r的特征值,并对特征值按降序排列,记为λ1≥λ2≥…≥λm≥0,以及相应的标准化特征向量为ei=(ei1,ei2,…,eim)′,||ei||=1;则风电功率影响因子的主成分分量ui=ei1x1+ei2x2+…+eimxm;步骤2.4、计算降序排列后的相关系数矩阵r的特征值的贡献率和累计贡献率,记贡献率为累计贡献率为k≤m,λj代表第j个特征值;步骤2.5、根据步骤2.4得到的累计贡献率,得到p个风电功率影响因子的主成分u=|u1,u2,…,up|;步骤3、将确定下来的风电功率影响因子的主成分数据和截止到t-1时刻的n组原始历史数据中的风电功率w结合,作为机器学习神经网络模型的输入,再将t时刻的风电功率序列作为神经网络模型的输出对数据进行训练,调节合适的模型参数,保存最佳训练模型;在该模型下输入经过主元分析得到降维后的测试样本数据,即可得到风电功率的预测序列;所述主成分数据与截止到t-1时刻的n组样本风电功率数据一起作为基于机器学习神经网络模型下的输入矩阵e以及目标输出序列矩阵f,如下公式所示:其中,upn表示主成分中第p类主成分下的第n个元素,wt代表t时刻的风电功率值;所述机器学习神经网络模型采用长短期记忆(longshorttermmemory,即lstm)网络,网络模型的具体参数根据不同的实例,结合经验给出;所述机器学习神经网络的数据处理包括了对输入输出数据进行归一化和反归一化处理,使其在模型内部处于0与1之间有利于模型训练数据,同时,确定长短期记忆网络模型的输入时间步和输出时间步;确定长短期记忆网络模型各层的神经元数目,模型迭代次数、批次、损失函数和优化器的确定;所述机器学习神经网络的数据包括模型训练数据和测试数据,具体包括输入训练数据,输出训练数据,输入测试数据和输出测试数据。采用上述技术方案所产生的有益效果在于:本发明提供的一种基于主元分析和机器学习的风电功率超短期预测方法,通过对风电功率影响因素进行主元分析,使得神经网络建模过程中减少了输入变量的维数,筛选出了贡献率比较高、维度小的几列风电功率影响因素数据,使机器学习神经网络中的复杂度大大减小,大大提高了风电场发电功率超短期预测模型的计算效率和预测精度。附图说明图1为本发明实施例提供的一种基于主元分析和机器学习的风电功率超短期预测方法的流程图;图2为本发明实施例提供的某风电场的基于主元分析和机器学习神经网络(pca-lstm)的风电功率超短期预测曲线图。具体实施方式下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。本实施例以某风电场为例,使用本发明的基于主元分析和机器学习的风电功率超短期预测方法对该风电场的风电功率进行预测。一种基于主元分析和机器学习的风电功率超短期预测方法,如图1所示,包括以下步骤:步骤1、在风电场数据的采样频率为t*下,构成n组数据的风电数据样本集合,并对缺失值采用插值方式进行处理;本实施例中,采样时间频率为15min,对缺失值按照插值方式处理,获得一共18204组数据样本,预测时间尺度为15min。所述风电数据样本集合包括t时刻之前的n个风电功率数据(w)=(wt-n,wt-(n-1),…,wt-1),其中,wt-1为t-1时刻的风电功率,wt-n为t-n时刻的风电功率,以及影响风电功率大小的影响因子矩阵其中,xi1,xi2,…,xim分别表示风电功率各类影响因子的数据,i=1,2,…,n和m分别代表样本集中的第i个样本以及第m类影响因子;本实施例中m=6;所述影响风电功率大小的影响因子包括风速、风向正弦值、风向余弦值、气温、气压以及湿度这些气象特征数据;步骤2、将步骤1所得的影响因子矩阵x进行主元分析(principalcomponentanalysis,即pca),根据累计贡献率的大小来确定变换后的主成分数据,具体方法为:步骤2.1、对步骤1中所得的影响因子矩阵x进行z-score标准化处理:首先求出影响因子矩阵的各列影响因子的均值其中,为第j类影响因子的均值,j=1,2,…,m;再求出各列影响因子的标准偏差,第j类影响因子的标准偏差记为最后将各影响因子做标准化变换得到标准化的影响因子均值矩阵(x*),其中,影响因子xij的标准化值步骤2.2、根据2.1进行z-score标准化后得到的标准化的影响因子均值(x*),计算得到其相关系数矩阵r,r的对角线上的数值为1;相关系数矩阵r的表达式为其中,r中的参数rjk如下公式所示:步骤2.3、分别计算相关系数矩阵r的特征值,并对特征值按降序排列,记为λ1≥λ2≥…≥λm≥0,以及相应的标准化特征向量为ei=(ei1,ei2,…,eim)′,||ei||=1;则风电功率影响因子的主成分分量ui=ei1x1+ei2x2+…+eimxm;步骤2.4、计算降序排列后的相关系数矩阵r的特征值的贡献率和累计贡献率,记贡献率为累计贡献率为k≤m,λj代表第j个特征值;步骤2.5、根据步骤2.4得到的累计贡献率,得到p个风电功率影响因子的主成分u=|u1,u2,…,up|;对累计贡献率的标准可依据不同的实际情况来自行给定,本实施例中,累计贡献率的阈值设定为acr=0.95;步骤3、将确定下来的风电功率影响因子的主成分数据和截止到t-1时刻的n组原始历史数据中的风电功率w结合,作为机器学习神经网络模型的输入,再将t时刻的风电功率序列作为神经网络模型的输出对数据进行训练,保存训练最佳模型;在该模型下输入经过主元分析得到降维后的测试样本数据,最后得到风电功率的预测序列;所述主成分数据与截止到t-1时刻的n组样本风电功率数据一起作为基于机器学习神经网络模型下的输入矩阵e以及目标输出序列矩阵f,如下公式所示:其中,upn表示主成分中第p类主成分下的第n个元素,wt代表t时刻的风电功率值;所述机器学习神经网络模型采用长短期记忆(longshorttermmemory,即lstm)网络,网络模型的具体参数根据不同的实例,结合经验给出;所述机器学习神经网络的数据处理包括了对输入输出数据进行归一化和反归一化处理,使其在模型内部处于0与1之间有利于模型训练数据,同时,确定长短期记忆网络模型的输入时间步和输出时间步;确定长短期记忆网络模型各层的神经元数目,模型迭代次数、批次、损失函数和优化器的确定;所述机器学习神经网络的数据包括模型训练数据和测试数据,具体包括输入训练数据,输出训练数据,输入测试数据和输出测试数据。本实施例中,长短期记忆网络模型的输入提前时间步设置为1,输出滞后时间步设定为1;并预留出160个测试样本;同时经过反复调整参数,本实施例中长短期记忆网络模型的参数为:神经元数目为100个,隐藏层数目为1,全连接,模型迭代次数取150、批次为144,损失函数采用“mae”、优化器的优化算法为“adam”;通过该机器学习神经网络模型得到该风电场的15min的超短期风电功率预测序列。本实施例在该套风电场风电数据下还采用均方根误差(rmse),均方根误差百分数(rmspe),平均绝对误差(mae)和平均绝对误差百分数(mape)4个标准来对几种神经网络模型在该数据下的预测效果进行对比分析。几类神经网络模型包括本发明的基于主元分析降维后的pca-lstm网络模型,原生的lstm网络模型,遗传优化的bp神经网络模型和未优化的bp神经网络模型。如图2所示的为本发明的pca-lstm网络模型下的预测效果。针对4种神经网络的误差,做了对比分析,如表1所示,这四个误差指标的计算值越小,说明该机器学习神经网络模型的预测效果越好。表1不同模型进行风电功率超短期预测的误差分析模型mae(kw)mape(%)rmse(kw)rmspe(%)pca-lstm10592.5835.60513727.5327.263lstm11723.6756.20315887.3418.406ga-bp13959.8637.38616958.9708.973bp14415.0317.62718015.4859.532均方根误差(rmse),均方根误差百分数(rmspe),平均绝对误差(mae)和平均绝对误差百分数(mape)4个标准的计算公式如下所示:其中,k′代表的是预测样本个数,此处k′=160,wcap为发电场总装机容量,wcap=189000kw,y(t)代表的是第t个样本中风电功率的真实值。最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1