一种基于混核机器学习的风机批功率预测方法与流程

文档序号:12469458阅读:237来源:国知局
一种基于混核机器学习的风机批功率预测方法与流程
本发明属于风场风功率预测
技术领域
,具体涉及一种基于混核机器学习的风机批功率预测方法。
背景技术
:近年来,随着全球化石油能源的日益匮乏,日本地震带来的核电警示,以及温室气体排放的增加,风能成为了满足全球日渐增长的能源需求。因此,加快包括风电在内的安全性清洁能源产业的发展已日渐趋势。为了提高我国电网接受风电的能力以及提高风电场利用效率,我国国家能源局2011年7月颁布的《风电场功率预测预报管理暂行办法》规定,从2012年1月1日开始,所有已并网运行的风电场必须建立起风电功率预测预报体系和发电计划申报工作机制并开始试运行,以提高风电场与电力系统协调运行的能力,保障电网运行安全,而未按要求报送风电功率预测结果的风电场不得并网运行。因此,做好风力发电的预测和调控是风电并网稳定运行的重要条件。风功率预测按照物理量进行划分,可以分为两类,一类是先预测风速,然后再预测风功率;另一类是直接对风功率进行预测。按照时间尺度进行划分,风功率预测可以分为三个阶段预测,分别是超短期预测、短期预测、以及中长期预测。超短期预测指的是对6小时以内的风功率进行预测,主要是为了电力系统的优化;短期预测是针对于6-48小时的预测,主要用于电力系统的调度;中长期预测主要针对的是72小时以后的预测,主要是为了提前做好风场的检修计划。由于风力发电的特点是波动性和间歇性比较强,并网后对电网的冲击巨大。因此,在风场的实际应用中,主要是对风功率的超短期和短期进行预测。按照预测原理的不同进行划分,风功率预测方法主要分为基于数值气象预报方法和基于历史数据的方法。专利号ZL201310422579.6的中国专利发明了一种基于数据特征提取的风功率预测误差估计方法,目的是为了估计风功率预测误差,进而降低大规模风电并网后对电网安全运行的不利影响,保证了电力系统的可靠运行。专利号ZL201410026591.X的中国专利发明了一种基于风功率预测不确定度的风电系统运行的控制方法,利用卷积计算的方法,结合了风功率的不确定性,能够准确求出备用需求,该计算方法具有普遍适用性。专利号ZL201310295998.8的中国专利发明了一种风功率预测误差识别方法,通过蒙特卡洛仿真方法和BP人工神经网络方法,解析了风功率预测误差的统计特性,从而减小日前发电计划误差。专利号ZL201010044821.7的中国专利发明了一套基于短期风功率预测的风电并网在线安全预警系统,利用自回归滑动平均方法建立短期风功率预测模型,实现对风电并网在线安全预警。上述方法利用了风功率误差信息、风功率的概率模型分布、以及传统的数据解析方法对风场风功率进行预测,并对预测的误差进行识别,但并没有结合风场中风机所在位置的分布情况进行风功率预测。技术实现要素:针对现有技术存在的不足,本发明提供一种基于混核机器学习的风机批功率预测方法。本发明的技术方案如下:一种基于混核机器学习的风机批功率预测方法,包括:步骤1、建立风场风机离线历史数据库;步骤2、以每个月份为节点,将风场风机离线历史数据库中的风场每台风机的历史数据都划分为12个历史数据集合;步骤3、针对不同月份,依据风场每台风机的地形地貌信息对风场中的风机进行批划分处理,将风场中地理位置相近的风机划分到同一个批;步骤4、将每个批内与该批内风功率平均值最接近的风机作为批样机;步骤5、利用各批样机的历史数据集合与历史风功率,建立不同月份的各批样机风功率预测模型;步骤6、根据风场未来的气象信息,利用各批样机风功率预测模型对各批样机风功率预测,将各批样机风功率预测值与所在批内风机个数相乘并求和,得到风场总风功率预测值。所述步骤1,包括:步骤1.1、获取风场风机离线历史数据,包括风场每台风机的地形地貌信息、气象信息、风功率、风场测风塔测得的风场风速;地形地貌信息,包括:经度、纬度、海拔高度;气象信息,包括:空气湿度、温度、风向、风场风速、气压;步骤1.2、对风场风机离线历史数据中的异常数据进行剔除;步骤1.3、对风场风机离线历史数据的缺失数据进行插值补全;步骤1.4、根据风场风机离线历史数据构建风场风机离线历史数据库并定期更新。所述步骤1.3,包括:步骤1.3.1、选取风场风机离线历史数据中缺失的气象信息以及风功率;步骤1.3.2、按照平均插值的方法,结合风场测风塔测得的有效风场风速,对气象信息中缺失的数据和风功率中缺失的数据进行补全。所述步骤4,包括:步骤4.1、统计各批内所含有风机的个数;步骤4.2、选取与批内各风机平均功率最接近的风机作为批样机;步骤4.3、定期对划分各批后的风机重新划分。所述步骤5,包括:步骤5.1、将各批样机的历史数据集合进行归一化处理;步骤5.2、将各批样机的历史数据集合作为输入,对应的历史各批样机风功率作为输出,训练得到不同月份的各批样机风功率预测模型;步骤5.3、通过各批样机风功率预测值与各批样机的实际风功率进行比较,判断误差是否在偏差范围以内:是,则进行步骤6,否则执行步骤5.4;步骤5.4:对误差进行校正,将实时的气象信息和风功率加入到各批样机的历史数据集合中,执行步骤5.1。所述步骤5.2,包括:步骤5.2.1、采用最小二乘支持向量机方法建立不同月份的各批样机风功率预测模型;步骤5.2.2、将各批样机的历史数据集合作为输入,对应的历史各批样机风功率作为输出,构建训练数据集,对各批样机风功率预测模型进行训练;步骤5.2.3、将批样机风功率预测模型转化为最小化目标函数且带有等式约束的方程;步骤5.2.4、构造拉格朗日函数,并对批样机风功率预测模型的回归系数、偏差、松弛变量以及拉格朗日乘子分别进行求导;步骤5.2.5:将多项式核函数、高斯核函数相结合,以混核函数作为批样机风功率预测模型中的映射核函数;步骤5.2.6:将求导后的各个方程组合成线性方程组,利用高斯消元法对线性方程组进行求解,求出批样机风功率预测模型的回归系数和偏差,最终得到各批样机风功率预测模型;步骤5.2.7:对批样机风功率预测模型的惩罚系数、多项式核函数维数、高斯核函数中的参数、以及混核函数的系数进行优化。所述步骤5.2.7,包括:步骤5.2.7.1:初始化批样机风功率预测模型的惩罚系数、多项式核函数维数、高斯核函数中的参数、以及混核函数的系数,产生批样机风功率预测模型参数群体,确定群体规模,设置最大迭代次数、批样机风功率预测模型参数变异率、参数交叉概率;步骤5.2.7.2:计算批样机风功率预测模型参数群体中每个个体对应的批样机风功率预测值,以批样机风功率预测模型输出的批样机风功率预测值与批样机风功率实际值均方根误差最小作为参数优化的目标函数;步骤5.2.7.3:对群体中的每个个体,依据交叉概率进行变异,得到变异后的个体;步骤5.2.7.4:分别将变异后的批样机风功率预测模型参数个体与未变异参数个体的目标函数值进行比较,目标函数值小的个体将作为新的参数个体进入后续的迭代搜索过程;步骤5.2.7.5:判断终止条件是否满足:当迭代次数达到最大迭代次数时,满足终止条件,停止迭代,输出最优解即最优的批样机风功率预测模型参数,进而确定最终的各批样机风功率预测模型;否则,转步骤5.2.7.3,继续进行迭代。有益效果:本发明根据风场每台风机的地形地貌信息、气象信息、风功率、风场风速,建立风场风机离线历史数据库;再以每个月份为节点,将风场风机离线历史数据库中的历史数据划分为12个历史数据集合;针对不同月份,依据风场每台风机的地形地貌信息,对风机进行批划分处理,将风场中地理位置相近的风机划分到同一个批;将与该风机批内风功率平均值最接近的风机作为批样机;结合各批样机历史数据集合和各批样机风功率历史实际值,通过训练得到不同月份的各批样机风功率预测模型;根据风场未来的气象信息,利用各批样机风功率预测模型进行各批样机风功率预测,进而对各批风功率进行预测,最后获得风场总风功率。本发明在保证满足风场风机正常运行的前提下,对风场中的发电总功率进行预测,可以对风场的发电状况进行监测,克服了现场延时滞后的缺陷,提高了风功率的预测准确度,同时也提高了设备的利用率,降低了运行成本,为工作人员的进一步电网调度提供了有价值的参考信息,提高了企业的经济效益和社会效益。通过对风场风机的气象数据和风功率数据进行收集,根据风功率的变化情况,替代了广泛使用的场平均和单机求和预测方法,对风场不同批内的批样机风功率进行预测,同时采用改进的最小二乘支持向量机方法进行建模,将高斯核函数和多项式核函数相结合作为本发明方法的核函数,并通过改进的差分进化方法对模型参数进行优化,使得各批样机风功率预测模型更加准确,具有更好的适应性,达到预测整个风场风功率的目的,为风场的电力调度提供了保障。附图说明图1为本发明具体实施方式的基于混核机器学习的风机批功率预测原理图;图2为本发明具体实施方式的基于混核机器学习的风机批功率预测方法流程图;图3为本发明具体实施方式的建立风场风机离线历史数据库流程图;图4为本发明具体实施方式的风场风机地形地貌分布图;图5为本发明具体实施方式的步骤4具体流程图;图6为本发明具体实施方式的步骤5的流程图;图7为本发明具体实施方式的步骤5.2的流程图;图8为本发明具体实施方式的步骤5.2.7的流程图;图9为本发明具体实施方式的风场总风功率预测值与实际值比较的曲线图。具体实施方式下面结合附图对本发明的具体实施方式做详细说明。本发明预测原理如图1所示:首先通过获取的风场历史数据建立风场风机离线历史数据库,数据来源于气象局的气象数据、风机的地形地貌位置数据、测风塔实时数据以及发电设备的实时功率数据,然后将获得的数据按照月份进行分类,分成12个类别历史数据集合。针对不同月份,依据风场每台风机的地形地貌信息对风场中的风机进行批划分处理,将风场中地理位置相近的风机划分到同一个批;将每个批内与该批内风功率平均值最接近的风机作为批样机;利用各批样机的历史数据集合与历史风功率,建立不同月份的各批样机风功率预测模型;根据风场未来的气象信息,利用各批样机风功率预测模型对各批样机风功率预测,将各批样机风功率预测值与所在批内风机个数相乘并求和,得到风场总风功率预测值,将预测结果提供给工作人员进行参考。现场的操作人员会结合风机运行系统的实时状态,将最终的风功率预测信息上报给风机的调度系统,进而对风场内的所有风机进行有效控制。一种基于混核机器学习的风机批功率预测方法,如图2所示,包括:步骤1、建立风场风机离线历史数据库;所述步骤1,如图3所示,包括:步骤1.1、获取风场风机离线历史数据,包括风场每台风机的地形地貌信息、气象信息、风功率、风场测风塔测得的风场风速;地形地貌信息,包括:经度、纬度、海拔高度;每台风机间隔15分钟获取气象信息,包括:空气湿度、温度、风向、风场风速、气压;每台风机间隔15分钟获取风功率;风场测风塔每间隔10分钟测量风场风速;步骤1.2、对风场风机离线历史数据中的异常数据进行剔除;步骤1.3、对风场风机离线历史数据的缺失数据进行插值补全;所述步骤1.3,包括:步骤1.3.1、以15分钟为基准选取风场风机离线历史数据中缺失的气象信息以及风功率;步骤1.3.2、按照平均插值的方法,结合风场测风塔测得的有效风场风速,对气象信息中缺失的数据和风功率中缺失的数据进行补全。设X={x1,x2,…xn}为全部的历史数据集合,其中i时刻历史数据样本xi∈X都具备6种信息:间隔15分钟的空气湿度、温度、风向、气压、风场风速、风功率。如有数据缺失,则通过平均插值方法进行补全,利用缺失的历史数据样本xi相邻时刻的历史数据样本进行插值:其中,xi+1为i+1时刻历史数据样本,xi-1为i-1时刻历史数据样本。步骤1.4、根据风场风机离线历史数据构建风场风机离线历史数据库并定期更新。步骤2、以每个月份为节点,将风场风机离线历史数据库中的风场每台风机的离线历史数据划分为12个历史数据集合,设集合{Q1,Q2,...,Q11,Q12}为12个历史数据集合;步骤3、由于12个月中不同时期的季节性变化情况,依据风场每台风机的地形地貌信息对风场中的风机进行批划分处理,将风场中地理位置相近的风机划分到同一个批;统计每台风机的地形地貌信息,包括经度、维度、海拔高度,按照地理位置的特点,如图4所示,对整个风场66台风机中正常运行的60台风机进行批划分,划分为6个批;由于在采集数据期间风场中有限电的情况发生,并且存在一些故障的风机,其中包括:23#、35#、36#、39#、41#、42#风机停止运行,因此在本实施方式中划分批时不考虑这些风机;步骤4、将每个批内与该批内风功率平均值最接近的风机作为批样机;如图5所示,具体步骤如下:步骤4.1、统计各批内所含有风机的个数;步骤4.2、选取与批内各风机平均功率最接近的风机作为批样机,如表1所示:表1批划分结果步骤4.3、考虑到风机限电和故障风机的因素,定期对划分各批后的风机重新划分。步骤5、利用各批样机的历史数据集合与历史风功率,建立不同月份的各批样机风功率预测模型;所述步骤5,如图6所示,包括:步骤5.1、将各批样机的历史数据集合进行归一化处理;各批样机的历史数据集合:其中zi1∈{z11,…,zn1}表示下一时刻批样机空气湿度、zi2∈{z12,…,zn2}表示下一时刻批样机温度、zi3∈{z13,…,zn3}表示下一时刻批样机风向、zi4∈{z14,…,zn4}表示下一时刻批样机气压、zi5∈{z15,…,zn5}表示下一时刻批样机风速、zi6∈{z16,…,zn6}表示当前时刻批样机风功率,zi7∈{z17,…,zn7}表示下一时刻批样机风功率,且n为训练数据个数;xik为zik归一化后的结果:其中,z.k表示(.表示所有行的第k列数据)矩阵中第k列上的所有数据,z.k为矩阵中第k列数据均值,得到归一化后数据矩阵:步骤5.2、将各批样机的历史数据集合作为输入,对应的历史各批样机风功率作为输出,训练得到不同月份的各批样机风功率预测模型;如图7所示,具体步骤如下:步骤5.2.1、采用最小二乘支持向量机方法建立不同月份的各批样机风功率预测模型:P1(t+1)=PJH1{S(t),T(t),D(t),Y(t),F(t),P(t)}(5)P2(t+1)=PJH2{S(t),T(t),D(t),Y(t),F(t),P(t)}(6)P3(t+1)=PJH3{S(t),T(t),D(t),Y(t),F(t),P(t)}(7)P4(t+1)=PJH4{S(t),T(t),D(t),Y(t),F(t),P(t)}(8)P5(t+1)=PJH5{S(t),T(t),D(t),Y(t),F(t),P(t)}(9)P6(t+1)=PJH6{S(t),T(t),D(t),Y(t),F(t),P(t)}(10)其中,S(t)为下一时刻的批样机湿度、T(t)为下一时刻的批样机温度、D(t)为下一时刻的批样机风向、Y(t)为下一时刻批样机气压、F(t)为下一时刻的批样机风速、P(t)为当前时刻批样机风功率、Pi(t+1)为下一时刻各批样机风功率预测值、PJHi{}为各批样机风功率预测模型,其中i=1,...,6;步骤5.2.2、将各批样机的历史数据集合作为输入,对应的历史各批样机风功率作为输出,构建训练数据集,对各批样机风功率预测模型进行训练;构造批样机风功率预测模型:其中,N为训练数据的个数,每个训练数据xi中包含批样机风功率预测模型下一时刻的历史数据信息,表示将批样机风功率预测模型的输入数据xi从低维映射到高维特征空间,f(xi)为下一时刻批样机风功率,w为批样机风功率预测模型的回归系数,b为批样机风功率预测模型的偏差;步骤5.2.3、将批样机风功率预测模型转化为最小化目标函数且带有等式约束的方程,即:其中,γ为批样机风功率预测模型的惩罚系数,ξi为批样机风功率预测模型的松弛变量,表示批样机风功率预测模型的目标函数,第一项为正则化项;第二项为经验风险;步骤5.2.4:构造公式(12)的拉格朗日函数,即:对批样机风功率预测模型的回归系数w、偏差b、松弛变量ξi以及拉格朗日乘子αi分别进行求导如公式(14)所示:步骤5.2.5:由于特征空间的维数可能非常高,因此采用核函数其中xi和xi分别为批样机风功率预测模型的输入数据,将多项式核函数高斯核函数σ2>0相结合,以混核函数K(xi,xj)=a1K1(xi,xj)+b2K2(xi,xj)作为批样机风功率预测模型中的映射核函数,其中a1+b2=1,a1≥0,b2≥0;步骤5.2.6:将求导后的各个方程组合成线性方程组,利用高斯消元法对线性方程组进行求解,求出批样机风功率预测模型的回归系数和偏差,最终得到各批样机风功率预测模型;步骤5.2.7:利用改进的差分进化算法对批样机风功率预测模型的惩罚系数γ、多项式核函数维数d、高斯核函数中的参数σ、以及混核函数K(xi,xj)=a1K1(xi,xj)+b2K2(xi,xj)的系数a1或b2进行优化;由于a1+b2=1故只须求得其中一个参数就可推算出另一个参数的取值;如图8所示,具体步骤如下:步骤5.2.7.1:初始化批样机风功率预测模型的上述各参数γ、σ、d、a1(b2),产生有np个批样机风功率预测模型参数群体,确定群体规模np为100,每个参数群体中的个体为其中v=1,2,...np,z=1,2,...k,k为4(即需要对批样机风功率预测模型优化的参数个数:批样机风功率预测模型的惩罚系数γ、多项式核函数维数d、高斯核函数中的参数σ、以及混核函数K(xi,xj)=a1K1(xi,xj)+b2K2(xi,xj)的系数a1或b2),设置最大迭代次数为gmax为20,批样机风功率预测模型参数变异率F为0.5+0.5*rand(0,1),rand(0,1)为0-1的随机数,参数交叉概率CR为0.7,设当前代数为g为0代;步骤5.2.7.2:计算批样机风功率预测模型参数群体中每个个体对应的风功率预测值,以批样机风功率预测模型输出的风功率预测值与批样机风功率实际值均方根误差最小作为参数优化的目标函数;步骤5.2.7.3:对群体中的每个个体依据交叉概率CR进行变异,得到变异后的个体如公式(15)所示:其中r1、r2、r3和r4是从参数群体中随机选择的互不相同的4个整数,Rv,z为0-1的随机数;步骤5.2.7.4:分别将变异后的批样机风功率预测模型参数个体与未变异参数个体的目标函数值进行比较,如公式(16)所示:目标函数值小的个体将作为新的参数个体进入后续的迭代搜索过程;步骤5.2.7.5:判断终止条件是否满足:当迭代次数达到最大迭代次数gmax时,满足终止条件,停止迭代,输出最优解即最优的批样机风功率预测模型参数,进而确定最终的各批样机风功率预测模型。否则,转步骤5.2.7.3,设置g=g+1,继续进行迭代;步骤5.3、通过各批样机风功率预测值与各批样机的实际风功率进行比较,判断误差是否在偏差范围以内:是,则进行步骤6,否则执行步骤5.4;步骤5.4:对误差进行校正,将实时的气象信息和风功率加入到各批样机的历史数据集合中,执行步骤5.1;步骤6、根据风场未来的气象信息,利用各批样机风功率预测模型对各批样机风功率预测,将各批样机风功率预测值与所在批内风机个数相乘并求和,得到风场总风功率预测值,达到预测整个风场风功率的目的;步骤6.1、对各批样机与各批内的风机个数相乘得到历史各批风功率:Pi=Pi′*wi,i∈{1,2,3,4,5,6}(17)步骤6.2、将各批风功率预测值求和,得到风场总风功率预测值P总:P总=P1+P2+P3+P4+P5+P6(18)其中Pi为批i的风功率预测值,Pi′为批i的批样机风功率,wi为批i的风机个数,P总为风场总风功率预测值。图9为本发明具体实施方式针对于某风场3天的风场总风功率预测值与实际值的曲线图。表2显示了本发明具体实施方式计算得到批划分的风场总风功率预测值与实际值的比较结果。表2批划分的风场总风功率预测值与实际值的比较结果时刻(15min)实际值(MW)预测值(MW)19.559.6927.8510.35310.7110.59411.2511.5557.2310.22………10138.6634.5810235.1833.7310338.6633.41………28639.1132.7828738.5830.8528829.3825.67如表3所示,基于某风场的实际生产数据,通过与场平均方法(利用整个风场的测风塔数据、气象数据,以及风场整个风功率,与本发明方法区别是它不考虑每台风机,只根据整个风场的历史数据对风功率进行预测)、单机求和方法(考虑风场的每台风机的特性,对风场的每台风机进行预测,最后通过求和得到风场的总风功率)进行比较,批划分的方法对于风场风功率预测来说更有效。其中风功率的均方根误差为5.40,平均相对误差为0.18,最大误差为17.41MW,预测准确度(计算公式如下所示)为95%,运行时间为0.47s。其中:pMk为k时段的实际平均功率,ppk为k时段预测平均功率,N为日预报总时段数,这里N为288(相当于3天内15分钟的总时刻),Cap为风电场运行装机容量,这里Cap为99MW。综上所述风场风功率的均方根误差控制在6以内,平均相对误差控制在0.2范围以内,最大误差控制在20MW范围以内,预测准确度在94%以上,运行时间在1s以内,证明了该方法能够帮助风场提高风功率预测的命中率,进行科学合理的发电,避免造成成本增加,进而帮助风场减少能源消耗。因此该方法不仅使操作人员能够进行风场的风机管理与维护,还可为日后进行风场风机调度提供参考值,进一步提高风场的运行管理,使风场风机在安全稳定的环境下运行。表3本发明、场平均以及单机求和方法性能比较结果当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1