一种风电场风速预测方法与流程

文档序号:12039362阅读:344来源:国知局
一种风电场风速预测方法与流程
本发明涉及一种能够准确预测风电场风速的方法,属于发电技术领域。

背景技术:
随着环境问题的日益突出与能源危机的日益加剧,风力发电得到了飞速发展。然而,由于风能具有高随机性和波动性,大大限制了风电的进一步发展。尤其是大规模风电并网后,电力系统很可能会出现电压、频率发生偏差、电压波动、甚至脱网等现象。因此对风电输出功率进行准确预测,对优化调度、保证电力系统的稳定、安全和经济运行都有着十分重要的现实意义。目前,按预测对象不同,风电功率预测方法可以分为基于功率的预测和基于风速的预测;按预测原理不同,风电功率预测方法可以分为物理方法与统计方法。而常用的统计方法有持续性法、自回归滑动平均法、神经网络法、灰色预测法、空间相关性等方法。其中神经网络法凭借其超强的非线性拟合与泛化能力,运用最为广泛,并取得了显著成效。然而,神经网络模型的输入变量和训练样本对预测效果有着非常关键的影响。在模型输入变量的选择上,大多数采用相关性人为设定阈值分析方法进行选取,这种选取方法不可避免地带有主观因素,造成信息冗余或损失;再者,影响风速的因素是多方面的,如果把它们都包含在模型输入内,将会加重神经网络的训练负担,降低模型的预测精度。而对于训练样本的选择问题,选取相似性高的数据训练模型已被证实可以增强训练效率,有效地提高模型的泛化能力。因此,如何从影响风速的多种非等同重要性因素中提取出重要因素作为模型输入变量,并选取准确合适的数据作为建模训练样本,就成为进一步提高神经网络预测精度的关键。

技术实现要素:
本发明的目的在于针对现有技术之弊端,提供一种从影响风速的多种非等同重要性因素中提取出重要因素作为模型输入变量,并选取准确合适的数据作为建模训练样本的风电场风速预测方法。本发明所述问题是以下述技术方案实现的:一种风电场风速预测方法,所述方法首先采用模糊粗糙集方法对影响风电场风速的多种因素进行属性约简,去除冗余信息,得到神经网络预测模型的输入变量;然后采用加权欧氏距离进行改进的聚类方法提取相似性较高的数据作为神经网络预测模型的训练样本,并使用聚类后的数据训练各类预测模型;最后根据当前属性值选择匹配的预测模型来预测风速。上述风电场风速预测方法,所述方法包括以下步骤:a.采用模糊粗糙集方法确定神经网络预测模型的输入变量,具体步骤为:1)从风电场中央监控系统中读取用于模糊粗糙集与改进聚类建模所需的风速、风向、温度、大气压的历史数据;2)综合考虑可能影响风电场风速的多种因素,把预测时刻的风速作为决策属性,将可能影响决策属性的因素列为条件属性,建立初始决策表;3)根据各属性的物理特点,选择合适的模糊隶属度函数对各属性模糊划分,对初始决策表模糊化;4)采用基于QuickReduck约简算法对条件属性进行约简,约简后的属性即为优化后的神经网络输入变量;b.采用改进的聚类方法选择神经网络预测模型的训练样本,具体步骤如下:Ⅰ.计算约简后各属性对决策属性的重要性,并采用归一化方法获得改进聚类所需各属性的权值系数;Ⅱ.随机选取k个对象作为初始聚类中心;Ⅲ.计算每个对象与各聚类中心的距离,按照距离最小的原则将各对象分配到邻近的聚类,所使用的距离函数为加权欧氏距离函数,表达式如下:其中,表示对象xi1,xj1间的加权欧氏距离;xi1k1,xj1k1(k=1,2,…,n)分别表示对象xi1,xj1第k1个属性值;wk1(k1=1,2,…,n)表示对象第k1个属性的权重系数;Ⅳ.计算每个聚类的样本均值,并以此作为新的聚类中心;Ⅴ.重复Ⅲ、Ⅳ步骤,直到聚类中心不再发生变化,得到相似性较高的k类数据及各类的簇中心Ci2,i2=1,2,…,k;Ⅵ.建立k类神经网络风速预测模型,分别使用聚类后的分类数据作为训练样本训练这k类神经网络预测模型;c.选择匹配的神经网络预测模型执行风速预测计算当前对象与各类簇中心之间的加权欧氏距离,若当前对象与第i2类簇中心Ci2加权欧氏距离最小,则使用第i2类预测模型进行预测。上述风电场风速预测方法,条件属性关于决策属性Q的重要性计算表达式为:σPQ(p)=γP+{p}(Q)-γP(Q)各属性权值系数的计算表达式如下:其中,n是约简后条件属性的个数;σk1表示第k个属性的重要性;σ’k1表示第k1个属性归一化后的重要性;i3是约简后第i3个条件属性。上述风电场风速预测方法,所述QuickReduck约简算法的伪代码如下:其中,条件属性P对决策属性Q的依赖度γP(Q)计算步骤如下:①分别计算各模糊等价类下近似集其中,Fi表示属于U/P的模糊等价类,P为条件属性;②分别计算模糊等价类Fi的模糊正区域③计算论域U中对象x对模糊正域的隶属度④计算条件属性P对决策属性Q的依赖度γP(Q),本发明在传统神经网络预测模型的基础上,对模型输入变量与训练样本这两大影响神经网络预测性能的重要因素进行了优化,大大提高了模型的泛化能力。测试结果表明,本发明能大幅度提升神经网络的预测性能,有效地提高风电场风速预测精度。附图说明下面结合附图对本发明作进一步说明。图1是本发明的算法框图;图2是风电场中央监控系统示意图;图3是风速预测效果比较图;图4是实例中采用的风速模糊隶属度函数;图5是实例中采用的温度模糊隶属度函数;图6是实例中采用的气压模糊隶属度函数。文中各符号清单为:表示对象xi1,xj1间的加权欧氏距离;xi1k1,xj1k1(k=1,2,…,n)分别表示对象xi1,xj1第k1个属性值;wk1(k1=1,2,…,n)表示对象第k1个属性的权重系数;n是约简后条件属性的个数;σk表示第k个属性的重要性;σ’k表示第k个属性归一化后的重要性;γP(Q)是条件属性P对决策属性Q的依赖度;i1,j1表示第i1,j1个对象;k1表示第k1个属性;i2表示i2类相似数据;i3是约简后第i3个条件属性;k表示相似性高的数据类别数。具体实施方式粗糙集理论是一种刻画不完整性、不确定性的数学分析工具。它能在保留关键信息的前提下对数据进行化简求得知识的最小表达式,能识别并评价数据之间的依赖关系,获取易于证实的规则知识。影响风速的因素是多方面的,若把它们看成一个知识表达系统,运用模糊粗糙集方法对影响风速的多种因素进行分析,可以约简得到能反映风速变化规律的多个重要属性作为神经网络输入变量,不仅很好地优化了输入空间,并且可以得到各属性对决策风速的重要性。而传统聚类方法则是将杂乱无章的数据分成相似度高的若干类,从而为模型提供相似性高的训练样本。但是,传统聚类方法在聚类过程中并没有考虑对象各变量在数据中的不等重要性,可能造成某些重要性低的变量贡献过大,从而影响聚类质量,因此需要根据变量的重要性对各变量赋予不同的权值系数。图1是本发明的总体算法框图。由图1可知,本发明的算法共包括了三个阶段,分别是采用模糊粗糙集方法确定神经网络预测模型的输入变量、采用改进聚类方法选择神经网络预测模型的训练样本及选择匹配的预测模型执行风速预测。采用模糊粗糙集对神经网络风速预测模型的输入变量进行优化,是本发明的一大核心技术。人工神经网络具有很强鲁棒性、非线性拟合能力与超强的自学习能力,在风电功率预测方面已得到了广泛应用,并取得了不错的效果。影响风速的因素是多方面的,包括温度、气压、湿度及先前若干时刻的风速值等,并且它们对预测时刻风速的影响也是不同的。若把这些变量同时包含到神经网络的输入内,将会加重神经网络的负担,降低模型泛化能力,不利于最后的预测。引入模糊粗糙集对影响风速的多种因素进行约简,在不需要先验知识的情况下可以删除一些不必要或不重要的因素,很好地实现了模型输入变量的优化,同时避免了使用相关性设定阈值确定输入时可能造成信息冗余或损失。基于模糊粗糙集对影响风速的因素约简算法的具体步骤如下:1)从风电场中央监控系统中读取用于模糊粗糙集与改进聚类建模所需的风速、风向、温度、大气压的历史数据;2)综合考虑可能影响风电场风速的多种因素,把预测时刻的风速作为决策属性,将可能影响决策属性的因素列为条件属性,建立初始决策表。3)根据各属性的物理特点,选择合适的模糊隶属度函数对各属性模糊划分,对初始决策表模糊化。4)采用基于QuickReduck约简算法对条件属性进行约简,约简后的属性即为优化后的神经网络输入变量。步骤1)所述的风电场中央监控系统的示意图如图2所示,每台风电机组当地有一个存储器用于存储该机组的运行数据,包括风速、风电功率、电压、电流及温度、大气压、风向等信息。同时,各机组通过通信网络向风电场中央监控传送数据,中央监控设有数据服务器与应用服务器等,以保存这些数据并用于风电场的运行与管理。本发明所述的数据采集是从风电场中央监控的数据服务器读取的。采用改进的聚类对神经网络风速预测模型的训练样本进行优化,是本发明的另一大核心技术。聚类方法可以将相似性较高的对象聚为一类,便于我们研究并掌握事物的内部规律。在进行风速预测时,风速变化是多样。若把历史数据分为相似性高的若干类,分别建立各类预测模型,并使用各类样本数据训练各类模型,可以增强模型对该类数据泛化能力,提高预测精度。然而在传统聚类方法中,对象的每个属性都得到了平等的对待,它们在聚类时所作的贡献是平等。但在实际应用中,对象的内在性质是不同的,每个属性表现出来的重要性也会有所不同,故在评价对象间差异度,还需考虑各属性的重要性。对此,在使用距离函数评价对象间的差异度时,可以根据属性的重要性赋予不同的权值系数,这样可以很好地解决不等同重要性因素对聚类的影响。那么,评价差异度的欧氏距离被替换为加权欧氏距离,表达式为其中,表示对象xi1,xj1间的加权欧氏距离;xi1k1,xj1k1(k=1,2,…,n)分别表示对象xi1,xj1第k1个属性值;wk1(k1=1,2,…,n)表示对象第k1个属性的权重系数;i1,j1表示第i1,j1个对象;k1表示第k1个属性。使用加权欧氏距离进行聚类可以很好地反映对象各属性在决策过程中所起的作用,增强了聚类的有效性。但是,使用所述方法时需要对数据的实际意义有一定的认识,并且要求能够选择合适的权重。模糊粗糙集可以在不需要任何先验知识情况下,比较客观地得到各属性相对于决策属性的重要性,适合用于求取改进聚类所需各属性的权值系数。下面将举一实例进行分析,但本发明不局限于本实例:华北地区某风电场的风电场中央监控系统记录了场内各风机风速、风向、温度、大气压等信息,采样时间间隔为十分钟。选取某机组历史数据中的一个月数据用于模糊粗糙集与改进聚类分析与建模,并选取之后的某一天的数据作为测试样本。本实例采用平均绝对误差(EMAE)、平均绝对百分误差(EMAPE)、最大误差(EMAX)三项指标衡量模型预测效果。本实例中,令下一预测时刻的风速v(t+1)为决策属性。考虑到前15个时刻风速v(t),v(t-1),…,v(t-14)与预测时刻风速具有较高相关性,故把它们都列为影响因素。此外,风的形成跟温度与气压差有着密切联系,故把当前与前一时刻的温度、气压和前5个时刻温度、气压的平均值也列为影响因素。而风是一个空间向量,风向的变化可能会影响风速大小,故影响因素也应该包括当前与前一时刻的风向。选取这23个影响因素作为条件属性,得到初始决策表输入属性。选取200组属性数据作为对象,建立初始决策表。接着,确定每个属性的模糊隶属度函数。对于风电机组,有两个重要关于风速的概念,切入风速与额定风速。切入风速指的是可以发出可利用电能的最低风速,额定风速指的是风机刚达到额定功率时的风速。采用三角隶属函数,以切入风速和额定风速为基准将风速划分为低风速、中风速、高风速三种状态,有U/v={vS,vM,vL},得到如图4所示模糊隶属度函数(在本案例中,切入风速和额定风速为3m/s和13m/s)。对于风向,采用除以360°归一化方法进行模糊化。对于温度属性,将温度模糊划分为低温、中温、高温三种状态,其隶属度函数如图5所示。考虑到大气压的相对变化幅度比较小,直接使用有名值时区别很小,先将大气压按下式变换:其中,P’i4表示变换后的气压值;Pi4表示变换前气压值;Pmin,Pmax分别表示气压最小值与最大值;n表示对象的总个数。采用梯形分布作为其模糊隶属度函数,如图6所示。确定各属性隶属度函数后,对初始决策表模糊化。采用QuickReduck算法并结合模糊粗糙集相关理论对可能影响决策风速的23个条件属性进行约简。为了克服个别不良数据及噪声的影响,设置了依赖度增量阈值Δγ=0.005,只有依赖度增量大于此阈值时,才认为该属性存在于约简中。表1.1记录了约简过程中部分属性集的依赖度。单属性时,当前时刻风速v(t)的依赖度最大,故v(t)必存在于约简中,此时R={v(t)}。而当属性集为{v(t),…,v(t-3),T(t)},此时集合对决策的依赖度为0.5880。继续添加属性时,如分别加入属性v(t-4)、P(t),此时它们的依赖度增量分别为0.0023和0.0047(如表1.1所示),都不大于阈值Δγ,故不认为它们存在约简中。这时,添加属性已不能使依赖度的增量大于阈值,故当前属性集R={v(t),v(t-1),v(t-2),v(t-3),T(t)}为最后的约简,集合中的各属性分别代表了t,t-1,t-2,t-3时刻的风速和t时刻的温度,故得到神经网络风速预测模型的输入空间为{v(t),v(t-1),v(t-2),v(t-3),T(t)}。分别计算删去其中某一属性时属性集对决策风速的依赖度γ{R-p}及各属性对决策属性的重要性μp(attr)。然后,对各属性重要性归一化,获得改进聚类时所需各属性的权值系数μ’p(attr),结果如表1.2所示。使用改进后的k聚类对一个月的属性数据进行聚类,选取各类数据样本训练k类神经网络预测模型。在本实例中,对k进行5-10之间取值测试,k取7时预测效果最好。表1.1约简过程中部分属性集依赖度表1.2约简后输入变量的重要性表2分别记录了不同输入空间下的预测结果。由表中前三项结果可以看出,模型输入缺少某些重要性属性时,预测精度会有所下降,下降幅度跟重要性有关。然而,若把气压或t-4时刻后的风速等某些重要性很低或不相关的因素加入到模型输入后,预测效果同样会变差,表明了过多的输入变量会加重模型的训练负担,影响预测精度。表2不同输入空间下的预测误差为了验证本发明的有效性,本实例分别采用直接神经网络方法ANN、模糊粗糙集和神经网络相结合方法FRS-ANN、模糊粗糙集与传统聚类相结合的神经网络预测方法FRS-C-ANN与本发明的方法FRS-IC-ANN对本案例进行了风速预测,结果如表3所示。从表3可以看出,相对于第一种方法,后三种方法的各项指标均有了大幅度提高,说明了优化输入空间可以减轻模型的训练负担,提高模型预测性能。方法2、3的各项指标则基本相同,而采用了改进聚类的方法4,各项指标相对于前两种方法都有了一定的提高。可以看出,传统聚类方法的引入并没有带来预测效果的提升,而改进后的聚类方法则考虑了属性间的不等重要性,提高了聚类效果,可以为模型提供相似度较高的训练样本,从而提高训练效率。从预测整体效果方面看,本方法对输入空间和训练样本实现优选后,EMAE和EMAPE分别下降了28.9%与28.3%,EMAX从3.3013下降到了2.0839;从误差分布方面看,绝对误差EAE大于1m/s的比例由34.03%下降到15.97%,而绝对百分比误差EAPE大于0.1的比例则从29.86%下降到20.14%,分别下降了53.1%和32.6%,表明了所述方法大幅度地提高了神经网络风电场风速预测性能,具有较强实用价值。表3预测结果对比本发明认为,传统聚类方法在聚类过程中并没有考虑对象各变量在数据中的不等重要性,它们在计算距离时各变量的权值系数都为1;本发明认为传统聚类不适合风速知识系统,本发明所说的改进聚类方法是用加权欧氏距离函数代替传统距离函数,并根据变量的重要性对各变量赋予不同的权值系数,从而提高了预测的准确性。本发明采用的QuickReduck约简算法,是指某外国学者在文献【RadzikowskaAM,KerreEE.Acomparativestudyoffuzzyroughset[J].FuzzySetandSystems,2002,126(1):137-156.】中提出来的一种用于属性约简经典算法。它通过不断增加属性,再根据依赖度的变化来决定属性的去留,该算法伪代码就是下图所示。首先,选取一个空集R作为初始集合。然后,依次增加属性到R集合中,判断属性增加后依赖度变化如何。若依赖度是增大的,则说明加入该属性后,相应的分类能力增加,即重要性提高;否则,重要性降低。直到γR(D)达到最大值时,R与C具有相同的分类能力,此时集合R为C一个属性约简的结果:
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1