一种风电机组功率曲线建模方法与流程

文档序号:16264785发布日期:2018-12-14 21:50阅读:920来源:国知局
一种风电机组功率曲线建模方法与流程

本发明涉及风力发电技术领域,尤其是涉及一种风电机组功率曲线建模方法。

背景技术

风能是一种储量丰富的可再生能源,风电机组运行过程中每时每刻都在产生大量的、结构多样的、彼此间存在复杂关联性的数据。科学合理地利用这些数据,挖掘其价值,是风力发电技术领域关注的热点和焦点。其中基于运行数据的风功率曲线的拟合建模更是受到了广泛的关注。风功率曲线是衡量风电场经济技术水平的标尺,可以考核机组性能优劣,检测机组运行状态,评估机组发电能力。风电机组实际风功率运行数据建模,是评估风电机组运行特性的一项关键工作。

风电机组风功率曲线建模方法可分为参数方法和非参数方法。其中,参数方法主要包括分段平均法(bin)、分段线性模型方法、函数拟合模型、四参数/五参数logistic模型以及多项式拟合方法等;非参数方法主要有模糊逻辑回归、人工神经网络方法、k最近邻以及样条回归模型等。目前,应用较为广泛的风功率曲线建模方法是iec标准bin方法,即分段平均法,此方法计算简便,但用于拟合计算的风速区间的数据量将直接影响功率特性曲线的拟合效果,在数据量较少的情况下易受噪声数据点影响,存在得到的离散模型不能作为进一步研究与应用所需的数学模型的不足。与参数方法相比,非参数方法对于潜在的目标模型不需要任何假设,但是这类方法的建模效率普遍较低。可见,开展性能更优的风电机组风功率曲线建模新方法研究,兼顾风功率曲线建模的平滑度、精确度和建模效率,便于风功率曲线的后续应用和研究具有重要的理论和工程价值。



技术实现要素:

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种风电机组功率曲线建模方法。

本发明的目的可以通过以下技术方案来实现:

一种风电机组功率曲线建模方法,该方法包括如下步骤:

(1)获取风电机组发电数据,包括多个风速-功率数据点;

(2)剔除发电数据中的离群值完成预处理;

(3)基于预处理后的发电数据进行样条拟合,得到初步风速-功率曲线;

(4)对初步风速-功率曲线进行平滑处理到光滑风速-功率曲线,完成建模。

步骤(3)采用三次样条拟合得到初步风速-功率曲线。

步骤(3)具体为:

(31)将预处理后的发电数据在风速v的分布区间[a,b]上按照风速大小划分为n个风速区间;

(32)建立初步风速-功率曲线:

pi=gi(v)+εi,

gi(v)为第i组风速功率数据的三次样条拟合函数,εi为三次样条拟合函数的误差项,εi=n(0,δ0),δ0为标准差,pi为第i组风速功率数据中的功率值。

第i组风速功率数据的三次样条拟合函数gi(v)具体为:

gi(v)=di(v-vi)3+ci(v-vi)2+bi(v-vi)+ai,(vi≤v≤vi+1),

其中,ai、bi、ci和di为多项式系数,vi与vi+1分别为第i个风速区间中的风速边界值。

步骤(4)采用最小二乘正则化对初步风速-功率曲线进行平滑处理。

步骤(4)具体为:

(41)对三次样条拟合函数粗糙度进行正则化惩罚,对初步风速-功率曲线pi进行正则化最小二乘估计,得到粗糙惩罚光滑样条函数:

其中,λ为决定惩罚程度的光滑参数,g(v)为[a,b]风速区间上的三次样条拟合函数,g(vi)表示风速取vi时的函数值,argmin表示求使公式取值最小时的三次样条拟合函数g(v);

(42)采用fellser方法求解粗糙惩罚光滑样条函数,得到光滑风速-功率曲线。

与现有技术相比,本发明具有如下优点:

(1)本发明预处理能剔除由于风机停机、弃风限电、传感器失灵和传输存储错误等原因造成的异常数据,减小风电机组功率曲线建模的误差;

(2)本发明采用样条拟合方法得到初步风速-功率曲线,具有高精度和高效率的优点;

(3)本发明在初步风速-功率曲线的基础上进行最小二乘正则化处理,保持高精度拟合的基础上最大程度消除噪声点的影响,得到的风功率曲线具有良好的精确度和平滑度,满足风功率曲线工程应用的需求。

附图说明

图1为本发明风电机组功率曲线建模方法的流程框图;

图2为本实施例曲线拟合光滑度较差状态下的曲线示意图;

图3为本实施例某台机组发电数据进行交叉验证的自由度与误差关系图;

图4为基于光滑样条的风功率曲线建模结果示意图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。注意,以下的实施方式的说明只是实质上的例示,本发明并不意在对其适用物或其用途进行限定,且本发明并不限定于以下的实施方式。

实施例

如图1所示,一种风电机组功率曲线建模方法,该方法包括如下步骤:

(1)获取风电机组发电数据,包括多个风速-功率数据点;

(2)剔除发电数据中的离群值完成预处理;

(3)基于预处理后的发电数据进行样条拟合,得到初步风速-功率曲线;

(4)对初步风速-功率曲线进行平滑处理到光滑风速-功率曲线,完成建模。

风电机组scada系统收集的原始数据中包含由于风机停机、弃风限电、传感器失灵和传输存储错误等原因造成的异常数据,首先要剔除风机运行数据中的离群值,可以减小曲线建模的误差,步骤(2)中预处理采用公开的文献:沈小军,付雪姣,周冲成,王伟.风电机组风速-功率异常运行数据特征及清洗方法[j].电工技术学报,2018年14期.中的方法进行预处理,这里不再详述。

在拟合问题中,如果函数在不同的地方有不同的线性度,常采用的是样条拟合和多项式拟合。样条拟合比多项式拟合效果更好,因为用低阶的样条函数能产生和高阶多项式类似的效果,并且可以避免龙格现象的出现,具有较好的数值稳定性和收敛性。

所谓样条函数,从数学上来说,就是按照一定光滑度要求连接起来的分段多项式。对需要拟合的风速-功率数据点中的风速v所处的区间[a,b]以节点vi进行划分:

a=v0<v1<…<vn<vn+1=b

样条函数的定义如下:假设函数sk(v)在划分的每个子段[vi,vi+1](i=0,1,…,n)上都是k次多项式,且在每个节点ti上具有直到k-1阶的连续导数,则称k次多项式sk(v)为k次样条函数。

根据weiestrass逼近定理,任意定义在有界区间[a,b]的连续函数f(x),总可以用函数sk(x)来逼近,而且两者的误差随函数阶数n的增加而趋于零,即

limn→∞en(f)=limn→∞maxa≤x≤b|f(x)-sk(x)|

=lim||f-sk||∞

根据上式,样条函数的阶数越高,拟合越准确,但是阶数越高,函数形式和参数估计越复杂。选择三次样条函数能保证函数及其一阶导数连续、二阶可导,同时模型又不会过于复杂,因此三次样条函数在实际工程中得到了广泛的应用。根据定义,三次样条函数s3(v)可以表示为:

g(v)=s3(v)=di(v-vi)3+ci(v-vi)2+bi(v-vi)+ai,(vi≤v≤vi+1)

如果三次样条函数g(v)的二阶、三阶导数在a和b处为零,则g(v)称为三次自然样条,这些约束条件叫做自然边界条件。根据边界约束条件,在a和b处,d0=c0=dn+1=cn+1=0,因此在[a,v1]和[vn,b]上,g(t)为线性函数。

本实施例中,步骤(3)采用三次样条拟合得到初步风速-功率曲线,具体为:

(31)将预处理后的发电数据在风速v的分布区间[a,b]上按照风速大小划分为n个风速区间;

(32)建立初步风速-功率曲线:

pi=gi(v)+εi,

gi(v)为第i组风速功率数据的三次样条拟合函数,εi为三次样条拟合函数的误差项,εi=n(0,δ0),δ0为标准差,pi为第i组风速功率数据中的功率值。

第i组风速功率数据的三次样条拟合函数gi(v)具体为:

gi(v)=di(v-vi)3+ci(v-vi)2+bi(v-vi)+ai,(vi≤v≤vi+1),

其中,ai、bi、ci和di为多项式系数,vi与vi+1分别为第i个风速区间中的风速边界值。理论上,三次样条函数gi(v)可通过最小二乘法进行求解,但经验表明直接采用最小二乘法求解样条函数的系数容易过拟合,且曲线的光滑度较差,如图2所示,过拟合或光滑度差的问题是由于数据量较少的情况下存在噪声点造成的,因为过拟合曲线会尽可能拟合所有的数据点,包括噪声点,导致样条函数的复杂度增加。解决这一问题常用的方法就是在求解的过程中加入正则化项。利用正则化项,可有效实现待求系数的惩罚以简化样条函数,提高拟合函数的泛化能力。因此,本发明步骤(4)采用最小二乘正则化对初步风速-功率曲线进行平滑处理。

正则化的一般形式是在目标函数后增加一个正则化项,本发明的正则化项对样条函数的粗糙度进行惩罚,故此项又称为惩罚项,所求出的样条函数又称为光滑样条。

对粗糙度进行惩罚,首先需定义函数的粗糙度:一个函数在x处的二阶导数的平方被称为它在t出的曲率,因此函数粗糙度的一个自然度量方法就是它的二阶导数平方的积分:

pen(x)=∫[g”(x)]2dx

上式是对拟合函数的光滑度限制,除此之外,还有对拟合函数的精确度限制:

为同时满足风功率曲线模型的精确度和平滑度,步骤(4)具体为:

(41)对三次样条拟合函数粗糙度进行正则化惩罚,对初步风速-功率曲线pi进行正则化最小二乘估计,得到粗糙惩罚光滑样条函数:

其中,λ为决定惩罚程度的光滑参数,g(v)为[a,b]风速区间上的三次样条拟合函数,g(vi)表示风速取vi时的函数值,argmin表示求使公式取值最小时的三次样条拟合函数g(v);

(42)采用fellser方法求解粗糙惩罚光滑样条函数,得到光滑风速-功率曲线。

fellser方法求解粗糙惩罚光滑样条函数具体为:

g=(g1,…,gn)'

γ=(γ1,…,γ)'

其中,gi=g(vi),γi=g”(vi),i=1,2,…,n。由自然边界条件可知,γ1=γn=0。

令q为n×(n-2)阶矩阵,矩阵元素为qji:

其中,hi=vi+1-vi。

令r为(n-2)×(n-2)阶对称矩阵,元素为rij:

因此有:

由g和γ完全确定三次自然样条函数g(v)的首要条件为q'g=rγ,则

其中,k=qr-1q'。

令p=(p1,…,pn)',则通过粗糙惩罚光滑样条模型可求得:

g=(i+λk)-1p

其中,i为单位矩阵。然后通过下面的公式对待定参数γ的求解:

(r+λq'q)γ=q'y

由于q'g=rγ,可得:

g=p-λqγ

求出g和γ后,即可得到所构造的样条函数。

同时,在风功率曲线建模过程中需要对光滑参数λ进行选择,选择参数的目标是在提高数据拟合精确度度和降低模型复杂度之间达到一个平衡点,能够充分拟合风速-功率数据的最简单模型为首选。光滑参数λ可以通过广义交叉验证(gcv)求得:

其中,a(λ)=i-λq(r+λq'q)-1q',称为光滑矩阵,tr(·)表示矩阵的迹,为矩阵主对角线上各个元素的总和,df(λ)=tra(λ),表示拟合自由度。

光滑参数λ的取值对惩罚项估值的影响很大,合适的参数会使模型有较优的预测性能和泛化性能。图3为某台机组运行数据进行交叉验证的自由度与误差关系图,结果表明,当自由度过小时,建立的曲线模型过于简单,不能体现原始数据的变化特征,导致训练数据和测试数据的模型误差均较大;当自由度过大时,对曲线拟合的粗糙度惩罚较小,由于噪声数据导致模型复杂且波动较大,甚至出现过拟合,会导致测试数据与建立的模型之间误差增加。图4为选择合适的自由度时风功率曲线拟合结果(df(λ)=12)。

由图4可知,基于光滑样条的风功率曲线建模具有很好的局部自适应拟合效果,对比图2,数据中由噪声引起的曲线波动现象得到了消除。利用光滑参数来确定建模精确度和曲线光滑度之间的优化平衡,既能保证对原始数据的精确拟合,又能对原始数据中的噪声数据引起的波动进行平滑。

上述过程为基于光滑样条的风功率曲线建模流程的主要内容。数据预处理有助于提高风功率曲线建模精度,但是预处理并不能完全剔除异常数据,剩余的少量噪声点仍会影响曲线的平滑度和精确度;采用基于光滑样条的风功率曲线建模方法可以在保持高精度拟合的基础上最大程度消除噪声点的影响,得到的风功率曲线具有良好的精确度和平滑度,满足风功率曲线工程应用的需求。

本实施例案例验证数据来源于张北某大型风电场1#、3#、4#风电机组2016年3月2日至2017年3月2日运行数据,并予以清洗整定。该风电场风电机组的基本参数如下:额定功率2000kw,风轮直径95.9m,切入风速3m/s,额定风速11m/s,切出风速(10min平均值)25m/s。评估风功率曲线建模效果的优劣,根据工程需求,主要是评估曲线建模的准确度、平滑度以及高效性和普适性。

验证基于光滑样条的风功率曲线建模的准确性,可以通过已有的模型定量指标进行定量评估。此处选择了两个常用的定量指标,分别为均方根误差(rmse)和akaike信息准则(aic)。

aic=-2lnl+2k

其中,l为模型的极大似然函数,k为模型中自由参数个数。对于同一组数据拟合的不同模型中,aic值最小的模型为拟合优良性与模型复杂度综合效果最优的模型。

验证光滑样条拟合的高效性,可以在相同数据量下对比不同风功率曲线建模方法耗费的时间。以下对比的几种建模方法所用的数据都已经过预处理,因此数据预处理时间不计在内。验证流程的普适性和稳定性,可通过对比不同数据质量下的建模结果进行定性评估。此处的数据质量只根据数据量而定,一般情况下数据量越充足,数据分布越集中,曲线建模效果越好;数据量越少,数据离散程度越高,曲线建模效果越差。因此,通过对不同时间尺度的风速-功率数据进行拟合,可以对风功率曲线建模方法及流程的稳定性和普适性进行验证。

(a)建模普适性及平滑度验证

本实施例分运行数据质量好和数据质量差两种情景开展了提出的风功率曲线建模方法普适性及平滑度验证。

情景1:数据质量良好

在数据质量良好的情境下,风功率曲线建模的数据样本为机组一年的风速-功率运行数据。在数据样本充足的情况下,基于光滑样条法建立的风功率曲线模型与bin法拟合的结果基本重合,说明本文提出的风功率曲线建模方法及流程具有可行性。

情景2:数据质量较差

在实际工程中,常应用季度或月度风功率曲线,以准确反映风电机组在某季节或月份的运行特性。但季度或月度的运行数据量少,噪声数据对风功率曲线建模的影响会扩大,因此需要验证光滑样条算法在数据量较少时的风功率曲线建模效果。曲线建模的样本为预处理后夏季的风速-功率数据,数据量与情景1相比,约降低为原来的1/4。

不同建模方法用于同一组风速-功率数据的研究比较表明,当数据密度足够大时,结果的差异不大,但在数据稀疏分散时,建模差异较为明显。随着时间尺度的缩短,数据样本减少后,部分高风速区间内数据稀少,且离散程度较高。bin方法所求的是间隔为0.5m/s的风速区间内风速和功率的平均值,当某一风速区间数据量稀少时,会扩大噪声数据的影响,导致部分功率曲线出现较大偏差。也就是说,在按月份或季度分析风电机组的性能时,采用bin法拟合的风功率曲线无法有效地对机组的实际运行情况进行分析。

基于光滑样条建立风功率曲线可以有效克服这一问题。光滑样条的本质是按照一定光滑度要求连接起来的分段多项式,和bin法不同的是,光滑样条拟合得到的是一条光滑曲线,而非离散的点。因此,当一些高风速区间数据样本点较少时,函数本身的连续性和光滑性可以在一定程度上滤除噪声数据的影响,而且当个别区间数据缺失时,样条函数会自动根据曲线的趋势进行拟合,具有数据填充的效果。基于光滑样条建立的风功率曲线模型较为平滑,不受数据区间分布的影响,拟合效果更佳。

不同数据质量下风功率曲线建模方法的对比验证结果表明,基于光滑样条的风功率曲线建模方法可以更为有效拟合实测风速-功率数据。此方法可以克服bin法在数据量较少时拟合易受噪声点影响的问题,在不同数据质量下,均具有较好的平滑度和普适性。

(b)建模准确性和效率对比分析

目前,传统经典的风功率曲线建模方法中,多项式建模方法可兼顾建模效率和精度,其综合效果最优。为此,文实施例采用案例中的1#机组清洗后的数据,对比分析了多项式建模方法和提出的光滑样条建模方法的准确性和效率。基于光滑样条法建立的风功率曲线模型与多项式模型基本重合。为了验证本申请提出的基于光滑样条的风电机组功率曲线建模方法及流程的准确性和高效性,分别对两种模型的均方根误差(rmse)、aic值和建模时间进行了量化对比。

表1和表2分别为基于年数据量和季数据量的风功率曲线光滑样条模型与多项式模型对比结果。

由表1和表2可得,在数据量大的情况下,基于光滑样条的风功率曲线模型的均方根误差(rmse)、aic值与建模时间均明显小于多项式模型,这说明基于光滑样条的风功率曲线建模方法对风速-功率运行数据的拟合误差更小,模型复杂度更低,流程计算效率更高。在数据量小的情况下(季数据量),两种方法耗时接近,差距在10-2s级别。两种模型的均方根误差也非常接近,但是基于光滑样条的风功率曲线模型的aic值显著低于多项式模型,达到相同的拟合优度的情况下,基于光滑样条的风功率曲线复杂度更低。基于光滑样条法的风功率曲线建模流程在精确度、模型优度和建模效率优于多项式建模方法。

表1年数据量下光滑样条拟合与多项式拟合方法对比

表2季数据量下光滑样条拟合与多项式拟合方法对比

综上所述,本申请提出的基于光滑样条的风功率曲线建模方法及流程是一种有效可行的风功率曲线建模方法,能满足典型工程应用中对于风功率曲线建模的精确度、平滑度、高效性和普适性的需求。

上述实施方式仅为例举,不表示对本发明范围的限定。这些实施方式还能以其它各种方式来实施,且能在不脱离本发明技术思想的范围内作各种省略、置换、变更。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1