基于密度分布的功率曲线拟合数据预处理方法及装置与流程

文档序号:21634623发布日期:2020-07-29 02:45阅读:365来源:国知局
基于密度分布的功率曲线拟合数据预处理方法及装置与流程

本发明属于风电领域,特别是涉及到一种基于密度分布的功率曲线拟合数据预处理方法及装置。



背景技术:

风力发电是一种具有很大发展潜力的新能源发电方式,清洁无污染,极具商业化发展前景,但是,由于风力发电具有明显的间歇性和波动性,并网后严重影响电网电能质量,同时,随着风电并网容量的逐年攀升,风力发电对电网的影响日益严重,为减少风电对电网的冲击,保护电网稳定运行,调度机构不得不在必要时对风电场采取限制并网的措施,造成风能消纳问题。提前对风电功率进行准确预测,可以缓解电力系统调峰压力,有效提高风电并网的能力。因此,风电功率预测对风风力发电的可持续发展起着重要的作用。

国内外对风电功率预测方法进行了大量研究,主流方法分为三类统计方法、物理方法、以及发展迅速的机器学习方法。不管哪一种方法都有自身的模型偏好和预报特点,不管哪一种方法都需要大量的风电场运行数据,然而,风电场运行数据在产生和采集过程中会受到各种因素的影响,由此带来误差,如果直接把这些数据引进风电功率预测模型中,会明显降低风电功率的预测精度,因此需要剔除异常数据,筛选有效的风电样本数据。



技术实现要素:

本发明提出一种基于密度分布的功率曲线拟合数据预处理方法及装置,能剔除异常、扩建和限电数据,保证功率模型训练输入的样本集中均为风电场有效数据。

为达到上述目的,本发明的技术方案是这样实现的:

一种基于密度分布的功率曲线拟合数据预处理方法,采集风电机组或风电场实际历史运行风速、功率,以及风电机组信息,根据实际历史功率的空间密度数分布情况,获取功率曲线,并根据功率曲线对实际功率数据进行预处理。

进一步的,采集风电机组或风电场实际历史运行风速、功率后,进行初筛处理,去除恒定值和异常值。

进一步的,根据实际历史功率的空间密度数分布情况获取功率曲线的方法包括:

(1)以风速为横坐标,功率为纵坐标,对风速进行等间隔划分,得到n个风速段,将功率进行等间隔划分,得到m个功率段,最终得到n*m个网格,以网格中心点坐标点代表该网格,即(vi,pj),其中,i=1,2,…,n;j=1,2,3,…,m;

(2)统计实际历史功率落在每个网格点的个数nym(i,j),得到二维的功率密度数空间分布情况,取所有网格的非零功率密度数的中位数记为median;

(3)当风速小于阈值时,对于该区域内的每个风速段内的最大功率空间密度数所对应的网格,如果该网格对应的功率密度数在其纵向或者横向均为最大值,则记录下该网格的中心坐标;

(4)当风速大于阈值时,对于该区域内的每个风速段vi所对应的各功率段pj,从高风功率段开始,即j=m,m-1,…,1,寻找符合以下条件的网格点并记录下该网格点的中心坐标,并进入下一个风速段的寻找;1)num(i,j)等于该功率段下的最大密度数为num(i,j)在i=1,2,…,n时的最大值;2)num(i,j)大于密度数的中位数median;

(5)根据步骤(3)和(4)获取到的坐标点,得到该风电机组的功率曲线。

更进一步的,步骤(5)中根据坐标点得到功率曲线的生成步骤包括:

(501)获取到的一组坐标点(vk,pk),其中k=1,2,…,q;以风速vk从小到大进行排序,将功率递减的坐标点去除,得到一组新的坐标(vk,pk),其中k=1,2,…,p;

(502)从0到30m/s,以0.1m/s为间隔构建风速序列,将(vk,pk)线性插值到新的风速序列上,得到功率曲线b;

(503)将功率曲线b中风速小于k米/秒的功率置为零,k为风机切入风速;

(504)将该组数据中的最大功率值和最大风速值作为额定输出功率和额定风速,大于额定风速的风速对应功率值等于额定输出功率,最终得到该风电机组的功率曲线。

进一步的,对实际功率数据进行预处理时,根据实际风速通过上述功率曲线插值得到理论发电功率,当实际功率与理论发电功率的偏差在一定范围内,则该实际功率值有效;如果超出该范围,则该实际功率值为异常;所述偏差范围为[-k1*c,k2*c],其中,k1,k2的范围为(0,0.3)。

本发明的另一方面,还提供了一种基于密度分布的功率曲线拟合数据预处理装置,包括:

采集单元,用于采集风电机组或风电场实际历史运行风速、功率,以及风电机组信息;

曲线获取单元,用于根据实际历史功率的空间密度数分布情况,获取功率曲线;

预处理单元,用于根据功率曲线对实际功率数据进行预处理。

进一步的,所述采集单元包括初筛模块,用于采集风电机组或风电场实际历史运行风速、功率后,进行初筛处理,去除恒定值和异常值。

进一步的,所述曲线获取单元包括:

网格划分模块,用于以风速为横坐标,功率为纵坐标,对风速进行等间隔划分,得到n个风速段,将功率进行等间隔划分,得到m个功率段,最终得到n*m个网格,以网格中心点坐标点代表该网格,即(vi,pj),其中,i=1,2,…,n;j=1,2,3,…,m;

密度统计模块,用于统计实际历史功率落在每个网格点的个数num(i,j),得到二维的功率密度数空间分布情况,取所有网格的非零功率密度数的中位数记为median;

坐标获取模块,用于:当风速小于阈值时,对于该区域内的每个风速段内的最大功率空间密度数所对应的网格,如果该网格对应的功率密度数在其纵向或者横向均为最大值,则记录下该网格的中心坐标;当风速大于阈值时,对于该区域内的每个风速段vi所对应的各功率段pj,从高风功率段开始,即j=m,m-1,…,1,寻找符合以下条件的网格点并记录下该网格点的中心坐标,并进入下一个风速段的寻找;1)num(i,j)等于该功率段下的最大密度数为num(i,j)在i=1,2,…,n时的最大值;2)num(i,j)大于密度数的中位数median;

功率曲线模块,用于根据坐标获取模块获取到的坐标点,得到该风电机组的功率曲线。

更进一步的,功率曲线模块包括:

排序子模块,用于将坐标获取模块获取到的一组坐标点(vk,pk),其中k=1,2,…,q;以风速vk从小到大进行排序,将功率递减的坐标点去除,得到一组新的坐标(vk,pk),其中k=1,2,…,p;

插值子模块,用于从0到30m/s,以0.1m/s为间隔构建风速序列,将(vk,pk)线性插值到新的风速序列上,得到功率曲线b;

置零子模块,用于将功率曲线b中风速小于k米/秒的功率置为零,k为风机切入风速;

曲线生成子模块,用于将该组数据中的最大功率值和最大风速值作为额定输出功率和额定风速,大于额定风速的风速对应功率值等于额定输出功率,最终得到该风电机组的功率曲线。

进一步的,所述预处理单元包括:

理论值模块,用于对实际功率数据进行预处理时,根据实际风速通过上述功率曲线插值得到理论发电功率;

偏差判断模块,用于判断:当实际功率与理论发电功率的偏差在一定范围内,则该实际功率值有效;如果超出该范围,则该实际功率值为异常;所述偏差范围为[-k1*c,k2*c],其中,k1,k2的范围为(0,0.3)。

与现有技术相比,本发明具有如下的有益效果:

本发明所提出的方法不同于一般统计拟合的方法,受异常数据的影响非常小,准确度极高,保证功率模型训练输入的样本集中均为风电场有效数据,进一步提高风电功率系统的预测精度,具有较强的普适性和工程应用价值;并且本发明简洁、易理解、可操作性强。

附图说明

图1为本发明实施例的采集实际数据的散点图;

图2为本发明实施例的基于密度分布选取的一组坐标点的示意图;

图3为本发明实施例的功率曲线示意图;

图4为本发明实施例的偏差范围示意图;

图5为本发明实施例的实际功率数据预处理后的示意图。

具体实施方式

需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。

为使本发明专利的目的、特征更明显易懂,下面结合附图对本发明专利的具体实施方式作进一步的说明。需说明的是,附图均采用非常简化的形式且均使用非精准的比率,仅用以方便、明晰地辅助说明本发明专利实施例的目的。

本发明的设计思想,是由于电场运行数据从scada系统中采集,在产生和采集的过程中均会受到各种因素的影响,由此带来误差,如果这部分数据较多被引进功率模型中,会明显降低风电功率的预测精度。因此,在使用历史数据训练模型前,需要考虑一定误差范围的情况下,剔除限电、故障等明显的功率异常点。本发明将风电场的实测风速和实测功率二维空间进行网格离散化,统计功率值落在各个网格内的个数,获得功率空间密度数分布,通过统计处理,得到风电场实测风速和实测功率的曲线,根据风电场实测功率与功率曲线转换的理论功率的比较,剔除异常、扩建和限电数据,保证功率模型训练输入的样本集中均为风电场有效数据。

本发明的具体步骤包括:

1、将获取到的实际历史运行数据进行初筛处理,去除恒定值和异常值;如果数据采集频率为15分钟,风电机组或风电场并网发电容量为c,则恒定值的判断阈值为24(该阈值根据经验得来,可以设定为大于3的整数,但也不宜过大,以免无法起到异常数据过滤作用);风速正常值的范围为[0,30],功率正常值的范围为[0,c];

2、以风速为横坐标,功率为纵坐标,从0到30米/秒对风速进行等间隔划分,得到n个风速段,从低风速段到高风速段进行编号1,2,…,n;将功率从0到c进行等间隔划分,得到m个功率段,从低功率段到高功率段进行编号1,2,3,…,m,最终得到n*m个网格,以网格中心点坐标点代表该网格,即(vi,pj),其中,i=1,2,…,n;j=1,2,3,…,m。通常,风速间隔为0.02米/秒,功率间隔为c/1500,上述的间隔是通过全国一百多个风电场实际数据测试经验得出的相对比较稳定的值;

3、统计实际历史功率落在每个网格点的个数num(i,j),即可得到二维的功率密度数空间分布情况,取所有网格的非零功率密度数的中位数记为median;

4、当风速小于vo时,一般vo取值为9~11米/秒(风速vo的取值一般接近风机额定输出功率,风电场限电基本发生在高风速段,风速超过vo时,该时段的数据会受限电影响,所以处理方法不一样),对于该区域内的每个风速段内的最大功率空间密度数所对应的网格,如果该网格对应的功率密度数在其纵向或者横向均为最大值,则记录下该网格的中心坐标;

5、当风速大于vo时,对于该区域内的每个风速段vi所对应的各功率段pj,从高风功率段开始,即j=m,m-1,…,1,直到寻找符合以下条件的网格点,一旦找到符合的网格点,立即停止当前的寻找,记录下该网格点的中心坐标,并进入下一个风速段的寻找;

所述条件为:1)num(i,j)等于该功率段下的最大密度数为num(i,j)在i=1,2,…,n时的最大值;2)num(i,j)大于密度数的中位数median;median为步骤3中求得的值,是所有网格点的非零功率密度数的中位数;

上述条件1)起决定性作用;条件2)是针对特别情况做的限定,可以看成特殊处理,可以说绝大部分电场的情况都能够满足条件2);

6、通过4、5两个步骤,可以获取一组坐标点(vk,pk),其中k=1,2,…,q,对该组坐标点进行以下处理:1)以风速vk从小到大进行排序,将功率递减的坐标点去除后,得到一组新的坐标(vk,pk),其中k=1,2,…,p,;2)从0到30m/s,以0.1m/s为间隔构建风速序列,将(vk,pk)线性插值到新的风速序列上,得到功率曲线b;3)将功率曲线b风速小于k米/秒的功率值为零(k为风机切入风速,一般取值范围为2~3.5m/s,该值跟风机机型有关);4)将该组数据中的最大功率值和最大风速值作为额定输出功率和额定风速,大于额定风速的风速对应功率值等于额定输出功率,最终得到该风电机组以实际运行数据为基础的功率曲线;

7、根据实际风速通过上述功率曲线可以插值得到一组理论发电功率ptheroy,当实际功率与理论发电功率的偏差在一定范围内,则认为该实际功率值有效,可以作为模型输入值,如果超出该范围,则认为该实际功率值为异常。一般情况该偏差范围为[-k1*c,k2*c],其中,k1,k2的范围为(0,0.3]。

依据上述步骤,获取某风电场2019年全年的实际风速和实际功率数据,进行如下数据处理:

该风电场装机为201mw,数据样本采集时间间隔为15分钟,去除24个以及以上连续的值,风速范围在[0,30]以外的值去除,以及功率在[0,201]以外的值去除;

以实际风速为横轴,实际功率为纵轴,绘制散点图,如图1所示,可以看出,该电场含有大量限电的数据,如果该数据放入训练模型中,会影响模型精度,需要剔除;

风速以0.02m/s为间隔,功率以0.134mw为间隔,vo值为10m/s,执行前面所述的步骤2、3、4、5,可获得一组坐标点,如图所示;

k取2m/s,将上述坐标点按照步骤6处理后,得到功率曲线,如图3所示;

根据功率曲线划分上下限,如图4所示,k1、k2分别取值为0.1和0.09,剔除异常值,得到的有效的实际功率值如图5所示。

由该电场实际数据处理过程可知,本发明受异常数据的影响非常小,剔除异常、扩建和限电数据,选取的有效的实际功率数据准确度极高。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1