一种基于误差评估的风电功率组合预测方法和系统与流程

文档序号:36167481发布日期:2023-11-23 20:06阅读:54来源:国知局
一种基于误差评估的风电功率组合预测方法和系统与流程

本发明涉及电力系统风电功率预测技术,具体涉及一种基于误差评估的风电功率组合预测方法和系统。


背景技术:

1、随着可再生能源在全球范围内的快速发展,风力发电在可再生能源中的比重越来越高。但是风力发电容易受到天气变化的影响而引起输出功率的突变和波动,具有一定的随机性,对电力系统的电压和频率稳定产生负面影响。因此精准的风电功率预测对电力系统运行的安全稳定和经济高效都尤为重要。

2、早期风电功率预测主要分为物理预测法和统计预测法两大类。物理预测法基于气象信息,建立大气环流模型,对风速风向进行预测,再结合风电机组的功率曲线关系,获得风电场的功率预测值。统计预测法主要利用风电场历史数据,建立统计模型,实现风电功率预测。常用的统计预测模型包括arma、arima和kalman滤波。近年来,有学者将数值天气预报信息与人工智能方法相结合,提出了一些风电功率预测新方法。为了进一步提高在数值天气预报精度受限情况下的风电功率精度,一些学者开始研究集上述众多算法之长的组合预测方法。总体来说,风电功率预测技术还存在很大进步空间,需要不断优化预测方法。


技术实现思路

1、发明目的:本发明的目的在于提供一种基于误差评估的风电功率组合预测方法和系统,解决了数值天气预报精度受限情况下的风电功率预测精度较低的问题,可以进一步提高风电功率预测泛化性和准确性。

2、技术方案:本发明的一种基于误差评估的风电功率组合预测方法,包括以下步骤:

3、获取数值天气预报数据和实测风电功率数据;

4、数据预处理:对数值天气预报数据和实测风电功率数据中存在的异常值、缺失值进行清洗和填充;

5、划分数据集:对数据预处理阶段所得到的清洗后的实测风电功率数据进行时序对齐,构建风电功率数据集,并将风电功率数据集划分为训练集、验证集和测试集;

6、模型构建:基于数据集分别构建基于xgboost算法的风电功率预测模型、基于lightgbm算法的风电功率预测模型和基于cnn算法的风电功率预测模型;

7、单一模型预测误差评估:基于数值天气预报数据识别出不同的风电功率预测场景并分类,利用训练集和验证集对各个预测模型进行训练与验证,得到各预测模型在验证集上的预测结果,计算每个预测模型在验证集上的每个预测结果与实际风电功率的预测误差,接着分别统计单一预测模型的点误差,得到各模型在不同风速和风向的预测场景下的预测误差评估结果;

8、多模型组合预测:利用测试集分别测试经过训练的基于xgboost算法的风电功率预测模型、基于lightgbm算法的风电功率预测模型和基于cnn算法的风电功率预测模型,得到各预测模型在测试集上的预测结果,结合单一模型预测误差评估步骤得到的各模型预测误差评估结果,针对不同预测场景选取误差最低的单一模型实现多模型预测结果的组合输出。

9、进一步的,对数值天气预报数据和实测功率数据中存在的异常值、缺失值进行清洗和填充,包括:

10、将风速、风向和风电功率数据划分为不同性质类别数据,其中,风速和风电功率划分为同一类别数据,风向数据单独划分为一个类别数据;

11、基于数据统计特性,对各类别数据分别采用3sigma检测法和孤立森林算法进行异常值检测;

12、基于逻辑判断检测出各类别数据中的连续恒定异常数据;

13、根据预设时间跨度确定填充策略,采用填充策略对连续恒定异常数据和缺失数据进行填充修复;其中,填充策略包括多元线性插值填充策略和相似时段填充策略。

14、进一步的,对各类别数据采用3sigma检测法进行异常值检测,包括以下步骤:

15、对于风电功率数据集中每个样本x∈x,检查是否满足μ-3σ≤x≤μ+3σ,其中,μ为样本均值,其计算公式为:

16、

17、其中,n表示样本数量;xi表示第i个样本的值;σ表示样本标准差;样本标准差σ的计算公式为:

18、

19、其中,n表示样本数量;xi表示第i个样本的值;μ表示当前数据样本均值;

20、对包含有风速、风向、温度、湿度的数值天气预报数据及实测风电功率数据进行3sigma检测,不满足3sigma条件的数据记录为突变异常。

21、进一步的,对各类别数据采用孤立森林算法进行异常值检测,包括以下步骤:

22、将实测风电功率数据与数值天气预报中的风速、风向、温度、湿度数据按时间索引进行合并,构成风电功率数据集,取所有构成数据列,x={x1,...,xn},其中,d表示数据维度,从x中随机抽取个时间点的数据构成x的子集x',将其放入根节点;

23、从d个数据维度中随机挑选一个数据列q,在当前风电功率数据集中随机产生一个切割点p使得:min(xij,j=q,xij∈x')<p<max(xij,j=q,xij∈x');

24、切割点p生成了一个超平面,将当前数据空间划分为两个子空间,在数据列p上其值小于p的样本点放入左子节点,其余样本点放入右子节点;

25、在左右子节点重复上述切割划分操作直到所有叶子节点都只有一个样本点或者孤立树到达指定高度,生成一棵孤立树;重复上述步骤直到生成t棵孤立树;

26、计算每个数据点的异常值,其具体方法为:

27、对于每一个数据点xi,令其遍历每一棵孤立树itree,计算数据点xi在森林中的平均高度h(xi),对所有点的平均高度做归一化处理,用以下公式计算异常值分数:其中:

28、

29、最终根据如下方式判断:

30、当e(h(x))趋向时,趋向0.5,即数据点x的路径平均长度与树的平均路径长度相近时,则不能区分是否异常;

31、当e(h(x))趋向0时,趋向1,即数据点x的异常分数接近1时,为异常点;

32、当e(h(x))趋向n-1时,趋向0,为正常值;

33、将孤立森林算法检测出来的异常点记录,并将其标记离群异常。

34、进一步的,根据预设时间跨度确定填充策略,采用填充策略对连续恒定异常数据和缺失数据进行填充修复;其中,采用多元线性插值填充策略进行填充修复时,包括以下步骤:

35、构建多元自回归函数,其计算公式为:

36、xi=β1xi-1+β2xi-2+…+βnxi-n

37、其中,xi表示当前样本值,xi-1,xi-2,…,xi-n为前n个时刻的样本值,β1,β2,…,βn表示回归系数;

38、对数据进行中心化,对每个样本更新其值为其中,xi为第i个样本值,为样本均值;

39、输入数据,使用最小二乘法估计回归系数β1,β2,…,βn的值;

40、将异常点前n个时刻的样本值输入自回归函数计算得到当前异常点的估计值,用于修复当前异常点;

41、对于多个时刻连续异常,且持续时间预设时间跨度的异常点采用迭代式的方法逐个修复。

42、进一步的,根据预设时间跨度确定填充策略,采用填充策略对连续恒定异常数据和缺失数据进行填充修复;其中,采用相似时段填充策略进行填充修复时,包括以下步骤:

43、对每个数据异常时段,挑选出相同日期类型,相同时段的近期数据;

44、计算对应时段关联要素与异常时段关联要素的欧式距离;

45、挑选欧式距离最近的结果作为相似时段候选,通过计算相似时段的均值,对进行异常时段的数据填充,以修复异常值。

46、进一步的,基于风电功率数据集分别构建基于xgboost算法的风电功率预测模型、基于lightgbm算法的风电功率预测模型和基于cnn算法的风电功率预测模型,包括以下步骤:

47、根据风电功率数据集确定基于xgboost算法的风电功率预测模型、基于lightgbm算法的风电功率预测模型的基本参数,以及基于cnn算法的风电功率预测模型的输入输出维度;

48、构建模型输出规则,各模型的输出为日前预测;

49、构建基于xgboost算法的风电功率预测模型、基于lightgbm算法的风电功率预测模型和基于cnn算法的风电功率预测模型。

50、进一步的,所述单一模型预测误差评估,包括以下步骤:

51、首先,利用训练集和验证集对各个预测模型进行训练与验证,得到各预测模型在验证集上的预测结果;

52、接着,根据基于xgboost算法的风电功率预测模型在验证集上的预测结果,采用均方误差mse计算基于xgboost算法的风电功率预测模型的每个预测结果与实际风电功率的预测误差;其中,均方误差mse的计算公式如下:

53、

54、其中,msei表示第i个样本的风电功率预测误差;yi表示第i个样本的实际风电功率值;表示第i个样本的预测风电功率值;

55、记录每个样本的预测误差,得到基于xgboost算法的风电功率预测模型在预设时间段的风电功率预测误差;

56、同样,采用均方误差mse分别计算基于lightgbm算法的风电功率预测模型和基于cnn算法的风电功率预测模型的每个预测结果与实际风电功率的预测误差并记录;

57、最终得到基于xgboost算法的风电功率预测模型、基于lightgbm算法的风电功率预测模型、基于cnn算法的风电功率预测模型这三种单一预测模型在预设时间段的风电功率预测误差结果集;

58、最后,对风速和风向数据进行分箱,分别统计单一预测模型在不同风速和风向组合下的误差分布,得到各模型在不同风速和风向场景下的预测误差评估结果。

59、进一步的,对风速和风向数据进行分箱,分别统计单一预测模型在不同风速和风向组合下的误差分布,得到各模型在不同风速和风向场景下的预测误差评估结果,具体步骤如下:

60、针对风电功率预测误差结果集,按照不同风速等级进行风速分箱,对风向按预设角度进行风向分箱,得到若干个风速分箱和若干个风向分箱;

61、根据不同风速、风向分箱,构建不同分箱组合,对应不同风电功率预测场景;

62、根据风电功率预测误差结果集,结合不同风电功率预测场景,分别统计在不同场景下,基于xgboost算法的风电功率预测模型、基于lightgbm算法的风电功率预测模型、基于cnn算法的风电功率预测模型这三种单一预测模型在预设时间段的风电功率预测的整体误差分布;

63、记录每个模型在预设时间段的风电功率数据上,不同场景下的预测误差,评估得到各模型在不同场景下的预测误差。

64、进一步的,所述多模型组合预测,具体步骤如下:

65、基于经过训练的基于xgboost算法的风电功率预测模型、基于lightgbm算法的风电功率预测模型和基于cnn算法的风电功率预测模型,利用测试集进行按天预测,每次使用三种单一预测模型预测输出一天的预测结果,对预测结果进行时序拼接,得到各预测模型在测试集上的预测结果;

66、将测试集中的每个样本的风速、风向数据进行分箱,根据分箱结果确定每个样本所属场景,并记录测试集上每个样本点所属的场景;

67、结合单一模型预测误差评估步骤得到的各模型预测误差评估结果,,针对不同预测场景选取误差最低的单一模型实现多模型预测结果的组合输出。

68、基于相同的发明构思,本发明还包括一种基于误差评估的风电功率组合预测系统,包括:

69、数据获取模块:用于获取数值天气预报数据和实测风电功率数据;

70、数据预处理模块:用于对数值天气预报数据和实测功率数据中存在的异常值、缺失值进行清洗和填充;

71、数据集划分模块:用于对数据预处理阶段所得到的清洗后的风速、风向、气温、湿度、实测风电功率数据进行时序对齐,构建风电功率数据集,以及用于将风电功率数据集划分为训练集、验证集和测试集;

72、模型构建模块:用于基于风电功率数据集分别构建基于xgboost算法的风电功率预测模型、基于lightgbm算法的风电功率预测模型和基于cnn算法的风电功率预测模型;

73、单一模型预测误差评估模块:用于识别出不同的风电功率预测场景并分类,对各个预测模型进行训练与验证,得到各预测模型在验证集上的预测结果,计算每个预测结果与实际风电功率的预测误差并统计,得到各模型在不同风速和风向的预测场景下的预测误差评估结果;

74、多模型组合预测模块:用于利用测试集分别测试经过训练的各个预测模型,得到各预测模型在测试集上的预测结果,结合单一模型预测误差评估步骤得到的各模型预测误差评估结果,针对不同预测场景选取误差最低的单一模型实现多模型预测结果的组合输出。

75、有益效果:本发明的技术方案与现有技术相比,其有益效果在于:使用三种单一模型可以有效提高预测结果多样性,利用模型预测误差评估方法,可以得到模型在不同场景下的预测性能评估,最后利用多模型组合预测方法可以充分发挥不同模型的特质优势,得高精度的预测结果。与其他方法相比,本发明能够在数值天气预报精度受限情况下,进一步提高风电功率预测精度,从而为电力系统的安全稳定运行提供数据支撑。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1