基于多尺度特征的自适应回归气象中长期优化方法及系统与流程

文档序号:31525509发布日期:2022-09-14 14:06阅读:94来源:国知局
1.本发明属于电力预测领域,特别是涉及一种基于多尺度特征的自适应回归气象中长期优化方法及系统。
背景技术
::2.电力交易市场的兴起对于定量化的中长期数值天气模型精度提出了较高要求,如温度的月度异常直接影响用电需求,降水对水力发电的影响,降雪、沙尘和地表辐照度对光伏发电的影响,极端寒潮、覆冰和大风引起的风机切机对风力发电的影响,这些波动均会造成电价的较大幅度变化,从而影响交易合约与相关策略。3.目前,数值天气预报对次季节到季节的可预报性理论上受限于物理模型的参数不确定性以及模式的初值误差,尤其是大气运动在小尺度和较长积分时长的情况下,现有模型中地表要素的中长期预报能力较弱,ecmwf(欧洲中期天气预报中心)的buizza等指出使用常规方法校准模型之后,由rmse(均方根误差)和crps(连续分级概率评分)作为评估指标的中长期低空风速可预报时长为21.5天,在近地表可能会进一步减弱。4.中长期天气预报通常关注对于mjo、enso等振荡信号的预测能力上,这种预测对于中尺度降水以及大气环流的预测有一定的参考意义,而缺乏针对某个地区(小尺度)地表要素(近地表物理量)的定量优化方法,如近地表的风速和温度等。5.目前的中长期预测多采用模拟初值或参数化扰动的集合预报系统来提高预测能力,众多气象机构均产生自己的集合预报结果,这就使得中长期的预报有多模式集合的预报作为数据基础。然而次季节、季节的地表要素预测数值分布范围较大,甚至对于概率预报产品来说都较难确定合适的方法,对于确定性预报来说,更需要一种通用的回归模型进行订正,校准过的地表预测,如温度、湿度、风速和气压等可以适用于各种气象相关的业务场景。6.大尺度波动的信号在中长期预测中更容易保留,即预测能力更强,研究者定义了一些通用的大气、海洋和海冰指数来定义这种信号从而关联局地地表要素,但某地(如某风电场)的地表要素与这些大尺度波动的关联并不清晰。此外,当前针对局地中长期地表要素的通用订正方法主要是各种后处理回归模型,模型参数无对应物理意义,精度较低,可解释性较差。技术实现要素:7.本发明提出一种基于多尺度特征的自适应回归气象中长期优化方法及系统,提高中长期天气预报中近地表要素的预报能力。8.为达到上述目的,本发明的技术方案是这样实现的:一种基于多尺度特征的自适应回归气象中长期优化方法,包括:s1、基于再分析资料和地表站点近地表物理量实测数据,构建再分析资料到实测数据的注意力模型;提取近地表物理量的权重函数;所述权重函数包括对应再分析资料不同格点分辨率的多组权重函数;s2、以s2s次季节到季节的多模式预报数据作为原始预测,选取两组数据,一组为模式层的多层数据;另一组为需要订正的近地表物理量;s3、利用s1中得到的权重函数和s2中提供的模式层的数据,取前m组权重函数中权重最大的与地表站点近地表物理量实测数据强相关的衍生物理量,作为大尺度波动信号组m1,m个衍生物理量为m11,m12…ꢀm1m;所述衍生物理量可以分两种,一种是有实际物理意义、前人有过研究的物理量,比如大气环流指数、海温指数、遥相关指数和大气涛动指数,另一种是通过特征工程构建的统计量,比如500hpa位势高度的平方、北太平洋海温距平的三次方等等。9.其中,s1中得到的权重函数为不同格点分辨率下的不同大尺度波动信号对应权重的分布,如第一种大尺度波动信号为0.3,第二种为0.23;所述的数量m与下面s4中m2~mp中的每组内的成员数量m保持一致。10.s4、将s2中需要订正的近地表物理量中不同模式的不同集合预报成员作为预测组m2,m3…ꢀmp,共p-1组,加上s3步求得的大尺度波动信号m1的一组,共p组;将地表站点近地表物理量实测数据作为回归目标,以使用ar自适应回归算法进行计算,求得最优预测结果。11.其中每个预测组的成员数为m,与s3中的m一致。12.进一步的,步骤s1所述注意力模型建立以及权重函数提取的过程包括:s101、基于再分析资料,选择近地表物理量,选择模式层的多层数据,单个近地表物理量单层数据为一个通道;本步骤中所述的再分析资料包括era5全球再分析资料和merra-2全球再分析资料;s102、将输入特征通道数与输出通道数匹配,学习每个输入特征通道的权重参数,最后通过重采样完成再分析资料到实测数据的注意力模型构建;提取模型中间层以及各个通道的权重函数;s103、将再分析资料进行格点重采样,调整格点分辨率以模拟不同尺度的大气波动信号,继续进行s101~s102计算,选出多组模型中间层以及各个通道的权重函数。13.这里的多组是指每进行一次s101-s102计算循环得到一组针对特定格点分辨率的各个通道的权重函数,最后得到多组权重函数,这些权重函数对应不同分辨率下的不同大尺度波动信号。14.进一步的,步骤s1中所述注意力模型为senet模型或sknet模型或cbam模型或danet模型。15.进一步的,步骤s4中的计算过程包括:s401、地表站点近地表物理量实测数据为v,m为p个预测组,训练段的累计误差为e,其中k为训练段的数据时间编号,i为p组成员的编号;为了尽可能对整段时间的大尺度信号的时间周期进行保留,训练段使用8:2或者7:3(训练段:验证段)的比例进行连续时间轴上的分段,之后使用交叉验证时同样保证验证段为连续一段时间;s402、根据累计训练段每个时刻的累计误差,计算验证段某时刻的估计误差b,其中,μ和γ为误差衰减系数,n为训练段的时长,t为验证段的时间编号;s403、p组预测根据w权重分配得到最终预测结果的误差为,其中,所述w权重分配是使用ar自适应回归算法需要求解(学习)的参数;定义d为校准后误差,定义协方差校准误差矩阵c,其中η为表征两组预测误差的衰减参数;s404、对s403中的et求最小值,即为求以下公式的最小值其中t表示矩阵转置;加入约束惩罚项,展开为,其中wg表示初始化的w或者上次优化得到的w;r为正定矩阵,对损失函数进行约束;权重w求和为1,二次规划求解即为求以下l的最小值,其中λ为权重约束系数;s405、通过s404得到各组预测的权重w,带入s403,即可求得最佳预测结果;s406、将不同模式的不同集合预报成员分为多个分位数作为原始预测结果,s401~s405流程交叉循环得到验证集上的最优预测结果。16.所述交叉循环包括:按照前面所述训练段和验证段的划分方法,每次将验证段在长度保持不变的情况下,时间轴上往前移动一个月,剩余样本为训练段,移动直至验证段到达整个样本的时间轴的最前方,产生多组训练段+验证段的组合进行参数寻优。17.所述最优预测结果为每次最佳预测结果(交叉验证的n组权重)的平均值。18.本发明的另一方面,还提供了一种基于多尺度特征的自适应回归气象中长期优化系统,包括:权重模块,基于再分析资料和地表站点近地表物理量实测数据,构建再分析资料到实测数据的注意力模型;提取近地表物理量的权重函数;所述权重函数包括对应再分析资料不同格点分辨率的多组权重函数;原始预测模块,以s2s次季节到季节的多模式预报数据作为原始预测,选取两组数据,一组为模式层的多层数据;另一组为需要订正的近地表物理量;大尺度信号模块,利用权重模块中得到的权重函数和原始预测模块中提供的模式层的数据,取前m组权重函数中权重最大的与地表站点近地表物理量实测数据强相关的衍生物理量,作为大尺度波动信号组m1,m个衍生物理量为m11,m12…ꢀm1m;回归计算模块,将原始预测模块的需要订正的近地表物理量中不同模式的不同集合预报成员作为预测组m2,m3…ꢀmp,共p-1组,加上大尺度信号模块求得的大尺度波动信号m1的一组,共p组;将地表站点近地表物理量实测数据作为回归目标,以使用ar自适应回归算法进行计算,求得最优预测结果。19.进一步的,所述权重模块包括:数据选择单元,基于再分析资料,选择近地表物理量,选择模式层的多层数据,单个近地表物理量单层数据为一个通道;本步骤中所述的再分析资料包括era5全球再分析资料和merra-2全球再分析资料;构建提取单元,将输入特征通道数与输出通道数匹配,学习每个输入特征通道的权重参数,最后通过重采样完成再分析资料到实测数据的注意力模型构建;提取模型中间层以及各个通道的权重函数;重采样单元,将再分析资料进行格点重采样,调整格点分辨率以模拟不同尺度的大气波动信号,继续进行数据选择单元和构建提取单元的计算,选出多组模型中间层以及各个通道的权重函数。20.进一步的,权重模块中所述注意力模型为senet模型或sknet模型或cbam模型或danet模型。21.进一步的,所述回归计算模块包括:累计误差单元:地表站点近地表物理量实测数据为v,m为p个预测组,训练段的累计误差为e,其中k为训练段的数据时间编号,i为p组成员的编号;估计误差单元:根据累计训练段每个时刻的累计误差,计算验证段某时刻的估计误差b,其中,μ和γ为误差衰减系数,n为训练段的时长,t为验证段的时间编号;结果误差单元:p组预测根据w权重分配得到最终预测结果的误差为,其中,所述w权重分配是使用ar自适应回归算法需要求解(学习)的参数;定义d为校准后误差,定义协方差校准误差矩阵c,其中η为表征两组预测误差的衰减参数;最小值单元:对结果误差单元中的et求最小值,即为求以下公式的最小值其中t表示矩阵转置;加入约束惩罚项,展开为,其中wg表示初始化的w或者上次优化得到的w;r为正定矩阵,对损失函数进行约束;权重w求和为1,二次规划求解即为求以下l的最小值,其中λ为权重约束系数;最佳结果预测单元:通过最小值单元得到各组预测的权重w,带入结果误差单元,即可求得最佳预测结果;交叉循环单元:将不同模式的不同集合预报成员分为多个分位数作为原始预测结果,上述回归计算模块中的各单元交叉循环得到验证集上的最优预测结果。22.与现有技术相比,本发明具有如下的有益效果:1)本发明使用注意力机制的中间层结果作为特征去了解大尺度和局地气象要素的关系,增强物理可解释性;2)本发明基于通用的ar回归算法,容易实现模型的迁移,且不受限于特定物理量,进一步解决多模式集合预报订正为确定性预报的问题;3)本发明提高中长期气象预测中近地表物理量的准确性,结合再分析资料中的有效物理时空关联延长中长期预报的可预报时长。附图说明23.图1是本发明实施例的流程示意图。具体实施方式24.需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。25.首先对本发明中的一些名词进行说明:ecmwf:europeancentreformedium-rangeweatherforecasts(ecmwf)欧洲中期天气预报中心,是一个独立的政府间组织,运营着欧洲最大的超级计算机系统,也是世界上最大的数值天气预报数据档案库;rmse:root-mean-squareerror(rmse)均方根误差,一种常用的描述预测和实测之间差距的统计方法;crps:continuousrankedprobabilityscore(crps)用来表征预测和实测的累积概率函数的差别,常用来评估标量概率预测的预测水平;再分析资料:再分析资料结合了数值天气预报模型和全球观测数据,是一种对全球气候状态描述的最优估计数据集;包括era5和merra-2;era5:ecmwf提供的第五代全球气候和天气的再分析资料;merra-2:美国国家航空航天局(nasa)提供的一套全球再分析资料;s2s预测数据:预测时长为sub-seasonaltoseasonal(s2s)次季节到季节范围的气象预测数据;ar回归模型:adaptableregression(ar)可保持气象要素时空一致性的自适应回归算法模型,通用性较强,方便部署在业务场景的回归模型;senet模型:squeeze-and-excitationnetworks(senet)压缩和激励网络是一种加入通道域权重的一种注意力机制模型;sknet、cbam、danet:selectivekernelnetworks(sknet),convolutionalblockattentionmodule(cbam),dualattentionnetwork(danet),是不同类型的注意力机制模型;mjo:madden-julianoscillation(mjo)是发生在赤道附近的几周到几个月范围的重要大气振荡现象;enso:elniño-southernoscillation(enso)是发生在热带太平洋,会影响全球范围气候变化的周期2~7年的风速和海温波动现象。26.本发明的设计思想是:注意力机制模型可以较好的模拟全局和局部的关联,而高维数组和多通道的运算匹配了大气科学中的单一物理量时空关联以及不同物理量之间的关联,可以提取出预报能力较弱局地地表要素与预报能力较强的大尺度波动的映射关系,基于这种关系可以进一步提高局地地表要素的预报能力;针对最后的多模式集合预报的处理环节,本发明提出一种通用的自适应回归模型,该模型结构精简,可解释性较强,结合注意力机制学习到的强相关的大尺度波动信号,可以进一步提高预测准确性。27.基于上述设计思想,本发明提出的具体方法如图1所示,包括:1)、基于era5和merra-2全球再分析资料,近地表物理量可以选择纬向风、经向风、温度、湿度、气压等,选择模式层的多层数据,单个物理量单层数据为一个通道。将地表站点近地表物理量的实测数据作为回归目标。28.2)、将输入特征通道数与输出通道数匹配,学习每个特征通道的权重参数,最后通过重采样完成再分析资料到实测数据的senet模型构建。提取模型中间层以及各个通道的权重函数。29.3)、将再分析资料进行格点重采样,调整格点分辨率以模拟不同尺度的大气波动信号,继续进行1)~2)计算,选出多组模型中间层以及各个通道的权重函数。30.4)、全球各大气象机构和气象局发布的s2s次季节到季节的预报产品作为原始预测,选取两组数据,一组为模式层的多层数据,另一组为风速、温度、湿度、气压等需要订正的地表物理量。31.5)、利用3)中得到的权重函数关系和4)中提供的模式层数据,计算与地表站点近地表物理量的实测数据强相关的衍生物理量,所述计算是指取权重最大的前m组大尺度波动信号(即与地表站点近地表物理量强相关的衍生物理量),作为大尺度波动信号组m1,物理量m个m11,m12…ꢀm1m。32.6)、将4)中不同模式的不同集合预报成员作为预测组m2,m3…ꢀmp,共p-1组,加入大尺度波动信号(衍生物理量)m1组,共p组。使用ar自适应回归算法进行计算,即下面步骤7)~11)。33.7)、地表站点近地表物理量实测数据为v,m为p个预测组,训练段的累计误差为e,其中k为训练段的数据时间编号,i为p组成员的编号;为了尽可能对整段时间的大尺度信号的时间周期进行保留,训练段使用8:2或者7:3(训练段:验证段)的比例进行连续时间轴上的分段,之后使用交叉验证时同样保证验证段为连续一段时间;8)、根据累计训练段每个时刻的累计误差,计算验证段某时刻的估计误差b,其中,μ和γ为误差衰减系数,n为训练段的时长,t为验证段的时间编号;9)、p组预测根据w权重分配得到最终预测结果的误差为,其中,所述w权重分配是使用ar自适应回归算法需要求解(学习)的参数;定义d为校准后误差,定义协方差校准误差矩阵c,其中η为表征两组预测误差的衰减参数;10)、对步骤9)中的et求最小值,即为求以下公式的最小值其中t表示矩阵转置;加入约束惩罚项,展开为,其中wg表示初始化的w或者上次优化得到的w;r为正定矩阵,对损失函数进行约束;权重w求和为1,二次规划求解即为求以下l的最小值,其中λ为权重约束系数;11)、求解步骤10)中方程得到各组预测的权重w,带入步骤9),即可求得最佳预测结果;12)、将6)中不同模式的不同集合预报成员分为多个分位数作为原始预测结果,7)~11)流程交叉循环得到验证集上的最优预测结果。34.所述交叉循环包括:按照前面所述训练段和验证段的划分方法,每次将验证段在长度保持不变的情况下,时间轴上往前移动一个月,剩余样本为训练段,移动直至验证段到达整个样本的时间轴的最前方,产生多组训练段+验证段的组合进行参数寻优。如,所有数据为2017年1月1日到2022年1月1日,一开始的划分为训练段2017年1月1日到2021年1月1日,验证段为剩余;第二次划分训练段为2017年1月1日到2020年12月1日和2021年12月整月,剩余为验证段,依次验证段逐月向前移动,进行交叉验证。35.所述最优预测结果为每次最佳预测结果(交叉验证的n组权重)的平均值。36.本发明结合再分析资料中的有效物理时空关联特征作为自回归模型的输入可以有效提高相同预报时长下地表物理量预测的准确性,从而延长可预报时长。比如,s2s的预测精度随着预报时长的增加精度降低,原始s2s预报地表风速在未来30天的预报精度为60%,与历史同期平均状态作为预报的精度相同,则定义为可预报时长为30天,而引入了有效时空关联特征的模型在38天的精度才降低到60%,因此将地表风速的可预报时长延长了约8天。37.本发明所述方法具体应用案例如下:使用era5、merra2全球格点数据等再分析数据,将数据进行格点重采样,某风电场近3年实测风速为实测数据,调优并建立senet模型,分析并提取全球高空以及海洋多层物理量在建模中权重较高的关系函数,提取其作为构建大尺度波动特征的依据。使用s2s数据集中的多模式集合预测数据中的风速作为风速预测值,加入大尺度波动特征,带入ar自适应回归模型,较使用通用的订正模型结果比,均方根误差减少了16.85%。38.以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1