一种基于深度学习的模式预报产品降尺度方法

文档序号:34885605发布日期:2023-07-25 15:35阅读:64来源:国知局
一种基于深度学习的模式预报产品降尺度方法

本发明涉及人工智能与数值模式预报后处理技术,特别是涉及一种基于深度学习的模式预报产品降尺度方法。


背景技术:

1、自从20世纪全球气象观测站网建立之后,人们发展了数值天气预报技术。但是由于计算资源、数值计算的稳定性和数值模式初值的不确定性等问题的约束,许多数值模式和再分析数据的分辨率较低,只能解决大尺度的天气现象。而在现实世界中,高分辨率的数值天气预报产品对于评估和决策当地社会的气候变化与社会生产计划至关重要。

2、为了解决数值预报产品分辨率低的问题,几十年来人们提出了各种降尺度技术,包括简单降尺度、统计降尺度、动力降尺度。简单降尺度结果的准确率低,不确定性大,动力降尺度参数获取困难、内部机制复杂并且需要大量的计算资源,传统的统计降尺度方法时空依赖关系利用不足,限制了此类方法的拟合能力。

3、随着大数据时代的到来与人工智能技术的发展,深度学习方法由于具有直接从数据中捕获非线性关系的能力,相较于其他方法展现出了更强的优越性。


技术实现思路

1、发明目的:本发明的目的是提供一种基于深度学习的模式预报产品降尺度方法,旨在通过模式后处理得到高分辨率的数值预报产品。

2、技术方案:本发明的一种基于深度学习的模式预报产品降尺度方法,包括以下步骤:

3、s1、选择数值模式和目标区域,并采集目标区域的辅助数据、低分辨率数值模式预报数据、高分辨率观测数据,并对数据进行预处理,构成降尺度数据集,将降尺度数据集划分为训练集、验证集和测试集,其中,训练集和验证集用于训练阶段,测试集用于测试;

4、s2、搭建基于改进卷积神经网络的深度学习模型,包括辅助信息处理部分、特征提取部分和降尺度部分,辅助信息处理部分包括第一至第五卷积和激活模块,以及第一至第三卷积模块,特征提取部分包括第六至第十五卷积和激活模块、第一至第七批标准化模块、第一至第三残差注意力模块以及第一至第四组合模块,降尺度部分包括第十六至第十八卷积和激活模块、第四卷积模块、第八批标准化模块、第一和第二最近邻插值模块以及第五和第六组合模块;

5、输入辅助数据依次经过第一至第四卷积和激活模块后,得到的第一特征图一路经第一卷积模块的卷积处理后得到第一跳跃连接特征图,另一路经第五卷积和激活模块处理后,得到的第二特征图一路经过第二卷积模块的卷积处理后得到第二跳跃连接特征图,另一路经过第三卷积模块的卷积处理后,得到接入特征提取部分的特征图;

6、低分辨率数值模式预报数据经特征提取部分的第六卷积和激活模块处理后,输入第一组合模块,与辅助信息处理部分接入特征提取部分的特征图组合得到第一组合特征图;第一组合特征图经第七卷积和激活模块处理后,一路输出作为第三跳跃连接特征图跳跃连接接入第四组合模块;另一路依次经过第八卷积和激活模块、第一批标准化模块后,一路输出作为第四跳跃连接特征图跳跃连接接入第三组合模块,另一路依次经过第九卷积和激活模块、第二批标准化模块后,一路输出作为第五跳跃连接特征图跳跃连接接入第二组合模块,另一路依次经过第十卷积和激活模块、第三批标准化模块、第十一卷积和激活模块、第四批标准化模块、第十二卷积和激活模块后输入第二组合模块,与第五跳跃连接特征图组合得到第二组合特征图;第二组合特征图依次经过第五批标准化模块、第一残差注意力模块、第十三卷积和激活模块后输入第三组合模块,与第四跳跃连接特征图组合得到第三组合特征图;第三组合特征图依次经第六批标准化模块、第二残差注意力模块、第十四卷积和激活模块后输入第四组合模块,与第三跳跃连接特征图组合得到第四组合特征图;第四组合特征图依次经第七批标准化模块、第三残差注意力模块、第十五卷积和激活模块后,得到第四特征图;

7、第四特征图经降尺度部分的第一最近邻插值模块后输入第五组合模块,与辅助信息处理部分的第二跳跃连接特征图组合,得到第五组合特征图;第五组合特征图依次经第八批标准化模块、第十六卷积和激活模块、第二最近邻插值模块后输入第六组合模块,与辅助信息处理部分的第一跳跃连接特征图组合,得到第六组合特征图;第六组合特征图依次经第十七卷积和激活模块、第十八卷积和激活模块、第四卷积模块处理后,得到模型输出;

8、s3、采用训练集和验证集随机分批次对步骤s2搭建的基于改进卷积神经网络的深度学习模型进行训练,得到训练好的降尺度误差最小的基于改进卷积神经网络的深度学习模型,然后用测试集对训练好的模型进行测试;

9、s4、基于所需时间的低分辨率预报数据生成高分辨率降尺度预报产品;

10、采集与步骤s1中相同目标区域但不同时间的低分辨率预报数据,与步骤s1中相同的辅助数据,共同组成输入变量输入步骤s3中训练好的基于改进卷积神经网络的深度学习模型中得到所需时间的高分辨降尺度预报产品。

11、进一步的,步骤s1中高分辨率观测数据的分辨率与目标分辨率相同;辅助数据为高分辨率地面高程数据。

12、进一步的,步骤s1中数据预处理包括:

13、首先,对辅助数据、低分辨率数值模式预报数据、高分辨率观测数据进行标准化处理,标准化公式为:

14、

15、其中,m为待标准化的辅助数据、低分辨率数值模式预报数据或高分辨率观测数据矩阵,mstd为标准化后的结果,mean(m)表示m的平均值,std(m)表示m的标准差

16、然后,对标准化后的低分辨率数值模式预报数据与辅助数据中的海洋部分赋空值,再分别对标准化后的辅助数据、低分辨率数值模式预报数据、高分辨率观测数据用最近邻插值在海洋区域进行填充。

17、进一步的,步骤s2中第一至第十八卷积和激活模块中的激活函数为:

18、relu(xi)=max(0,xi)

19、其中,xi为特征图的元素;

20、第一至第八批标准化模块中的批标准化公式为:

21、

22、其中,γ、β为可训练参数,∈为一定值,x为特征图矩阵,e[x]为特征图矩阵x的均值,var[x]为特征图矩阵x的方差。

23、进一步的,步骤s2中降尺度部分的最近邻插值进行上采样的公式为:

24、

25、

26、其中,dstx、dsty分别为放大后特征图的格点横纵坐标,dstwidth、dstheight分别为放大后特征图的长与宽,srcx、srcy分别为原特征图的格点横纵坐标,srcwidth、src-eight分别为原特征图的长与宽。

27、进一步的,步骤s2中第一至第三残差注意力模块为融合了非局地注意力机制的res2net模块,具体为:

28、输入特征图依次做卷积、批标准化运算并激活后,得到第一次激活的特征图,一路与后续特征图相加;另一路在通道维度上平均分为四份分别进行操作:第一份特征图不做处理,待后续与其他几份特征图组合;第二份特征图做同大小卷积、批标准化运算并激活,得到第二份特征图的结果;第二份特征图的结果一路待后续与其他几份特征图组合,另一路与第三份特征图组合,对组合后的特征图做同大小卷积运算、批标准化并激活,得到第三份特征图的结果;第四份特征图与第三份特征图的结果组合,最终得到第四份特征图的结果;最后将第一至第四份特征图的结果在通道维度上组合,之后对这组特征图做卷积运算、批标准化并激活,得到组合四份特征图后的第二次激活的特征图;

29、组合四份特征图后第二次激活的特征图一路与后续特征图相加,另三路分别做三个同大小卷积运算,得到三组通道数为原来一半的特征图,之后分别改变三组特征图的矩阵形状,将三维矩阵转变为二维矩阵,改变后的三组特征图的矩阵分别为列数为通道数的第一矩阵、行数为通道数的第二矩阵、列数为通道数的第三矩阵;之后第一矩阵与第二矩阵做矩阵乘法得到注意力权重矩阵,将注意力权重矩阵用s0ftmax激活函数激活后与第三矩阵做矩阵乘法,改变得到特征图的矩阵形状与组合四份特征图后第二次激活的特征图的矩阵形状相同,进行一次卷积运算后与组合四份特征图后第二次激活的特征图相加,然后进行卷积运算后与第一次激活的特征图相加,最终得到残差注意力模块的输出。

30、进一步的,步骤s3中基于改进卷积神经网络的深度学习模型的训练方法为监督学习,根据损失函数得到高分辨率观测数据与低分辨率预报数据的差异,然后通过梯度下降更新模型参数,损失函数为:

31、

32、其中,n为数据格点总数,i为格点位置,yi为观测数据i格点的数值,yi’为模型结果i格点的数值。

33、本发明的一种基于深度学习的模式预报产品降尺度系统,包括:

34、数据采集及处理模块,用于采集目标区域的地面高程数据、低分辨率数值模式预报数据、高分辨率观测数据,并对数据进行预处理,构成降尺度数据集,将降尺度数据集划分为训练集、验证集和测试集,其中,训练集和验证集用于训练阶段,测试集用于测试;

35、模型搭建模块,用于搭建基于改进卷积神经网络的深度学习模型,包括辅助信息处理部分、特征提取部分和降尺度部分,辅助信息处理部分包括第一至第五卷积和激活模块,以及第一至第三卷积模块,特征提取部分包括第六至第十五卷积和激活模块、第一至第七批标准化模块、第一至第三残差注意力模块以及第一至第四组合模块,降尺度部分包括第十六至第十八卷积和激活模块、第四卷积模块、第八批标准化模块、第一和第二最近邻插值模块以及第五和第六组合模块;输入辅助数据依次经过第一至第四卷积和激活模块后,得到的第一特征图一路经第一卷积模块的卷积处理后得到第一跳跃连接特征图,另一路经第五卷积和激活模块处理后,得到的第二特征图一路经过第二卷积模块的卷积处理后得到第二跳跃连接特征图,另一路经过第三卷积模块的卷积处理后,得到接入特征提取部分的特征图;低分辨率数值模式预报数据经特征提取部分的第六卷积和激活模块处理后,输入第一组合模块,与辅助信息处理部分接入特征提取部分的特征图组合得到第一组合特征图;第一组合特征图经第七卷积和激活模块处理后,一路输出作为第三跳跃连接特征图跳跃连接接入第四组合模块;另一路依次经过第八卷积和激活模块、第一批标准化模块后,一路输出作为第四跳跃连接特征图跳跃连接接入第三组合模块,另一路依次经过第九卷积和激活模块、第二批标准化模块后,一路输出作为第五跳跃连接特征图跳跃连接接入第二组合模块,另一路依次经过第十卷积和激活模块、第三批标准化模块、第十一卷积和激活模块、第四批标准化模块、第十二卷积和激活模块后输入第二组合模块,与第五跳跃连接特征图组合得到第二组合特征图;第二组合特征图依次经过第五批标准化模块、第一残差注意力模块、第十三卷积和激活模块后输入第三组合模块,与第四跳跃连接特征图组合得到第三组合特征图;第三组合特征图依次经第六批标准化模块、第二残差注意力模块、第十四卷积和激活模块后输入第四组合模块,与第三跳跃连接特征图组合得到第四组合特征图;第四组合特征图依次经第七批标准化模块、第三残差注意力模块、第十五卷积和激活模块后,得到第四特征图;第四特征图经降尺度部分的第一最近邻插值模块后输入第五组合模块,与辅助信息处理部分的第二跳跃连接特征图组合,得到第五组合特征图;第五组合特征图依次经第八批标准化模块、第十六卷积和激活模块、第二最近邻插值模块后输入第六组合模块,与辅助信息处理部分的第一跳跃连接特征图组合,得到第六组合特征图;第六组合特征图依次经第十七卷积和激活模块、第十八卷积和激活模块、第四卷积模块处理后,得到模型输出;

36、模型训练模块,用于采用训练集和验证集随机分批次对搭建的基于改进卷积神经网络的深度学习模型进行训练,得到训练好的基于改进卷积神经网络的深度学习模型,并采用测试集进行测试;

37、预报模块,用于提取与s1中相同目标区域的高分辨率地面高程数据,与s1中相同目标区域但不同时间低分辨率预报数据,共同组成输入变量输入训练好的深度学习模型中得到目标时间高分辨降尺度预报产品。

38、本发明的一种装置设备,包括存储器和处理器,其中:

39、存储器,用于存储能够在处理器上运行的计算机程序;

40、处理器,用于在运行所述计算机程序时,执行如上所述一种基于深度学习的模式预报产品降尺度方法的步骤。

41、本发明的一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被至少一个处理器执行时实现如上所述一种基于深度学习的模式预报产品降尺度方法的步骤。

42、有益效果:与现有技术相比,本发明的显著技术效果为:

43、(1)本发明提供了一种地面高程数据在深度学习方法中的利用方式。

44、使用卷积处理地面高程信息的方式,既将高分辨率地面高程信息特征图调整为与低分辨率气温信息相同大小方便输入,又保留了地面高程的高分辨率信息,并且控制了地面高程信息占网络进行特征提取和降尺度时的比例。这种利用辅助信息的方式可以在各个领域有所应用。

45、(2)本发明考虑了高分辨率观测数据与低分辨率模式预报数据的相关性与模型偏差问题,在网络结构中结合了非局地注意力机制与res2net残差模块,提高了数据利用效率,增强了网络拟合能力。非局地注意力机制是一种对空间敏感的注意力机制,它可以从特征图全局角度分配每个位置的重要性并且可以忽略距离捕获不同位置的相互作用。res2net模块作为原始残差模块的变体,不仅保留了残差连接避免模型偏差的优点,还可以在一个模块中耦合多尺寸感受野特征,使用较少的计算量协同利用了更多的数据,提高了计算效率。

46、(3)本发明的网络使用最近邻插值与卷积运算配合的方式提高特征图的分辨率,规避了转置卷积带来的棋盘效应,提高了模型的准确率和实用价值。

47、(4)本发明的网络结构整体呈u形,跳跃连接不仅使得网络耦合了不同尺寸的感受野即气象中不同尺度的信息,提高了信息利用效率,还使得网络中各个部分和谐的结合起来,并且在降尺度部分接受了更小尺度的地面高程信息。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1