一种基于深度置信网络的气象预报方法和系统与流程

文档序号:19739356发布日期:2020-01-18 04:58阅读:145来源:国知局
一种基于深度置信网络的气象预报方法和系统与流程

本申请涉及气象服务情报保障领域,特别是涉及一种基于深度置信网络的气象预报方法和系统。



背景技术:

气象预报保障对用户开展的众多活动安全顺利举办具有重大的影响。传统的气象情报保障是构建于hpc及云平台混合架构的气象数据服务平台上,通过开展基于数值预报、统计学习、高性能计算等信息技术,重点围绕多源资料同化短临预报在气象预测方面的应用研究,提升气象预测速率、精准度,面向不同目标群体,提供精细化、专业化的气象服务,做好场所精细化智慧气象服务,支撑重点场所气象服务保障。

然而,构建于hpc及云平台混合架构的气象数据服务平台上的气象预报方法由于具有初始误差和模式误差,存在预报精度低的缺陷。

针对数值预报问题,模式初值存在客观因素,模式的初始条件只是大气真实状态下的一种近似,因此初始误差是持久存在的,主要是观测过程中所产生的误差,即观测误差。只利用气象卫星观测时,大气对可见光的散射使得探测出的地面反照率和云顶资料存在一定的偏差,由直接观测的红外辐射资料反演云顶和地面温度的过程中也存在一定的误差。气象雷达观测,按照降水量和雷达回波强度之间的经验关系推测降水量会存在误差,尤其是远距离探测时产生的误差更大。

模式误差是模式对物理过程描述不准确而产生的误差。由于大气运动中的湍流过程,在模式中小尺度系统的生消机制是难以准确进行描述的。在模式中通常采用了参数化的方法来考虑这些过程的影响,平均过程将次网格的物理过程和动力过程表示出网格以上尺度的平均影响。这种描述和真实次网格过程之间的误差就存在误差;因而在预报气象时存在精度低的缺陷。



技术实现要素:

本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。

根据本申请的一个方面,提供一种基于深度置信网络的气象预报方法,该气象预报方法包括以下步骤:

根据目标区域的场地信息获得多个历史观测数据;

构建增强决策树对所述历史观测数据进行训练,得到第一预测数据;

将第一预测数据输入cfd计算流体动力学模型中,并进行稳态数值模拟以得到第二预测数据,根据所述第二预测数据得到来流条件下的流场分布;

基于克里金插值方法,将所述第二预测数据插值于目标区域中的任意位置以提取出模拟风速值,获得训练数据集;

将训练数据集的训练样本输入dbn深度神经网络,对该dbn深度神经网络进行训练,利用训练好的气象预报模型对待观测数据进行气象预测,以生成预测结果。

可选的,所述气象预报方法将dbn深度神经网络获得的预测结果与传统物理模型获得的预报结果进行比对分析,以对第一预测数据的参数进行调优。

可选的,采用地物回波识别算法对cfd模型的第一预测数据的参数进行调优,具体包括以下子步骤:

采集雷达的基数据,根据所述基数据获得回波特征参数;

运用统计方法对所述回波特征参数进行分析,确定地物回波与降水回波特征参数的差异;

根据每个所述地物回波与降水回波特征参数的差异分别设置隶属函数,将所述隶属函数转换成识别结果,其中,该识别结果在[0,1]范围内;

对所述识别结果进行加权平均获得某点的判据值,当所述某点的判据值超过预设的阈值时,则该点就被判定为地物回波。

可选的,所述传统物理模型为模式方程组求解大气演变模型、多个动态核心和物理选项求解模型。

可选的,所述增强决策树为cart决策树模型。

可选的,构建所述cart决策树模型包括以下子步骤:

基于基尼指数并利用特征选择方法获得气象特征;

根据所述气象特征并依据回归方差划分得到回归树;

对所述回归树进行剪枝,并采用后剪枝方法对所述回归树进行修正,根据修正后的回归树构建出所述cart决策树模型。

可选的,所述根据所述第二预测数据得到来流条件下的流场分布包括以下子步骤:

将第一预测数据的场所来流条件对流场进行cfd预计算,得到关键流场数据,将该关键流场数据存入数据库中,建立场景流场特性数据库;

利用场景流场特性数据库进行风速预测,获得第二预测数据;

将所述第二预测数据作为cfd模型的输入边界条件,查询第二预测数据相近的来流条件,并调用场景流场特性数据库的流场分布数据,以获得来流条件下的流场分布。

可选的,对历史观测数据、第一预测数据或第二预测数据进行优化,以得到标准化的预测数据,基于所述标准化的预测数据构建所述训练数据集。

根据本申请的另一个方面,提供了一种基于深度置信网络的气象预报系统,该系统包括获取模块、第一训练模块、模拟模块、插值模块和第二训练模块;

所述获取模块用于根据目标区域的场地信息获得多个历史观测数据;

所第一训练模块用于构建增强决策树对所述历史观测数据进行训练,得到第一预测数据;

所述模拟模块用于将第一预测数据输入cfd计算流体动力学模型中,并进行稳态数值模拟以得到第二预测数据,根据所述第二预测数据得到来流条件下的流场分布;

所述插值模块基于克里金插值方法,将所述第二预测数据插值于目标区域中的任意位置以提取出模拟风速值,获得训练数据集;

所述第二训练模块用于将训练数据集的训练样本输入dbn深度神经网络,对该dbn深度神经网络进行训练,利用训练好的气象预报模型对待观测数据进行气象预测,以生成预测结果。

可选的,所述模拟模块执行以下操作:

将第一预测数据的场所来流条件对流场进行cfd预计算,得到关键流场数据,将该关键流场数据存入数据库中,建立场景流场特性数据库;

利用场景流场特性数据库进行风速预测,获得第二预测数据;

将所述第二预测数据作为cfd模型的输入边界条件,查询第二预测数据相近的来流条件,并调用场景流场特性数据库的流场分布数据,以获得来流条件下的流场分布。

根据本申请的另一个方面,提供了一种计算机电子设备,该计算设备包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,该计算机程序存储于存储器中的用于程序代码的空间,该计算机程序在由处理器执行时实现用于执行任一项根据本发明的气象预报方法步骤。

根据本申请的另一个方面,提供了一种计算机可读存储介质,该计算机可读存储介质包括用于程序代码的存储单元,该存储单元设置有用于执行根据本发明的气象预报方法步骤的程序,该程序被处理器执行。

根据本申请的另一个方面,提供了一种包含指令的计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行根据本发明的气象预报方法步骤。

本实施例通过cfd计算流体动力学模型对历史观测数据和实时观测数据进行预测,可以实现精细化的预报,该cfd计算流体动力学模型在时间维度上的挖掘观测数据,识别并学习历史上反复出现的天气模式,从而能够预测天气现象的大气运动过程;

另外利用克里金插值方法将第二预测数据从观测点位置扩充到目标区域范围内任意点;同时考虑各气象要素间的相关性,利用dbn深度神经网络对模拟出风速值进行训练,从而对待观测的数据进行预报,体现出各观测数据的不同要素之间在物理上的相关性;

本实施例的气象预报方法实现了对多源资料同化及中尺度数值预报和基于深度学习的精细化气象预报,包含的原始数据、中间数据、预测数据和评估分析数据的多维展示分析、情报监控和管理。

根据下文结合附图对本申请的具体实施例的详细描述,本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。

附图说明

后文将参照附图以示例性而非限制性的方式详细描述本申请的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解,这些附图未必是按比例绘制的。附图中:

图1是根据本申请实施例的基于深度置信网络的气象预报方法的流程示意图;

图2是根据本申请实施例的提供的一种订阅消息模型的示意图;

图3是根据本申请实施例的提供的dbn深度神经网络的结构示意图;

图4是是根据本申请实施例的提供的一种对数据进行优化的示意图;

图5是根据本申请实施例的基于深度置信网络的气象预报系统的结构示意图;

图6是根据本申请实施例的计算设备示意图;

图7是根据本申请实施例的计算机可读存储介质示意图。

具体实施方式

图1是根据本申请实施例的基于深度置信网络的气象预报方法的流程示意图;参见图1所知,本申请实施例提供的气象预报方法可以包括以下步骤:

s100:基于目标区域的场地信息获得多个历史观测数据;

s200:构建增强决策树并对历史观测数据进行训练,得到第一预测数据;

s300:将第一预测数据输入cfd计算流体动力学模型中,并进行稳态数值模拟以得到第二预测数据,根据所述第二预测数据得到来流条件下的流场分布;

s400:基于克里金插值方法,将所述第二预测数据插值于目标区域中的任意位置以提取出模拟风速值,获得训练数据集;

s500:将训练数据集的训练样本输入dbn深度神经网络,对该dbn深度神经网络进行训练,利用训练好的气象预报模型对待观测数据进行气象预测,以生成预测结果。

可选的,本实施例中的历史观测数据包括地表粗糙度数据等。常规观测数据通过直接测量的方式可以获取比遥感数据精确的定点气象信息。根据实际需求,在特定场景的关键点建立地面观测站,采集风速、风向、气温、气压、相对湿度等常规观测数据,以用于多源数据同化模型及构建特定场景小区域的训练数据集,同时对存入应用中心数据库的数据进行质量控制,以确保数据的质量过关提高数据的可用性和可靠性。质量控制方案主要从气候极值范围、时间一致性、空间一致性和要素间一致性几个方面来对数据产品进行初步检查与标记。

可选的,本实施例中的s200的增强决策树为cart决策树模型。一般来说,当数据集的因变量为连续性数值时,将产生一个回归树,可以用叶节点观察的均值作为预测值。

其中,构建所述cart决策树模型包括以下子步骤:

s210:基于基尼指数并利用特征选择方法获得气象特征;其中,所述气象特征选择可以采用气象信息增益、增益率、基尼系数和卡方检验等方法;

s220:根据所述气象特征并依据回归方差划分得到回归树;其中,回归方差越大,节点数据越分散(不纯),因此本实施例采用最小化方法进行划分;

s230:对所述回归树进行剪枝,并采用后剪枝方法对所述回归树进行修正,根据修正后的回归树构建出所述cart决策树模型;

具体的,在所述回归树得到充分生长后,基于损失矩阵或复杂度方法进行剪枝,采用后剪枝的方法对该回归树树进行修正。

具体的,现有技术中一般是以观测数据的数值的预报结果为边界条件,采用计算流体动力学(cfd,即computationalfluiddynamics)模型对地形、地表粗糙度等观测数据进行模拟,以得到在一定来流条件下的场地内更加精细的空间流场分布;但是现有技术中的cfd模型在每次预测时都需要求解navier-stokes方程(n-s方程)来得到空间流场分布,因此存在计算量巨大,难以满足预测时效性的要求。

本实施例中,假定历史观测数据为稳态的来流条件,则模拟出目标区域内的来流条件所对应的空间流场分布是唯一的;因此,本实施例采用cfd模型对空间流场进行稳态数值模拟,从而获得该来流条件下的空间流场分布。

本实施例中,如果若干预测时刻具有相同或相近的来流条件,则这些时刻场所内的流场也将呈现出相同或相似的分布。因此,对某一时刻进行风速预测时,可以参考以前时刻所具有相同或相近来流条件的流场数据(例如可参考1年内每隔30s的来流条件的流场数据),即从数值模拟计算域的尺寸、对流项插值阶数、计算网格、数值模拟结果的判断等几个要素进行计算,而不需要在每个预测点上重新求解navier-stokes方程来得到空间流场分布,因此本实施例可以地快速预测临近的风速。

其中,步骤s300包括以下几个子步骤;

s310:将第一预测数据的场所来流条件对流场进行cfd预计算,得到关键流场数据,将该关键流场数据存入数据库中,建立场景流场特性数据库;

s320:利用场景流场特性数据库进行风速预测,获得第二预测数据;

s330:将所述第二预测数据作为cfd模型的输入边界条件,查询第二预测数据相近的来流条件,并调用场景流场特性数据库的流场分布数据,以获得来流条件下的流场分布。

这种预测方法将复杂的cfd流场数值模拟放到风速预测之前完成,合理地解决了cfd模型的时效性问题。

本实施例通过利用cfd计算流体动力学模型,对中尺度预报数据(即第一预测数据)进行计算,最终输出小尺度的预报数据(即第二预测数据),并将小尺度预报数据与中尺度数据进行分析比对,对小尺度预报数据不断调优,从而提高了小尺度范围内的气象预报能力。

本实施例通过构建dbn深度神经网络,即将当前观测数据、中尺度预报数据、同化方法、小尺度预报数据等加入到该dbn神经网络中,利用深度学习的方法和各种输入的数据进行训练;参见图3,通过设置对比试验,可确定神经网络隐藏层数、各层神经元数量、训练学习率、迭代次数等参数的最佳配置。保证了深度学习所输出的小尺度预报结果与固定场境气象数据传感器及激光雷达采集来的实际观测数据的匹配性,提高了小尺度预报结果的时效性和准确性。

可选的,参见图4,在s500中,对历史观测数据、第一预测数据或第二预测数据进行优化,以得到标准化的预测数据,基于所述标准化的预测数据构建所述训练数据集。

具体的,对中尺度数值预报数据、流体力学模型模拟的流场分布特征、历史观测数据等数据,并对这些数据进行优化(即采用格式转换等方法),将优化后得到的标准化数据作为真实值以构建训练数据集,将训练数据集中的训练样本输入dbn深度神经网络,进行训练。

在本实例中,可以将不符合文件名命名规范的历史观测数据、第一预测数据或第二预测数据等气象数据文件转换成标准的文件名,下面将举例说明对对各类数据采用统一格式并存储归类从而得到所述训练数据集;

对于文本文件可采用标准经纬度格式,即按照区站号、年、月、日、时、纬度、经度、测站高度、台站类型、变量、质量控制码的顺序进行分类存储,并给出明确的缺测值信息;

对于二进制文件可采用标准数文件格式,对二进制文件的第一行为说明信息,给出相应的年、月、日、时、变量信息,数文件的主体部分按照行为纬度,列为经度的顺序存放;

hdf文件可采用标准hdf4格式,该hdf4格式文件中给出相关的时间、变量、属性、经纬度信息、缺测等信息;

nc文件可采用标准netcdf文件格式,netcdf文件中给出相关的时间、变量、属性、经纬度信息、缺测等信息。

在另一实施例中,所述基于深度置信网络的气象预报方法还包括步骤s600,将dbn深度神经网络获得的预测结果与传统物理模型获得的预报结果进行比对分析,以进一步对实现对统计模型(即cfd模型)的第一预测数据的参数进行调优;

其中,所述传统物理模型例如为模式方程组求解大气演变模型或多个动态核心和物理选项求解模型。

由于雷达脉冲在大气中的超折射产生的地物回波属于非气象因子,会污染雷达探测结果,对雷达资料的定量应用产生严重影响;因此可采用地物回波识别算法对cfd模型的第一预测数据的参数进行调优。

本实施例的地物回波识别算法是建立在模糊逻辑法的基础上。模糊逻辑法是指运用统计方法分析各种雷达回波特征,找出地物回波不同于降水回波的特征,对这些特征给以相同的权重,得到一个表明每个距离库中受地物回波影响可能性的量化数值,最终识别出那些超过某一阈值的地物回波信息。

由于地面目标一般是静止的,回波强度呈无规则分布,经常出现在低仰角层,且高一层的回波强度远远小于本层的回波强度;层状云降水水平范围较广、强度均匀;对流云降水结构紧密、高度较高、回波强度强。所以,本实例利用地物回波识别算法对cfd模型的第一预测数据的参数进行调优包括以下子步骤:

s610:采集雷达的基数据,根据所述基数据获得回波特征参数;

具体的,所述雷达的基数据包括:回波强度、径向速度、速度谱宽等基础数据;所述回波特征参数包括:回波强度的水平纹理、垂直变化、沿径向方向的变号、径向速度的区域平均值、径向速度的区域方差、速度谱宽的区域平均值等。

s620:运用统计方法对所述回波特征参数进行分析,确定地物回波与降水回波特征参数的差异;

s630:根据每个所述地物回波与降水回波特征参数的差异分别设置隶属函数,将所述隶属函数转换成识别结果,其中,该识别结果在[0,1]范围内;

s640:对所述识别结果进行加权平均获得某点的判据值,当所述某点的判据值超过预设的阈值时,则判断该点为地物回波。

本实施例中的气象预报方法会将气象的实时数据和生成的预测结果通过显示装置(例如web页面)不间断地展示给用户,例如对于预测到的大风、雨雪等会影响正常举办活动的预测结果,会实时地向用户发送预警信息。

在一个实施例中,参见图2,采用消息队列后台的展示方法将气象的实时数据和预测结果进行展示,以实现用户的定制化业务数据同步推送服务请求的需求。

所述消息队列后台包括点对点消息队列模型,该点对点消息队列模型包括消息生产者(producer)和消息消费者(consumer);该消息生产者producer通过点对点消息队列模型(即为消息生产者向一个特定的队列发送消息,消息消费者从该队列中接收消息;)向消息消费者发送消息,消息消费者签收确认(acknowledge)成功处理的消息。

其中,所述消息生产者producer用于发送消息到消息队列;消息消费者consumer用于从消息队列接收所述消息;需要说明的是消息的生产者和消费者可以不同时处于运行状态。

可选的,所述消息队列后台还包括发布订阅消息模型,该发布订阅模型包括发布者和订阅者,支持发布者向一个特定的主题(topic)发布消息,0个或多个订阅者接收来自该特定的主题(topic)消息;参见图2,在这种模型下,发布者和订阅者彼此不知道对方。实际操作过程中,必须先订阅,再发送消息,而后接收订阅的消息。

本实施例中的订阅消息模型支持消息的持久化,对于一些关键的核心业务来说是非常重要的,启用消息持久化后,消息队列宕机重启后,消息可以从持久化存储恢复,消息不丢失,可以继续消费处理。消息的收发同样支持异步方式:异步发送消息,不需要等待消息队列的接收确认;异步接收消息,以push的方式触发消息消费者接收消息。

另外,本实施例通过将将气象的实时数据和生成的预测结果通过显示装置不间断地展示给,构建出数据展示平台,该平台支持图文结合以及地理信息系统等功能,将当前观测数据、中尺度预报数据、小尺度预报等数据图文并茂地展现给用户,从而为小范围、高频次、精确短临气象预报提供了的数据支撑。

本实施例通过cfd计算流体动力学模型对历史观测数据和实时观测数据进行预测,可以实现精细化的预报,该cfd计算流体动力学模型在时间维度上的挖掘观测数据,识别并学习历史上反复出现的天气模式,从而能够预测天气现象的大气运动过程;另外利用克里金插值方法将第二预测数据从观测点位置扩充到目标区域范围内任意点;同时考虑各气象要素间的相关性,利用dbn深度神经网络对模拟出风速值进行训练,从而对待观测的数据进行预报,体现出各观测数据的不同要素之间在物理上的相关性;

本实施例的气象预报方法实现了对多源资料同化及中尺度数值预报和基于深度学习的精细化气象预报,包含的原始数据、中间数据、预测数据和评估分析数据的多维展示分析、情报监控和管理。

本实施例可以通过将构建固定场景气象数据传感器及激光雷达采集的数据为历史观测数据,从中尺度预报入手进行预报数据输出,并进行数据同化,提高了中尺度范围内的气象预报能力。

基于同一发明构思,如图5所示,本申请实施例还提供了一种基于深度置信网络的气象预报系统,该气象预报系统包括获取模块、第一训练模块、模拟模块、插值模块和第二训练模块;

所述获取模块用于根据目标区域的场地信息获得多个历史观测数据;

所第一训练模块用于构建增强决策树对所述历史观测数据进行训练,得到第一预测数据;

所述模拟模块用于将第一预测数据输入cfd计算流体动力学模型中,并进行稳态数值模拟以得到第二预测数据,根据所述第二预测数据得到来流条件下的流场分布;

所述插值模块基于克里金插值方法,将所述第二预测数据插值于目标区域中的任意位置以提取出模拟风速值,获得训练数据集;

所述第二训练模块用于将训练数据集的训练样本输入dbn深度神经网络,对该dbn深度神经网络进行训练,利用训练好的气象预报模型对待观测数据进行气象预测,以生成预测结果。

可选的,所述模拟模块执行以下操作:

将第一预测数据的场所来流条件对流场进行cfd预计算,得到关键流场数据,将该关键流场数据存入数据库中,建立场景流场特性数据库;

利用场景流场特性数据库进行风速预测,获得第二预测数据;

将所述第二预测数据作为cfd模型的输入边界条件,查询第二预测数据相近的来流条件,并调用场景流场特性数据库的流场分布数据,以获得来流条件下的流场分布。

本实施例提供的上述识别系统,可以执行上述任一基于深度置信网络的气象预报方法中的实施例所提供的方法,详细过程详见方法实施例中的描述,此处不赘述。

根据下文结合附图对本申请的具体实施例的详细描述,本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。

本申请实施例还提供了一种计算设备,参照图6,该计算设备包括存储器520、处理器510和存储在所述存储器520内并能由所述处理器510运行的计算机程序,该计算机程序存储于存储器520中的用于程序代码的空间530,该计算机程序在由处理器510执行时实现用于执行任一项根据本发明的识别方法步骤531。

本申请实施例还提供了一种计算机可读存储介质。参照图7,该计算机可读存储介质包括用于程序代码的存储单元,该存储单元设置有用于执行根据本发明的识别方法步骤的程序531′,该程序被处理器执行。

本申请实施例还提供了一种包含指令的计算机程序产品。当该计算机程序产品在计算机上运行时,使得计算机执行根据本发明的方法步骤。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、获取其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。

专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令处理器完成,所述的程序可以存储于计算机可读存储介质中,所述存储介质是非短暂性(英文:non-transitory)介质,例如随机存取存储器,只读存储器,快闪存储器,硬盘,固态硬盘,磁带(英文:magnetictape),软盘(英文:floppydisk),光盘(英文:opticaldisc)及其任意组合。

以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1