一种主客观降水预报的机器学习融合方法与流程

文档序号:23223463发布日期:2020-12-08 15:06阅读:204来源:国知局
一种主客观降水预报的机器学习融合方法与流程

本发明实施例涉及降水预报技术领域,尤其涉及一种主客观降水预报的机器学习融合方法。



背景技术:

现有的主客观降水预报融合方案主要采用反距离权重插值方法实现,该方法在主客观降水量级相同的区域内不做改变,而在其存在差异的部分采用计算格点与两者落区边缘之间距离差异的方式得到该区域内的具体降水数值。其主要缺点如下:

1、在融合区域丢失了原有数值模式降水的空间分布特征,缺少物理意义;

2、在融合区域边界处容易出现降水量不连续的现象;

3、当空间分辨率过高即格点数过多时,插值计算效率较低,运算时间过长。

基于此,本发明设计了一种主客观降水预报的机器学习融合方法,以解决上述问题。



技术实现要素:

本发明实施例提供一种主客观降水预报的机器学习融合方法,以解决背景技术中提及的技术问题。

本发明实施例提供一种主客观降水预报的机器学习融合方法。在一种可行的方案中,包括如下步骤:

s1、对数值模式确定性预报历史资料进行整编,得到长度不小于一年的降水以及相关物理量的标准化数据集q1;

s2、对数值模式集合预报历史资料进行整编,得到长度不小于一年的全集成员降水预报标准化数据集q2;

s3、通过cimiss数据接口获取长度不小于一年的自动观测站实况降水资料,并整编为标准化数据集q3;

s4、比对标准化数据集q1、q2和q3,剔除任一数据不齐全时段,将得到相同时段内的规整数据集建立模型;

s5、分析筛选出指定数量的与降水空间分布特征关系相关联的重要性预报因子,并进入模型构建阶段;

s6、通过机器回归方案学习,构建降水空间分布特征与数值模式预报因子之间的关系,并建立预报模型;

s7、通过主管降水落去预报提起相关降水量级等值线数据;

s8、根据降水空间分布特征模型在不同等值线区域内重构与主观降水落区相符的降水格点场;

s9、融合各降水量级格点场,得出主客观融合预报结果。

本发明实施例提供一种主客观降水预报的机器学习融合方法。在一种可行的方案中,所述s1中相关物理量包括涡度信息、散度信息、水汽通量信息以及不同高度水汽信息。

本发明实施例提供一种主客观降水预报的机器学习融合方法。在一种可行的方案中,所述s1中的标准化数据集为统一空间分辨率的点格数据形式。

本发明实施例提供一种主客观降水预报的机器学习融合方法。在一种可行的方案中,所述s5中筛选预报因子的方法为随机森林法。

本发明实施例提供一种主客观降水预报的机器学习融合方法。在一种可行的方案中,所述s6中机器回归方案学习包括gbdt回归方案学习和adaboost回归方案学习中的其中一种。

基于上述方案可知,本发明的有益效果为,

1、本发明通过通过建立降水空间分布与数值模式降水及相关产品之间数学模型的方法,解决丢失数值模式降水特征,缺少物理意义的问题;

2、通过重构整个降水空间场内的降水分布特征,解决融合边界处降水量不连续的问题;

3、通过在业务运行时间外每隔固定时间建模,解决计算效率低下,运行时间过长的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明融合方法的流程框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,也可以是成一体;可以是机械连接,也可以是电连接,也可以是通讯连接;可以是直接连接,也可以通过中间媒介的间接连接,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。

图1为本发明提供的一种主客观降水预报的机器学习融合方法;包括如下步骤:

s1、对数值模式确定性预报历史资料进行整编,得到长度不小于一年的降水以及相关物理量的标准化数据集q1;

s2、对数值模式集合预报历史资料进行整编,得到长度不小于一年的全集成员降水预报标准化数据集q2;

s3、通过cimiss数据接口获取长度不小于一年的自动观测站实况降水资料,并整编为标准化数据集q3;

s4、比对标准化数据集q1、q2和q3,剔除任一数据不齐全时段,将得到相同时段内的规整数据集建立模型;

s5、分析筛选出指定数量的与降水空间分布特征关系相关联的重要性预报因子,并进入模型构建阶段;

s6、通过机器回归方案学习,构建降水空间分布特征与数值模式预报因子之间的关系,并建立预报模型;

s7、通过主管降水落去预报提起相关降水量级等值线数据;

s8、根据降水空间分布特征模型在不同等值线区域内重构与主观降水落区相符的降水格点场;

s9、融合各降水量级格点场,得出主客观融合预报结果。

通过上述内容不难发现,通过本发明的主客观降水预报的机器学习融合方法对降水预报学习过程中,将确定性预报降水及其相关变量与其相关的物理量预报,集合预报所有集合成员的降水量预报以及自动站实况降水数据作为基础数据。分析数值模式确定性预报降水及分析降水分布情况与数值模式预报之间的联系,进而利用统计和机器学习方法建立可以描述区域内降水分布特征的预报模型。之后根据主观降水落区的降水等值线划分情况,在同一降水量级区域中应用降水分布特造型,重构该区域的内部分布特征。最终得到一套主客观降水融合预报产品;通过建立降水空间分布与数值模式降水及相关产品之间数学模型的方法,解决丢失数值模式降水特征,缺少物理意义的问题。通过重构整个降水空间场内的降水分布特征,解决融合边界处降水量不连续的问题。通过在业务运行时间外每隔固定时间建模,解决计算效率低下,运行时间过长的问题。

可选地,所述s1中相关物理量包括涡度信息、散度信息、水汽通量信息以及不同高度水汽信息。值得说明的是,在本实施例中,涡度信息为围绕垂直轴旋转的涡度分量,散度信息为降水从周围汇合到某一处或从某一处流散开来程度的量,为衡量速度场辐散、辐合强度的物理量;水汽通量信息为水平方向或树枝方向的水汽输送量。

此外,所述s1中的标准化数据集为统一空间分辨率的点格数据形式。

再具体地说,所述s5中筛选预报因子的方法为随机森林法,通过利用随机森林法对预报因子进行筛选工作,可以对标准化数据集产生高准确度的分类器,处理大量的输入变量,减少误差评估,学习过程快捷。

进一步的,所述s6中机器回归方案学习包括gbdt回归方案学习和adaboost回归方案学习中的其中一种,在利用adaboost回归方案学习时,能“聚焦于”那些较难分(更富信息)的样本上;在具体实现上,最初令每个样本的权重都相等,对于第k次迭代操作,根据这些权重来选取样本点,进而训练分类器。

在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一特征和第二特征直接接触,或第一特征和第二特征通过中间媒介间接接触。

而且,第一特征在第二特征“之上”、“上方”和“上面”可以是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度低于第二特征。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”或“一些示例”等的描述,意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任意一个或者多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1