一种基于机器学习的海雾预测方法

文档序号:35570841发布日期:2023-09-24 07:39阅读:31来源:国知局
一种基于机器学习的海雾预测方法

本发明涉及气象领域,提供了一种基于机器学习的海雾预测方法。


背景技术:

1、海雾是海洋上低层大气中一种水汽凝结现象,由于水滴或冰晶的大量积聚使能见度降低,危害人民的生命财产安全。我国航海运输、渔业捕捞、海洋开发以及军事等活动的日益频繁,准确地预测海雾逐渐成为气象研究人员的重点研究目标。与其他灾害性天气相比,海雾的业务预报水平还远不能满足业务需求。现今在国内外气象部门对海雾的预报方法主要有天气学方法、数值预报方法和机器学习方法。天气学方法依赖于预报员主观经验,预报准确率不能得到保障。数值预报对于大范围海雾预报准确率高,但对于微尺度海雾预报能力差。

2、随着社会科技水平的不断进步,大数据时代已经来临。计算机运算能力的提高使得机器学习技术发展迅速,国内外已经运用其 在海雾预报领域,并且都得到诸多研究成果,被专家学者认为是一种行之有效的方法。机器学习方法运用历史数据资料进行统计和分析,建立海雾和气象要素之间的模型,进而预报海雾。在对于我国沿海地区进行海雾预报研究过程中,机器学习方法已经取得了一定成果,常见机器学习建模方法包括逐步回归、支持向量机、决策树、神经网络等,可以用来预测未来是否会有雾。然而,目前沿海地区的海雾客观预报方法可能存在空报和漏报的情况,整体准确率偏低。因此,预报员需要首先综合分析多种客观预报结果,然后对结果展开主观订正,进一步提升对海雾和能见度预测的准确率。机器学习方法是在选择最优影响因子基础上完成的,计算方法易于掌握,占用的计算资源和计算时间也相对很少,因此机器学习方法是目前沿海气象台站预报海雾的主要方法之一。但是影响因子的筛选容易受主观经验的影响。预报因子的选取以及预报量和预报因子之间的经验统计关系的不确定性都是制约预报结果的重要因素。利用机器学习方法进行海雾预测研究,要做好影响因子与结果的相关性研究,这样会大大提高基于机器学习方法的海雾预测的准确性。


技术实现思路

1、本发明的主要目的在于解决影响因子选取的问题以及融合多模型进行联合决策,达到提高准确率的目的。

2、为了实现上述目的本发明采用以下技术手段:

3、一种基于机器学习的海雾预测方法,包括以下步骤:

4、步骤1、使用gfs数据以及自动气象站数据进行数据的时空匹配以及异常值处理得到目标区域的海雾初步数据集,初步数据集中gfs数据作为特征数据,自动站数据作为标签数据;

5、步骤2、利用主成分分析法展开分析初步数据集,将原本的特征数据进行优化选取得到优化数据集;

6、步骤3、优化数据集使用过采样法算法处理,解决海雾类别不平衡问题,将优化数据集分为训练集数据和测试集数据,将得到的训练集数据带入不同的机器学习算法中进行训练,得到训练好的三个模型,即决策树模型、随机森林模型、lgbm模型;

7、步骤4、定义检验海雾事件类型,海雾事件类型包括浓雾、大雾、轻雾和无雾,并计算对应事件的准确率acc:,

8、其中,h代表的预测海雾等级是定义的海雾事件类型且实际也是定义的海雾事件类型的数量,f代表的预测海雾等级是定义的海雾事件类型且实际不是定义的海雾事件类型的数量,m代表的预测海雾等级不是定义的海雾事件类型且实际是定义的海雾事件类型的数量,c代表的预测海雾等级不是定义的海雾事件类型且实际也不是定义的海雾事件类型的数量;

9、步骤5、将测试数聚集输入训练好的三个模型,得到三个模型的输出海雾事件类型,通过三个模型的输出海雾事件类型进行综合判断,得到最终的海雾事件类型。

10、上述技术方案中,时空匹配采用距离就近匹配原则,将自动站数据和最近的gfs格点数据匹配。

11、上述技术方案中,步骤2包括以下步骤:

12、步骤2.1、海雾影响因子选取,海雾影响因子分别是对流有效位能(cape)、抬升指数(li)、海平面气压(msl)、露点温度(td)、比湿(sh)、总云量(tcdc)、气温(temp)、相对湿度(rh)、绝对涡度(absv)、垂直速度(dzdt)、位势高度(gh)、u风(u)、v风(v)。

13、步骤2.2、对步骤2.1所述的海雾影响因子采用主成分分析海雾影响因子对比各海雾影响因子的贡献,决定输入模型的最终预报因子,实现降维,得到优化特征数据。

14、上述技术方案中,步骤5中通过三个模型的输出结果进行综合判断,得到最终结果的具体实现如下:如果三个模型输出的海雾事件类型均不相同,则选取三个模型中准确率acc值最大的模型输出的海雾事件类型为最终输出结果;

15、如三个模型中有任意两个模型输出的海雾事件类型相同,则以这两个模型输出的海雾事件类型为最终输出结果;

16、如三个模型输出的海雾事件类型均相同,则以这三个模型输出的海雾事件类型为最终输出结果。

17、因为本发明采用上述技术手段,因此具备以下有益效果:

18、1、本发明采用三种模型进行联合判断,对于三个模型输出均不同的情况,采用准确率acc进行独立判断,对于有2个模型有相同结果的,以相同结果多的为最终结果,这样进一步提高了模型的准确率。

19、2、利用机器学习方法预测海雾,首先要解决的关键步骤是清楚影响因子与结果的相关性。然后利用主成分分析法对于初步数据集影响因子进行优化选择,最后得到优化后的数据集,达到了降维的目的并且提高了模型运行速度。



技术特征:

1.一种基于机器学习的海雾预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于机器学习的海雾预测方法,其特征在于,时空匹配采用距离就近匹配原则,将自动站数据和最近的gfs格点数据匹配。

3.根据权利要求1所述的一种基于机器学习的海雾预测方法,其特征在于,步骤2包括以下步骤:

4.根据权利要求1所述的一种基于机器学习的海雾预测方法,其特征在于,步骤5中通过三个模型的输出结果进行综合判断,得到最终结果的具体实现如下:如果三个模型输出的海雾事件类型均不相同,则选取三个模型中准确率acc值最大的模型输出的海雾事件类型为最终输出结果;


技术总结
本发明涉及气象领域,提供了一种基于机器学习的海雾预测方法。目的在于解决影响因子选取的问题以及融合多模型进行联合决策,达到提高准确率的目的。主要方案包括获取目标区域的海雾初步数据集,利用主成分分析法展开分析初步数据集,将原本的特征数据进行优化选取得到优化数据集;将优化数据集分为训练集数据和测试集数据,将得到的训练集数据带入不同的机器学习算法中进行训练,得到训练好的三个模型,即决策树模型、随机森林模型、LGBM模型;定义检验海雾事件类型,并计算对应事件的准确率,将测试数聚集输入训练好的三个模型,得到三个模型的输出海雾事件类型,通过三个模型的输出海雾事件类型进行综合判断,得到最终的海雾事件类型。

技术研发人员:苏德斌,樊昌元,何关兴,唐田野
受保护的技术使用者:成都信息工程大学
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1