基于机器学习的海洋低空波导预测方法

文档序号:26007279发布日期:2021-07-23 21:26阅读:139来源:国知局
基于机器学习的海洋低空波导预测方法

本发明涉及无线电气象学和电波科学技术,特别涉及一种基于机器学习的海洋低空波导预测方法。



背景技术:

由于海洋环境湿度、气压、风速、波浪等气候因素会随海面高度变化而变化,海面上空的大气折射率也会发生相应改变,当折射率的改变满足一定条件时便形成了大气波导。大气波导能够使电磁波射线向下弯曲的曲率大于地球表面的曲率,将电磁能量陷获在波导结构内形成大气波导传播,它的存在会导致超视距现象和雷达盲区的出现。

悬空波导和表面波导是海面上垂直覆盖面较广的两种波导,一般将其统称为低空大气波导。低空大气波导的出现,可使电磁波以较小的损耗沿大气波导传播,这对海上低空范围的通信、探测、导航等系统的性能影响显著。由于波导层使得无线电波来回不断反射,增加了其传播路径中的电场强度,从而使其能量衰减大大减缓,无线电波就会在波导层进行超长距离传播。因此,针对海洋悬空波导、表面波导的探测、预测,对于构建无缝、可靠、安全的海洋信息感知及通信至关重要。

对低空波导传统的判断方法主要包括基于探空数据的大气波导统计分析和中尺度数值预报模式。前者能够提供精准的波导信息但高度依赖数据集的获取,进而严重限制了其适应性,后者实用性更高但在量化大气波导参数精度方面仍存不足。因此,亟需探寻能够有效提高中尺度数值预报模式精准度的波导预测新机制。近年来,大数据及机器学习技术方兴未艾,已经广泛应用于图象识别、自然语言处理等各个领域,并取得了优异的预测效果,而针对海洋低空波导判断方面的相关研究鲜有报道,相关工作亟待展开。考虑探空数据获取波导特征的准确性以及数值模式预报波导的实用性,基于已有的气象、环境参数数据及少量的探空数据,利用机器学习理论方法,有望深入挖掘数据之间的内在规律和联系,构建探空数据驱动的数值模式迭代优化模型,进一步提升海洋低空波导的预测精度。



技术实现要素:

有鉴于此,本发明提出一种基于机器学习的海洋低空波导预测方法。

上述方法可以具体包括:实验数据wrf中尺度数值模式预报气象数据与探空实测气象数据的数据格式;利用双线性插值、神经网络拟合等数据预处理手段,得到wrf中尺度数值模式预报气象参数与探空实测数据之间的差异规律;引入gbdt与xgboost两种机器学习算法,得到利用空间维度局部、低密度探空气象数据修正广域、灵活空间颗粒度数值模式预报气象参数的机制;基于预报气象参数修正机制,结合气象参数到波导参数的过渡机制,得到新型预报波导参数机制;运用新型预报波导机制预报南海区域各项波导参数,并进行南海区域波导参数的可视化分析。

其中,上述wrf中尺度数值模式预报气象数据与探空实测气象数据的数据格式包括:wrf中尺度数值模式预报数据可提供南海海面气温、气压、水汽压、水汽混合比等气象参量,实用性更高但在精度方面存在不足;探空数据具体包括了气压、水汽压、水汽混合比、高度、温度、露温、风向和风速等气象参数,精准性强但分辨率很低。

上述利用数据预处理手段得到wrf中尺度数值模式预报气象参数与探空实测数据之间的差异规律包括:根据世界时(utc)和北京时间的对应关系,将两种数据进行时间层面的对齐;利用python的basemap库绘制地图,呈现出探空观测站点与数值模式格点分布,筛选出南海区域的29个探空观测站点;利用双线性插值方法处理数值模拟数据进行经纬度对齐,得到经纬度对齐的两种数据;以及利用神经网络拟合方法处理探空观测数据进行垂直高度对齐,得到垂直高度层面对齐的两种数据。

上述引入机器学习方法训练得到气象参数修正机制包括设计三种特征工程方案;使用训练集数据训练gbdt/xgboost模型,期间使用验证集数据检验模型的拟合情况,最后使用测试集数据检验模型的修正能力,得到气象参数修正模型;以及通过模型指标对比,得到最优气象参数修正机制。

其中,上述三种特征工程方案包括:仅使用对齐后的模拟数据;使用探空数据站点周围4个模拟点数据;以及使用对齐后的模拟数据和地理变量。

其中,上述模型指标包括:模型得分(score);修正数据与模拟数据相较探空实测数据的误差;以及均方根误差(rmse)。

上述得到新型预报波导参数机制包括:根据预报气象参数修正机制,得到更精确的预报气象参数;根据修正气象参数到大气折射指数的直接映射,根据高精度大气折射指数随高度的变化情况,推演得到更精确的、可供使用的波导数据。

上述预报南海区域各项波导参数并进行南海区域波导参数的可视化分析包括:运用新型预报波导参数机制,判断南海区域是否发生大气波导;以及计算南海区域大气波导的各项参数,例如:波导顶高、波导层厚度、波导强度等。

附图说明

图1为本发明一些实施例所述的基于机器学习的海洋低空波导预测方法流程图;

图2为本发明一些实施例所述的wrf中尺度数值模式预报数据与探空实测数据分布图;

图3为本发明一些实施例所述的双线性插值和神经网络拟合等数据预处理结果图;

图4为本发明一些实施例所述的基于三种特征工程方案和两种机器学习模型的气象参数修正结果图;

图5为本发明一些实施例所述的模型得分(score)、修正数据与模拟数据相较探空实测数据的误差以及均方根误差(rmse)对比图;

图6为本发明一些实施例所述的探空、模拟、修正波导情况对比图;

图7为本发明一些实施例所述的南海区域波导个数及波导强度示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。

图1为本发明一些实施例所述的基于机器学习的海洋低空波导预测方法流程图。如图1所示,针对传统wrf中尺度数值模拟预报波导不准确问题,获取wrf中尺度数值模式预报数据与探空实测数据的数据格式;然后采用双线性插值、神经网络拟合等数据处理手段,获得wrf中尺度数值模式预报气象参数与探空实测气象数据之间的差异规律;通过引入梯度提升决策树(gbdt)与极端梯度提升树(xgboost)两种机器学习算法,提出利用空间维度局部、低密度探空气象数据修正广域、灵活空间颗粒度数值模式预报气象参数的机制;接下来,基于上述预报气象参数修正机制,结合气象参数到大气折射指数的映射关系、大气折射指数到波导参数的过渡机制,提出新型预报波导参数机制;最后,利用新型预报波导参数机制预报南海区域低空大气波导。

图2为本发明一些实施例所述的wrf中尺度数值模式预报数据与探空实测数据分布图。如图2所示,wrf中尺度数值模式预报数据分布密集,分辨率约为25km×25km,分布在南海区域的预报数据格点数高达711450个,该数据可提供南海海面气温、气压、水汽压、水汽混合比等气象参量,实用性更高但在精度方面存在不足;探空实测数据分布极为稀疏,全球探空观测点仅有536个,探空数据具体包括了气压、水汽压、水汽混合比、高度、温度、露温、风向和风速等气象参数,精准性强但分辨率很低。因此,需进一步对wrf中尺度数值模式预报气象参数与探空实测气象数据之间的差异规律展开研究。

图3为本发明一些实施例所述的双线性插值和神经网络拟合等数据预处理结果图。从图3可以看出wrf中尺度数值模式预报数据与探空实测数据的相对位置分布,利用双线性插值方法处理数值模拟数据进行经纬度对齐,得到经纬度对齐的两种数据。双线性插值方法如下所示:

首先,在x方向进行线性插值,得到下式:

然后,在y方向进行线性插值,得到下式:

其中,探空数据站点周围4个模拟点数据为函数f在q11=(x1,y1),q12=(x1,y2),q21=(x2,y1)及q22=(x2,y2)4个点的值,探空数据站点数据为函数f在点p=(x,y)的值。

接下来,利用神经网络拟合方法处理探空观测数据进行垂直高度对齐,得到垂直高度层面对齐的两种数据。神经网络拟合如下式所示:

yj=f(βj-θj)(4)

其中,βj为第j个输出神经元的输入,θj为输出层第j个节点的阈值,yj为输出层第j个节点的输出值。神经网络训练是以模型输出值y与实际值yk的均方误差尽可能小为目标,通过对权值和阈值进行更新,实现学习的过程,最终得到最优解。

如图3所示,通过神经网络拟合方法可拟合出0-3000m各项气象参数(水汽压、温度、气压、水汽混合比)的拟合曲线。接下来,再从拟合曲线中找到与数值模拟数据同高度的气象参数便可实现两种数据垂直高度对齐。

此外,数据预处理手段包括:查阅世界时(utc)和北京时间的对应关系,进行两种数据时间层面对齐;利用python的basemap库绘制地图,一并呈现出探空观测站点与数值模式格点分布,筛选得到南海区域的29个探空观测站点。

通过上述数据预处理手段可实现数值模拟数据与探空观测数据一一对应的关系。

图4为本发明一些实施例所述的基于三种特征工程方案和两种机器学习模型的气象参数修正结果图。针对三种特征工程方案和两种机器学习模型组合成六种预报气象参数修正机制,以气象参数水汽压(e)的修正曲线为例呈现该结果,在修正曲线图中绿色线为gbdt、xgboost模型修正的气象参数曲线,橙色线为探空气象参数曲线。如图4所示,六种修正结果依次为仅使用对齐后的模拟数据的gbdt、xgboost修正结果;使用探空数据站点周围4个模拟点数据的gbdt、xgboost修正结果;以及使用对齐后的模拟数据和地理变量的gbdt、xgboost修正结果。

其中,含有地理变量的修正曲线与探空数据曲线的吻合程度更高,这代表着地理变量对修正结果有着至关重要的影响。比较两种机器学习方法,xgboost较gbdt训练速度更快,且结果更为精确。因此,本发明所提的预报气象参数修正机制为使用对齐后的模拟数据和地理变量的xgboost修正模型。

为了展示本发明各实施例的使用性能,发明人进行了多种指标多种方法的对比实验。图5、图6和图7从多个方面展示了实验结果。其中,图5为发明一些实施例所述的模型得分(score)、修正数据与模拟数据相较探空实测数据的误差以及均方根误差(rmse)对比图;图6为本发明一些实施例所述的三种大气折射指数对比图;图7为本发明一些实施例所述的三种大气折射指数及波导情况对比图;

图5所示的对比实验以模型得分(score)、修正数据与模拟数据相较探空实测数据的误差以及均方根误差(rmse)为衡量指标,验证本发明所提的预报气象参数修正机制的修正性能,可通过下述三个公式计算得到实验结果:

其中,通过公式(5)可计算出六种预报气象参数修正机制的训练集、测试集得分,得分越高修正效果越好;通过公式(6)可计算出六种修正数据与模拟数据相较探空实测数据的误差,当修正-探空误差小于模拟-探空误差时可说明该预报气象参数修正机制有修正效果,误差越小修正效果越好;通过公式(7)可计算出六种预报气象参数修正机制在不同决策树数量条件下的训练集、测试集均方根误差,误差越小修正效果越好。

从图5可以看出,本发明所提的预报气象参数修正机制(使用对齐后的模拟数据和地理变量的xgboost修正模型)的训练集、测试集得分最高,所得修正数据与探空实测数据误差最小。并且,随着决策树数量的增加,训练集、测试集的均方根误差下降较快,更为接近0。

图6所示的对比实验给出了修正大气折射率指数、模拟大气折射率指数与探空大气折射率指数及其各自的波导情况对比图。三种大气折射指数分别通过修正气象参数、模拟气象参数、探空气象参数计算而得,大气折射指数m的计算公式为:

其中,t为大气温度,k;p为大气压强,hpa;e为水汽压,hpa,z为海拔高度,m,这些参数都可以直接或间接地从数值模拟数据中获取,r为平均地球半径,取值为6.371×106m。

由于大气波导相关情况通过判断大气折射指数梯度来获得,因此,判断大气波导出现消失条件如下所示:

其中,当大气折射指数梯度满足公式(9)时,可判定波导出现,此时可把该海拔高度的大气作为波导层底。然后,随着海拔高度的升高继续进行判断,直到满足公式(10)时,则判定波导消失,该海拔高度的大气作为波导层顶,它与离它最近的波导层底联合判定大气波导。

波导强度δm和波导厚度δz的计算公式如下所示:

△m=mmax-mmin(11)

△z=zmax-zmin(12)

其中,波导层底的m值记为mmax,波导层顶的m值记为mmin。同理,波导层底的z值记为zmin,波导层顶的z值记为zmax。

从图6可以看出,模拟大气折射指数未能预报出大气波导,而探空大气折射指数与修正大气折射指数均能预报出大气波导,因此,通过修正大气折射指数可以预测出更为精准的大气波导参数。综上所述,相较于传统wrf中尺度数值模式的波导参数预报,本发明实例所提的新型预报波导参数机制,可得到更为精准的波导判定及参数预测结果。

图7为本发明一些实施例所述的南海区域波导个数及波导强度示意图。通过利用新型预报波导参数机制预报南海区域低空大气波导;然后,呈现南海区域大气波导的分布情况和特征;最后,进行南海区域波导参数的可视化分析。所述南海区域波导参数的可视化分析结果包括:

(1)2017年1月1日0时的南海区域波导个数在南海各个区域分布不均;

(2)2017年1月1日0时的南海区域波导强度不是很大,且普遍集中于0~6m范围内。

以上所述仅为本发明的一个实例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

当前第1页1 2 
网友询问留言 已有1条留言
  • 访客 来自[中国] 2022年05月11日 12:01
    向科研人员致敬!您们辛苦了!
    0
1