基于多维特征挖掘神经网络的GNSS-R海风反演方法

文档序号:30495987发布日期:2022-06-22 04:32阅读:375来源:国知局
基于多维特征挖掘神经网络的GNSS-R海风反演方法
基于多维特征挖掘神经网络的gnss-r海风反演方法
技术领域
1.本发明涉及大气科学与计算机科学学科研究领域,具体涉及基于多维特征挖掘神经网络的gnss-r海风反演方法。


背景技术:

2.海洋表面风速是一项重要的海洋状态物理参数,对全球以及局部气候有着重要影响,不仅是研究物理海洋学、海洋气象学以及海洋动力学等多个学科的重要物理参数,在海洋灾害的监测预报,保障海洋渔业安全以及军事活动等方面也离不开对海面的风场的监测研究。
3.全球导航卫星系统反射信号遥感(global navigation satellite system reflectometry,简写为gnss-r)技术是将导航卫星视作发射源,通过搭载的接收机接受处理导航卫星反射信号来获取相应物理特征信息的相对新型的遥感探测技术。相较传统测风方式,其具有低成本、全天候、全天时、全球覆盖且受云雨影响小等优势。
4.基于gnss-r反演海洋表面风速的传统方式是通过从gnss-r的主要观测指标之一延迟多普勒映射(delay-doppler map,简写为ddm)中提取例如归一化雷达截面(normalized bistatic radar cross-section,简写为nbres)或前沿斜率(leading edge of the slope,简写为les)等特征,构建观测值与风速的映射关系,建立地球物理模型函数来反演风速。然而该方法通常所选择使用的特征参数较为单一,使得构造的函数模型较为简单,进而导致反演精度有限。
5.随着计算机算法的发展、计算机硬件数据存储能力以及计算能力的提升,基于数据驱动的深度学习技术已经广泛应用于计算机视觉、自然语言处理以及语音分析等多个计算机研究方向。此外,将深度学习技术应用于遥感、医学、军事、农业以及安全等众多研究领域已成为研究的热点与趋势。


技术实现要素:

6.本发明的目的在于克服现有技术缺陷,提出了基于多维特征挖掘神经网络的gnss-r海风反演方法。
7.为了实现上述目的,本发明提出了一种基于多维特征挖掘神经网络的gnss-r海风反演方法,所述方法包括:
8.从采集的全球导航卫星系统反射信号遥感gnss-r数据中选取不同种类的特征参数,进行预处理及格式转换;
9.将格式转换后的特征参数输入预先建立和训练好的风速反演模型,得到反演后的风速值;
10.所述风速反演模型通过挖掘不同种类特征参数之间的数据信息,提取数据时间的相关性,实现风速反演。
11.作为上述方法的一种改进,所述特征参数包括:雷达截面、前沿斜率、时空地理信
息、仪器信息和航天器姿态数据。
12.作为上述方法的一种改进,所述预处理及格式转换具体包括:
13.剔除数值为nan或为负数的特征参数,并根据质量控制标签对选取的特征参数进行筛选;
14.对筛选后的不同种类特征参数进行归一化处理。
15.作为上述方法的一种改进,所述风速反演模型的输入为特征参数,输出为风速值,所述风速反演模型包括依次连接的输入层、卷积网络层、门控循环单元、全连接层以及输出层,其中,
16.所述输入层的隐藏层节点数目由输入特征参数的个数决定;
17.所述卷积网络层卷积核个数为32,卷积核大小为3,激活函数为relu函数;
18.所述门控循环网络层隐藏层节点数为32,激活函数为softsign函数;
19.所述全连接层隐藏层分别为16、16和8,激活函数为softsign函数;
20.所述输出层节点数为1,激活函数为linear函数。
21.作为上述方法的一种改进,所述方法还包括风速反演模型的训练步骤,具体包括:
22.步骤s1)选取一段时间内的飓风全球导航卫星系统l1波段的观测值,选取相应时间段内欧洲中期天气预报中心的再分析数据;
23.步骤s2)基于双线性插值的方式对l1波段的观测值和再分析数据进行时空匹配,基于反射点的经纬坐标以及时间进行数据时空匹配,生成原始数据样本集,每组原始数据样本包括由时间节点与空间位置所约束的gnss-r可观测值以及对应的风速真值;
24.步骤s3)对原始数据样本集进行预处理及格式转换,建立训练集;
25.步骤s4)将训练集输入风速反演模型,包括正向传播与误差反向传导,通过训练过程更新网络模型的参数直至达到最优模型,从而得到训练好的风速反演模型。
26.作为上述方法的一种改进,所述步骤s4)具体包括:
27.选取adam优化器作为优化算法;
28.使用正向传播经过风速反演模型的层层计算得到计算风速;
29.通过mse损失函数计算当前计算风速与风速真值之间的误差,基于该误差通过误差反向传导过程对风速反演模型的各层参数进行更新,直至误差在允许范围内或验证误差不再下降,则完成模型的训练,得到训练好的风速反演模型。
30.一种基于多维特征挖掘神经网络的gnss-r海风反演系统,所述系统包括:风速反演模型、预处理模块和反演输出模块,其中,
31.所述预处理模块,用于从采集的全球导航卫星系统反射信号遥感gnss-r数据中选取不同种类的特征参数,进行预处理及格式转换;
32.所述反演输出模块,用于将格式转换后的特征参数输入预先建立和训练好的风速反演模型,得到反演后的风速值;
33.所述风速反演模型通过挖掘不同种类特征参数之间的数据信息,提取数据时间的相关性,实现风速反演。
34.与现有技术相比,本发明的优势在于:
35.1、本发明提出基于多维特征挖掘神经网络的gnss-r海风反演方法,是一种基于数据驱动的反演模型,无较高的软硬件需求,可在单台工作机上实现模型的搭建、并完成模型
训练与反演过程,且模型易于移植,便于实现跨平台应用;
36.2、本发明通过深度学习技术搭建的深层神经网络可同时挖掘包括来自信号特征、仪器属性以及航天器姿态等多种属性的输入特征,建立多个特征与海面风速的复杂非线性关系,为gnss-r海面风速反演提供了新的特征参考;
37.3、本发明通过在网络模型中添加卷积网络层与门控循环机制,使得模型不仅能够通过卷积网络层基于特征维度挖掘特征之间的数据信息,同时通过门控循环机制实现基于时间维度的数据特征挖掘,提取数据的时间相关性信息,进而提升模型的总体反演精度。
附图说明
38.图1是本发明的基于多维特征挖掘神经网络的gnss-r海风反演方法流程图;
39.图2是风速反演模型搭建及训练流程图;
40.图3是风速反演模型反演结果。
具体实施方式
41.本发明的目的在于设计一种新的基于gnss-r的海洋表面风速反演模型,设计并搭建了基于深度学习的多维度特征深入挖掘混合神经网络模型,该模型由输入层、卷积网络层(convolutional neural network,cnn)、门控循环单元(gated recurrent unit,gru)、全连接层以及输出层组成,不仅能够建立多种特征参数与风速之间的复杂非线性关系,同时能够分别基于特征间维度以及时间维度挖掘特征信息。通过该方法反演海洋表面风速具有较高的反演精度,并且在高风速下具有较小的离散程度,为基于gnss-r反演海洋表面风速提供了一个新的反演方法与模型设计思路。
42.如图1所示,本发明提出了一种基于深度神经网络的gnss-r海面风速反演方法,步骤如下:
43.第一步:原始数据采集与特征值选取。采集一段时间的gnss-r数据以及风速真值组成原始样本集,并选取用于反演风速的特征值;
44.采集用于神经网络模型训练的原始数据集,并基于双线性插值的方式,基于反射点的经纬坐标以及时间进行数据时空匹配,生成原始数据样本集,每组原始样本都是由时间节点与空间位置所约束的gnss-r可观测值与风速真值组成。此外,基于gnss-r海面风速反演的地球物理函数模型以及数据校准经验选取特征值,例如归一化雷达截面、前沿斜率、信噪比、航天器姿态等。
45.第二步:数据预处理与格式转换。对原始数据集进行数据预处理,包括质量控制以及数据归一化,并将处理后数据转化为模型训练所需的监督学习数据;
46.为了确保数据质量,避免异常值对模型造成影响,因此需要对原始数据进行质量控制与筛选。具体包括:剔除特征值为nan或为负数的数据以及根据质量控制标签对数据进行筛选等,从而减少因异常数据对模型反演精度造成的影响。此外,由于特征参数之间量纲不同且部分数量级之间存在较大差异,因此需要对数据进行归一化处理,将数据缩放在[0,1]区间内,具体计算公式如下:
[0047]
[0048]
通过归一化可消除量纲带来的影响,提升模型的训练速度。随后将质量控制后的数据转化为神经网络模型训练、测试所需的监督学习数据,并将总体数据按照6:4划分为训练集与测试集,分别用于神经网络的训练与测试,并将训练数据集中的10%划分为验证数据集,用于监测模型训练,避免模型过拟合。
[0049]
第三步:模型搭建。搭建由输入层、卷积网络层、门控循环单元、全连接层以及输出层组成的深度神经网络;
[0050]
搭建以特征参数为输入,风速真值为输出的神经网络模型,其中特征参数包括地球物理模型中使用的特征量如归一化雷达截面(normalized bistatic radar cross-section,nbres)或前沿斜率(leading edge of the slope,les)、时空地理信息、仪器信息以及航天器姿态等。模型由五部分组成,分别为输入层、卷积网络层、门控循环单元、全连接层以及输出层,分别作用于接收输入特征数据信息、挖掘输入特征之间的数据信息、提取数据时间相关性、风速计算以及输出模型反演所得风速。
[0051]
第四步:模型训练。通过训练过程使得模型建立特征与风速之间的复杂非线性关系;
[0052]
模型的训练过程即神经网络的学习过程,包括正向传播与误差反向传导,通过训练过程更新网络模型的参数直至达到最优模型。首先训练数据集通过正向传播经过神经网络的层层计算后得到网络的计算输出,并通过定义的损失函数计算当前计算输出与真值之间的误差,将当前计算结果与拟定的误差范围进行比较,若在拟定的范围内或验证数据集的反演精度不再下降则完成模型的训练,反之则基于该误差通过误差反向传导过程对神经网络的各层参数进行更新,直至更新至完成模型训练的条件。总体流程如图2所示。
[0053]
第五步:海面风速反演。训练后的模型则可通过输入待反演的特征参数获取模型的风速反演结果。
[0054]
下面结合附图和实施例对本发明的技术方案进行详细的说明。
[0055]
实施例1
[0056]
本发明的实施例1提出了一种基于多维特征挖掘神经网络的gnss-r海风反演方法。
[0057]
原始数据来自飓风全球导航卫星系统(cyclone global navigation satellite system,cygnss)l1波段数据,该卫星系统由nasa于2016年底发射,是一个由8颗同步轨道的微型卫星组成的gnss-r星座业务化应用系统,该卫星系统的8颗卫星可同时工作,并提供纬度覆盖范围在38
°
n至38
°
s之间的高时空分辨率数据。风速真值选取自欧洲中期天气预报中心(european centre for medium-range weather forecasts,ecmwf)再分析数据。
[0058]
如图1所示,具体步骤如下:
[0059]
第一步、原始数据采集与特征值选取:选取来自cygnss l1波段观测值作为特征输入,风速真值来自ecwmf,数据的时间跨度为2019年8月1日至2019年8月31日,其中ecwmf时间分辨率为1h,空间分辨率为12.5km
×
12.5km,由于上两种数据在时空分辨率上存在差异,因此基于双线性插值的方式进行时空匹配,匹配后的原始数据样本在千万级。随后选取包括nbrcs、les、信噪比、反射点地理空间坐标以及给航天器姿态在内的特征作为输入参数。
[0060]
第二步、数据预处理与格式转换:对采集后原始数据进行数据预处理。首先进行数据质量控制与筛选,具体包括剔除特征值为nan的特征数据、剔除特征值为负的数据、根据
cygnss的质量控制标签(quality_flag)对数据进行筛选。为避免特征之间量纲以及数量级之间的差异对模型训练造成影响,加快神经网络模型训练收敛效率,将特征数据进行归一化处理。随后将预处理后的数据格式转化为网络训练所需的监督学习数据,按照6:4将总体数据划分为训练数据集与测试数据集,再将训练集中的10%数据划作验证集,其中训练数据集包含13443402组监督学习数据,测试数据集包含8962156组数据。
[0061]
第三步、模型搭建:该混合神经网络由输入层、卷积网络层、门控循环机制层、全连接层以及输出层组成,其中输入层隐藏层节点数目由输入特征个数决定,输出层节点数为1,即输出神经网络模型计算后的风速值,卷积网络层卷积核个数为32、卷积核大小为3,门控循环网络层隐藏层节点数为32,全连接层隐藏层为16、16、8。此外,选择mse(mean square error,mse)作为损失函数,选取relu作为卷积层的激活函数、softsign作为门控循环层与全连接层的激活函数、linear作为输出层的激活函数、优化算法选取adam优化器、批尺寸为64以及通过提前终止的策略决定模型的迭代次数。
[0062]
第四步、模型训练:模型的训练过程即神经网络的学习过程,可概括为正向传播与误差反向传导两步,将训练数据集通过正向传播经过神经网络的层层计算后得到网络的计算输出,并通过mse损失函数计算当前计算输出与真值之间的误差,并基于该误差通过误差反向传导过程对神经网络的各层参数进行更新,直至更新至模型计算结果与真值之间的误差在拟定的范围内或验证数据集的反演精度不再下降则完成模型的训练。
[0063]
第五步、海面风速反演:训练后的模型可用于海面风速反演,将待反演的数据输入至训练完成的模型即可获取反演后的风速值,该模型的整体rmse反演精度为1.46m/s,相关系数为0.876。图3给出了神经网络模型反演结果与风速真值的散点图分布,可以看到在整体风速范围内模型的反演结果较好,总体散点分布在x=y直线上,且在高风速区域离散程度较小。
[0064]
实施例2
[0065]
本发明的实施例2提出了一种基于多维特征挖掘神经网络的gnss-r海风反演系统,基于实施例1的方法实现,所述系统包括:风速反演模型、预处理模块和反演输出模块,其中,
[0066]
所述预处理模块,用于从采集的全球导航卫星系统反射信号遥感gnss-r数据中选取不同种类的特征参数,进行预处理及格式转换;
[0067]
所述反演输出模块,用于将格式转换后的特征参数输入预先建立和训练好的风速反演模型,得到反演后的风速值;
[0068]
所述风速反演模型通过挖掘不同种类特征参数之间的数据信息,提取数据时间的相关性,实现风速反演。
[0069]
本发明通过深度学习技术设计搭建了基于gnss-r反演海洋表面风速的混合神经网络模型,能够挖掘来自cygnss的l1波段特征数据来反演海洋表面风速。该模型具有易于搭建、便于移植且反演精度高的优势,整体rmse(root mean square error,rmse)反演精度为1.46m/s,为基于gnss-r反演海洋表面风速提出了新的模型结构。
[0070]
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明
的权利要求范围当中。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1