一种基于多尺度深度卷积神经回归网络的被动高分辨处理方法与流程

文档序号:33374685发布日期:2023-03-08 03:33阅读:27来源:国知局
一种基于多尺度深度卷积神经回归网络的被动高分辨处理方法与流程

1.本发明属于水声信号检测技术以及人工智能技术领域,具体涉及一种基于多尺度深度卷积神经回归网络的被动高分辨处理方法。


背景技术:

2.信号检测是声纳信号处理的重要功能之一,而提高空间分辨能力则是信号检测技术发展的重要目标。虽然增大阵列孔径能够提高其空间分辨性能,但在多数情况下,增大阵列孔径是不现实的,因此许多高分辨空间谱估计算法发展和兴起,随着多种现代信号处理理论和技术的应用,当前被动检测分辨能力逐步提高,然而传统的检测体制并没有突破,不具备自主学习和进化能力,在多目标、强干扰等复杂环境下的性能还有很大提升空间。
3.近年来,深度学习技术快速发展,目前已经在计算机视觉、语音信号处理等领域得到了广泛应用。本发明将深度学习用于被动高分辨处理,在构造标准化高分辨增强学习样本的基础上,提出了一种多尺度深度卷积神经回归网络建模、训练与应用方法,利用深层网络的复杂非线性关系拟合能力实现阵元域频域数据处理,有助于提升被动目标检测的空间分辨能力。


技术实现要素:

4.本发明的目的在于提供一种基于多尺度深度卷积神经回归网络的被动高分辨处理方法,以解决背景技术中现有的被动检测空间分辨方法在多目标、强干扰等复杂环境下的检测性能不高的问题。
5.为实现上述目的,本发明提供技术方案如下:
6.一种基于多尺度深度卷积神经回归网络的被动高分辨处理方法,所述方法包括以下步骤:
7.步骤1,构建训练样本集,所述训练样本集中任一训练样本包括三维阵元域频域数据x
sample
和对应的真实高分辨空间能量谱标签y
lable

8.步骤2,基于训练样本构建多尺度深度卷积神经回归网络模型;
9.步骤3,构建关于多尺度深度卷积神经回归网络模型的加权增强损失函数;
10.步骤4,基于训练样本集和加权增强损失函数训练多尺度深度卷积神经回归网络模型;
11.步骤5,将新的三维阵元域频域数据作为输入,通过训练后的多尺度深度卷积神经回归网络模型得到预测的高分辨空间能量谱。
12.优选地,任一所述训练样本的构建包括以下步骤:
13.步骤1.1,设定被动宽带警戒检测模型输入参数的范围,所述输入参数包括目标参数,目标参数包括目标数量、目标信噪比及目标方位;
14.步骤1.2,设定输入参数的参数值,并通过被动宽带警戒检测模型生成二维阵元域
频域数据xf及对应的一维空间能量谱y;
15.步骤1.3,对二维阵元域频域数据xf进行三维扩展拼接处理,得到三维阵元域频域数据x
sample

16.步骤1.4,对一维空间能量谱y进行高分辨增强处理,得到真实高分辨空间能量谱标签y
lable

17.优选地,所述步骤1.3包括以下步骤:
18.步骤1.3.1,对二维阵元域频域数据xf求实部、虚部及求模,分别得到三个二维矩阵x
f,real
、x
f,imag
、x
f,mod

19.步骤1.3.2,各二维矩阵分别扩展1维得到三维矩阵x
f,real_m
、x
f,imag_m
、x
f,mod_m
,并在扩展维度上进行拼接操作,得到三维阵元域频域数据x
sample

20.优选地,所述步骤1.4包括以下步骤:
21.步骤1.4.1,从一维空间能量谱y中按波束号依次取出滑动窗口长度的序列y
sub

22.步骤1.4.2,基于序列y
sub
中最小的m个值计算中值并作为该波束的背景,得到背景序列y
back

23.步骤1.4.3,生成与一维空间能量谱的长度length(y)相同的零值序列y
target
,按目标方位对应的波束号序列n
target
对零值序列赋值为对应的空间能量谱,记为y
target
(n
target
)=y(n
target
);
24.步骤1.4.4,计算真实高分辨空间能量谱y
lable
标签为赋值后的零值序列与背景序列之和y
lable
=y
target
+y
back

25.优选地,所述训练样本集包括第一训练样本集和第二训练样本集,第二训练样本集中的生成过程中,设定的目标数量不小于2,且至少有2个目标方位间隔不大于2个波束。
26.优选地,所述多尺度卷积神经回归网络模型的构建包括以下步骤:
27.添加卷积层和layernorm层;
28.添加若干基本模块1;
29.添加layernorm层和卷积层;
30.添加若干基本模块2;
31.添加layernorm层和卷积层;
32.添加若干基本模块3;
33.添加layernorm层和卷积层;
34.添加若干基本模块4;
35.添加全局平均池化层和全连接层。
36.优选地,所述基本模块1、基本模块2、基本模块3及基本模块4均包括3个并行分支;
37.分支1和分支2均包括依次连接的卷积层、卷积通道维归一化的layernorm层、卷积层、gelu激活函数、全连接层、系数加权层,其中系数加权层针对卷积特征在通道维点乘加权向量,该加权向量长度与卷积特征通道数量相同;分支3为直连层;三个分支输出的卷积特征进行相加,得到模块的输出。
38.优选地,所述步骤3包括以下步骤:
39.步骤3.1,对真实高分辨空间能量谱y
lable
进行逐渐零值统计并划分为非零子序列
和零值子序列
40.其中,l0和l1分别表示真实高分辨空间能量谱中无目标和有目标的结果,length(y
lable
)表示真实高分辨空间能量谱的序列长度,i0、i1均为高分辨空间能量谱的索引;
41.步骤3.2,按照真实非零子序列和真实零值子序列划分情况对预测高分辨增强空间能量谱r
model
进行同位置划分
42.步骤3.3,构建加权增强损失值其中,nb为训练时的batch大小,α0和α1为加权系数。
43.优选地,所述步骤4包括以下步骤:
44.步骤4.1,通过第一训练样本集对多尺度深度卷积神经回归网络模型进行训练,其中,加权增强损失函数中α0和α1均为1.0;
45.步骤4.2,通过第二训练样本集对多尺度深度卷积神经回归网络模型进行二次训练,其中,加权增强损失函数中α0=1.0和α1=2.0。
46.与现有技术相比,本发明的有益效果为:
47.本发明使用与阵元域频域数据特点适配的深度学习算法进行处理,与传统基于阵列信号处理相比,非线性拟合效果更好,并具备模型学习和进化能力,能够随着长期训练实现性能提升,宽容性更好。
附图说明
48.图1为本发明流程图。
49.图2为高分辨空间能量谱的构造示意图。
50.图3为本发明中多尺度深度卷积神经回归网络模型构建时所用的多尺度卷积基本模块结构示意图。
51.图4为发明提出的多尺度卷积神经网络模型结构图。
52.图5为深度卷积神经回归网络建模方案示意图。
53.图6为多尺度卷积神经网络模型增强学习框架。
54.图7为基于多尺度卷积神经回归网络模型的被动高分辨处理方法仿真验证结果。
具体实施方式
55.下面将结合附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。
56.图1示出了本发明的一种基于多尺度深度卷积神经回归网络的被动高分辨处理方法,参照图1,该被动高分辨处理方法包括以下5个步骤。
57.步骤1,构建训练样本集,所述训练样本集中任一训练样本包括三维阵元域频域数据x
sample
和对应的真实高分辨空间能量谱y
lable

58.本发明步骤1中,训练样本集由大量的训练样本构成,每一训练样本可表示为(x
sample
,y
lable
),也即三维阵元域频域数据与真实高分辨空间能量谱呈——对应的关系。
59.该步骤1具体包括以下步骤:
60.步骤1.1,设定被动宽带警戒检测模型输入参数的范围,该输入参数主要包括声纳基阵参数、目标参数和背景噪声参数;该声纳基阵参数包括基阵阵元数量、采样率、处理频率、基阵位置向量等,根据声纳基阵参数要求设定声纳基阵参数的参数值;目标参数包括目标数量、目标信噪比及目标方位,按使用需求设置目标数量和信噪比范围,以及背景噪声参数;
61.步骤1.2,根据设定的目标参数的范围设定目标参数的参数值,并通过被动宽带警戒检测模型生成二维阵元域频域数据xf及对应的一维空间能量谱y;
62.步骤1.3,对二维阵元域频域数据xf进行三维扩展拼接处理,得到三维阵元域频域数据x
sample

63.步骤1.4,对一维空间能量谱y进行高分辨增强处理,得到真实高分辨空间能量谱标签y
lable

64.步骤1.5,重复步骤1.2-1.4,得到第一训练样本集;
65.步骤1.6,重复步骤1.2-1.4,其中,输入的目标数量不少于2,且至少有2个目标方位间隔不大于2个波束,得到第二训练样本集。
66.本发明步骤1.1中,被动宽带警戒检测模型为本领域的一种常用基阵数据处理模型,简单来说,该被动宽带警戒检测模型的构建包括以下步骤:构建被动基阵数据模拟模型,其输入包括声纳基阵参数和目标参数,输出为二维阵元域频域数据xf;生成阵列流形矩阵,输入主要包括观测空间向量、基阵位置向量和工作频率;通过常规波束形成算法模型对二维阵元域频域数据xf进行处理,得到对应的一维空间能量谱y;以上构建方法为本领域的常规技术手段,在此不做赘述。
67.本发明步骤1.2中,针对单次样本生成,根据目标数量与信噪比范围,随机设定目标数量和相应信噪比,同时按照一定规则设定目标方位,然后通过被动宽带警戒检测模型生成二维阵元域频域数据及对应的一维空间能量谱。本发明中,通过控制声纳基阵参数和背景噪声参数值不变,仅改变目标参数值,从而获得不同的训练样本。
68.本发明中,通过步骤1.1-1.4完成训练样本生成模型的构建,然后按照步骤1.5的要求重复执行步骤1.1-1.4,可得到大规模样本集,将其作为第一训练样本集;在第一训练样本集构建完成后,按照步骤1.6的要求重复执行步骤1.1-1.4,得到第二个大规模样本集,将其作为第二训练样本集。
69.本发明步骤1.3中,具体来说,该三维扩展拼接处理包括以下步骤:
70.步骤1.3.1,对二维阵元域频域数据xf求实部、虚部及求模,分别得到三个二维矩阵x
f,real
、x
f,imag

xf,mod

71.步骤1.3.2,各二维矩阵分别扩展1维得到三维矩阵x
f,real_m
、x
f,imag_m
、x
f,mod_m
,并在扩展维度上进行拼接操作,得到三维阵元域频域数据x
sample

72.以x
f,real_m
为例,其扩展1维后的三个维度分别为1、x
f,real_m
维度1和x
f,real_m
维度2,
其维度2和维度3上的值与x
f,real_m
对应,x
f,imag_m
、x
f,mod_m
的求取过程与x
f,real_m
相同,然后将x
f,real_m
、x
f,imag_m
、x
f,mod_m
在维度1上进行拼接操作,形成三维矩阵x
sample
,其维度依次为3、xf维度1和xf维度2。
73.图2示出了高分辨增强标签构造示意图,针对仿真阵元域频域数据进行常规波束形成得到的空间能量谱结果,结合事先已知的目标数量和方位,仅针对目标所在方位构造谱估计结果,从而显著提升训练样本标签的方位分辨能力。具体来说,步骤1.4中,高分辨增强处理包括以下步骤:
74.步骤1.4.1,从一维空间能量谱y中按波束号依次取出滑动窗口长度的序列y
sub

75.步骤1.4.2,基于序列y
sub
中最小的m个值计算中值并作为该波束的背景,得到背景序列y
back

76.步骤1.4.3,生成与一维空间能量谱的长度length(y)相同的零值序列y
target
,按目标方位对应的波束号序列n
target
对零值序列赋值为对应的空间能量谱,记为y
target
(n
target
)=y(n
target
);
77.步骤1.4.4,计算真实高分辨空间能量谱y
lable
为赋值后的零值序列与背景序列之和y
lable
=y
target
+y
back

78.这里,波束号即为一维空间能量谱y的序号,即一维空间能量谱y若有256个点,则波束号1对应其中的第1个点。举例来说,滑动窗口长度为2l,则步骤1.4.1中,从一维空间能量谱y中按波束号依次取出长度为2l的序列y
sub
,即对于波束号n
beam
,取出其前后两端各l长度的空间能量谱,若一端超过n
beam
可取值范围,也即n
beam-l<0或n
beam
+l>length(y)则该端取值从0或length(y)开始取值,剩余l-n
beam
个点从一维空间能量谱y的另一端取出。
79.本发明步骤1.4.3中,按目标方位对应的波束号序列n
target
对零值序列赋值为对应的空间能量谱,举例来说,若步骤1.2中设定的目标数量为2且目标方位为1和3,通过步骤1.4得到的真实高分辨空间能量谱标签y={1,0.2,1.5,0.35,0.25},则y
target
(n
target
)={1,0,1.5,0,0};也即将空间能量谱中无目标的幅值设置为0,有目标的幅值保持原来的幅值不变。
80.步骤2,基于训练样本构建多尺度深度卷积神经回归网络模型。
81.本发明步骤2中,基于卷积神经网络框架来构建神经网络模型,具体包括构建4个基本模块和构建整个深度卷积网络模型两部分。
82.构建4个基本模块的主要流程如下:
83.步骤2.1.1,构造基本模块1。添加三个并行分支。分支1依次包括卷积层(7
×
7,64,1)、卷积通道维归一化的layernorm层、卷积层(1
×
1,256,1)、gelu激活函数、全连接层(1
×
1,64,1)、系数加权层;分支2依次包括卷积层(5
×
5,64,1)、卷积通道维归一化的layernorm层、卷积层(1
×
1,256,1)、gelu激活函数、全连接层(1
×
1,64,1)、系数加权层;分支3为直连层;将三个分支输出的卷积特征进行相加,得到该模块最终输出结果。
84.步骤2.1.2,构造基本模块2。添加三个并行分支。分支1依次包括卷积层(7
×
7,128,1)、卷积通道维归一化的layernorm层、卷积层(1
×
1,512,1)、gelu激活函数、全连接层(1
×
1,128,1)、系数加权层;分支2依次包括卷积层(5
×
5,128,1)、卷积通道维归一化的layernorm层、卷积层(1
×
1,512,1)、gelu激活函数、全连接层(1
×
1,128,1)、系数加权层;分支3为直连层;将三个分支输出的卷积特征进行相加,得到该模块最终输出结果。
85.步骤2.1.3,构造基本模块3。添加三个并行分支。分支1依次包括卷积层(7
×
7,256,1)、卷积通道维归一化的layernorm层、卷积层(1
×
1,1024,1)、gelu激活函数、全连接层(1
×
1,256,1)、系数加权层;分支2依次包括卷积层(5
×
5,256,1)、卷积通道维归一化的layernorm层、卷积层(1
×
1,1024,1)、gelu激活函数、全连接层(1
×
1,256,1)、系数加权层;分支3为直连层;将三个分支输出的卷积特征进行相加,得到该模块最终输出结果。
86.步骤2.1.4,构造基本模块4。添加三个并行分支。分支1依次包括卷积层(7
×
7,512,1)、卷积通道维归一化的layernorm层、卷积层(1
×
1,2048,1)、gelu激活函数、全连接层(1
×
1,512,1)、系数加权层;分支2依次包括卷积层(5
×
5,512,1)、卷积通道维归一化的layernorm层、卷积层(1
×
1,2048,1)、gelu激活函数、全连接层(1
×
1,512,1)、系数加权层;分支3为直连层;将三个分支输出的卷积特征进行相加,得到该模块最终输出结果。
87.本发明中,系数加权层针对卷积特征在通道维点乘加权向量,该加权向量长度与卷积特征通道数量相同。
88.图3示出了本发明中多尺度深度卷积神经回归网络模型构建时所用的多尺度卷积基本模块结构示意图,其中x为模块输出通道数量,该模块基于当前主流深度卷积神经网络架构构造,各基础模块中分支1和分支2通过配置不同的卷积操作过程参数,结合ln层标准化和gelu激活函数,能够增强对不同尺度的适应性,从而提高对数据动态的洞察能力和精细特征的捕捉时机,分支3为直连分支,能够增强网络在大深度情况下的可训练性。
89.图5示出了多尺度深度卷积神经回归网络建模方案示意图,设定三维阵元域频域数据样本的输入尺寸a
×b×
3,a>16,b>16,int()表示向下取整,r
out
表示高分辨空间能量谱长度,该方案包含了多个卷积层、池化层和各基本模块。
90.参照图4和5,构建多尺度深度卷积神经回归网络模型的主要流程如下:
91.步骤2.2.1,添加卷积层(4
×
4,64,2)和layernorm层;
92.步骤2.2.2,添加3个串联的基本模块1;
93.步骤2.2.3,添加layernorm层和卷积层(2
×
2,128,2);
94.步骤2.2.4,添加3个串联的基本模块2;
95.步骤2.2.5,添加layernorm层和卷积层(2
×
2,256,2);
96.步骤2.2.6,添加9个串联的基本模块3;
97.步骤2.2.7,添加layernorm层和卷积层(2
×
2,512,2);
98.步骤2.2.8,添加3个串联的基本模块4;
99.步骤2.2.9,添加全局平均池化层和全连接层(512,n
spatial_spec
),n
spatial_spec
表示输出的空间能量谱长度。
100.本发明中,相邻的不同基本模块间通过卷积层进行特征压缩,并通过layernorm层进行数据的归一化处理。通过综合利用多个不同参数下的多尺度卷积基本模块,结合卷积层、全局平均池化层和全连接层等的组合运用,实现阵元域频域数据降维与特征抽象,最终输出高分辨空间能量谱。
101.步骤3,构建关于多尺度深度卷积神经回归网络模型的加权增强损失函数。
102.本发明步骤3中,针对模型损失函数构造,以最小均方误差方法为基础,并根据训练样本对应标签各方位上是否有目标出现,赋予相应的加权系数,形成多目标加权损失函数。在此基础上,将模型训练过程划分为两个阶段并对优化器、学习率、多目标加权系数等
进行合理设置,同时根据基于验证样本集的模型性能测试变化趋势设定模型训练中止条件。
103.所述步骤3包括以下步骤:
104.步骤3.1,对真实高分辨空间能量谱标签y
lable
进行逐渐零值统计并划分为真实非零子序列和真实零值子序列
105.其中,l0和l1分别表示真实高分辨空间能量谱标签中无目标和有目标的结果,length(y
lable
)表示真实高分辨空间能量谱标签的序列长度,i0、i1均为高分辨空间能量谱的索引;
106.步骤3.2,按照真实非零子序列和真实零值子序列划分情况对预测高分辨增强空间能量谱r
model
进行同位置划分
107.步骤3.3,构建加权增强损失值其中,nb为训练时的batch大小,α0和α1为加权系数。
108.步骤4,基于训练样本集和加权增强损失函数训练多尺度深度卷积神经回归网络模型。
109.本发明步骤4中,对建立的多尺度卷积神经网络模型进行训练,将模型训练过程划分为两个阶段,包括第一阶段中将第一训练样本集按500∶1随机划分为相互独立的训练样本集1和测试样本集1,并基于该第一训练样本集对模型进行训练,以及,第二阶段中,将第二训练样本集按按500∶1随机划分为相互独立的训练样本集2和测试样本集2对第一阶段训练完成的模型进行二次训练。参照图6所示,其具体过程如下。
110.步骤4.1,训练阶段1,主要步骤如下:
111.步骤4.1.1,基于sgd优化器对模型展开训练,其中学习率(lr)设置为0.001,冲量(momentum)设置为0.9,权重衰减设置为0.00001;设定模型每轮学习1个batch样本,batch-size设置为64;α0、α1均设置为1.0,即退化为无加权损失函数。
112.步骤4.1.2,从训练样本集1中随机放回式取样,得到一批输入样本s
batch
及对应标签l
batch
,对s
batch
和l
batch
进行归一化处理,将s
batch
作为多尺度卷积神经网络模型的输入进行处理,输出r
batch
,对l
batch
和r
batch
按步骤3中的损失函数计算损失值,并基于adam优化器进行优化。
113.步骤4.1.3,重复步骤4.1.2,开展多轮次模型训练。设定每训练50轮作为1个epoch,下同。在每个epoch训练结束后基于测试样本集1进行模型性能测试,统计目标方位识别正确率,当满足每100个epoch目标方位计算正确率上升低于3%时,中止模型训练。
114.步骤4.2,训练阶段2,主要步骤如下:
115.步骤4.2.1,基于adam优化器对模型展开训练,其中学习率(lr)设置为0.0001;设定模型每轮学习1个batch样本,batch-size设置为64;α0、α1分别设置为1.0和2.0。
116.步骤4.2.2,从训练样本集2中随机放回式取样,得到一批输入样本s
batch
及对应标
签l
batch
,对s
batch
和l
batch
进行归一化处理,将s
batch
作为多尺度卷积神经网络模型的输入进行处理,输出r
batch
,对l
batch
和r
batch
按步骤3中的损失函数计算损失值,并基于adam优化器进行优化。
117.步骤4.2.3,重复步骤4.2.2,开展多轮次模型训练。设定每训练50轮作为1个epoch,下同。在每个epoch训练结束后基于测试样本集2进行模型性能测试,统计目标方位识别正确率,当满足每100个epoch目标方位计算正确率上升低于1%时,中止模型训练。
118.步骤5,将新的三维阵元域频域数据作为输入,通过训练后的多尺度深度卷积神经回归网络模型得到预测的高分辨空间能量谱。
119.本发明步骤5中,当出现新的未知的二维阵元域频域数据时,可按照步骤1.4和1.5进行处理,得到三维阵元域频域数据,将其作为步骤4中获得的训练后的多尺度深度卷积神经回归网络模型的输入,可直接预测到高分辨空间能量谱。
120.图7示出了基于多尺度卷积神经回归网络模型的被动高分辨处理方法仿真验证结果,该模型已利用大规模仿真样本集训练完善,可以看到,和常规波束形成结果相比,多尺度卷积神经网络模型输出的结果分辨率更高,验证了该网络模型的有效性。
121.本发明在构造高分辨增强训练样本集基础上,设计了多尺度卷积框架并建立了适配的深层经回归网络模型,提出了多目标加权的模型损失函数,设计了模型优化学习训练策略,实现了从三维阵元域频域数据到高分辨空间能量谱标签之间的复杂非线性关系拟合。和传统方法相比,本专利所提方法泛化能力更强。该方法应用于仿真数据处理,取得较好效果。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1