一种基于声矢量场的声源方位估计方法、系统及装置

文档序号:32007821发布日期:2022-11-02 14:15阅读:135来源:国知局
一种基于声矢量场的声源方位估计方法、系统及装置

1.本发明涉及信号处理领域,尤其涉及一种基于声矢量场的声源方位估计方法、系统及装置。


背景技术:

2.传统的目标方位估计方法均建立在假设的物理或数学模型之上,且所建立的模型有较大局限性。当应用环境发生改变或接收信号的信噪比降低时,使用经典目标方位估计方法得到的结果性能急剧下降。在水下目标探测领域,矢量水听器可以同步、共点的对水质点的声压和三轴振速信息进行测量。相较于传统的标量水听器,矢量水听器有着较小的几何尺寸和较大的信息获取能力。但由于声场环境的影响和矢量水听器自身的特性,传统的单矢量水听器目标估计方法的性能受到了很大的限制。在环境发生变化、入射信号信噪比降低时,声源目标方位估计方法的性能会发生大幅的下降。


技术实现要素:

3.本发明的目的是提供一种基于声矢量场的声源方位估计方法、系统及装置,以解决传统方法对环境和噪声的适应能力弱的问题。
4.本发明所采用的第一技术方案是:一种基于声矢量场的声源方位估计方法,包括以下步骤:
5.构建矢量声场模型;
6.基于矢量声场模型生成仿真数据并进行预处理,得到预处理后数据;
7.基于预处理后数据对预设的残差神经网络进行训练,得到初步声源方位估计模型;
8.结合初步声源方位估计模型和目标域数据进行参数微调,得到最终声源方位估计模型。
9.进一步,所述矢量声场模型的表达式如下:
[0010][0011]
上式中,p(t)表示声压,t表示时刻,v
x
(t)表示t时刻在x轴的声速分量,vy(t)表示t时刻在y轴的声速分量,vz(t)表示t时刻在z轴的声速分量,ρ表示水体介质的密度,c表示水体介质中的声速,θ表示目标的方位角,表示目标的俯仰角。
[0012]
进一步,所述基于矢量声场模型生成仿真数据并进行预处理,得到预处理后数据
这一步骤,其具体包括:
[0013]
基于模拟声场模型仿真生成单矢量水听器频域声压信号和频域三轴振速信号,得到模拟数据;
[0014]
对模拟数据进行互谱运算,得到声压-振速互谱;
[0015]
对声压-振速互谱进行归一化处理,得到归一化后数据;
[0016]
对归一化后数据进行矩阵转换处理,得到预处理后数据。
[0017]
进一步,所述基于预处理后数据对预设的残差神经网络进行训练,得到初步声源方位估计模型这一步骤,其具体包括:
[0018]
将预处理后数据划分为训练集、验证集和测试集;
[0019]
将训练集输入至预设的残差神经网络进行训练;
[0020]
基于损失函数最小化实际方位角度与标签方位角度之间的误差并迭代更新网络的权重参数;
[0021]
判断到达到预设的迭代次数,保存网络的权重参数,得到初步声源方位估计模型。
[0022]
进一步,所述预设的残差网络包括五个卷积模块和一个全连接层,具体包括:
[0023]
第一卷积模块,包括一个残差块和一个最大池化层;
[0024]
第二卷积模块,包括三个残差块;
[0025]
第三卷积模块,包括四个残差块;
[0026]
第四卷积模块,包括六个残差块;
[0027]
第五卷积模块,包括三个残差块;
[0028]
每个残差块均包括三个卷积层。
[0029]
进一步,所述结合初步声源方位估计模型和目标域数据进行参数微调,得到最终声源方位估计模型这一步骤,其具体包括:
[0030]
将初步声源方位估计模型中的网络参数迁移至目标网络并对目标网络中的全连接层进行初始化;
[0031]
根据目标域数据对目标网络中的卷积层参数和全连接层参数进行训练更新,得到最终声源方位估计模型。
[0032]
本发明所采用的第二技术方案是:一种基于声矢量场的声源方位估计系统,包括:
[0033]
模型构建模块,用于构建矢量声场模型;
[0034]
数据仿真模块,基于矢量声场模型生成仿真数据并进行预处理,得到预处理后数据;
[0035]
网络训练模块,基于预处理后数据对预设的残差神经网络进行训练,得到初步声源方位估计模型;
[0036]
参数微调模块,用于结合初步声源方位估计模型和目标域数据进行参数微调,得到最终声源方位估计模型。
[0037]
本发明所采用的第三技术方案是:一种基于声矢量场的声源方位估计装置,包括:
[0038]
至少一个处理器;
[0039]
至少一个存储器,用于存储至少一个程序;
[0040]
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如上所述一种基于声矢量场的声源方位估计方法。
[0041]
本发明方法、系统及装置的有益效果是:本发明通过构建矢量声场模型模拟产生单矢量水听器接收数据,以得到高质量仿真数据,通过高质量仿真数据训练网络并对网络模型进行迁移,把网络整体架构迁移到全新的环境当中,使用新环境下的少量数据对网络进行微调更新,从而使网络在全新的环境中也有优秀的表现。
附图说明
[0042]
图1是本发明一种基于声矢量场的声源方位估计方法的步骤流程图;
[0043]
图2是本发明一种基于声矢量场的声源方位估计系统的结构框图;
[0044]
图3是本发明具体实施例声场矢量信号接收模型示意图;
[0045]
图4是本发明具体实施例数据预处理示意图;
[0046]
图5是本发明具体实施例为resnet50残差神经网络结构示意图;
[0047]
图6是本发明具体实施例在实际环境中的目标方位估计结果。
具体实施方式
[0048]
下面结合附图和具体实施例对本发明做进一步的详细说明。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
[0049]
如图1所示,本发明提供了一种基于声矢量场的声源方位估计方法,该方法包括以下步骤:
[0050]
s1、构建矢量声场模型;
[0051]
在海洋环境中,水体质点在声压的作用下会产生沿声压负梯度方向的加速度,用牛顿第二定律可以写出水质点的动量方程,即水质点的欧拉方程:
[0052][0053]
其中,p(r,z,t)为声场中距离坐标轴原点距离为r,深度为z处的水质点在t时刻受到的声压,v为该水质点在声压p(r,z,t)作用下产生的振速向量,ρ为水体介质的密度。
[0054]
考虑点声源均匀向周围辐射简谐声波,即声波的时间函数为e-jωt
,ω为信号角频率。因此水质点的加速度dv/dt=jωv,则可以得到
[0055][0056]
在简谐声波模型中,声源沿距离r方向辐射的平面波可以表示为
[0057]
p(r,t)=pe
j(ωt-kr)
[0058]
上式中,p为声压的幅度,k=ω/c为平面波波数,c为水体介质中的声速。
[0059]
根据上式进行代入替换,可以得到质点振速和声压之间的关系
[0060][0061]
参照图3,给出了声场中矢量信号的接收示意图v
x
,vy,vz分别为水质点振速在x,y,z方向上的速度投影;θ为目标的方位角;为目标的俯仰角。根据三角函数关系,可以得到
[0062][0063]
进而,得到本具体实施例的矢量声场模型,表达式如下:
[0064][0065]
上式中,p(t)表示声压,t表示时刻,v
x
(t)表示t时刻在x轴的声速分量,vy(t)表示t时刻在y轴的声速分量,vz(t)表示t时刻在z轴的声速分量,ρ表示水体介质的密度,c表示水体介质中的声速,θ表示目标的方位角,表示目标的俯仰角。
[0066]
其矢量形式为
[0067]
y=ap
[0068]
上式中,y=[p,v
x
,vy,vz]为矢量信号,矢量水听器的四个通道可以近似等效为四个标量水听器阵列,为矢量水听器的导向向量,p=[p(t1),p(t2),

,p(tk)]为k个快拍的声压信号。
[0069]
根据kraken简正波声场理论可以得到声压的各模态叠加方程,可计算得出声场中任意一点的声压。
[0070]
考虑单频声源信号在均匀介质中长距离传播,简正波理论中质点声压可以写为
[0071][0072]
其中,为常数,ρ(zs)为声源所在深度zs处的海水密度,m是传播模态数量。
[0073]
海水质点的振速可以通过欧拉方程得到
[0074][0075]
式中,v表示海水质点的振速向量,包含x、y、z三个方向的振速,定义为梯度算子。在上一节中考虑声源发出简谐信号,速度矢量v随时间简谐变化,即因此质点的振速可以表示为
[0076][0077]
水质点的振速向量和三轴振速的投影关系如图3所示。图中θ为目标方位角,也是待估计的角度,为目标的俯仰角,θ∈[0,2π],
[0078]
振速矢量v向x轴方向投影得到海水质点在x轴方向上的速度分量
[0079][0080]
考虑远场条件下的声场模型,有因此上式得以简化。同理可以得到振速矢量v在y,z方向上的速度分量vy和vz[0081][0082][0083]
训练集的仿真环境参数具体如表1所示。声源方位角范围为1~360
°
,均匀取360个角度参数;声源深度为3m和6m;声源距水听器的水平距离范围为0.2~5km,间隔0.2km,共25组参数;水听器深度和海水深度分别为44m和61m;沉积层的厚度共选取四组参数,范围为2~14m,间隔4m;沉积层的声速从1550m/s开始增加,步长为20m/s,一直增加到1650m/s,共6组参数;基底的声速选取1750m/s;沉积层和基底的密度分别为1.6、1.8g/cm3;沉积层和基底的声速衰减均为0.3db/λ。
[0084]
表1仿真环境参数表
[0085]
[0086][0087]
考虑训练集声源信号为200~300hz的宽带信号。由于kraken计算声场时只能对单频声源信号进行计算,因此在这里间隔1hz均匀选取101组单频信号进行声场计算,计算的到的频域复信号为声源时域信号的傅里叶变换频谱。
[0088]
s2、基于矢量声场模型生成仿真数据并进行预处理,得到预处理后数据;
[0089]
具体地,为了降低深度学习网络模型构建的难度,加快网络的收敛速度,提高网络预测的性能,对简正波理论的声场计算程序kraken仿真产生在多种环境条件下单矢量水听器声压和三轴振速共四个通道的接收数据进行预处理,如附图4所示。
[0090]
s2.1、基于模拟声场模型仿真生成单矢量水听器频域声压信号和频域三轴振速信号,得到模拟数据;
[0091]
s2.2、对模拟数据进行互谱运算,得到声压-振速互谱;
[0092]
具体地,对计算得到的频域声压信号p(f),频域三轴振速信号v
x
(f)、vy(f)、vz(f)进行互谱运算,得到的声压—振速互谱为
[0093][0094]
s2.3、对声压-振速互谱进行归一化处理,得到归一化后数据;
[0095]
具体地,对上式的声压—振速互谱进行归一化处理至其值域落在0~1之间,使得后续利用深度学习网络能够较快的达到收敛,防止梯度下降时发生梯度消失或梯度爆炸问题
[0096][0097]
s2.4、对归一化后数据进行矩阵转换处理,得到预处理后数据。
[0098]
具体地,由于深度学习并不能对复数信号进行处理,因此需要将复数形式的互谱矩阵拆分为两部分,复数数据的实部作为输入数据矩阵的首部,复数数据的虚部单独拿出来构成一个实数矩阵拼接在实部矩阵的后面。
[0099]
基于深度学习的目标方位估计问题本质上为机器学习四大问题中的回归问题,即通过建立输入数据和输出之间的非线性拟合以建立单矢量水听器接收信号与目标方位角之间的函数映射关系。在该问题当中,深度学习的样本类为1
°
~360
°
共360个已知的角度作为数据集的标签。为了使得输出结果更加直观同时降低网络训练难度,本发明选择空间伪谱作为基于深度学习的doa估计方法的标签。
[0100]
当目标真实方位角为θ0时,对应的1
×
360数据标签为
[0101][0102]
其中,σ2表示网络模型的宽容性和容忍度。为了在保证网络充分收敛的同时提升网络模型对噪声的忍耐能力,数据标签均使用σ=15
°
的高斯标签。
[0103]
s3、基于预处理后数据对预设的残差神经网络进行训练,得到初步声源方位估计模型;
[0104]
s3.1、将预处理后数据划分为训练集、验证集和测试集;
[0105]
具体地,对步骤s1和s2的参数进行组合后,共产生1200组环境参数和360组角度参数,共432000组数据用于深度学习网络的训练。将数据集数据完全打乱,并按9:1的比例将数据集分成训练集和测试集。
[0106]
s3.2、将训练集输入至预设的残差神经网络进行训练;
[0107]
具体地,搭建深度学习领域中的残差神经网络以精确估计声源方位,该网络通过构建残差块在神经网络内部进行网络的跳跃连接,解决了传统卷积神经网络因网络深度过大而引起的梯度消失问题。
[0108]
本发明采用resnet50残差神经网络。该网络的基本模型如附图5所示。网络由五个卷积模块和一个全连接层组成。第一个卷积模块包含一个卷积层和一个最大池化层,其余四个卷积模块分别包含3、4、6和3个残差块,每个残差块包含三个卷积层,四个卷积模块中的第一个残差模块的第二个卷积层在数据宽度方向的卷积步长分别为1、2、2和2。在进行卷积计算时仅选用权重参数,不引入偏置参与计算。每个卷积模块的第一个残差块用1
×
1卷积创建捷径连接,其余残差块均由恒等映射创建捷径连接。resnet50残差神经网络有(3+4+6+3)
×
3+1个卷积层和一个输出层共计五十层网络结构。在卷积神经网络和全连接层之间设置平均池化层用以减小输出数据数量。全连接层共有两层,神经元个数分别为8192和360。选择relu函数作为网络的非线性激活函数。
[0109]
s3.3、基于损失函数最小化实际方位角度与标签方位角度之间的误差并迭代更新网络的权重参数;
[0110]
s3.4、判断到达到预设的迭代次数,保存网络的权重参数,得到初步声源方位估计模型。
[0111]
具体地,将训练集数据送入网络进行训练。在训练过程中,使用mse损失函数最小化实际方位角度与标签方位角度之间的误差。分别采用adam和sgd两种优化算法迭代更新网络的权重,adam优化器应用于前两个训练周期内以加快网络的收敛速度;sgd优化器应用于剩余epoch中,可以对网络收敛进行精细化调节。两个优化器的学习率分别设置为0.0001和0.001。当达到设定的8个周期的迭代次数后,结束训练并保存训练完成的网络模型。根据仿真结果表示,网络的输出结果极其逼近数据标签,表明本发明克服了传统算法在低信噪比条件下目标方位估计性能严重退化的问题。
[0112]
s4、结合初步声源方位估计模型和目标域数据进行参数微调,得到最终声源方位估计模型。
[0113]
具体地,由于真实的海洋环境复杂多变,始终随时间和空间发生变化,在时间和空
间上具有很强的不均匀性,kraken模拟生成的声场信号并不能完美的符合实际海洋环境中单矢量水听器的接收信号。此外,简正波模型在真实海洋环境中自身存在偏差,声源信号和噪声信号的类型未知,这就使得仿真采用的数据集和残差神经网络在环境发生变化时性能严重下降,并不能对真实海洋环境中的声源进行精确定位,在真实应用中存在很大的局限性。因此,本步骤将用大量高质量仿真数据训练得到深度学习网络模型进行迁移,把网络整体架构迁移到全新的环境当中,重新使用新环境下的少量数据对网络进行微调更新,从而使网络在全新的环境中也有优秀的表现。
[0114]
s4.1、将初步声源方位估计模型中的网络参数迁移至目标网络并对目标网络中的全连接层进行初始化;
[0115]
s4.2、根据目标域数据对目标网络中的卷积层参数和全连接层参数进行训练更新,得到最终声源方位估计模型。
[0116]
本发明的网络迁移过程如下述:将训练好的卷积神经网络参数整体迁移到目标网络当中,对目标网络中的全连接层进行随机初始化,并使用目标域中的数据对卷积层参数进行更新,同时对全连接层进行训练,得到迁移之后的适用于全新场景的深度学习网络模型,使得原始的残差神经网络进行迁移后能够更好地适应全新的任务。网络迁移与修正后,其泛化能力和应用场景的适应性显著提高,并且极大地减少了时间成本和模型训练的难度。
[0117]
对resnet50残差神经网络进行迁移。迁移学习训练相关参数设置如下:训练的mini-batch-size设置为32组,每组数据共进行100次正向传播,一个epoch内网络参数共更新[1800/32]=57次。损失函数选择mse,由于最后一组输入网络的数据组数较少,因此在计算均方损失函数时对每组数据取平均值。使用adam优化器进行损失函数的反向传播和网络参数的更新。全连接层参数的学习率设置为0.0001。卷积层网络参数仅进行微调,因此卷积层参数更新的学习率设置为全连接层的十分之一。
[0118]
如附图6所示,实线代表目标的真实角度,在图中表示为一条梯度为1的正比例函数,圆点表示在各个入射角下方法的doa估计结果,圆点的密集程度和点距离实线的位置可以描述方法doa估计的性能。从结果图中可以看出,原本性能较好的残差神经网络进行迁移学习之后,估计结果均匀的分布在目标的真实角度。根据仿真结果可知,使用工作环境的少量数据对网络模型进行迁移可以极大的提升网络模型的估计性能,本发明有着很强的泛化能力。
[0119]
如图2所示,一种基于声矢量场的声源方位估计系统,包括:
[0120]
模型构建模块,用于构建矢量声场模型;
[0121]
数据仿真模块,基于基于矢量声场模型生成仿真数据并进行预处理,得到预处理后数据;
[0122]
网络训练模块,基于预处理后数据对预设的残差神经网络进行训练,得到初步声源方位估计模型;
[0123]
参数微调模块,用于结合初步声源方位估计模型和目标域数据进行参数微调,得到最终声源方位估计模型。
[0124]
上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也
相同。
[0125]
一种基于声矢量场的声源方位估计装置:
[0126]
至少一个处理器;
[0127]
至少一个存储器,用于存储至少一个程序;
[0128]
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如上所述一种基于声矢量场的声源方位估计方法。
[0129]
上述方法实施例中的内容均适用于本装置实施例中,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
[0130]
一种存储介质,其中存储有处理器可执行的指令,其特征在于:所述处理器可执行的指令在由处理器执行时用于实现如上所述一种基于声矢量场的声源方位估计方法。
[0131]
上述方法实施例中的内容均适用于本存储介质实施例中,本存储介质实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
[0132]
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本技术权利要求所限定的范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1