一种基于GAF-D3Net的单波束水下目标识别方法

文档序号:33097055发布日期:2023-02-01 00:06阅读:50来源:国知局
一种基于GAF-D3Net的单波束水下目标识别方法
一种基于gaf-d3net的单波束水下目标识别方法
技术领域
1.本发明属于信号处理、图像处理、人工智能技术领域,特别是涉及一种基于gaf-d3net的单波束水下目标识别方法。


背景技术:

2.水下目标识别是水声领域内的热点问题之一,也是实现目标检测的重要步骤。近年来,多波束成像声呐已经成为获取水下目标信息的重要工具。针对声呐图像目标识别的问题,早期主要采用分割算法结合手动提取特征,通过概率模型进行识别的方法,如sift特征、hog特征等图像几何特征结合svm、线性分类判别进行检测。但受限于人工设计的特征无法充分抽象出目标的关键信息,传统的识别方法准确率较低。随着深度学习的发展,研究者们对神经网络的研究不断深入,卷积神经网络被广泛地应用于计算机视觉,在图像分割、目标检测、目标识别等领域都发挥了巨大的作用。卷积神经网络能够自动提取输入数据集的高维特征,同时对输入信号的维度没有限制,但现有的复杂卷积神经网络模型大多使用二维图像作为输入,应用于一维信号的卷积神经网络模型很少。
3.常规多波束形成方法在生成声呐图像时,利用了多元阵的输出幅值,其大小也就代表了生成的声呐图像相应像素值的大小。在这个过程中舍弃了信号的相位信息,而相位中也有对目标识别有帮助的关键信息,因此会造成识别准确率的下降。同时波束图像会出现旁瓣干扰,很多情况下声呐图像的对比度低、边界模糊,因此,利用声呐图像进行检测和识别还有很多问题亟待解决。


技术实现要素:

4.本发明目的是为了解决目前存在的声呐图像成像效果不佳,信号相位信息缺失导致的识别精度低的问题,实现对水下目标的高精度识别,提出了一种基于gaf-d3net的单波束水下目标识别方法。该方法通过对接收到的单波束回波信号降维,减少运算量的同时保证了数据原有的时间变化趋势,保留了信号的相位信息。通过gaf编码将一维信号编码为二维图像,并根据水下目标gaf数据集的特性构建了gaf-d3net,实现了数据的分类识别。
5.本发明是通过以下技术方案实现的,本发明提出一种基于gaf-d3net的单波束水下目标识别方法,所述方法包括:
6.步骤一:对于采集得到的声呐回波信号数据,首先对数据进行预处理,完成目标区域筛选以及降维处理;
7.步骤二:对经过处理的声呐回波信号,使用格拉姆角场gaf编码为二维图像信号,生成格拉姆角差场gadf和格拉姆角和场gasf;
8.步骤三:构建gaf-d3net卷积神经网络结构,将gaf图像输入gaf-d3net中训练,实现图像的特征提取和分类判别。
9.进一步地,在步骤一中,
10.接收到的单波束回波信号包含了大量的无用信息,根据先验信息截取目标存在的
时域信号段;
11.对截取的时域信号段,根据分段聚合近似paa的方法降维,保证了时间序列的时间相关性,同时生成符合卷积神经网络训练尺寸的信号维度,具体形式如下:
[0012][0013]
其中,1≤m≤n,n表示该时域信号段的长度,信号表示为s=(s1,s2,...,sn);m是经过paa处理后的信号长度,将处理后的信号表示为s'=(s
′1,s'2,...,s'm);上式可以将原信号划分为长度均等的m个信号段,求取每个信号段的平均值,用该平均值表示这一段信号的特征值,将得到的m个特征值组成新的序列替换原始的时间序列以实现降维,m的值等价于后续编码生成的图像边长。
[0014]
进一步地,在步骤二中,使用格拉姆角场将时序信号编码为二维图像;首先通过归一化将信号范围聚集到[-1,1]之间,具体形式如下:
[0015][0016]
其中,归一化后的信号用表示,
[0017]
将数值编码为角余弦,时间戳编码为半径,具体形式如下:
[0018][0019][0020]
其中,φ是编码之后的角余弦,r是编码之后的半径,ti表示时间戳,n是时间戳的总长度。
[0021]
进一步地,通过内积的形式分别定义格拉姆角和场和格拉姆角差场,具体形式如下:
[0022][0023][0024]
式中,i是单位行向量,长度与归一化信号相同,将编码得到的角余弦代入上式,得到格拉姆角场的展开公式,具体形式如下:
[0025][0026][0027]
上式展示了一维信号通过gaf编码为二维图像的矩阵表示,矩阵的主对角线包含
了原始序列的完整信息,根据时间戳可知编码是从左上方到右下方逐步编码。
[0028]
进一步地,在步骤三中,构建gaf-d3net卷积神经网络结构进行训练,gaf-d3net分为特征提取模块和分类模块,其中特征提取模块包含五个卷积块。
[0029]
进一步地,同时使用gasf和gadf作为输入,在一定程度上扩充了训练数据集。
[0030]
进一步地,所述特征提取模块包含五个卷积块,具体构建如下:
[0031]
卷积块1,包括一个卷积层,卷积核3
×
3,填充为1,一个批归一化层,一个relu激活函数,通道数由3拓展到32;
[0032]
卷积块2,包括一个卷积层,卷积核3
×
3,填充为1,膨胀率为3,一个批归一化层,一个relu激活函数,一个最大池化层,通道数由32拓展到64;
[0033]
卷积块3,包括一个卷积层,卷积核3
×
3,填充为1,膨胀率为3,一个批归一化层,一个relu激活函数,一个最大池化层,通道数由64拓展到128;
[0034]
卷积块4,包括一个卷积层,卷积核3
×
3,填充为1,膨胀率为3,步长为2,一个批归一化层,一个relu激活函数,一个最大池化层,通道数由128拓展到256;
[0035]
卷积块5,包括一个卷积层,卷积核3
×
3,填充为1,膨胀率为3,步长为2,一个批归一化层,一个relu激活函数,通道数由256拓展到512。
[0036]
进一步地,所述分类模块包括一个自适应池化层,一个维度拉伸和一个线性层即全连接层;其中自适应池化层能够根据输入特征图大小自动设置参数;维度拉伸使用pytorch中的flatten函数实现,将经过自适应池化层的输出拉伸为一维向量,输入全连接层完成分类识别。
[0037]
进一步地,训练超参数设置学习率0.01,训练次数200次,损失函数选择交叉熵损失,同时使用余弦衰减来改变学习率。
[0038]
本发明的有益效果为:
[0039]
本发明提出的单波束水下目标识别方法,与传统的使用声呐图像进行识别的方法相比,本发明所述方法使用了原始回波信号,在处理中通过分段聚合近似以及极坐标变换,保留了信号的时间信息,避免了传统声呐图像只使用回波信号幅值而舍弃了相位信息的弊端。与人工设计特征对回波信号特征提取的方法相比,本发明所述方法通过gaf将信号编码为二维图像信号,设计了与之配套的卷积神经网络进行特征提取,从而提取到更加充分的高维特征,解决了由于对回波信号认知不充分导致的特征提取过程中信息损失的问题。通过泛化性测试,使用同一目标在不同时间相同姿态得到的数据,与经典神经网络结构进行对比,得知本发明所述方法有更好的泛化性,抗干扰能力更强。本发明所述方法更加适用于处理水下目标识别问题。
附图说明
[0040]
图1为本发明所述基于gaf-d3net的单波束水下目标识别方法的流程图;
[0041]
图2为格拉姆角场流程图;
[0042]
图3为gaf-d3net示意图;
[0043]
图4为gaf编码与声呐图像样例;
[0044]
图5为使用本发明所述不同膨胀率测试训练损失对比图;
[0045]
图6为使用本发明所述泛化性测试roc曲线对比图。
具体实施方式
[0046]
下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0047]
在主动声呐目标识别中,换能器基阵将声信号聚集,形成波束,产生的声信号经水下传播,遇到目标时产生回波信号,经换能器接收基阵阵元处理得到声呐图像。在生成声呐图像的过程中,只利用了接收信号的幅值,而舍弃了相位信息,因此会损失一定的关键信息,造成识别准确度的下降。同时,相比于传统光学图像,声呐图像受噪声影响较大,声呐图像表现出对比度低、目标边缘模糊、旁瓣干扰严重等特质,直接使用声呐图像做目标识别任务会遇到很多问题。
[0048]
结合图1-6,本发明提出一种基于gaf-d3net的单波束水下目标识别方法,所述方法包括以下步骤:
[0049]
s1:对于采集得到的声呐回波信号,由于其数据量较大,不利于直接处理,因此首先对数据进行预处理,完成目标区域筛选以及降维处理;
[0050]
s2:对经过处理的声呐回波信号,使用格拉姆角场(gramian angular field,gaf)编码为二维图像信号,生成格拉姆角差场(gadf)和格拉姆角和场(gasf);
[0051]
s3:对得到的gaf图像,包括gadf和gasf,构建gaf-d3net卷积神经网络结构,将gaf图像输入gaf-d3net中训练,实现图像的特征提取和分类判别。
[0052]
所述步骤s1对回波信号预处理,具体包括以下步骤:
[0053]
s1.1:对于单波束(单通道)声呐,直接对接收到的回波信号进行处理;对于多波束(多通道),将每个通道接收到的信号相加,构建具有自然指向性的单波束信号,对该单波束信号进行处理。单波束(单通道)回波信号中包含了大量的无用信息,根据先验信息截取目标存在的时域信号段;
[0054]
s1.2:对截取的时域信号段,根据分段聚合近似(piecewise aggregation approximation,paa)的方法降维,保证了时间序列的时间相关性,同时生成符合卷积神经网络训练尺寸的信号维度。具体形式如下:
[0055][0056]
其中,1≤m≤n,n表示该时序信号段的长度,该信号表示为s=(s1,s2,...,sn)。m是经过paa处理后的信号长度,将处理后的信号表示为s'=(s
′1,s'2,...,s'm)。上式可以将原信号划分为长度均等的m个信号段,求取每个信号段的平均值,用该平均值表示这一段信号的特征值。将得到的m个特征值组成新的序列替换原始的时间序列以实现降维,m的值等价于后续编码生成的图像边长。考虑到设计的卷积神经网络,输入图像的维度需要符合卷积神经网络的输入,这里的实例中选取m的值为224,最终编码生成大小为224
×
224的gaf图像。
[0057]
结合图2,所述步骤s2使用gaf将信号编码为二维图像,具体包括以下步骤:
[0058]
s2.1:经过paa降维的信号,通过归一化将信号范围聚集到[-1,1]之间,具体形式
如下:
[0059][0060]
其中,归一化后的信号用表示,
[0061]
s2.2:对s2.1得到的结果,将数值编码为角余弦,时间戳编码为半径,具体形式如下:
[0062][0063][0064]
其中,φ是编码之后的角余弦,r是编码之后的半径。ti表示时间戳,n是时间戳的总长度。经过上式编码的信号有两个特殊性质,其一是由于cos函数在[0,π]单调,给定时间序列,经过编码能够在极坐标系产生唯一的映射结果,具有唯一的逆映射。其次,与笛卡尔坐标系相比,编码后的信号转换到了极坐标系下,可以更好地保留时间相关性。
[0065]
s2.3:通过内积的形式,分别定义格拉姆角和场和格拉姆角差场,具体形式如下:
[0066][0067][0068]
上式中,i是单位行向量,长度与归一化信号相同。将s2.1和s2.2编码得到的角余弦代入上式,得到格拉姆角场的展开公式,具体形式如下:
[0069][0070][0071]
上式展示了一维信号通过gaf编码为二维图像的矩阵表示。根据时间戳可知编码是从左上方到右下方逐步编码,因此gaf编码能够提供一种保持时间相关性的方法。其次,矩阵的主对角线包含了原始序列的完整信息。
[0072]
结合图3,所述步骤s3构建gaf-d3net卷积神经网络结构,具体包括以下步骤:
[0073]
s3.1:gaf-d3net分为特征提取模块和分类模块,其中特征提取模块包括五个卷积块。
[0074]
当前主流的卷积神经网络模型如resnet、vgg等,主要应用于光学图像,在包括imagenet等数据集上进行训练和测试,这些数据集包括了上百万张图片和上千种类别。而由于水下目标数据集的局限性,数据集的数量和类别远远达不到上述复杂网络的标准。简单的数据集如果使用复杂的模型训练,得到的结果往往是过拟合。因此本发明设计了一个简易的gaf-d3net,具体结构如图3所示。gaf-d3net只使用5个卷积层和1个全连接层,同时
使用空洞卷积扩大感受野,降低计算复杂度。图5为空洞卷积膨胀率的测试结果,适宜的膨胀率可以加快模型收敛速度,提高网络的准确率,但过高的膨胀率会降低网络模型的性能,本发明选用膨胀率为3的空洞卷积层。下面是5个卷积块的具体构成:
[0075]
卷积块1,包括1个卷积层(卷积核3
×
3,填充为1),1个批归一化层,1个relu激活函数,通道数由3拓展到32。卷积块1的作用是拓展通道数,输出的特征图与输入特征图大小完全一致;
[0076]
卷积块2,包括1个卷积层(卷积核3
×
3,填充为1,膨胀率为3),1个批归一化层,1个relu激活函数,1个最大池化层(2
×
2,步长为2),通道数由32拓展到64;
[0077]
卷积块3,包括1个卷积层(卷积核3
×
3,填充为1,膨胀率为3),1个批归一化层,1个relu激活函数,1个最大池化层(2
×
2,步长为2),通道数由64拓展到128;
[0078]
卷积块4,包括1个卷积层(卷积核3
×
3,填充为1,膨胀率为3,步长为2),1个批归一化层,1个relu激活函数,1个最大池化层(2
×
2,步长为2),通道数由128拓展到256;
[0079]
卷积块5,包括1个卷积层(卷积核3
×
3,填充为1,膨胀率为3,步长为2),1个批归一化层,1个relu激活函数,通道数由256拓展到512;
[0080]
卷积块2-5使用了空洞卷积,这里使用空洞卷积能够在减少计算次数的同时获得更大的感受野,同时不会降低训练识别精度。
[0081]
s3.2:gaf-d3net分为特征提取模块和分类模块,其中分类模块主要包括以下结构:
[0082]
分类模块包括一个自适应池化层,一个维度拉伸,一个线性层(全连接层)。其中自适应池化层能够根据输入特征图大小自动设置参数。维度拉伸使用pytorch中的flatten函数实现,将经过自适应池化层的输出拉伸为一维向量,输入全连接层完成分类识别。
[0083]
所述步骤s3将gaf图像输入gaf-d3net中训练,具体包括以下步骤:
[0084]
s4.1:设置模型超参数,其中学习率为0.01,训练次数200次,损失函数选择交叉熵损失函数。在本发明中,使用了余弦衰减来降低学习率,因为随着训练的深入,设计的初始学习率无法满足当前的训练状态,往往学习率偏大,因此需要设置合适的学习率下降方法。
[0085]
s4.2:输入训练数据集,使用梯度下降法更新参数,优化损失函数;
[0086]
s4.3:每次训练结束得到模型,可以选择把每一次的结果都存下来,也可以选择与前一次结果对比,保留损失最低的那一个,在本发明中由于需要进行泛化性测试,保留了所有的训练结果。待训练次数达到设定次数或者损失函数不再下降,结束训练。
[0087]
下面阐述本发明的评价过程:
[0088]
在本实施例中,所得到的数据按照7:2:1的比例划分训练集、验证集和测试集,使用训练后的模型对测试集进行分类。分类结果的评估指标主要包括精准率(precision,p)、召回率(recall,r)、准确率(accuracy,acc)、f1,上述评估指标具体计算公式如下:
[0089][0090][0091]
[0092][0093]
其中tp表示样本种类和判别结果均为正样本的个数,fp表示样本本身为负样本,但错判为正样本的个数,tn表示样本种类和判别结果均为负样本的个数,fn表示样本本身为正样本,但错判为负样本的个数。
[0094]
测试使用经典神经网络识别声呐图像,与本发明所述的方法做对比,统计得到如下表所示的结果。
[0095][0096]
表中,数据编号1对应图4中的1)声呐图像,数据编号2对应图4中的2)gaf图像。由表可以看出,本发明对水下目标的识别准确率达到了99.65%,效果较为理想。
[0097]
使用同一物体同一姿态,在不同时间采集到的数据进行测试,图6绘制出测试结果的roc曲线,根据roc曲线与坐标系围成的面积auc可以判断出本发明所述方法的泛化性能是最优的。
[0098]
本发明的有益效果为:
[0099]
(1)使用单波束信号进行水下目标识别,解决了声呐图像只使用信号幅值信息而忽略了相位信息的问题,在一定程度上提高了识别准确率;
[0100]
(2)使用分段聚合近似结合格拉姆角场(gaf)编码回波信息,在实现降维的同时保证了序列的时间变化趋势,保留了信号的时间相关性,同时将信号编码为适合卷积神经网络训练的二维图像形式;
[0101]
(3)构建了gaf-d3net对gaf图像分类识别,该网络模型使用了空洞卷积来提高特征层的感受野,同时仅仅使用较少的卷积层和池化层,模型复杂度和计算量相对经典的神经网络架构很低,在泛化性测试上也有较好的效果。
[0102]
以上对本发明所提出的一种基于gaf-d3net的单波束水下目标识别方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1