基于卷积神经网络的水下目标特征提取方法与流程

文档序号:11293254阅读:1921来源:国知局
基于卷积神经网络的水下目标特征提取方法与流程

本发明涉及的是一种水下目标特征提取方法。



背景技术:

目前,关于水下目标特征提取主要有时域和频域两种方法,时域即从波形结构特征进行提取,时域分析主要基于以下理论:目标之间的结构、材料或是形状之间差异会反映在其回波形状上,目标差异越明显其波形结构差异越明显;此外回波的接收角度和目标的姿态不同,也会对时域的波形产生较大影响,这些差异也隐藏着目标之间的特性,即从波形结构里提取目标的分类特征。频域特征指将信号处理后得到的频谱特征,通过谱估计的方法对目标进行辨别,并从中进行目标特征参数提取,其方法包括有无参谱估计,参数化谱估计和高阶谱估计。但是在实际操作中,水下信号多为非平稳信号,频率变化较剧烈,还参杂着很多背景噪声。如果变换到频域空间上就会导致时序的结构信息丢失,不能完整的刻画出目标信号在时序上的长时结构特征。这就使得当前基于频域的水下目标特征提取方法的效果深受质疑。因此,如何把时域信号和频域信号有效的融合,实现基于信号融合的特征提取方法成为本发明需要解决的关键问题。

传统的cnn网络是一个具有多隐层的的深度神经网络结构。对这种网络进行如下描述:

卷积神经网络中每一层都是由多个二维特征图罗列而成,每个特征图中一个像素代表一个神经元节点。网络中把神经元节点分为卷积神经元和池化神经元。池化神经元组成二维池化特征图,其激活值对应特征图像素值,而池化特征图的组合又形成了池化层。卷积神经元、卷积特征图和卷积层之间存在类似的关系。cnn网络以卷积层和池化层交替栈式结构连接而成,网络将二维图像数据作为输入。区别于传统模式识别手段,样本的数据处理、特征提取以及分类流程都隐式的嵌入到这种深度互联结构的卷积网络中。一般情况下,卷积层又被称为特征提取层,前一层的某一局部感受野以适当大小输入到卷积层对应的神经元上,将这一过程称为提取局部特征,也就是说局部特征之间的位置关系较上一层的输入是未发生位置变化的;又将池化层称为特征映射层或下采样层,将每个特征图映射为一个平面。为了保持特征映射过程中特征的位移、旋转不变性,卷积层的激活函数通常采用激活值不易发散的sigmoid函数。另外,因为每个特征映射层上的神经元采用权值共享的原则,从而极大的减少了网络参数的数量,又避免了因过多的自由参数带来的过拟合现象。网络中每一个特征提取层(卷积层)后伴随着一个特征映射层(池化层),这种带有池化结构的网络,可以使得模型对原始数据具有很强的降噪和抗干扰能力。

池化层中某一区域内的多个神经元,只有激活值大的那个神经元才能起到强化权值的作用,这也符合了“最大值检出假说”。这种神经元在不断强化自身的同时还控制了周围神经元的输出结果,也就是特征映射图中提取到的特征为每个局部区域的相同特征。

卷积神经网络结构以原始图像作为网络输入,图中使用了4层网络结构,每层各个特征图中的相邻神经元以卷积核大小为单位,逐层将局部信息向下层传递,而下层则对传递过来的信息进行卷积运算即特征提取,如边缘特征或方向特征。网络的训练过程则是不断修改卷积核中参数的过程。而同一个卷积核是被特征图所共享的,可以视卷积核为一个可滑动的滤波器,扫描整个特征图的过程记为对某一特征进行提取的过程。而作为二次特征提取的池化层更像是模糊滤波器。可以理解为将众多杂糅在输入数据中的特征信息经过网络的过滤最终分散到了各个低分辨率特征图上。

二维图像中特征信息往往具有很强的隐蔽性,因为观测目标位置的变化,观察角度的不同等都会导致观测目标产生形变、位移甚至扭曲。然而用显式的方法将图像中具有位移、缩放和扭曲不变性的特征提取出来的难度又是巨大的,即使存在也不具有广泛的适用性。

针对这样的问题,cnn的特征检测机制则给出了很好的答案。cnn的每次卷积运算都是针对局部特征进行的提取,因而目标的位置变化或缩放变化都不会对特征提取过程产生影响,并且cnn这种隐式的提取过程使得模型具有广泛的适用性。大量训练数据中的不变性结构信息在网络的特征空间中逐层被提取出来。又因为其结构的特点能与逻辑回归分类器进行无缝的融合,实现了端到端的图像处理方法。其可以直接将图像输入到网络,并获得分类信息。避免了特征提取和分类之间的数据重构,而其中的特征提取过程隐藏在了网络结构当中。

由于特征图之间的权值是局部相连且权值共享的,基于这一特点可以将一个网络置于多个机器中同时进行训练实现并行的效果。其在计算和训练速度上明显优于其他全连接神经网络。

cnn网络模型的设计灵感来自于仿生学,其结构特点更接近生物神经网,所以在处理一些自然界的原始信号,如图像信息或声音信息时具有独特的优越性。

可以概括出,卷积神经网络较其他网络模型在特征提取方面有如下优势:

1、检测数据可以直接作为网络的输入数据,无需任何预处理过程;

2、端到端的数据处理过程,简化了数据重建的复杂度;

3、权值共享的策略,在减轻了训练负担的同时,为训练提供并行化的可能。

由于原始输入通过深层网络得到的深层特征数据都是以特征图的方式呈现出来,而三维特征最终又都会通过一维向量化即全连接的方式输入到全连接层进行分类处理,其中,全连接层和卷积层的主要区别是卷积层嵌入了有大量的空间信息,而全连接层则没有。卷积层的空间结构可以用一个3维张量来表示,其表示形式为h×w×d,其中,h,w表示卷积层中的一个卷积特征图的纵向神经元数目和横向神经元数目,d则表示层中特征图的数目。这种3维张量可以理解为卷积层将二维输入数据分解成了多个h×w的局部区域,而d维个这样的局部区域组成的集合一同描述着一种视觉模式。而全连接层将卷积层得到的出作为输入,但是会将3维的特征图进行向量化,得到的1维特征向量代表分类器的特征向量。在这一过程中,空间信息会丢失并且空间特征不能在softmax层得到恢复,进而影响到分类准确度,并且在网络不断反馈调节时会间接影响特征提取的质量。



技术实现要素:

本发明的目的在于提供一种简单直接,能弥补因全连接层的一维向量化所带来的空间信息丢失的基于卷积神经网络的水下目标特征提取方法。

本发明的目的是这样实现的:

1、将原始辐射噪声信号的采样序列s(n),分成25个连续部分,每个部分再设置25个采样点,其中25个连续部分之间允许有数据交叉重叠的部分,交叉重叠度设置为50%;

2、将第j段数据信号的采样样本mj(n)做归一化和中心化处理;

归一化处理:

l的取值设置为2的整数次幂;

中心化处理:

3、进行短时傅里叶变换经过变换后得到第j段数据信号的lofar图:

经过以上操作即得到完整的lofar图,将已经获得的lofar谱图作为卷积网络的输入,执行以下分步:

(1)在初始化阶段采用随机初始化参数方法为卷积网络中的权值进行赋值,并且确定网络参数调整方法为梯度下降方法,并设置网络训练终止条件,设置输出数据与标签数据的偏差阈值为0.07;

(2)将处理好的lofar图作为网络的输入矩阵,在前向传播阶段,输入矩阵通过两次交替的卷积和池化运算将特征图传递到了加权层,得到初步的特征图信息;

(3)在加权层为特征图进行加权,加权过程分为两部分:一个是spatial维度的加权,另一个是channel维度的加权;

4、获得两种权值向量后,将向量赋值到已有3维张量中;其具体的操作包括:为最后一层卷积层经过池化后的3维特征张量,k表示整个池化层中特征图的个数,w,h为每个特征图的平面维度,xkij为3维特征张量中第k个特征图中第(i,j)个像素值,为加权之后的3维特征张量,x'kij表示加权后的3维张量中第k个特征图下的第(i,j)个特征像素其获得方式是通过将已经计算好的空间权重因子αij、通道权重因子βk与特征像素xkij三者相乘,

x'kij=αijβkxkij

最后在对χ'的每个特征图进行加和池化操作,将3维的带权特征张量聚合成一个一维的特征向量f={f1,f2,...,fk},其中fk计算为式,

通过以上的处理将3维的带权特征张量聚合成一个一维的特征向量;

5、将得到特征向量输入到全连接层进行分类并计算与标签数据的误差,检查损失误差是否低于误差阈值,若低于则停止网络训练,否则进入步骤6;

6、使用梯度下降方法对网络从后向前逐层进行参数调整,并转入步骤2。

本发明提出了一个简单直接的方法,来弥补上面所提到的因全连接层的一维向量化所带来的空间信息丢失。

在最后一个特征图层向量化之前,本发明将会强化特征图层的空间信息,使得这种空间信息可以输入到最后的全连接层中。强化的角度则会从通道(channel)和空间(spatial)两个维度来增强,最后聚合为一维向量输入到全连接层。

强化特征图层空间信息的方法主要是,首先假设不同的特征图之间的重要程度是不一样的,比如有的特征图中包含的信息会比较单一,而有的会因为某些特征信息的数据表示是非线性和线性不可分的,所以经过深层过滤后的特征图里仍然包含许多信息。同样,每个特征像素的重要程度也是有区分的。基于以上想法,本发明将给予不同特征图和特征像素赋予权值,来强化空间结构信息,进而提取高质量的数据特征。

首先针对多维加权算法的步骤和流程进行说明。在具体的赋权过程中,假设已经得到在一次前向传播过程中的最终特征图层,对该特征图层进行多维加权流程如下:

1、局部池化:

对最后一层卷积层的每个特征图使用局部池化操作,池化窗口大小为w×h,窗口滑动步长为s。经过池化后得到一个3维张量。

2、计算空间(spatial)权重因子:

对池化后的特征图上的每个特征像素都指派一个权重αij,对应特征图上的第(i,j)个像素。

3、计算通道(channel)权重因子:

对于池化后的每个特征图即通道k,都赋予一个权重βk。(详细计算通道权重过程将在3.3.2中介绍)

4、加权计算:

将上两步计算得到的空间权值和通道权值赋予到其对应的位置上,最后得到一个带权的3维张量。

5、向量归一化:

针对以上数据进行归一化处理,得到聚合后的多维加权特征向量。

经过以上5步处理好的向量称为多维加权特征向量。在以上流程中,将最后一层卷积层进行池化操作的目的是为了起到特征二次提取的作用。同时,该池化操作方法还可以有效的降低待处理的数据规模。

接下来是加权过程。

在完成以上操作,获得两种权值向量后,需要将向量赋值到已有3维张量中。其具体的操作是,首先定义为最后一层卷积层经过池化后的3维特征张量。k表示整个池化层中特征图的个数,w,h为每个特征图的平面维度。定义xkij为3维特征张量中第k个特征图中第(i,j)个像素值。定义为加权之后的3维特征张量,x'kij表示加权后的3维张量中第k个特征图下的第(i,j)个特征像素,而其获得方式是通过将已经计算好的空间权重因子αij、通道权重因子βk与特征像素xkij三者相乘。如下式。

x'kij=αijβkxkij

最后在对χ'的每个特征图进行加和池化操作,将3维的带权特征张量聚合成一个一维的特征向量f={f1,f2,...,fk},其中fk计算为式。

通过以上的处理,已经将3维的带权特征张量聚合成一个一维的特征向量。下一步需要针对得到的特征向量f做归一化处理后再连入全连接层,进行聚合的主要目的就是为了减少全连阶层的输入规模,进而减少了需要训练的网络连接权值,从而避免过拟合现象发生。然后再将特征向量做归一处理,就是得到了最终的多维加权特征向量。

接下来具体介绍两种权值的计算过程。

针对多维加权算法中的空间权重和通道权重,本发明主要采取了两种无参数化的空间权重因子和通道权重因子的计算方法,其中无参数化指的是不会对卷积网络带来额外的参数,而使其影响到网络的训练效率和可能发生的过拟合现象。

根据神经认知机对可塑性突触的形成的假设:如果在神经元y的近旁存在有比y更强的激活神经元y',则从x至y的突触连接就不进行强化。这也就是说,这种突触连接的强化应符合“最大值检出假说”,即在某一小区域(称之为邻域)内存在的一神经元集合中,只有输出最大的神经元才发生输入突触的强化。

从以上理论可以理解为,激活值越大的神经元对其附近的连接权值影响越大,其重要程度也就越大。那么定义ck为3维特征张量χ中的第k个特征图,为特征张量中所有特征图的累加,即如式。

通过式上面的式子得到了初步的空间权值矩阵,其含义为将不同特征图的同一位置激活值xkij进行叠加,从而反映出平面空间上某一位置累计激活值的强度,即强度越大该位置也就越重要,该位置对应αij的值也就应该越大,之后就是对s进行归一化操作,得到最终的权值矩阵a,此处的归一化处理选取的是含有两个超参的归一化函数:

其中sij表示s中第(i,j)个像素值,可调参数a,b的选取,可以根据网络训练情况而定。

对于面向通道上的权值向量的选取,本发明提出了一种基于图像熵的加权算法。因为某些特征信息的数据表示是非线性和线性不可分的,所以经过深层过滤后的特征图里仍然包含许多信息。因此对于每个特征图的重要程度可以用其中含有的信息量多少进行分析。

衡量信息多少的信息熵是从整个信息来源的统计特性上进行分析获得的。它是从平均意义上来反映信源的总体特性。对于某特定的信源,其信息熵只有一个。不同统计特性的信息来源,其信息熵也会有相应的变化。针对未知性较大的变量,其信息熵的个数也相对较多。

鉴于信息熵以上特性,本发明将引入图像熵的思想来衡量特征图中信息量的多少。虽然图像熵指的是整个图像中的平均信息量,但是一维的图像熵只能反映出图像中灰度分布的聚集情况。并不能表现出信息在空间的分布特征。因此本发明为了能与特征图相适应且同时反映出特征图中信息的空间分布特征,本发明采用了二维图像熵的方法来解决该问题。在具体操作上,本发明选择特征图的邻域激活均值作为激活值分布的空间特征量,与特征图内某一像素的激活值组成特征二元组。

但是图像熵中的灰度值是一个离散化的数值,而特征图中激活值是通过连续的激活函数得到的,所以再计算特征图的图像熵之前,本发明采用等宽离散化的方法对特征图重新处理,实现连续数据的离散化。其中对每个像素点的激活值处理如式所示。

其中x为某像素点的激活值,xmin,xmax为激活函数有效的下界和上界,m为离散后的区间长度。定义(i,j)为离散化后的特征二元组其中i(0≤i≤m)为特征像素的离散激活值,j(0≤j≤m)为离散化后的特征图邻域激活均值。第k个特征图的熵值为hk,具体计算如下式所示,

其中

而f(i,j)表示特征二元组(i,j)出现的频数,hw为特征图像尺度大小。至此给出的特征图熵值计算公式既反映出了特征图中所含信息量的多少,又强调了特征图中激活值与其邻域的信息分布情况。最后再对所有特征图的熵值进行归一化处理,即如式。

上面部分介绍了为了增强卷积特征图中的空间信息而引入的一种新的多维特征加权算法以及该算法的计算方式。

本发明利用lofar谱图实现了两种信号的有效融合,lofar谱图保留了信号在时间和频率两个维度的信息。即将一个连续时间段内的信号分成多个帧,对每一帧内的信号求其功率谱,最后将多个功率谱以时间顺序展开。并利用深度学习知识,隐式的提取目标特征,减少了人工参与的工作。所以,本发明针对lofar谱图使用卷积神经网络(convolutionalneuralnetwork,cnn)对目标进行时频特征分析,提取能够反映时间结构和频率信息的特征。

本发明主要工作是针对传统cnn网络进行研究与改进。cnn网络中的卷积过程能过程能够提取出原始图像或声音信号中的局部特征信息,并且效果良好,得到了广泛的应用。

本发明的有益效果为:

本发明方法的识别率与传统卷积神经网络算法相比,对特征图层进行了空间信息多维度的加权操作,来弥补上面所提到的因全连接层的一维向量化所带来的空间信息丢失的缺陷。

在利用lofar图谱进行目标识别时,结合了特征图多维度加权算法的卷积神经网络的识别率更加准确,将识别率提高到75%左右。

附图说明

图1为本发明的加权过成图;

图2为本发明的流程图;

图3为卷积网络结构图;

图4a与图4b为感受野大小与滤波器数量两组实验方案;

图5a与图5b为参数实验效果对比图;

图6为对比实验收敛效果图。

具体实施方式

下面举例对本发明做更详细的描述。

对原始噪声信号进行时频域的转换生成能够表示时频域信息的lofar谱图。具体处理过程为:

1、定义s(n)为原始辐射噪声信号的采样序列,将其分成25个连续部分,每个部分再设置25个采样点。其中25个连续部分之间允许有数据交叉重叠的部分,交叉重叠度设置为50%。

2、定义mj(n)为第j段信号的采样样本,并对其做归一化和中心化处理,其目的是让辐射噪声信号的幅值在时间上分布均匀和达到去直流使样本的均值为零。

归一化处理:

为了便进行傅里叶变换的计算,将l的取值设置为2的整数次幂。

中心化处理:

3.定义为短时傅里叶变换,经过变换后得到第j段数据信号的lofar图:

将以上获得的各段数据的功率谱按时间顺序依次展开,即得到完整的lofar图。

上述即为lofar图获取的一般步骤,虽然lofar谱图是二维的图像,横轴表示时间,纵轴表示频率,但反映的却是三维的信息。可以用灰度值的大小来表示在该时间和该频率下的能量大小。

将已经获取lofar谱图作为卷积网络的输入,带有特征图加权的网络的具体结构如图3。

(1).在初始化阶段采用随机初始化参数方法为卷积网络中的权值进行赋值,并且确定网络参数调整方法为梯度下降方法,即网络反向传播训练阶段使用梯度下降方法收敛整个网络。并设置网络训练终止条件,设置输出数据与标签数据的偏差阈值为0.07。

(2).将处理好lofar图作为网络的输入矩阵。在前向传播阶段,输入矩阵通过两次交

替的卷积和池化运算将特征图传递到了加权层。此时得到了初步的特征图信息。

(3).为实现增强特征图空间信息在加权层为特征图进行加权,加权过程大致分为两大

部分:一个spatial维度的加权一个channel维度的加权。

根据神经认知机对可塑性突触的形成的假设:如果在神经元y的近旁存在有比y更强的激活神经元y',则从x至y的突触连接就不进行强化。这也就是说,这种突触连接的强化应符合“最大值检出假说”,即在某一小区域(称之为邻域)内存在的一神经元集合中,只有输出最大的神经元才发生输入突触的强化。

从以上理论可以理解为,激活值越大的神经元对其附近的连接权值影响越大,其重要程度也就越大。那么定义ck为3维特征张量χ中的第k个特征图,为特征张量中所有特征图的累加,即如式。

通过式上面的式子得到了初步的空间权值矩阵,其含义为将不同特征图的同一位置激活值xkij进行叠加,从而反映出平面空间上某一位置累计激活值的强度,即强度越大该位置也就越重要,该位置对应αij的值也就应该越大,之后就是对s进行归一化操作,得到最终的权值矩阵a,此处的归一化处理选取的是含有两个超参的归一化函数:

其中sij表示s中第(i,j)个像素值,设置可调参数α=0.5,b=1。

对于面向通道上的权值向量的选取,本发明提出了一种基于图像熵的加权算法。因为某些特征信息的数据表示是非线性和线性不可分的,所以经过深层过滤后的特征图里仍然包含许多信息。因此对于每个特征图的重要程度可以用其中含有的信息量多少进行分析。

衡量信息多少的信息熵是从整个信息来源的统计特性上进行分析获得的。它是从平均意义上来反映信源的总体特性。对于某特定的信源,其信息熵只有一个。不同统计特性的信息来源,其信息熵也会有相应的变化。针对未知性较大的变量,其信息熵的个数也相对较多。

鉴于信息熵以上特性,本发明将引入图像熵的思想来衡量特征图中信息量的多少。虽然图像熵指的是整个图像中的平均信息量,但是一维的图像熵只能反映出图像中灰度分布的聚集情况。并不能表现出信息在空间的分布特征。因此本发明为了能与特征图相适应且同时反映出特征图中信息的空间分布特征,本发明采用了二维图像熵的方法来解决该问题。在具体操作上,本发明选择特征图的邻域激活均值作为激活值分布的空间特征量,与特征图内某一像素的激活值组成特征二元组。

但是图像熵中的灰度值是一个离散化的数值,而特征图中激活值是通过连续的激活函数得到的,所以再计算特征图的图像熵之前,本发明采用等宽离散化的方法对特征图重新处理,实现连续数据的离散化。其中对每个像素点的激活值处理如式所示。

其中x为某像素点的激活值,xmin,xmax为激活函数有效的下界和上界,设置m=255为离散后的区间长度。定义(i,j)为离散化后的特征二元组其中i(0≤i≤m)为特征像素的离散激活值,j(0≤j≤m)为离散化后的特征图邻域激活均值。第k个特征图的熵值为hk,具体计算如下式(3-6)所示。

其中

而f(i,j)表示特征二元组(i,j)出现的频数,hw为特征图像尺度大小。至此给出的特征图熵值计算公式既反映出了特征图中所含信息量的多少,又强调了特征图中激活值与其邻域的信息分布情况。最后再对所有特征图的熵值进行归一化处理,即如式。

上面部分介绍了新的多维特征加权算法以及该算法的计算方式。

4、在完成以上操作,获得两种权值向量后,需要将向量赋值到已有3维张量中。其具体的操作是,首先定义为最后一层卷积层经过池化后的3维特征张量。k表示整个池化层中特征图的个数,w,h为每个特征图的平面维度。定义xkij为3维特征张量中第k个特征图中第(i,j)个像素值。定义为加权之后的3维特征张量,x'kij表示加权后的3维张量中第k个特征图下的第(i,j)个特征像素,而其获得方式是通过将已经计算好的空间权重因子αij、通道权重因子βk与特征像素xkij三者相乘。如下式。

x'kij=αijβkxkij

最后在对χ'的每个特征图进行加和池化操作,将3维的带权特征张量聚合成一个一维的特征向量f={f1,f2,...,fk},其中fk计算为式。

通过以上的处理,已经将3维的带权特征张量聚合成一个一维的特征向量。

5、将得到特征向量输入到全连接层进行分类并计算与标签数据的误差。检查损失误差是否低于误差阈值,若低于则停止网络训练。否则进入步骤6。

6、使用梯度下降方法对网络从后向前逐层进行参数调整,因为加权层没有引入额外参数,所以整个调整过程与传统卷积网络无异。并转入步骤2。

实验结果与分析:

(一)数据集的选取

本章节将以仿真的形式,现假定目标噪声由线谱和连续谱组成且符合平稳态随机过程,其中线谱通常分布在1khz以下的低频端。并将多组具有随机相位的正弦波作为目标信号的线谱分量。即表示为下式。

其中k为线谱数量,ak为第k条线谱的幅度,fk为线谱频率,φk为随机的相位。在模拟不同的信号时,fk控制在1khz以内。为了模拟真实环境下的噪声情况,在仿真的时序信号中混入幅值不同的高斯白噪声。

结果及分析

(1)感受野大小和滤波器数量对算法的影响

在卷积网络中,感受野大小和滤波器数量影响特征提取的质量与效率,所以它们的取值对算法有很大的影响。在实验中,设置多组不同实验方案进行对比如图5a与图5b,从效果对比图中可以看出,感受野粒度细实验效果越好,以及滤波器越多实验效果越好。

(2)加权cnn算法和传统cnn算法的对比

将本发明提出加权cnn与传统卷积网络以及ricnn进行对比,网络收敛效果如图6。从

图中可以看出,带有加权cnn的网络模型的收敛速度要优于其它两种网络模型。

结论:

本发明的改进算法在传统的卷积神经网络基础上,主要做了以下改进:

卷积网络中卷积池化部分的特征图在进入全连接层时,会造成空间信息的丢失,为了弥补空间特征信息,本发明提出了多维特征加权算法,通过给通道维度和空间维度的信息赋予一定的权值来进行特征图层的空间强化,对于通道维度的强化思想是利用图像熵理论为每个通道上的特征图进行熵值计算。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1