目标识别方法、装置、计算机设备和存储介质与流程

文档序号:23384735发布日期:2020-12-22 13:49阅读:101来源:国知局
目标识别方法、装置、计算机设备和存储介质与流程

本申请涉及图像识别技术领域,尤其涉及一种目标识别方法、装置、计算机设备和存储介质。



背景技术:

随着当今科技的快速发展,合成孔径雷达(syntheticapertureradar,sar)图像在各个领域尤其是军事领域发挥越来越多的作用,越来越多的学者将研究重心集中在基于sar图像的目标识别方法上。

目前,基于sar图像的目标识别方法主要包括两个过程:图像预处理和图像目标识别。其中的图像预处理过程主要包括灰度值归一化、能量归一化、尺寸裁剪等预处理步骤;图像目标识别过程主要包括:利用预设的图像识别网络模型对经过预处理后的sar图像进行目标物体的识别,得到包括目标物体的识别结果。

但是,上述基于sar图像的目标识别方法存在识别准确性低的问题。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够有效提高识别准确性的目标识别方法、装置、计算机设备和存储介质。

第一方面,一种目标识别方法,所述方法包括:

以原始图像的质心为中心进行扩展,从原始图像中提取出感兴趣区域图像;感兴趣区域图像的尺寸小于预设阈值;

将感兴趣区域图像输入至预设的图像识别网络中,得到感兴趣区域图像的特征向量;图像识别网络是基于增广样本集训练得到的网络,增广样本集中包括原始样本图像和对原始样本图像进行图像数据增广处理后的图像;

将特征向量输入至预设的分类器中,得到目标物体的分类结果。

在其中一个实施例中,所述从原始图像中提取出感兴趣区域图像,包括:

确定原始图像的质心;

以质心为中心,按照预设尺寸对原始图像进行图像采集,得到感兴趣区域图像。

在其中一个实施例中,所述图像识别网络的训练过程包括:

获取多个原始样本图像;

对多个原始样本图像进行处理,得到多个处理后的样本图像,以构建所述增广样本集;

将增广样本集中的多个样本图像输入至初始图像识别网络,训练初始图像识别网络,得到图像识别网络。

在其中一个实施例中,所述对多个原始样本图像进行处理包括图像旋转处理和/或对图像增加随机噪声。

在其中一个实施例中,所述对多个原始样本图像进行处理包括图像旋转处理,对多个原始样本图像进行处理,得到多个处理后的样本图像,包括:

按照预设旋转方向和预设角度旋转各所述原始样本图像,得到所述多个处理后的样本图像。

在其中一个实施例中,所述对多个原始样本图像进行处理包括对图像增加随机噪声,对多个原始样本图像进行处理,得到多个处理后的样本图像,包括:

从预设数值范围内随机选取一个数值作为修正数值;

在各原始样本图像中的各像素值上增加修正数值,得到多个处理后的样本图像。

在其中一个实施例中,所述对多个原始样本图像进行处理包括图像旋转处理和对图像增加随机噪声,对多个原始样本图像进行处理,得到多个处理后的样本图像,包括:

从预设数值范围内随机选取一个数值作为修正数值;

在各原始样本图像中的各像素值上增加修正数值,得到多个修正后的图像;

按照预设旋转方向和预设角度旋转各修正后的图像,得到多个处理后的样本图像。

在其中一个实施例中,所述对多个原始样本图像进行处理包括图像旋转处理和对图像增加随机噪声,对多个原始样本图像进行处理,得到多个处理后的样本图像,包括:

按照预设旋转方向和预设角度旋转各原始样本图像,得到多个旋转后的样本图像;

从预设数值范围内随机选取一个数值作为修正数值;

在各旋转后的样本图像中的各像素值上增加修正数值,得到多个处理后的样本图像。

在其中一个实施例中,所述图像识别网络包括第一卷积层和第二卷积层;第一卷积层用于使用预设尺寸的卷积核对所述感兴趣区域图像进行卷积操作,第二卷积层用于使用预设尺寸的卷积核对激活函数层输出的图像进行卷积操作;所述预设卷积核尺寸阈值。

第二方面,一种目标识别装置,所述装置包括:

提取模块,用于以原始图像的质心为中心进行扩展,从原始图像中提取出感兴趣区域图像;感兴趣区域图像包含待识别的目标物体;

识别模块,用于将感兴趣区域图像输入至预设的图像识别网络中,得到感兴趣区域图像的特征向量;图像识别网络是基于增广样本集训练得到的网络,增广样本集中包括原始样本图像和对原始样本图像进行图像数据增广处理后的图像;

分类模块,用于将特征向量输入至预设的分类器中,得到目标物体的分类结果。

第三方面,一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现第一方面任一实施例所述的目标识别方法。

第四方面,一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面任一实施例所述的目标识别方法。

本申请提供的一种目标识别方法、装置、计算机设备和存储介质,通过以原始图像的质心为中心进行扩展,从原始图像中提取出感兴趣区域图像,并将感兴趣区域图像输入至预设的图像识别网络中,得到感兴趣区域图像的特征向量;再将特征向量输入至预设的分类器中,得到目标物体的分类结果。其中的图像识别网络是基于增广样本集训练得到的网络,而增广样本集中包括原始样本图像和对原始样本图像进行图像数据增广处理后的图像。在上述过程中,由于对原始样本图像进行了图像数据增广处理,因此训练图像识别网络时的样本图像数据集得到了极大的增强,使样本图像数据集中包含的数据量增多,以及提升了图像数据集的多样性,避免了因样本图像数据集中的图像数量有限和单一性致使在训练过程中容易出现过拟合的现象,从而提高了训练好的图像识别网络的识别准确性。另外,感兴趣区域图像的尺寸小于预设阈值,说明感兴趣区域图像的尺寸较小,使感兴趣区域图像中包含目标物体的比例增大,减少了图像背景噪声的影响,更好的使图像识别网络在训练学习的过程中学习到有用的信息,进而提高了图像识别网络的识别能力。

附图说明

图1为一个实施例提供的一种应用场景示意图;

图2为一个实施例提供的一种目标识别方法的流程图;

图3a为图2实施例中s101的一种实现方式的流程图;

图3b为一个实施例提供的一种提取感兴趣区域图像的效果示意图;

图4为一个实施例提供的一种图像识别网络的训练方法的流程图;

图5为一个实施例提供的一种图像数据增广方法的流程图;

图6为一个实施例提供的一种图像数据增广方法的流程图;

图7为一个实施例提供的一种图像数据增广方法的流程图;

图8为一个实施例提供的一种卷积神经网络的结构示意图;

图9为一个实施例提供的一种网络结构的示意图;

图10为一个实施例提供的另一种网络结构的示意图;

图11为一个实施例提供的一种目标识别方法的总流程图;

图12为一个实施例提供的一种目标识别装置的结构示意图;

图13为一个实施例提供的一种目标识别装置的结构示意图;

图14为一个实施例提供的一种目标识别装置的结构示意图;

图15为一个实施例提供的一种计算机设备的内部结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本申请,并不用于限定本申请。

本申请提供的目标识别方法,可以应用于如图1所示的应用环境中,其中,终端与合成孔径雷达连接,合成孔径雷达用于获取sar图像,并将该sar图像传送给终端,终端设备用于对sar图像进行解析,以识别sar图像中的目标物体。上述终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。

下面将通过实施例并结合附图具体地对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。

图2为一个实施例提供的一种目标识别方法的流程图,该方法的执行主体为图1中的终端,该方法涉及的是终端对原始图像中的目标物体进行识别的具体过程。如图2所示,该方法包括:

s101、以原始图像的质心为中心进行扩展,从原始图像中提取出感兴趣区域图像;感兴趣区域图像的尺寸小于预设阈值。

其中,原始图像为待识别的图像,具体可以为通过合成孔径雷达扫描任意周围环境得到的sar图像,或是通过其它类型能够扫描周围环境的扫描设备得到的扫描图像。感兴趣区域图像为包含待识别目标物体的图像,其尺寸小于预设阈值,预设阈值可以根据实际应用需求确定,一般该预设阈值小于原始图像的尺寸,当该预设阈值取值较小时,相当于感兴趣区域图像的尺寸取值较小。例如,若原始图像为128×128的图像,则对应的感兴趣区域图像的尺寸可以为49×49,需要说明的是,49×49是较优选择,本方案也可以选择其它尺寸,对此本实施例不做限制。另外,上述感兴趣区域图像中包含目标物体的数量可以是一个,也可以是多个,对此本实施例不做限制。

在本实施例中,终端可以通过各种类型的雷达获取原始图像,可选的,终端也可以通过特定数据库获取原始图像,例如,mstar数据库,对此本实施例不做限制。在实际应用中,当终端获取到原始图像后,可以直接采用预设的图像提取方法从该原始图像中提取出特定尺寸的感兴趣图像,也可以先对原始图像进行诸如灰度值归一化、滤波等处理,再采用预设的图像提取方法从处理后的图像中提取出特定尺寸的感兴趣图像。特别说明的是,本实施例中的感兴趣区域图像可以通过质心定位的方式获取得到,即以原始图像的质心为中心扩展得到一个区域图像,并将该区域图像作为感兴趣区域图像。

s102、将感兴趣区域图像输入至预设的图像识别网络中,得到感兴趣区域图像的特征向量;图像识别网络是基于增广样本集训练得到的网络,增广样本集中包括原始样本图像和对原始样本图像进行图像数据增广处理后的图像。

其中,图像识别网络用于对输入的感兴趣区域图像进行特征提取得到感兴趣区域图像中的特征向量,其具体可以是卷积神经网络,或是其它类型的神经网络,只要能够从感兴趣区域图像中提取出特征向量即可。原始样本图像的形式和内容与前述原始图像的形式和内容一致,具体内容请参见前述内容,在此不做重复说明。增广样本集为需要训练得到图像识别网络时使用到的训练样本图像集合,其中包含的样本图像的数量大于原始样本图像的数量。图像数据增广处理为一种图像处理方法,具体可以为一种图像滤波处理,可选的,也可以为一种图像噪声处理,可选的,还可以为一种图像变形处理。

在本实施例中,当终端获取到原始样本图像,并对原始样本图像进行图像数据增广处理后,得到包含原始样本图像和经过图像数据增广处理后的图像的增广样本集。终端再进一步的将增广样本集输入至待训练的图像识别网络中进行训练,得到训练好的图像识别网络。然后,在实际测试中,终端可以将从原始图像中提取出的感兴趣区域图像输入至已经训练好的图像识别网络中,得到该感兴趣区域图像的特征向量,以便之后根据该特征向量实现对目标物体的识别。上述分类结果为描述目标物体类型的结果,例如,目标物体是建筑物还是其它类型的物体。

s103、将特征向量输入至预设的分类器中,得到目标物体的分类结果。

其中,分类器用于对特征向量进行分类,其具体可以为svm分类器。在实际应用中,当终端通过前述图像识别网络得到特征向量后,可以进一步的将特征向量输入至待训练的分类器中进行训练,得到训练好的分类器。在实际测试中,终端将通过图像识别网络得到的特征向量输入至分类器中进行目标物体的分类,得到关于目标物体的分类结果。

上述实施例提供的目标识别方法,通过从原始图像中提取出感兴趣区域图像,并将感兴趣区域图像输入至预设的图像识别网络中,得到感兴趣区域图像的特征向量;再将特征向量输入至预设的分类器中,得到目标物体的分类结果。其中的图像识别网络是基于增广样本集训练得到的网络,而增广样本集中包括原始样本图像和对原始样本图像进行图像数据增广处理后的图像。在上述过程中,由于对原始样本图像进行了图像数据增广处理,因此训练图像识别网络时的样本图像数据集得到了极大的增强,使样本图像数据集中包含的数据量增多,以及提升了图像数据集的多样性,避免了因样本图像数据集中的图像数量有限和单一性致使在训练过程中容易出现过拟合的现象,从而提高了训练好的图像识别网络的识别准确性。另外,感兴趣区域图像的尺寸小于预设阈值,说明感兴趣区域图像的尺寸较小,使感兴趣区域图像中包含目标物体的比例增大,减少了图像背景噪声的影响,更好的使图像识别网络在训练学习的过程中学习到有用的信息,进而提高了图像识别网络的识别能力。

在一种应用场景中,终端无论通过任何方式获取到的原始图像都会受到光照、拍摄设备的硬件条件限制等因素影响,使原始图像有噪声、对比度不同等缺点,如果不进行图像预处理,则后续从原始图像中提取出的特征会包含噪声信息,从而影响识别效果。例如,对于sar图像来说,在合成孔径雷达捕获目标的时候,由于其特殊的成像原理,导致sar图像中有很多背景杂波,而地面目标在雷达成像中占有很少的比例。由于背景噪声以及目标物体占有很小比例的问题存在,如果直接拿原始sar图像进行识别或者特征提取,将会使特征中含有很多噪声信息,从而对sar图像自动目标识别造成很多负面影响。因此,对sar图像进行预处理达到减轻sar图像中背景杂波的不良影响是十分有必要的。

因此,基于上述描述,本发明提供了一种简单的预处理方法,即质心定位方法,从而使原始图像的背景噪声减小。该质心定位方法包含在上述s101“以原始图像的质心为中心进行扩展,从原始图像中提取出感兴趣区域图像”的步骤中,如图3a所示,图3a为图2实施例中s101的一种实现方式的流程图,该步骤包括:

s201、确定原始图像的质心。

本实施例涉及原始图像的质心的确定方法,可选的,具体可以采用关系式(1)和关系式(2)计算得到:

其中,mpq为一阶矩;当p=0,q=0时,mpq为零阶矩,(x,y)为图像任一像素的位置,f(x,y)表示像素的灰度值,(xcyc)表示质心。

本实施例中,当终端获取到原始图像时,可以将原始图像中的各像素的灰度值和坐标位置代入到采用关系式(1)和关系式(2)中,计算得到原始图像的质心,以便接下来根据该质心获取特定尺寸的感兴趣区域图像,尽可能多的去除原始图像中的背景噪声。

s202、以质心为中心,按照预设尺寸对原始图像进行图像采集,得到感兴趣区域图像。

其中,预设尺寸可以根据实际应用需求确定,本实施例中的预设尺寸为l×l,l=49。

当终端确定了原始图像的质心后,可以进一步的以该质心为中心点,按照l×l的采样尺寸分别从中心点周围的各个方向上采集原始图像上的数据,得到感兴趣区域图像,使感兴趣区域图像能够包含尽可能多的目标物体,尽可能少的非目标物体。可选的,终端在确定了原始图像的质心后,也可以以质心为中心点,分别向中心点四周扩展出一个l×l的图像矩阵。该l×l的图像为原始图像的感兴趣区域。例如,以mstar数据库为例,其原始图像的大小为128*128,确定了该原始图像的质心后,提取出的感兴趣区域图像为49*49,如图3b所示,其中a为原始图像,b为感兴趣区域图像。

上述实施例涉及的根据质心定位方式确定感兴趣区域图像的方法,因得到的感兴趣图像的尺寸较小,以及包含的目标物体的比例较大,所以能够极大的减少原始图像的背景噪声,且该方法简单实用以及应用性广,从而使根据该感兴趣图像进行目标识别的方法,可以提高目标识别的准确性。

基于图2实施例的描述可知,其中的图像识别网络是经过预先训练得到的网络,而在训练的过程中,训练样本的数据量和多样性是十分重要的,有限的图像数据或单一的图像数据会给后续的网络学习带来数据的局限性,容易使网络学习过程中出现过拟合。特别针对sar图像,因为获取渠道单一,因此sar图像的数据集数据量较少且单一,因此,本发明提供了一种增加训练样本集中图像数据量和图像多样性的方法,以及基于增广样本集的训练方法,接下来的实施例上述这两种方法。

图4为一个实施例提供的一种图像识别网络的训练方法的流程图,如图4所示,该方法包括:

s301、获取多个原始样本图像。

本实施例涉及的是获取原始样本图像的方法,具体方法与前述s101中获取原始图像的方法一致,详细内容请参见前述s101的说明,在此不做重复说明。

s302、对多个原始样本图像进行处理,得到多个处理后的样本图像,以构建增广样本集。

本实施涉及对原始样本图像进行处理的方法,具体的处理方法可以采用与s102中涉及到的图像数据增广处理方法相同的图像处理方法,具体可以为图像滤波处理、图像噪声处理、图像变形处理等中的任一种处理方法。本实施例中,当终端获取到多个原始样本图像后,可以进一步的采用预先设置好的各种类型的图像数据处理方法对这多个原始样本图像进行处理,得到多个处理后的样本图像,然后将增加的多个处理后的样本图像与多个原始样本图像共同集合形成一个增广样本集,以便之后训练图像识别网络时使用。需要说明的是,在终端对多个原始样本图像进行图像数据处理时,可以采用相同的图像数据处理方法依次对多个原始样本图像处理,也可以采用不同的图像数据处理方法依次对多个原始样本图像处理,这样可以极大的增加增广样本集中的图像数据量和图像多样性。

s303、将增广样本集中的多个样本图像输入至初始图像识别网络,训练初始图像识别网络,得到图像识别网络。

当终端通过上述的方式构建增广样本集后,可以进一步的将该增广样本集中的多个样本图像输入至终端预先构建的初始图像识别网络中,训练该初始图像识别网络,并根据该初始图像识别网络的收敛性,调整该初始图像识别网络的参数,直至该初始图像识别网络收敛,得到训练好的图像识别网络,以便之后在图2实施例中使用该图像识别网络进行测试。

在一种应用场景中,即在对一种sar图像进行目标识别时,通过对sar图像的成像原理分析发现sar图像的成像参数、姿态方位角、俯视角度甚至周围环境较小的波动都将对sar成像造成很大的特征差异性;另外,sar图像对雷达俯角和目标方位角均很敏感,这两个角度的变化也会影响sar的成像效果。同时,一副sar图像中,当我们改变目标物体的角度或者对图像像素整体加上一个随机噪声(随机整数)时,图像中被识别的目标不会改变。通过上述两种思路,每个像素的像素值将会改变或者图像的视觉效果将会改变,同时也会使算法学习到的特征的多样性得到提高。

根据上述原理和应用场景,本申请提供了sar图像数据增强的方法,则上述对多个原始样本图像进行处理可以包括图像旋转处理和/或对图像增加随机噪声。具体的,本申请基于图像旋转处理和/或对图像增加随机噪声的方式,提供了四种对原始样本图像的处理方法,下述实施例将具体说明这四种处理方法。

第一种,对原始样本图像进行处理若包括图像旋转处理,则上述s302“对多个原始样本图像进行处理,得到多个处理后的样本图像”具体包括:按照预设旋转方向和预设角度旋转各原始样本图像,得到多个处理后的样本图像。

在本实施例中,当终端获取到多个原始样本图像后,可以进一步的按照预设旋转方向(例如,顺时针或逆时针)将每个原始样本图像旋转到预设角度,得到旋转后的每个样本图像。需要说明的是,每个原始样本图像的旋转角度可以相同,也可以不相同。至于具体的旋转角度可以随机选取,对此本实施例不做限制。

第二种,对原始样本图像进行处理若包括对图像增加随机噪声,则上述s302“对多个原始样本图像进行处理,得到多个处理后的样本图像”,如图5所示,具体包括:

s401、从预设数值范围内随机选取一个数值作为修正数值。

本实施例中的预设数值范围为[-10,10]。修正数值表示需要对原始样本图像中的像素值进行修正时使用到的整数值。本实施例中的修正值为随机从数值范围为[-10,10]中随机选取的一个整数值。本实施例不对预设数值范围做限制,可以根据实际应用需求确定。

s402、在各原始样本图像中的各像素值上增加修正数值,得到多个处理后的样本图像。

当终端基于上述s401的方法得到修正数值后,可以进一步的将该修正数值添加到每个原始样本图像中的各像素值上,以改变各像素值,然后将增加修正数值后的各原始样本图像作为处理后的样本图像。需要说明的是,终端可以在每个原始样本图像上增加相同的像素修正值,也可以在每个原始样本图像上增加不同的像素修正值,这样可以极大的增加增广样本集中的图像数据量和图像多样性。

第三种,对原始样本图像进行处理若包括:先对图像增加随机噪声,再进行图像旋转处理,则上述s302“对多个原始样本图像进行处理,得到多个处理后的样本图像”,如图6所示,具体包括:

s501、从预设数值范围内随机选取一个数值作为修正数值。

本实施例涉及的内容与前述s401中涉及到的内容相同,详细内容请参见s401的内容,在此不做重复说明。

s502、在各原始样本图像中的各像素值上增加修正数值,得到多个修正后的图像。

本实施例涉及的内容与前述s402中涉及到的内容相同,详细内容请参见s402的内容,在此不做重复说明。

s503、按照预设旋转方向和预设角度旋转各修正后的图像,得到多个处理后的样本图像。

本实施例涉及的内容与前述第一种图像数据增广方法中包含的具体方法一致,详细内容请参见前述对第一种图像数据增广方法的说明,在此不做重复说明。

第四种,对原始样本图像进行处理若包括:先进行图像旋转处理,再对图像增加随机噪声,则上述s302“对多个原始样本图像进行处理,得到多个处理后的样本图像”,如图7所示,具体包括:

s601、按照预设旋转方向和预设角度旋转各原始样本图像,得到多个旋转后的样本图像。

本实施例涉及的内容与前述第一种图像数据增广方法中包含的具体方法一致,详细内容请参见前述对第一种图像数据增广方法的说明,在此不做重复说明。

s602、从预设数值范围内随机选取一个数值作为修正数值。

本实施例涉及的内容与前述s401中涉及到的内容相同,详细内容请参见s401的内容,在此不做重复说明。

s603、在各旋转后的样本图像中的各像素值上增加修正数值,得到多个处理后的样本图像。

本实施例涉及的内容与前述s402中涉及到的内容相同,详细内容请参见s404的内容,在此不做重复说明。

通过上述四种图像数据增广方法得到的增广样本集的图像数据量可以扩充到原始样本集的10倍以上,进而使图像识别网络在学习过程中能够学习到更加丰富的信息,从而提高了图像识别网络的范化能力。

在实际应用中,在训练图像识别网络之前,还需要构建该图像识别网络,需要考虑很多参数,例如卷积层的层数、卷积核个数、卷积核尺寸、网络层数以及层与层之间的连接方式等等。这些参数任何一个被改变,网络结构都会发生变化。在本发明中,通过对原始样本图像的分析,设计出了一种针对sar图像识别的卷积神经网络。

如图8所示,该卷积神经网络包括两个卷积层,分别为第一卷积层和第二卷积层,其它结构层包括第一池化层、第二池化层、第一激活函数、第一全连接层、第二激活函数、第二全连接层、第三激活函数、输出层。上述各层的连接关系如图8所示的连接方式。

其中,上述第一卷积层用于使用预设尺寸的卷积核对感兴趣区域图像进行卷积操作。预设尺寸大于预设卷积核尺寸阈值,所述预设卷积核尺寸阈值可以根据实际应用需求确定,一般为常用的卷积核尺寸,例如,3×3的卷积核,而本实施例中的卷积核的尺寸大于预设卷积核尺寸阈值,说明卷积核的尺寸较大。上述第二卷积层用于使用预设尺寸的卷积核对激活函数层输出的图像进行卷积操作,可见,第二卷积层使用的卷积核与第一卷积层使用的卷积核的尺寸相同。

示例性说明,本发明设计的卷积神经网络的各层参数请见表1中的内容:

表1

在表1中,relu1、relu2、relu3分别为上述第一激活函数、第二激活函数、第三激活函数,这些激活函数可以使特征具有非线性转化。

可选的,上述任一激活函数的具体表达式可以为关系式(3):

f(x)=max(0,x)(3);

在式(3)中可以看出,当函数自变量x小于0的时,函数值f(x)是0,这就意味着该神经元不被激活,通过relu类型的激活函数,可以使该卷积神经网络提取出的特征更加具有稀疏性。

表1中的第一池化层和第二池化层均选用最大池化层,用于降低上一层卷积层输出的特征图像的维度。

表1中的softmax为卷积神经网络中的输出层,同时为训练该卷积神经网络过程中使用到的一种分类器,softmax是一个多类别的分类器,在分类过程中要求分类的类别之间是严格互相排斥的。

可选的,softmax分类器的具体公式可以为如下关系式(4):

其中,aj和ak表示某类标签,sj表示某类标签的概率。

可以理解的是,在训练该卷积神经网络的过程中,终端可以根据上述softmax分类器的输出结果确定该网络的损失函数,再相应的根据损失函数调整卷积神经网络的参数,使该卷积神经网络达到最优状态即收敛,从而得到输入原始样本图像的特征向量,以及与该特征向量对应的类别标签,以便之后再根据该类别标签实现对原始图形的识别。

从表1中所列的各参数可知,上述卷积神经网络输入端输入的图像的大小为49×49,极大的减小了输入图像中的背景噪声。由于卷积核的大小和个数对从网络学习到的特征特别重要,和其他自然图像或者人脸图像相比,sar图像中目标在图像中只占有较少的比例,图像背景占据了图像的大部分。因此选择较大的卷积核有助于网络学习的特征中包含较多的目标信息,使网络学习到更好的高层次特征。如果选择较小的卷积核时,使卷积核与图像卷积得到的特征图中有的特征图不包含目标物体,反而含有很多背景噪声。因此本发明中将卷积核大小定义为7×7,使网络在执行卷积操作时可以学习更好的目标信息。同时,由于网络输入图像尺寸较小、卷积核大小较大,因此本发明的卷积神经网络结构中包含的卷积层的层数为两层,属于一种浅网络结构,而这种浅网络结构比较简单,可以避免网络过深带来的在学习网络过程中的过拟合问题,还可以使得网络的收敛性更快,进而提高了网络的识别速度和能力。

基于上述图2和图3实施例所述的方法,本申请还提供了一种目标识别网络,如图9所示,该目标识别网络使用上述图2和图3实施例所述的方法实现目标识别。其中,图像预处理模块用于对原始图像进行预处理,并从中提取出感兴趣区域图像,以去除原始图像中的背景噪声;卷积神经网络用于提取感兴趣区域图像的特征向量;svm分类器用于对特征向量进行分类,得到目标物体的分类结果,特别说明的是,结合图8实施例所述的卷积神经网络结构,svm分类器输入端输入的特征向量是图8实施例所示的卷积神经网络结构中的第一全连接层的输出的特征向量。之后,关于使用该目标识别网络结构实现目标识别的具体方法与图2和图3实施例所述的方法相同,具体内容请参见前述说明,在此不做重复累赘说明。

基于上述图4实施例所述的方法,本申请还提供了一种训练时使用的目标识别网络,如图10所示,该网络结构使用上述图4实施例所述的方法实现训练卷积神经网络。其中,训练样本增广处理模块用于对多个原始样本图像进行图像数据增广处理,得到增广样本集;图像预处理模块用于从增广样本集中的各样本图像中提取感兴趣区域图像;卷积神经网络用于提取感兴趣区域图像的特征向量;svm分类器用于对特征向量进行分类,得到目标物体的分类结果。关于该网络结构中的卷积神经网络的训练过程与图4实施例所述的方法相同,具体内容请参见前述说明,在此不做重复累赘说明。需要说明的是,当训练好卷积神经网络之后,再进一步的根据训练好的卷积神经网络提取出的特征向量训练svm分类器,以使svm分类器能够根据特征向量输出目标物体的分类结果。

综合上述所有实施例所述的内容,本申请还提供了一种目标识别方法,图11为一个实施例提供的目标识别方法的总流程图,如图11所示,该方法包括:

第一、训练阶段:

s701、获取原始样本图像。

s702、将原始样本图像集中的各原始样本图像进行图像数据增广处理,得到增广样本图像集。

s703、采用质心定位的方式,从增广样本图像集中的各样本图像中提取出感兴趣区域图像。

s704、将感兴趣区域图像输入至构建好的初始卷积神经网络中进行训练,得到特征向量和训练好的卷积神经网络。

s705、将特征向量输入至初始svm分类器中进行训练,得到训练好的svm分类器。

第二、测试阶段:

s801、获取原始图像。

s802、采用质心定位的方式,从原始图像中提取出感兴趣区域图像。

s803、将感兴趣区域图像输入至训练好的卷积神经网络中,得到特征向量。

s804、将特征向量输入至训练好的svm分类器中,得到分类结果。

s805、输出分类结果。

综上,本发明通过对sar图像的成像原理以及各种成像参数进行分析,设计了一种简单的图像数据预处理方法(质心定位法)减少sar图像中原始数据的背景噪声,使得图像识别网络输入的感兴趣区域图像中包含更多的有用信息。针对sar图像原始数据不足的情况,设计了一种数据增强的方法(图像数据增广方法),通过该方法可以使原始数据量大量提升。另外还针对sar图像设计了一个卷积神经网络,由于sar图像中目标尺寸较小,该网络一改常规网络较大的输入图像,使用较小尺寸的输入图像,同时采取较浅网络使得网络收敛更快,效果更好。通过上述的卷积神经网络和数据增强的方法,可以使该发明在sar图像目标识别的准确率得到极大的提升。

应该理解的是,虽然图2-7、图11的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-7、图11中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行。

在一个实施例中,如图12所示,提供了一种目标识别装置,包括:提取模块11、识别模块12和分类模块13,其中:

提取模块11,用于以原始图像的质心为中心进行扩展,从原始图像中提取出感兴趣区域图像;感兴趣区域图像包含待识别的目标物体;

识别模块12,用于将感兴趣区域图像输入至预设的图像识别网络中,得到感兴趣区域图像的特征向量;图像识别网络是基于增广样本集训练得到的网络,增广样本集中包括原始样本图像和对原始样本图像进行图像数据增广处理后的图像;

分类模块13,用于将特征向量输入至预设的分类器中,得到目标物体的分类结果。

在一个实施例中,如图13所示,上述提取模块11包括:确定单元111和采集单元112,其中:

确定单元111,用于确定原始图像的质心;

采集单元112,用于以质心为中心,按照预设尺寸对原始图像进行图像采集,得到感兴趣区域图像。

在一个实施例中,如图14所示,上述装置还包括训练模块14,该训练模块14包括:获取单元141、增广处理单元142、以及训练单元143,其中:

获取单元141,用于获取多个原始样本图像;

增广处理单元142,用于对多个原始样本图像进行处理,得到多个处理后的样本图像,以构建所述增广样本集;

训练单元143,用于将增广样本集中的多个样本图像输入至初始图像识别网络,训练初始图像识别网络,得到图像识别网络。

在一个实施例中,上述增广处理单元142具体用于在对多个原始样本图像进行处理包括图像旋转处理时,按照预设旋转方向和预设角度旋转各所述原始样本图像,得到所述多个处理后的样本图像。

在一个实施例中,上述增广处理单元142具体用于在对多个原始样本图像进行处理包括对图像增加随机噪声时,从预设数值范围内随机选取一个数值作为修正数值;

在各原始样本图像中的各像素值上增加修正数值,得到多个处理后的样本图像。

在一个实施例中,上述增广处理单元142具体用于在对多个原始样本图像进行处理包括图像旋转处理和对图像增加随机噪声时,从预设数值范围内随机选取一个数值作为修正数值;在各原始样本图像中的各像素值上增加修正数值,得到多个修正后的图像;按照预设旋转方向和预设角度旋转各修正后的图像,得到多个处理后的样本图像。

在一个实施例中,上述增广处理单元142具体用于在对多个原始样本图像进行处理包括图像旋转处理和对图像增加随机噪声时,按照预设旋转方向和预设角度旋转各原始样本图像,得到多个旋转后的样本图像;从预设数值范围内随机选取一个数值作为修正数值;在各旋转后的样本图像中的各像素值上增加修正数值,得到多个处理后的样本图像。

关于目标识别装置的具体限定可以参见上文中对于一种目标识别方法的限定,在此不再赘述。上述目标识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图15所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种目标识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图15中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:

以原始图像的质心为中心进行扩展,从原始图像中提取出感兴趣区域图像;感兴趣区域图像包含待识别的目标物体;

将感兴趣区域图像输入至预设的图像识别网络中,得到感兴趣区域图像的特征向量;图像识别网络是基于增广样本集训练得到的网络,增广样本集中包括原始样本图像和对原始样本图像进行图像数据增广处理后的图像;

将特征向量输入至预设的分类器中,得到目标物体的分类结果。

上述实施例提供的一种计算机设备,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时还实现以下步骤:

以原始图像的质心为中心进行扩展,从原始图像中提取出感兴趣区域图像;感兴趣区域图像包含待识别的目标物体;

将感兴趣区域图像输入至预设的图像识别网络中,得到感兴趣区域图像的特征向量;图像识别网络是基于增广样本集训练得到的网络,增广样本集中包括原始样本图像和对原始样本图像进行图像数据增广处理后的图像;

将特征向量输入至预设的分类器中,得到目标物体的分类结果。

上述实施例提供的一种计算机可读存储介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双倍数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1