一种目标检测方法、目标检测装置及电子设备与流程

文档序号:18321319发布日期:2019-08-03 10:29阅读:283来源:国知局
一种目标检测方法、目标检测装置及电子设备与流程

本申请属于图像处理技术领域,尤其涉及一种目标检测方法、目标检测装置、电子设备及计算机可读存储介质。



背景技术:

目标检测是结合了物体定位和物体分类的一项计算机视觉任务,其目的是在图像中找到所有目标物体出现的区域,并给出区域内目标物体的具体类别。由于计算资源的发展和不断丰富的数据集,近年来,基于深度学习的目标检测方法和其对应框架成为目标检测领域的主流方法。与传统的计算机视觉方法相比,基于深度学习的目标检测方法具有定位和分类更加准确,速度更快等特点。然而,当前较为广泛使用的基于深度学习的目标检测方法仅能够输出被搜索物体的外接矩形,之后仍需要通过进一步的定位操作来查找物体的顶点坐标,才能最终实现对物体的精确定位,可见,现有技术中基于深度学习的目标检测方法难以实现速度与准确率的均衡,无法实现又快又好的物体定位及分类。



技术实现要素:

有鉴于此,本申请提供了一种目标检测方法、目标检测装置、电子设备及计算机可读存储介质,可实现快速与准确的物体定位及分类。

本申请的第一方面提供了一种目标检测方法,包括:

提取待处理的原始图像的特征图;

通过预设的区域推荐网络,在上述特征图中对所包含的目标物体进行一次定位,以确定一个以上第一区域,其中,上述第一区域为包含有目标物体的区域,所述目标物体为多边形物体;

为各个第一区域生成外接矩形,并对各个第一区域的外接矩形进行池化操作,分别得到与各个第一区域相关的第二区域,其中,各个第二区域的尺寸相同;

通过预设的物体检测网络,对各个第二区域中所包含的目标物体进行二次定位及分类,以确定上述第二区域中所包含的目标物体的位置及类别。

本申请的第二方面提供了一种目标检测装置,包括:

特征图提取单元,用于提取待处理的原始图像的特征图;

区域推荐单元,用于通过预设的区域推荐网络,在上述特征图中对所包含的目标物体进行一次定位,以确定一个以上第一区域,其中,上述第一区域为包含有目标物体的区域;

池化单元,用于为各个第一区域生成外接矩形,并对各个第一区域的外接矩形进行池化操作,分别得到与各个第一区域相关的第二区域,其中,各个第二区域的尺寸相同;

物体检测单元,用于通过预设的物体检测网络,对各个第二区域中所包含的目标物体进行二次定位及分类,以确定上述第二区域中所包含的目标物体的位置及类别。

本申请的第三方面提供了一种电子设备,上述电子设备包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现如上述第一方面的方法的步骤。

本申请的第四方面提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如上述第一方面的方法的步骤。

本申请的第五方面提供了一种计算机程序产品,上述计算机程序产品包括计算机程序,上述计算机程序被一个或多个处理器执行时实现如上述第一方面的方法的步骤。

由上可见,在本申请方案中,首先提取待处理的原始图像的特征图,然后通过预设的区域推荐网络,在上述特征图中对所包含的目标物体进行一次定位,以确定一个以上第一区域,其中,上述第一区域为包含有目标物体的区域,且所述目标物体为多边形物体,接着为各个第一区域生成外接矩形,并对各个第一区域的外接矩形进行池化操作,分别得到与各个第一区域相关的第二区域,其中,各个第二区域的尺寸相同,最后通过预设的物体检测网络,对各个第二区域中所包含的目标物体进行二次定位及分类,以确定上述第二区域中所包含的目标物体的位置及类别。通过本申请方案,由区域推荐网络来筛选各个锚框中是否存在目标物体,以找出可能存在目标物体的锚框集合,同时实现对目标物体的粗定位;再由物体检测网络进一步判断目标物体的类别,同时实现对目标物体的顶点的精确定位。因而通过本申请所提出的目标检测方法,可以直接定位被搜索的多边形物体(也即目标物体)的顶点,一步到位的解决目标物体的精确定位问题。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的目标检测方法的实现流程示意图;

图2是本申请实施例提供的目标检测方法中,区域推荐网络及物体检测网络的连接架构图;

图3是本申请实施例提供的目标检测装置的结构框图;

图4是本申请实施例提供的电子设备的结构示意图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。

为了说明本申请上述的技术方案,下面通过具体实施例来进行说明。

实施例一

下面对本申请实施例提供的一种目标检测方法进行描述,请参阅图1,本申请实施例中的目标检测方法包括:

在步骤101中,提取待处理的原始图像的特征图;

在本申请实施例中,可以首先获取待处理的原始图像,并提取上述待处理的原始图像的特征图。具体地,可以启动电子设备所连接的摄像头进行拍摄后获得待处理的原始图像。在获得待处理的原始图像后,通过一较深的卷积网络对上述待处理的原始图像进行特征提取,以得到特征图。具体地,本步骤中所使用的用于特征提取的上述卷积网络的结构可以根据被检测的目标物体的复杂程度来决定,例如,可以采用vgg16卷积网络、googlenet卷积网络及resnet卷积网络等,此处不作限定。

在步骤102中,通过预设的区域推荐网络,在上述特征图中对所包含的目标物体进行一次定位,以确定一个以上第一区域;

在本申请实施例中,上述第一区域为包含有目标物体的区域,上述第一区域为多边形区域,而并非单一的矩形区域;且所述目标物体为多边形物体。具体地,在本申请实施例中,不限定上述多边形物体是否为规则,也即,不管是规则的多边形物体还是不规则的多边形物体,均可以通过本申请方案实现定位及分类。需要注意的是,站在上述区域推荐网络的角度来说,上述第一区域为上述区域推荐网络在经过判断后所认为的包含有目标物体的区域;但由于上述第一区域可能会发生判断错误的情况,因而上述第一区域实际上并不是绝对包含有目标物体的区域,也即,站在用户的角度来说,上述区域推荐网络所确定的第一区域实际上指的是很可能包含有目标物体的区域。在得到上述特征图后,上述区域推荐网络将利用一较小的卷积网络来进一步提取上述特征图的图像特征。具体地,上述步骤102包括:

a1、通过预设的区域推荐网络及预设的锚框尺寸,对上述特征图进行检测,以筛选得到第一锚框集合;

在本申请实施例中,锚框的尺寸由研发人员所预先设定,为了使得上述区域推荐网络在搜索中具备较强的鲁棒性,可以预先设定多组不同大小和长宽比的锚框。具体地,上述锚框的形状可以根据目标物体的形状所确定,例如,若被搜索目标为n边形,则上述锚框的初始形状也被设置为相应的正n边型。通过对锚框的大小及长宽比取不同的值,所得到的锚框类型的数量具体为锚框大小种类数量*锚框长宽比种类数量,也即,每一锚框大小种类与每一锚框长宽比种类均可构建出一类型的锚框。通过多种类型的锚框,可以适应目标物体的不同形状及大小。需要注意的是,上述目标物体的种类和数量也不做限定。也即是说,待处理的原始图像中可能有多种目标物体,且每种目标物体下可能有多个目标物体,例如,待处理的原始图像中有a类型的目标物体4个,b类型的目标物体3个,上述a类型的物体及b类型的物体均为四边形物体。上述区域推荐网络将基于上述若干种锚框在特征图中的若干个预设的像素点上进行检测,具体地,可以预先设定以8为步长,在特征图中确定锚框的放置位置,也即,针对任一锚框,其中心点距离相邻锚框的中心点的距离可以为8像素,使得相邻锚框的中心点的距离为上述所设定的预设步长;其中,上述相邻锚框具体指的是上述锚框的上、下、左、右的锚框。当然,在实际应用中,也可以将锚框放置位置的步长设定为其它值,此处不作限定。通过上述过程,将锚框放置于特征图的各个可放置锚框的像素点上,一旦检测到当锚框放置在某一像素点上,且根据区域推荐网络判断后认为该锚框内存在目标物体时,则将放置于该像素点位置的锚框存放于第一锚框集合中,也即,上述第一锚框集合为包含有目标物体的锚框的集合。需要注意的是,此处包含有目标物体的锚框,具体指的是根据区域推荐网络判断后认为存在目标物体的锚框,也即,站在上述区域推荐网络的角度来说,上述第一锚框集合中的各个锚框均是包含有目标物体的锚框;但由于可能出现区域推荐网络判断错误的情况,因而上述第一锚框集合中的各个锚框并不是绝对包含有目标物体的锚框,也即,站在用户的角度来说,上述区域推荐网络所确定的第一锚框集合中的各个锚框指的是很可能包含有目标物体的锚框。

a2、通过上述第一锚框集合中各个锚框与目标物体的距离,筛选得到有效锚框;

在本申请实施例中,在第一种应用场景下,针对任一目标物体,获取包含上述目标物体的各个锚框与上述目标物体的距离;将包含上述目标物体的所有锚框中,与上述目标物体的距离最小的锚框确定为有效锚框。在第二种应用场景下,针对任一目标物体,获取包含上述目标物体的各个锚框与上述目标物体的距离;将包含上述目标物体的所有锚框中,与上述目标物体的距离小于预设的距离阈值的锚框确定为有效锚框。具体地,上述距离的计算公式为:

其中,n为目标物体的顶点数(也即锚框的顶点数),xa、ya分别为锚框的横纵坐标信息,x、y分别为目标物体的横纵坐标信息。i表示顶点,通过i由0至n-1,可遍历锚框的各个顶点与目标物体的相应顶点的距离。具体地,在第一种应用场景下,通过将与上述目标物体的距离最小的锚框确定为有效锚框,可保障每一目标物体均能找到相对应的有效锚框,以此避免出现目标物体找不到对应有效锚框的问题。需要说明的是,上述两种应用场景可以择一应用,也可以同时应用,此处不作限定。

a3、基于上述目标物体的位置,对各个有效锚框的顶点位置进行回归运算;

在本申请实施例中,为了更好的理解上述步骤a3,先对上述区域推荐网络的训练进行简单介绍。在训练时,假定输入至区域推荐网络的训练图像中,包含有一个以上待检测的训练物体;也即,上述区域推荐网络的输出为对上述一个以上训练物体的粗略位置预测。可以认为,为了将网络的训练及应用的过程区分开来,将网络应用时所要检测的对象记为目标物体,将网络训练时所要检测的对象记为训练物体。则该区域推荐网络的损失函数由锚框分类和物体位置回归两部分损失函数共同构成,具体地,上述区域推荐网络的损失函数的定义如下:

其中,第一项为锚框分类的损失函数,第二项为物体位置回归的损失函数;n为研发人员在计算损失时所随机抽选的锚框的数量,该随机抽选的锚框的数量由研发人员所预先设置,例如,可以被设定为256;pi为区域推荐网络所预测的第i个锚框中包含训练物体的概率;若该第i个锚框为有效锚框,则pi*的取值为1;否则,若该第i个锚框为无效锚框,则pi*的取值为0;ti表示区域推荐网络对训练物体顶点的预测坐标,ti*为训练物体顶点的实际坐标,由于物体位置回归的损失函数在与锚框分类的损失函数求和前先乘以了pi*,因而仅当锚框为有效锚框时,基于该锚框的物体位置预测的损失才会被计入总的物体位置损失中;上述ncls与n相等,也即是说,当n被设定为256时,该ncls也被设定为256;上述nreg可以根据能够生成锚框的像素点位置的总数所设定,例如,可以将上述nreg设定为能够生成锚框的像素点位置的总数除以一预设参数,上述预设参数可以为10或其它数值,此处不作限定;可以认为,上述ncls与nreg为两个标准化的参数,这两个参数的目的是为了让锚框分类和物体位置回归对总的损失函数的影响达到平衡。具体地,锚框分类的损失函数lcls采用softmax损失函数,物体位置回归的损失函数lreg采用huber位置损失函数。上述huber位置损失函数具体为:

其中,x为训练物体顶点的预测坐标与训练物体顶点的实际坐标的差,在对训练物体的每一个顶点的预测坐标都进行了上述运算后进行求和,即可得到训练物体经过上述区域推荐网络的位置预测操作后的位置损失。在上述区域推荐网络中,训练物体顶点的预测坐标和实际坐标都通过包含有该训练物体的锚框的坐标进行编码,其编码方法具体为:

txn=(xn-xan)/hatyn=(yn-yan)/ha

其中,xn、yn分别代表训练物体的第n个顶点,xan为对应锚框的第n个顶点,若训练物体为n边形,则n的取值为[0,n)。xn、xn*、xan分别为上述区域推荐网络对训练物体顶点的预测坐标、实际坐标及相对应的有效锚框的坐标。ha为n边形锚的高。通过以上表达式可以看出,在上述区域推荐网络的训练过程中,训练物体的预测坐标由各个有效锚框的初始坐标逐渐向训练物体的实际坐标回归。

a4、基于回归运算后所得到的各个有效锚框的顶点位置,确定一个以上第一区域。

在本申请实施例中,由于对上述区域推荐网络进行了训练,使得训练物体的预测坐标由各个有效锚框的初始坐标逐渐向训练物体的实际坐标回归;因而,在经过了回归运算后所得到的各个有效锚框的坐标实际上已经向目标物体的实际坐标靠拢了,可以直接基于回归运算后所得到的各个有效锚框的顶点位置,确定一个以上第一区域;也即是说,已训练的区域推荐网络可以将回归运算后的有效锚框作为第一区域进行输出,该第一区域已能够在某种程度上代表其所包含的目标物体,可以认为,上述第一区域为对目标物体的初步定位。

在步骤103中,为各个第一区域生成外接矩形,并对各个第一区域的外接矩形进行池化操作,分别得到与各个第一区域相关的第二区域;

在本申请实施例中,各个第一区域经过池化操作后所分别得到的对应的第二区域的尺寸相同。上述区域推荐网络所输出的第一区域已经是对目标物体的初步定位;基于此,为了能够使用统一的物体检测网络的结构进一步提取第一区域中目标物体的特征,先为该第一区域生成外接矩形,并将上述各个第一区域的外接矩形确定为感兴趣区域(regionofinterest,roi),随后结合步骤101所提取得到的特征图对上述各个感兴趣区域的大小进行池化操作,使得兴趣区域的特征图大小保持统一;具体地,将对各个第一区域的外接矩形进行池化操作后所得到的区域记为第二区域。

在步骤104中,通过预设的物体检测网络,对各个第二区域中所包含的目标物体进行二次定位及分类,以确定上述第二区域中所包含的目标物体的位置及类别。

在本申请实施例中,上述第二区域已经经过了池化,因而其特征图大小将相同;基于此,可以将这些维度相同的第二区域的特征图通过两个全连接层生成第二区域的特征向量;上述特征向量分别作为上述物体检测网络中的分类器和回归器的输入,实现对第二区域中目标物体的分类和位置回归。具体地,在上述物体检测网络中,若被搜索的目标物体共有m类,则对第二区域所包含的目标物体进行分类的结果有m+1种,分别为m个物体类别和1个背景类。同时,目标物体的顶点坐标由区域推荐网络得到的初步定位结果进一步向目标物体的实际坐标值回归。

为了更好的理解上述步骤104,先对上述物体检测网络的训练进行简单介绍。在训练时,假定输入至区域推荐网络的训练图像中,包含有一待检测的训练物体;可以认为,为了将网络的训练及应用的过程区分开来,将网络应用时所要检测的对象记为目标物体,将网络训练时所要检测的对象记为训练物体。也即,上述物体检测网络的输出为对该训练物体的精细位置预测及分类。具体地,上述物体检测网络在训练过程中的损失函数也为多任务损失函数;则上述物体检测网络的损失函数的定义如下:

其中,pi为上述物体检测网络对第i个第二区域中训练物体的预测分类,ui为第i个区域中训练物体的实际分类。ti和ti*分别为训练物体顶点的预测坐标和实际坐标。当pi被背景类时,γ取值为0,否则为1,也即是说,只有包含训练物体的第二区域的坐标误差被计入了总的坐标误差中;上述分类器采用softmax损失函数,回归器采用huber损失函数。由上式可以看出,在物体检测网络的训练过程中,训练物体的预测坐标值由区域检测网络得到的初步定位结果进一步向训练物体的实际坐标值回归。因而,在执行上述步骤104,实际应用已训练的上述物体检测网络时,可通过物体检测网络的分类器和位置回归,实现对目标物体的分类及二次定位,得到目标物体类别及目标物体的顶点位置。具体地,分类器使用区域推荐网络中得到的第一区域的外接矩形进行分类,而位置回归则以第一区域的顶点作为起点进行回归,以实现区域推荐网络及物体检测网络的连接。

烦请参阅图2,图2示出了本申请实施例中所提出的区域推荐网络及物体检测网络的连接架构图。从上述图2中可知,原始图像在经过特征提取后得到特征图,该特征图将被作为区域推荐网络的输入,同时还作为池化操作的输入;而池化操作的另一输入为区域推荐网络所输出的第一区域,上述第一区域可以被认为是对目标物体的初步定位;在对第一区域的外接矩形集合特征图进行了池化操作后,得到第二区域,该第二区域的特征向量将被输入至物体检测网络中,经由上述物体检测网络获得对目标物体的精细定位及分类。

由上可见,通过本申请实施例,由区域推荐网络来筛选各个锚框中是否存在目标物体,同时实现对目标物体的粗定位;再由物体检测网络进一步判断目标物体的类别,同时实现对目标物体的顶点的精确定位。并且,由于区域推荐网络中可以设置多组不同大小锚框,因而可以使得区域推荐网络具有较好的鲁棒性,即使目标物体的大小,长宽比在一定范围内发生变化,仍可准确对目标物体进行定位和分类。可见,通过本申请实施例所提出的目标检测方法,可以直接定位被搜索的多边形物体(也即目标物体)的顶点,一步到位的解决目标物体的精确定位问题。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。

实施例二

本申请实施例二提供了一种目标检测装置,上述目标检测装置可集成于电子设备中,如图3所示,本申请实施例中的目标检测装置300包括:

特征图提取单元301,用于提取待处理的原始图像的特征图;

区域推荐单元302,用于通过预设的区域推荐网络,在上述特征图中对所包含的目标物体进行一次定位,以确定一个以上第一区域,其中,上述第一区域为包含有目标物体的区域,所述目标物体为多边形物体;

池化单元303,用于为各个第一区域生成外接矩形,并对各个第一区域的外接矩形进行池化操作,分别得到与各个第一区域相关的第二区域,其中,各个第二区域的尺寸相同;

物体检测单元304,用于通过预设的物体检测网络,对各个第二区域中所包含的目标物体进行二次定位及分类,以确定上述第二区域中所包含的目标物体的位置及类别。

可选地,上述区域推荐单元302包括:

第一锚框集合筛选子单元,用于通过预设的区域推荐网络及预设的锚框尺寸,对上述特征图进行检测,以筛选得到第一锚框集合,其中,上述第一锚框集合为包含有目标物体的锚框的集合;

有效锚框筛选子单元,用于通过上述第一锚框集合中各个锚框与目标物体的距离,筛选得到有效锚框;

回归运算子单元,用于基于上述目标物体的位置,对各个有效锚框的顶点位置进行回归运算;

第一区域确定子单元,用于基于回归运算后所得到的各个有效锚框的顶点位置,确定一个以上第一区域。

可选地,上述有效锚框筛选子单元包括:

第一距离获取子单元,用于针对任一目标物体,获取包含上述目标物体的各个锚框与上述目标物体的距离;

第一有效锚框确定子单元,用于将包含上述目标物体的所有锚框中,与上述目标物体的距离最小的锚框确定为有效锚框。

可选地,上述有效锚框筛选子单元包括:

第二距离获取子单元,针对任一目标物体,获取包含上述目标物体的各个锚框与上述目标物体的距离;

第二有效锚框确定子单元,将包含上述目标物体的所有锚框中,与上述目标物体的距离小于预设的距离阈值的锚框确定为有效锚框。

可选地,物体检测单元304包括:

特征向量提取子单元,用于针对任一第二区域,基于上述特征图,提取上述第二区域的特征向量;

物体分类子单元,用于根据上述第二区域的特征向量及预设的分类器,对上述第二区域中所包含的目标物体进行分类,得到上述第二区域中所包含的目标物体类别;

物体定位子单元,用于根据与上述第二区域相关的第一区域的顶点及预设的回归器,对上述第二区域中所包含的目标物体进行二次定位,得到上述第二区域中所包含的目标物体的顶点位置。

由上可见,通过本申请实施例,由区域推荐网络来筛选各个锚框中是否存在目标物体,同时实现对目标物体的粗定位;再由物体检测网络进一步判断目标物体的类别,同时实现对目标物体的顶点的精确定位。并且,由于区域推荐网络中可以设置多组不同大小锚框,因而可以使得区域推荐网络具有较好的鲁棒性,即使目标物体的大小,长宽比在一定范围内发生变化,仍可准确对目标物体进行定位和分类。

实施例三

本申请实施例三提供了一种电子设备,请参阅图4,本申请实施例中的电子设备4包括:存储器401,一个或多个处理器402(图4中仅示出一个)及存储在存储器401上并可在处理器上运行的计算机程序。其中:存储器401用于存储软件程序以及模块,处理器402通过运行存储在存储器401的软件程序以及单元,从而执行各种功能应用以及数据处理,以获取上述预设事件对应的资源。具体地,处理器402通过运行存储在存储器401的上述计算机程序时实现以下步骤:

提取待处理的原始图像的特征图;

通过预设的区域推荐网络,在上述特征图中对所包含的目标物体进行一次定位,以确定一个以上第一区域,其中,上述第一区域为包含有目标物体的区域,所述目标物体为多边形物体;

为各个第一区域生成外接矩形,并对各个第一区域的外接矩形进行池化操作,分别得到与各个第一区域相关的第二区域,其中,各个第二区域的尺寸相同;

通过预设的物体检测网络,对各个第二区域中所包含的目标物体进行二次定位及分类,以确定上述第二区域中所包含的目标物体的位置及类别。

假设上述为第一种可能的实施方式,则在第一种可能的实施方式作为基础而提供的第二种可能的实施方式中,上述通过预设的区域推荐网络,在上述特征图中进行一次定位,以确定一个以上第一区域,其中,上述第一区域为包含有目标物体的区域,包括:

通过预设的区域推荐网络及预设的锚框尺寸,对上述特征图进行检测,以筛选得到第一锚框集合,其中,上述第一锚框集合为包含有目标物体的锚框的集合;

通过上述第一锚框集合中各个锚框与目标物体的距离,筛选得到有效锚框;

基于上述目标物体的位置,对各个有效锚框的顶点位置进行回归运算;

基于回归运算后所得到的各个有效锚框的顶点位置,确定一个以上第一区域。

在上述第二种可能的实施方式作为基础而提供的第三种可能的实施方式中,通过上述第一锚框集合中各个锚框与目标物体的距离,筛选得到有效锚框,包括:

针对任一目标物体,获取包含上述目标物体的各个锚框与上述目标物体的距离;

将包含上述目标物体的所有锚框中,与上述目标物体的距离最小的锚框确定为有效锚框。

在上述第二种可能的实施方式作为基础而提供的第四种可能的实施方式中,通过上述第一锚框集合中各个锚框与目标物体的距离,筛选得到有效锚框,包括:

针对任一目标物体,获取包含上述目标物体的各个锚框与上述目标物体的距离;

将包含上述目标物体的所有锚框中,与上述目标物体的距离小于预设的距离阈值的锚框确定为有效锚框。

在上述第一种可能的实施方式作为基础而提供的第五种可能的实施方式中,上述通过预设的物体检测网络,对各个第二区域进行二次定位及分类,以确定上述第二区域中所包含的目标物体的位置及类别,包括:

针对任一第二区域:

基于上述特征图,提取上述第二区域的特征向量;

根据上述第二区域的特征向量及预设的分类器,对上述第二区域中所包含的目标物体进行分类,得到上述第二区域中所包含的目标物体类别;

根据与上述第二区域相关的第一区域的顶点及预设的回归器,对上述第二区域中所包含的目标物体进行二次定位,得到上述第二区域中所包含的目标物体的顶点位置。

应当理解,在本申请实施例中,所称处理器402可以是中央处理单元(centralprocessingunit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器401可以包括只读存储器和随机存取存储器,并向处理器402提供指令和数据。存储器401的一部分或全部还可以包括非易失性随机存取存储器。例如,存储器401还可以存储设备类型的信息。

由上可见,通过本申请实施例,由区域推荐网络来筛选各个锚框中是否存在目标物体,同时实现对目标物体的粗定位;再由物体检测网络进一步判断目标物体的类别,同时实现对目标物体的顶点的精确定位。并且,由于区域推荐网络中可以设置多组不同大小锚框,因而可以使得区域推荐网络具有较好的鲁棒性,即使目标物体的大小,长宽比在一定范围内发生变化,仍可准确对目标物体进行定位和分类。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将上述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者外部设备软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,上述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,上述计算机程序包括计算机程序代码,上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读存储介质可以包括:能够携带上述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机可读存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,上述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读存储介质不包括是电载波信号和电信信号。

以上上述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1