目标检测方法、装置、设备、存储介质及计算机程序产品与流程

文档序号：35870398发布日期：2023-10-28 03:34阅读：29来源：国知局

本技术实施例涉及人工智能领域，涉及但不限于一种目标检测方法、装置、设备、存储介质及计算机程序产品。

背景技术：

1、目标检测(object detection)的任务是找出图像中所有感兴趣的目标(物体)，确定这些目标的类别和位置，目标检测是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态，加上成像时光照、遮挡等因素的干扰，目标检测一直是计算机视觉领域最具有挑战性的问题。

2、相关技术中，通常采用骨干网络提取图像的特征图，并基于特征图进行目标检测，由于骨干网络提取的图像的特征图并不能提取到能够准确表征图像信息的特征，因此，在后续检测过程中，通过检测头并不能准确的确定出不同检测类别下的目标所在的位置，从而降低目标检测的准确度。

技术实现思路

1、本技术实施例提供一种目标检测方法、装置、设备、存储介质及计算机程序产品，至少能够应用于人工智能领域和图像识别领域，能够准确的得到检测头在对相应检测类别进行检测时所需的特征，使得检测头能够基于匹配的映射特征对待检测图像进行准确的目标检测，从而提高目标检测的准确度。

2、本技术实施例的技术方案是这样实现的：

3、本技术实施例提供一种目标检测方法，包括：对待检测图像中具有不同分辨率的特征图进行多尺度特征融合，得到在多个尺度下的输出特征；其中，所述多尺度特征融合是对具有至少一种分辨率的特征图进行融合；确定针对所述待检测图像进行目标检测的多个检测类别以及每一检测类别对应的检测头；其中，每一检测类别对应一个检测头；针对每一所述检测头，对所述多个尺度下的输出特征进行特征映射，得到与相应检测头匹配的映射特征；其中，所述映射特征与相应检测头匹配用于表征：所述映射特征是所述相应检测头在对相应检测类别进行检测时所需的特征；调用每一检测类别对应的所述检测头，基于所述匹配的映射特征对所述待检测图像进行目标检测，得到针对每一检测类别的至少一个检测框；基于所述至少一个检测框，确定所述待检测图像在所述每一检测类别下的目标检测结果。

4、本技术实施例提供一种目标检测装置，所述装置包括：多尺度特征融合模块，用于对待检测图像中具有不同分辨率的特征图进行多尺度特征融合，得到在多个尺度下的输出特征；其中，所述多尺度特征融合是对具有至少一种分辨率的特征图进行融合；第一确定模块，用于确定针对所述待检测图像进行目标检测的多个检测类别以及每一检测类别对应的检测头；其中，每一检测类别对应一个检测头；特征映射模块，用于针对每一所述检测头，对所述多个尺度下的输出特征进行特征映射，得到与相应检测头匹配的映射特征；其中，所述映射特征与相应检测头匹配用于表征：所述映射特征是所述相应检测头在对相应检测类别进行检测时所需的特征；目标检测模块，用于调用每一检测类别对应的所述检测头，基于所述匹配的映射特征对所述待检测图像进行目标检测，得到针对每一检测类别的至少一个检测框；第二确定模块，用于基于所述至少一个检测框，确定所述待检测图像在所述每一检测类别下的目标检测结果。

5、在一些实施例中，所述装置还包括：最大池化处理模块，用于调用骨干网络中的主干层对所述待检测图像进行最大池化处理，得到最大池化特征；多分辨率特征提取模块，用于调用所述骨干网络中的多个残差卷积层依次对所述最大池化特征进行不同分辨率下的特征提取，得到所述具有不同分辨率的特征图；其中，每一所述残差卷积层对应一个下采样尺度和与所述下采样尺度对应的分辨率；所述多个残差卷积层依次相连，且所述多个残差卷积层连接于所述主干层之后；依次相连的所述多个残差卷积层对应的分辨率递减。

6、在一些实施例中，每一所述残差卷积层包括多个残差卷积模块；所述多分辨率特征提取模块还用于：如果当前的残差卷积层是所述骨干网络中的第一个残差卷积层，调用当前的残差卷积层中的多个残差卷积模块对所述最大池化特征进行卷积处理，得到卷积特征；如果当前的残差卷积层是所述骨干网络中的第n个残差卷积层，调用当前的残差卷积层中的多个残差卷积模块对第n-1个残差卷积层输出的所述卷积特征进行卷积处理，得到迭代卷积特征；n为大于1的整数，且n小于或等于所述残差卷积层的总数；基于所述多个残差卷积层中的每一所述残差卷积层输出的所述卷积特征和所述迭代卷积特征，确定相应残差卷积层的特征图；其中，每一所述残差卷积层对应的特征图具有不同的分辨率。

7、在一些实施例中，所述多尺度特征融合模块还用于：调用多尺度特征网络中的多个单尺度特征模块，分别对每一所述残差卷积层对应的特征图进行多尺度特征融合，得到在多个尺度下的输出特征；其中，每一所述单尺度特征模块输出在一个尺度下的输出特征。

8、在一些实施例中，第n个残差卷积层对应的特征图中包括第一个至第n-1个残差卷积层对应的特征图中的特征信息；每一所述残差卷积层对应一个单尺度特征模块；多个所述单尺度特征模块依次连接；每一所述单尺度特征模块对应一特征尺度；所述多尺度特征融合模块还用于：针对所述多个单尺度特征模块中的最后一个单尺度特征模块，调用所述单尺度特征模块对最后一个残差卷积层对应的特征图进行特征映射，得到最后一个单尺度特征模块在相应特征尺度下的输出特征；调用第n-1个单尺度特征模块，对第n个单尺度特征模块输出的特征尺度下的输出特征和第n-1个残差卷积层对应的特征图进行多尺度特征融合，得到第n-1个单尺度特征模块在相应特征尺度下的输出特征；n为大于1的整数，且n小于或等于所述单尺度特征模块的总数。

9、在一些实施例中，所述多尺度特征融合模块还用于：调用第n-1个单尺度特征模块，对所述第n个单尺度特征模块输出的特征尺度下的输出特征和第n-1个残差卷积层对应的特征图进行相加，得到第n-1个单尺度特征模块在相应特征尺度下的输出特征；或者，调用第n-1个单尺度特征模块，对所述第n个单尺度特征模块输出的特征尺度下的输出特征和第n-1个残差卷积层对应的特征图进行拼接处理，得到拼接特征图；对所述拼接特征图进行卷积降维处理，得到第n-1个单尺度特征模块在相应特征尺度下的输出特征。

10、在一些实施例中，每一所述检测头对应一特征映射网络；所述特征映射模块还用于：针对每一所述检测头，调用与所述检测头对应的特征映射网络，通过所述特征映射网络中的特征映射单元分别对所述多个尺度下的输出特征进行特征映射，得到与相应检测头匹配的映射特征。

11、在一些实施例中，所述目标检测模块还用于：调用每一检测类别对应的所述检测头，基于所述匹配的映射特征对所述待检测图像进行目标检测，得到针对每一检测类别下的每一检测框的位置信息和尺寸信息；基于所述位置信息和所述尺寸信息，将所述检测框渲染至所述待检测图像中。

12、在一些实施例中，所述目标检测方法通过目标检测模型来实现；所述装置还包括：模型训练模块，用于：构建每一检测类别对应的样本数据集，并获取多个指定尺度对应的总锚框数量；通过循环迭代以下步骤，对所述目标检测模型进行训练，直至所述目标检测模型收敛：对样本数据集中的样本检测图像中具有不同分辨率的样本特征图进行多尺度特征融合，得到在多个尺度下的样本输出特征；针对每一所述检测头，对所述多个尺度下的样本输出特征进行特征映射，得到与相应检测头匹配的样本映射特征；其中，所述样本映射特征与相应检测头匹配用于表征：所述样本映射特征是所述相应检测头在对相应检测类别进行检测时所需的样本特征；获取所述样本检测图像中的多个矩形框；对所述多个矩形框进行聚类，得到与所述总锚框数量对应的多个类和每一个类的类心；基于每一个类和所述类心，确定当前迭代训练过程中的多个锚框；将所述多个锚框应用于与每一所述检测头匹配的样本映射特征对应的样本映射特征图中；基于所述锚框在所述样本映射特征图中的位置信息和预先标注的标注信息，对当前迭代训练过程中的目标检测模型进行损失计算，得到损失结果；基于所述损失结果，对所述目标检测模型中的模型参数进行修正，得到训练后的目标检测模型。

13、在一些实施例中，所述模型训练模块还用于：针对任一检测类别，从图像库中采集具有所述检测类别的样本图像，并标注所述样本图像中与所述检测类别对应的检测目标，形成标注后的样本检测图像；所述样本检测图像对应一标注信息；将所述样本检测图像添加至与所述检测类别对应的样本数据集中；其中，同一所述样本图像属于至少一个检测类别的样本数据集中的样本检测图像。

14、在一些实施例中，所述目标检测模型包括骨干网络、多尺度特征网络、特征映射网络和至少一个检测头；所述模型训练模块还用于：将所述样本检测图像输入至所述目标检测模型中，通过所述骨干网络对所述样本检测图像进行不同分辨率下的特征提取，得到所述具有不同分辨率的样本特征图；通过所述多尺度特征网络对所述具有不同分辨率的样本特征图进行多尺度特征融合，得到在多个尺度下的样本输出特征；针对每一所述检测头，通过所述特征映射网络对所述多个尺度下的样本输出特征进行特征映射，得到与相应检测头匹配的样本映射特征。

15、在一些实施例中，所述特征映射网络中包括多个特征映射单元，所述特征映射单元的数量与所述多尺度特征网络中的单尺度特征模块的数量相同；所述样本映射特征包括多个尺度下的子样本映射特征；每一所述子样本映射特征对应一子映射特征图；所述模型训练模块还用于：确定每一所述锚框的面积；按照所述面积从大到小的顺序，对所述多个锚框进行排序，形成锚框序列；按照所述锚框序列中的锚框的顺序，将所述多个锚框划分成多个锚框组；所述锚框组的数量与所述特征映射网络中的特征映射单元的数量相同；根据每一所述映射特征的尺度和所述锚框组中的锚框的面积，将每一所述锚框组中的全部锚框应用于一组子样本映射特征对应的子样本映射特征图中。

16、在一些实施例中，所述模型训练模块还用于：当所述样本检测图像是任一检测类别对应的样本数据集中的图像时，基于所述损失结果，对所述目标检测模型中的骨干网络、多尺度特征网络、特征映射网络和与所述检测类别对应的检测头中的权值进行修正，得到所述训练后的目标检测模型。

17、本技术实施例提供一种电子设备，包括：存储器，用于存储可执行指令；处理器，用于执行所述存储器中存储的可执行指令时，实现上述的目标检测方法。

18、本技术实施例提供一种计算机程序产品，该计算机程序产品包括可执行指令，可执行指令存储在计算机可读存储介质中；其中，电子设备的处理器从计算机可读存储介质中读取可执行指令，并执行可执行指令时，实现上述的目标检测方法。

19、本技术实施例提供一种计算机可读存储介质，存储有可执行指令，用于引起处理器执行所述可执行指令时，实现上述的目标检测方法。

20、本技术实施例具有以下有益效果：通过对待检测图像中具有不同分辨率的特征图进行多尺度特征融合，得到在多个尺度下的输出特征；并且针对每一检测头，对多个尺度下的输出特征进行特征映射，得到与相应检测头匹配的映射特征；其中，映射特征与相应检测头匹配是指映射特征是相应检测头在对相应检测类别进行检测时所需的特征；之后，调用每一检测类别对应的检测头，基于匹配的映射特征对待检测图像进行目标检测，能够准确的得到针对每一检测类别的至少一个检测框；从而基于至少一个检测框，准确的确定出待检测图像在每一检测类别下的目标检测结果。如此，通过对待检测图像中具有不同分辨率的特征图进行多尺度特征融合，并对多个尺度下的输出特征进行特征映射，从而准确的得到检测头在对相应检测类别进行检测时所需的特征，使得检测头能够基于匹配的映射特征对待检测图像进行准确的目标检测，从而提高目标检测的准确度。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李德辉
技术所有人：腾讯科技（深圳）有限公司
我是此专利的发明人

上一篇：电池模组及具有其的动力电池的制作方法
上一篇：一种车载屏蔽接头的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。