目标检测模型的确定方法及装置、存储介质与流程

文档序号：36654581发布日期：2024-01-06 23:41阅读：22来源：国知局

本发明涉及图像识别领域，具体而言，涉及一种目标检测模型的确定方法及装置、存储介质。

背景技术：

1、近年来，深度学习发展迅猛，被广泛应用到计算机视觉、语音识别以及自然语言处理上。随着数据规模积累的足够大，场景越加复杂，对模型的精度也有越来越高的要求。目标检测作为计算机视觉应用的主要探索之一，其模型和训练方法也得到一次次的改进和研发。目标检测训练方案中标签分配策略（label assigner）对训练精度的影响非常大，一个好的标签分配策略不仅能大幅度提升模型精度，还可以提升训练速度，加速模型收敛。而目前主流的标签分配策略有基于侯选框（bbox）和真实框(gt_box)的交并比来确定的，有基于bbox的中心点是否落在gt_box内来确定的，有通过统计学方案确定的如atss_assigner，也有基于模型训练不断优化的如simota_assigner。但目前的研究中，均集中在如何改进label assigner的策略来提升检测模型的精度，改进效果并不显著。

2、针对相关技术，现有检测模型对图片进行目标检测的准确度较低的问题，目前尚未提出有效的解决方案。

3、因此，有必要对相关技术予以改良以克服相关技术中的所述缺陷。

技术实现思路

1、本发明实施例提供了一种目标检测模型的确定方法及装置、存储介质，以至少解决现有检测模型对图片进行目标检测的准确度较低的问题。

2、根据本发明实施例的一方面，提供一种目标检测模型的确定方法，包括：获取训练样本集合，其中，所述训练样本集合中的每个训练样本包括：样本图片、所述样本图片的多个标注框和每个标注框对应的标签；使用所述训练样本集合对待训练的检测模型进行训练，直到所述待训练的检测模型对应的目标损失函数的取值满足预设的收敛条件，其中，所述待训练的检测模型包括：用于对所述样本图片进行目标检测的目标网络和用于分别对所述目标网络检测出的预测框集合进行标签分配预测的n个标签分配器；n为大于1的正整数，所述目标损失函数的取值根据所述n个标签分配器产生的n组损失共同确定；将结束训练时的待训练的检测模型确定为目标检测模型。

3、在一个示例性的实施例中，使用所述训练样本集合对待训练的检测模型进行训练，包括：通过以下步骤执行第i轮训练，其中，i为大于或等于1的正整数，经过第0轮训练的检测模型是未经过训练的所述待训练的检测模型：获取第i-1轮训练得到的目标网络对样本图片进行检测后得到的预测框集合；使用所述第i-1轮训练得到的n个标签分配器分别对所述第i轮检测出的预测框集合进行标签分配，得到n个标签分配预测结果，其中，每个标签分配预测结果包括所述预测框集合中每个预测框的标签；根据所述n个标签分配预测结果确定所述第i轮训练的目标分类损失函数的取值以及目标定位损失函数的取值，其中，所述目标损失函数包括所述目标分类损失函数和所述目标定位损失函数；所述n个标签分配器在得到所述n个标签分配预测结果的过程中产生了所述n组损失；在所述第i轮训练的所述目标定位损失函数的取值和所述目标分类损失函数的取值均满足对应的收敛条件的情况下，结束训练；在所述第i轮训练的所述目标定位损失函数的取值不满足对应的收敛条件、或者所述目标分类损失函数的取值不满足对应的收敛条件的情况下，调整经过第i-1轮训练得到的检测模型中的参数，得到经过所述第i轮训练得到的检测模型。

4、在一个示例性的实施例中，根据所述n个标签分配预测结果确定所述第i轮训练的目标分类损失函数的取值，包括：根据n个标签分配预测结果确定n个矩阵，其中，所述n个矩阵中的第j个矩阵用于表示第j个标签分配器产生的标签分配预测损失，所述第j个矩阵中的元素值包括第j个标签分配器为所述预测框集合中每个预测框进行标签分配预测产生的分配预测损失；根据所述n个矩阵确定所述第i轮训练的目标分类损失函数的值。

5、在一个示例性的实施例中，根据n个标签分配预测结果确定n个矩阵，包括：通过以下方式得到n个矩阵中的第j个矩阵，以得到所述n个矩阵：将n个标签分配预测结果中的第j个标签分配预测结果和与所述第j个标签分配预测结果对应的标签分配结果输入至分类损失函数，得到第j个矩阵；其中，所述第j个标签分配预测结果对应的标签分配结果是根据所述第j个标签分配器的标签分配策略、所述样本图片的多个标注框和每个标注框对应的标签对所述第i轮检测出的预测框集合进行标签分配的结果。

6、在一个示例性的实施例中，根据所述n个矩阵确定所述第i轮训练的目标分类损失函数的值，包括：从所述n个矩阵中确定目标矩阵；根据所述n个矩阵中除所述目标矩阵以外的n-1个矩阵确定目标权重矩阵，其中，目标权重矩阵中的元素值包括所述目标矩阵中每个预测框对应的分配预测损失的权重值；将所述目标权重矩阵和所述目标矩阵进行矩阵对位相乘运算，得到第i轮训练的目标分类损失函数的取值。

7、在一个示例性的实施例中，根据所述n个矩阵中除所述目标矩阵以外的n-1个矩阵确定目标权重矩阵，包括：将所述n-1个矩阵进行加法运算，得到第一中间矩阵；将所述第一中间矩阵进行归一化处理，得到第二中间矩阵；将预设矩阵与所述第二中间矩阵进行减法运算，得到目标权重矩阵，其中，所述预设矩阵与所述第二中间矩阵具有相同的行列数、且所述预设矩阵的每个元素值等于1。

8、在一个示例性的实施例中，根据所述n个标签分配预测结果确定所述第i轮训练的目标定位损失函数的取值，包括：根据所述n个标签分配预测结果确定n个标签分配器产生的n个定位损失；根据所述n个定位损失确定所述第i轮训练的目标定位损失函数的取值。

9、在一个示例性的实施例中，根据n个标签分配预测结果确定n个标签分配器产生的n个定位损失，包括：通过以下方式得到n个定位损失中的第j个定位损失，以得到n个定位损失：根据所述n个标签分配预测结果中的第j个标签分配预测结果确定第j组预测框，其中，所述第j组预测框中的每个预测框对应的标签不为背景标签；使用定位损失函数确定所述第j组预测框对应的位置信息与所述多个标注框对应的位置信息之间的定位损失，得到第j个定位损失。

10、在一个示例性的实施例中，将结束训练时的待训练的检测模型确定为目标检测模型之后，所述方法还包括：获取待进行目标检测的目标图片；通过所述目标检测模型对所述目标图片进行目标检测，以在所述目标图片中确定多个检测框以及所述多个检测框中每个检测框的标签。

11、根据本发明实施例的另一方面，还提供了一种目标检测模型的确定装置，包括：获取模块，用于获取训练样本集合，其中，所述训练样本集合中的每个训练样本包括：样本图片、所述样本图片的多个标注框和每个标注框对应的标签；训练模块，用于使用所述训练样本集合对待训练的检测模型进行训练，直到所述待训练的检测模型对应的目标损失函数的取值满足预设的收敛条件，其中，所述待训练的检测模型包括：用于对所述样本图片进行目标检测的目标网络和用于分别对所述目标网络检测出的预测框集合进行标签分配预测的n个标签分配器；n为大于1的正整数，所述目标损失函数的取值根据所述n个标签分配器产生的n组损失共同确定；确定模块，用于将结束训练时的待训练的检测模型确定为目标检测模型。

12、根据本发明实施例的又一方面，还提供了一种计算机可读的存储介质，该计算机可读的存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述目标检测模型的确定方法。

13、根据本发明实施例的又一方面，还提供了一种电子装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，上述处理器通过计算机程序执行上述目标检测模型的确定方法。

14、本发明，由于在待训练的检测模型中设置了多个标签分配器，进而可以在训练的过程中同时兼顾各种标签分配器的优点来提升检测模型的性能，提高检测模型对图片进行目标检测的准确度，进而解决了现有检测模型对图片进行目标检测的准确度较低的问题。此外，在待训练的检测模型中设置多个标签分配器还可以提高模型的收敛速度，进而减少了对模型进行训练的装置的相关资源（例如：内存资源，cpu资源等等）的占用时间。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：林亦宁,杨德城
技术所有人：上海闪马智能科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。