一种用于目标检测的模型的训练方法及装置与流程

文档序号：34239436发布日期：2023-05-25 00:20阅读：30来源：国知局

本公开涉及人工智能，尤其涉及一种用于目标检测的模型的训练方法及装置。

背景技术：

1、随着技术的发展，在零售行业中使用计算机视觉已成为最重要的技术趋势之一。实体零售商将计算机视觉算法与商店摄像机结合使用，以了解他们的客户的客户类型以及行为信息。目前，虽然现有的算法能够识别面部并确定人类特征，例如性别或年龄范围，但是，零售商更需要通过使用计算机视觉技术中的图检测模型来跟踪顾客在商店中的移动，以便可以根据顾客的移动路线来分析导航路线、检测步行模式以及衡量店面关注时间。

2、目前的图检测模型存在一些共同问题，目前的图检测模型的训练样本是由selective search算法给出的，这些训练样本里包含有“背景”，和“其他物体”，而图检测模型的目标检测任务是需要检测图片中的“人”。在实际的检测任务中，，线下商场的人气有较大下滑，会存在很多实际图像中只有一个或是两个人。虽然利用selective search算法生成大约1000-2000人的训练样本图像，但是训练样本图像不是专门为“人”这个类别而生成的；在这种情况下的数据集(即训练样本图像)，很容易产生正样本的数量少于负样本的情况。这样，会导致基于上述数据集训练得到的图检测模型的泛化能力不强，从而导致图检测模型的精度下降和正样本的召回率下降；在这种情况下，这类图检测模型需要对正样本进行过采样或对负样本进行欠采样等操作，进而导致训练过程相对复杂困难。

技术实现思路

1、有鉴于此，本公开实施例提供了一种用于目标检测的模型的训练方法、装置、计算机设备及计算机可读存储介质，以解决现有技术中利用selective search算法生成的训练样本图像的数据集，很容易产生正样本的数量少于负样本的情况，这样会导致基于上述数据集训练得到的图检测模型的泛化能力不强，从而导致图检测模型的精度下降和正样本的召回率下降，进而导致训练过程相对复杂困难的问题。

2、本公开实施例的第一方面，提供了一种用于目标检测的模型的训练方法，所述方法包括：

3、获取训练图像样本集；其中，所述训练图像样本集包括若干训练图像样本，每组训练图像样本包括一张样本图像、所述样本图像对应的真实目标对象图像以及所述真实目标对象图像对应的真实类别标签；

4、针对每一组训练图像样本的每一轮训练，将所述训练图像样本中的样本图像输入预设的目标检测模型，得到所述样本图像对应的若干候选目标图像框；将所述样本图像对应的若干候选目标图像框输入预设的分类回归模型，得到所述样本图像对应的预测目标对象图像和所述预测目标对象图像对应的预测类别标签；根据所述样本图像对应的预测目标对象图像和所述预测目标对象图像对应的预测类别标签，以及，所述样本图像对应的真实目标对象图像以及所述真实目标对象图像对应的真实类别标签，确定所述训练图像样本的本轮的损失函数值；

5、根据所述训练图像样本集中每组训练图像样本分别在n轮训练中的每一轮训练中的损失函数值，确定每组训练图像样本的样本类型；

6、利用所述训练图像样本集、所述训练图像样本集中每个训练图像样本的样本类型和预设的样本类型对应的损失函数权重值，对所述目标检测模型和所述分类回归模型进行训练，得到已训练的目标检测模型和分类回归模型。

7、本公开实施例的第二方面，提供了一种用于目标检测的模型的训练装置，所述装置包括：

8、集合获取单元，用于获取训练图像样本集；其中，所述训练图像样本集包括若干训练图像样本，每组训练图像样本包括一张样本图像、所述样本图像对应的真实目标对象图像以及所述真实目标对象图像对应的真实类别标签；

9、数值确定单元，用于针对每一组训练图像样本的每一轮训练，将所述训练图像样本中的样本图像输入预设的目标检测模型，得到所述样本图像对应的若干候选目标图像框；将所述样本图像对应的若干候选目标图像框输入预设的分类回归模型，得到所述样本图像对应的预测目标对象图像和所述预测目标对象图像对应的预测类别标签；根据所述样本图像对应的预测目标对象图像和所述预测目标对象图像对应的预测类别标签，以及，所述样本图像对应的真实目标对象图像以及所述真实目标对象图像对应的真实类别标签，确定所述训练图像样本的本轮的损失函数值；

10、类型确定单元，用于根据所述训练图像样本集中每组训练图像样本分别在n轮训练中的每一轮训练中的损失函数值，确定每组训练图像样本的样本类型；

11、模型训练单元，用于利用所述训练图像样本集、所述训练图像样本集中每个训练图像样本的样本类型和预设的样本类型对应的损失函数权重值，对所述目标检测模型和所述分类回归模型进行训练，得到已训练的目标检测模型和分类回归模型。

12、本公开实施例的第三方面，提供了一种计算机设备，包括存储器、处理器以及存储在存储器中并且可以在处理器上运行的计算机程序，该处理器执行计算机程序时实现上述方法的步骤。

13、本公开实施例的第四方面，提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述方法的步骤。

14、本公开实施例与现有技术相比存在的有益效果是：本公开实施例可以先获取训练图像样本集；其中，所述训练图像样本集包括若干训练图像样本，每组训练图像样本包括一张样本图像、所述样本图像对应的真实目标对象图像以及所述真实目标对象图像对应的真实类别标签。然后，可以针对每一组训练图像样本的每一轮训练，将所述训练图像样本中的样本图像输入预设的目标检测模型，得到所述样本图像对应的若干候选目标图像框；将所述样本图像对应的若干候选目标图像框输入预设的分类回归模型，得到所述样本图像对应的预测目标对象图像和所述预测目标对象图像对应的预测类别标签；根据所述样本图像对应的预测目标对象图像和所述预测目标对象图像对应的预测类别标签，以及，所述样本图像对应的真实目标对象图像以及所述真实目标对象图像对应的真实类别标签，确定所述训练图像样本的本轮的损失函数值。接着，可以根据所述训练图像样本集中每组训练图像样本分别在n轮训练中的每一轮训练中的损失函数值，确定每组训练图像样本的样本类型。最后，可以利用所述训练图像样本集、所述训练图像样本集中每个训练图像样本的样本类型和预设的样本类型对应的损失函数权重值，对所述目标检测模型和所述分类回归模型进行训练，得到已训练的目标检测模型和分类回归模型。可见，本实施例中先利用每组训练图像样本中的样本图像以及所述样本图像对应的真实目标对象图像以及所述真实目标对象图像对应的真实类别标签，确定每组训练图像样本分别在每一轮训练中的损失函数值，然后，依据每组训练图像样本分别在每一轮训练中的损失函数值为每组训练图像样本进行分类，确定组训练图像样本的样本类型；这样，对训练图像样本进行了充分的全局分析和挖掘，通过对训练图像样本在第一阶段训练过程中(即n轮训练)的损失函数值进行分类，甄别出不同的样本类型(比如简单样本，普通样本和难样本)，由于不同样本类型的训练图像样本对于目标检测模型、分类回归模型的训练效果的影响程度(比如影响目标检测模型、分类回归模型的泛化能力)不同，因此，可以根据不同的样本类型设置不同的损失函数权重值，以便在利用所述训练图像样本集、所述训练图像样本集中每组训练图像样本的样本类型和预设的样本类型对应的损失函数权重值，对所述目标检测模型、分类回归模型进行训练的过程中，可以减少不影响模型训练效果的样本类型的训练图像样本的损失函数权重值，以及提高对模型训练效果影响较大的样本类型的训练图像样本的损失函数权重值，以充分发挥对模型训练效果影响较大的样本类型的训练图像样本的潜力，减少对模型训练效果没有影响或者影响较差的样本类型的训练图像样本对于目标检测模型、分类回归模型训练的影响；可见，本实施例可以有效改善不同样本类型的训练图像样本的训练权重(即损失函数权重值)分布，从而让目标检测模型、分类回归模型的训练过程更为充分，可以提升了目标检测模型、分类回归模型的训练效率和效果，进而提升目标检测模型、分类回归模型的性能，进一步提高实际业务场景中目标检测模型、分类回归模型的检测效果(比如提高目标检测模型、分类回归模型的目标检测精准度)。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：暴宇健王芳
技术所有人：北京龙智数科科技服务有限公司
我是此专利的发明人

上一篇：一种热塑性弹性体材料及其制备方法与流程
上一篇：一种腰托结构、人体工学椅和腰托调节方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。