半监督目标检测模型训练方法、装置、设备及介质与流程

文档序号：33823341发布日期：2023-04-19 20:37阅读：48来源：国知局

本发明涉及半监督目标检测，特别是涉及一种半监督目标检测模型训练方法、装置、设备及介质。

背景技术：

1、随着计算机技术的发展和计算机视觉原理的应用，目标检测具有广泛的应用场景，例如自动驾驶、工业生产、视频监控、医学影像处理以及卫星影像处理等。目标检测大多基于深度学习算法，目标检测的结果取决于模型训练中的有标签数据，如物体的位置与类别等标签信息，由于深度神经网络的训练需要大量数据，对训练图像完成标注需要耗费大量时间和人力,因此，出现了利用半监督进行目标检测的方式。其中，半监督通过同时利用有标签和无标签数据，即从有标签数据中获得强监督学习信号，从无标签的训练数据中获取到有用的学习信息，能够进一步提升目标检测模型的性能。

2、半监督目标检测技术可分为基于一致性学习和伪标签学习算法。其中，基于一致性学习的半监督目标检测方法通过识别同一张无标签图像在扰动情况下的一致性特征，从而利用无标签图像的数据信息进行目标检测；基于伪标签学习的半监督目标检测算法，通过对有标签数据进行学习，得到预训练模型，即教师网络，然后对无标签数据进行预测获得伪标签数据，最后利用伪标签数据和有标签数据重新共同训练模型，即通过获得的学生网络实现目标检测。但在现有技术中，基于伪标签学习的半监督目标检测没有对目标检测任务拆分为目标定位与目标分类，并且教师模型和学生模型都只使用了目标检测网络，使得半监督目标检测模型对无标签数据做分类的能力较低，从而导致目标检测的结果准确性低的问题。

技术实现思路

1、鉴于以上所述现有技术的缺点，本发明提供了一种半监督目标检测模型训练方法、装置、设备及介质，用于解决半监督目标检测模型的目标检测结果准确性低的技术问题。

2、针对于上述问题，本发明提供了一种半监督目标检测模型训练方法，所述方法包括：

3、获取标注数据集与无标注数据集，所述标注数据集内的图像样本携带目标对象的目标坐标和目标类别；

4、构建包含相同目标检测网络和图像分类网络的权重系数随机化的教师模型与权重系数随机化的学生模型，利用所述标注数据集对所述权重系数随机化的教师模型进行训练，获得权重系数更新的教师模型；

5、使用所述权重系数更新的教师模型对所述无标注数据集中目标对象进行预测，获得伪目标坐标和伪目标类别；

6、根据所述目标坐标、所述目标类别、所述伪目标坐标以及所述伪目标类别联合训练所述权重系数随机化的学生模型，获得权重系数更新的学生模型；

7、基于所述权重系数更新的学生模型的权重系数，更新所述权重系数更新的教师模型的权重系数，直至两者间的权重系数符合预设条件，将当前所述权重系数更新的学生模型作为半监督目标检测模型。

8、于本发明一实施例中，利用所述标注数据集对所述权重系数随机化的教师模型进行训练，获得权重系数更新的教师模型，包括：

9、通过所述目标坐标和所述目标类别对所述权重系数随机化的教师模型中的目标检测网络进行训练；以及，

10、对所述目标坐标对应的区域进行裁剪，获得目标区域；

11、将所述目标类别作为所述目标区域的标签，对所述权重系数随机化的教师模型中的图像分类网络进行训练，获得所述权重系数更新的教师模型。

12、于本发明一实施例中，获得所述权重系数更新的教师模型之后，所述方法还包括：

13、基于目标检测网络第一损失函数计算所述权重系数更新的教师模型中目标检测网络的训练损失值；

14、基于图像分类网络损失函数计算所述权重系数更新的教师模型中图像分类网络的训练损失值。

15、于本发明一实施例中，所述目标检测网络第一损失函数的计算公式为：

16、

17、其中，lossdetection表示目标检测网络训练损失值；i表示第i个框；li表示预测的第i个框的目标坐标；表示对应的真实目标坐标；x，y，w，h分别表示目标区域左上顶点的横纵坐标、区域的宽和高；表示类别的真实标签；yi表示预测的类别；smoothl1用于衡量li和的差别；softmax(y)表示预测类别时的归一化操作；

18、所述图像分类网络损失函数的计算公式为：

19、

20、其中，lossclassification表示图像分类网络训练损失值；表示类别的真实标签；yi表示预测的类别；softmax(y)表示预测类别时的归一化操作。

21、于本发明一实施例中，使用所述权重系数更新的教师模型对所述无标注数据集中目标对象进行预测，获得伪目标坐标和伪目标类别，包括：

22、使用所述权重系数更新的教师模型中的目标检测网络对所述无标注数据集中目标对象进行预测，获得所述伪目标坐标；

23、对所述伪目标坐标对应的区域进行裁剪，获得伪目标区域；

24、通过所述权重系数更新的教师模型中的图像分类网络对所述伪目标区域进行预测，获得所述伪目标类别。

25、于本发明一实施例中，在获得权重系数更新的学生模型之后，所述方法还包括：

26、基于目标检测网络第二损失函数计算所述权重系数更新的学生模型中目标检测网络的训练损失值，所述权重系数更新的学生模型中目标检测网络的训练损失值包括检测损失值；

27、基于所述图像分类网络损失函数计算所述权重系数更新的学生模型中图像分类网络的训练损失值。

28、于本发明一实施例中，基于所述权重系数更新的学生模型的权重系数，更新所述权重系数更新的教师模型的权重系数，直至两者间的权重系数符合预设条件，将当前所述权重系数更新的学生模型作为半监督目标检测模型，包括：

29、当所述权重系数更新的学生模型中图像分类网络的训练损失值小于第一预设阈值时，基于所述目标检测网络的第一损失函数计算所述权重系数更新的学生模型中目标检测网络的训练损失值，以使所述权重系数更新的学生模型中目标检测网络的训练损失值包括检测损失值和类别损失值；

30、基于修改了目标检测网络损失函数后的权重系数更新的学生模型的权重系数，更新所述权重系数更新的教师模型的权重系数；

31、当所述权重系数更新的学生模型的权重系数与所述权重系数更新的教师模型权重系数的差值小于第二预设阈值时，将当前所述权重系数更新的学生模型作为半监督目标检测模型。

32、于本发明一实施例中，修改之前的权重系数更新的学生模型中目标检测网络损失函数为目标检测网络第二损失函数，计算公式为：

33、

34、其中，lossdetection表示目标检测网络训练损失值；i表示第i个框；li表示预测的第i个框的目标坐标；表示对应的真实目标坐标；x，y，w，h分别表示目标区域左上顶点的横纵坐标、区域的宽和高；smoothl1用于衡量li和的差别；

35、修改之后的权重系数更新的学生模型中目标检测网络损失函数为目标检测网络第一损失函数，计算公式为：

36、

37、其中，lossdetection表示目标检测网络训练损失值；i表示第i个框；li表示预测的第i个框的目标坐标；表示对应的真实目标坐标；x，y，w，h分别表示目标区域左上顶点的横纵坐标、区域的宽和高；表示类别的真实标签；yi表示预测的类别；smoothl1用于衡量li和的差别；softmax(y)表示预测类别时的归一化操作。

38、于本发明一实施例中，将当前所述权重系数更新的学生模型作为半监督目标检测模型之后，所述方法还包括：

39、将待测图像输入所述半监督目标检测模型，得到所述待测图像的检测结果。

40、本发明还提供了一种半监督目标检测模型训练装置，其特征在于，所述装置包括：

41、数据集获取模块，用于获取标注数据集与无标注数据集，所述标注数据集内的图像样本携带目标对象的目标坐标和目标类别；

42、教师模型训练模块，用于构建包含相同目标检测网络和图像分类网络的权重系数随机化的教师模型与权重系数随机化的学生模型，利用所述标注数据集对所述权重系数随机化的教师模型进行训练，获得权重系数更新的教师模型；

43、预测模块，用于使用所述权重系数更新的教师模型对所述无标注数据集中目标对象进行预测，获得伪目标坐标和伪目标类别；

44、学生模型训练模块，用于根据所述目标坐标、所述目标类别、所述伪目标坐标以及所述伪目标类别联合训练所述权重系数随机化的学生模型，获得权重系数更新的学生模型；

45、权重系数更新模块，用于基于所述权重系数更新的学生模型的权重系数，更新所述权重系数更新的教师模型的权重系数，直至两者间的权重系数符合预设条件，将当前所述权重系数更新的学生模型作为半监督目标检测模型。

46、本发明还提供了一种电子设备，包括：处理器及存储器；所述存储器用于存储计算机程序，所述处理器用于执行所述存储器存储的计算机程序，以使所述电子设备执行上述的方法。

47、本发明还提供了一种计算机可读存储介质，其上存储有计算机程序：所述计算机程序被处理器执行时实现上述的方法。

48、如上所述，本发明实施例提供的一种半监督目标检测模型训练方法、装置、设备及介质，具有以下有益效果：

49、首先通过获取标注数据集与无标注数据集，其中，标注数据集内的图像样本携带目标对象的目标坐标和目标类别，然后利用标注数据集对权重系数随机化的教师模型进行训练，获得权重系数更新的教师模型，进一步地，使用权重系数更新的教师模型对无标注数据集中目标对象进行预测，获得伪目标坐标和伪目标类别，再根据目标坐标、目标类别、伪目标坐标以及伪目标类别联合训练权重系数随机化的学生模型，获得权重系数更新的学生模型，最后基于权重系数更新的学生模型的权重系数更新权重系数更新的教师模型的权重系数，直至两者间的权重系数符合预设条件，将当前权重系数更新的学生模型作为半监督目标检测模型。通过将检测任务拆分为定位和分类两个子任务对模型进行训练，能够获得准确且泛化能力强的半监督目标检测模型。

50、应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本技术。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：叶德贤
技术所有人：重庆长安汽车软件科技有限公司
我是此专利的发明人

上一篇：一种防止术后病人侧卧的限制装置
上一篇：一种黄精生产加工用切片装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。