本公开涉及人工智能,具体为深度学习、图像处理、计算机视觉。具体涉及一种目标检测模型训练方法、目标检测方法、装置和电子设备。
背景技术:
1、随着人工智能(artificial intelligence,ai)的快速发展,人工智能已经广泛应用于计算机视觉技术、语音识别技术、自然语言处理技术、深度学习、大数据处理技术等领域。
2、基于人工智能的图像检测技术也已经广泛应用于不同场景。其中,基于人工智能的目标检测技术,用于确定图像中的物体边界框和物体类别。如何提高目标检测性能十分重要。
技术实现思路
1、本公开提供了一种目标检测模型训练方法、目标检测方法、装置和电子设备。
2、根据本公开的一方面,提供了一种目标检测模型训练方法,包括:
3、在教师模型中,将样本图像输入图像特征提取网络得到教师图像特征,并将所述教师图像特征输入编码器得到教师序列特征;将可学习的教师查询向量和所述教师序列特征输入解码器得到增强教师查询向量,并根据所述增强教师查询向量进行预测得到教师预测信息;
4、在学生模型中,将所述样本图像输入图像特征提取网络得到学生图像特征,并将所述学生图像特征输入编码器得到学生序列特征;将可学习的学生查询向量和所述学生序列特征输入解码器得到增强学生查询向量,并根据所述增强学生查询向量进行预测得到学生预测信息;
5、根据所述教师预测信息、所述学生预测信息和样本图像的真值信息,对所述教师查询向量进行训练,并对所述学生模型进行训练。
6、根据本公开的另一方面,提供了一种目标检测方法,包括:
7、获取待检测的目标图像;
8、将所述目标图像输入目标检测模型得到检测结果;所述目标检测模型为采用本公开任意实施例公开的目标检测模型训练方法所训练得到的学生模型。
9、根据本公开的又一方面,提供了一种目标检测模型训练装置,包括:
10、教师预测模块,用于在教师模型中,将样本图像输入图像特征提取网络得到教师图像特征,并将所述教师图像特征输入编码器得到教师序列特征;将可学习的教师查询向量和所述教师序列特征输入解码器得到增强教师查询向量,并根据所述增强教师查询向量进行预测得到教师预测信息;
11、学生预测模块,用于在学生模型中,将所述样本图像输入图像特征提取网络得到学生图像特征,并将所述学生图像特征输入编码器得到学生序列特征;将可学习的学生查询向量和所述学生序列特征输入解码器得到增强学生查询向量,并根据所述增强学生查询向量进行预测得到学生预测信息;
12、模型训练模块,用于根据所述教师预测信息、所述学生预测信息和样本图像的真值信息,对所述教师查询向量进行训练,并对所述学生模型进行训练。
13、根据本公开的又一方面,提供了一种目标检测装置,包括:
14、目标图像模块,用于获取待检测的目标图像;
15、目标图像检测模块,用于将所述目标图像输入目标检测模型得到检测结果;所述目标检测模型为采用本公开任意实施例公开的目标检测模型训练方法所训练得到的学生模型。
16、根据本公开的另一方面,提供了一种电子设备,该电子设备包括:
17、至少一个处理器;以及
18、与所述至少一个处理器通信连接的存储器;其中,
19、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开任意实施例所提供的方法。
20、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行本公开任意实施例所提供的方法。
21、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
1.一种目标检测模型训练方法,包括:
2.根据权利要求1所述的方法,其中,所述将可学习的教师查询向量和所述教师序列特征输入解码器得到增强教师查询向量,包括:
3.根据权利要求1所述的方法,其中,所述将可学习的学生查询向量和所述学生序列特征输入解码器得到增强学生查询向量,包括:
4.根据权利要求1所述的方法,其中,所述根据所述教师预测信息、所述学生预测信息和样本图像的真值信息,对所述教师查询向量进行训练,并对所述学生模型进行训练,包括:
5.根据权利要求2所述的方法,其中,所述根据所述教师预测信息、所述学生预测信息和样本图像的真值信息,对教师模型中的交叉注意力层进行训练,包括:
6.根据权利要求1所述的方法,所述方法还包括:
7.根据权利要求6所述的方法,其中,所述根据所述教师预测信息、所述学生预测信息、所述中间预测信息和样本图像的真值信息,对所述教师查询向量进行训练,并对所述中间解码器和所述学生模型中进行训练,包括:
8.根据权利要求6所述的方法,其中,所述将可学习的教师查询向量和所述教师序列特征输入解码器得到增强教师查询向量,包括:
9.根据权利要求8所述的方法,其中,所述根据所述教师预测信息、所述中间预测信息和样本图像的真值信息,对教师模型中的交叉注意力层进行训练,包括:
10.根据权利要求6所述的方法,其中,所述将可学习的中间查询向量和所述学生序列特征输入所述中间解码器得到增强中间查询向量,包括:
11.一种目标检测方法,包括:
12.一种目标检测模型训练装置,包括:
13.根据权利要求12所述的装置,其中,所述教师预测模块包括:
14.根据权利要求12所述的装置,其中,所述学生预测模块包括:
15.根据权利要求12所述的装置,其中,所述模型训练模块包括:
16.根据权利要求13所述的装置,其中,所述交叉训练单元包括:
17.根据权利要求12所述的装置,所述装置还包括中间训练模块,所述中间训练模块包括:
18.根据权利要求17所述的装置,其中,所述模型训练模块包括:
19.根据权利要求17所述的装置,其中,所述教师预测模块包括:
20.根据权利要求19所述的装置,其中,所述第二交叉训练单元包括:
21.根据权利要求17所述的装置,其中,所述增强中间单元包括:
22.一种目标检测装置,包括:
23.一种电子设备,包括:
24.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行根据权利要求1-11中任一项所述的方法。
25.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-11中任一项所述的方法。