对象识别方法、装置、可读介质及电子设备与流程

文档序号:34885583发布日期:2023-07-25 15:34阅读:23来源:国知局
对象识别方法、装置、可读介质及电子设备与流程

本公开涉及计算机,具体地,涉及一种对象识别方法、装置、可读介质及电子设备。


背景技术:

1、随着深度学习的发展,深度神经网络在学术界和工业界受到了越来越多的重视,并且得到了广泛的应用。例如,可以基于深度学习模型实现语音识别以及图像的目标检测等。

2、一般来说,深度神经网络的计算量和参数量越多,也即模型越大,其学习能力就越强,越能拟合实际的业务数据。然而,受限于硬件设备,神经网络模型不能无限变大。因此,需要设计一个小模型,保持较小的参数量和计算量。但是小模型的学习能力相对较差,为了解决该问题,可以采用知识蒸馏算法,在训练小模型的时候,引入大模型的相关参数作为小模型的正则化约束项,从而实现将大模型的知识蒸馏给小模型,使得小模型的识别精度和学习能力得以提高。


技术实现思路

1、提供该部分内容以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该部分内容并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。

2、第一方面,本公开提供一种对象识别方法,所述方法包括:

3、获取待识别的目标对象;

4、将所述目标对象输入目标识别模型后,得到识别结果;

5、所述目标识别模型为根据投影矩阵、第一特征图以及第二特征图对目标知识接受模型进行模型训练后得到的识别模型;所述第一特征图为预先训练得到的目标知识输出模型的至少一个第一预设中间层输出的特征图,所述第二特征图为预先训练得到的所述目标知识接受模型的至少一个第二预设中间层输出的特征图;所述投影矩阵用于对所述第一特征图和所述第二特征图进行知识蒸馏。

6、第二方面,本公开提供一种对象识别装置,所述装置包括:

7、获取模块,用于获取待识别的目标对象;

8、识别模块,用于将所述目标对象输入目标识别模型后,得到识别结果;

9、所述目标识别模型为根据投影矩阵、第一特征图以及第二特征图对目标知识接受模型进行模型训练后得到的识别模型;所述第一特征图为预先训练得到的目标知识输出模型的至少一个第一预设中间层输出的特征图,所述第二特征图为预先训练得到的所述目标知识接受模型的至少一个第二预设中间层输出的特征图;所述投影矩阵用于对所述第一特征图和所述第二特征图进行知识蒸馏。

10、第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现本公开第一方面所述方法的步骤。

11、第四方面,本公开提供一种电子设备,包括:

12、存储装置,其上存储有至少一个计算机程序;

13、至少一个处理装置,用于执行所述存储装置中的所述至少一个计算机程序,以实现本公开第一方面所述方法的步骤。

14、通过上述技术方案,可以使用投影矩阵将目标知识输出模型的中间层输出的第一特征图,和目标知识接受模型的中间层输出的第二特征图进行知识蒸馏,然后根据知识蒸馏后的特征图对目标知识接受模型进行模型训练,即可得到识别精度较高的目标识别模型,相比较于相关技术中需要设计较多的精巧模块来实现中间层的知识蒸馏来说,本公开的知识蒸馏方案实现较简单,同时使得目标识别模型的性能(如识别精度)得以提升。例如,目标识别模型的识别精度可以提升至与目标知识输出模型接近的识别精度。这样,基于目标识别模型进行语音识别或者目标检测时,可以提高语音识别或者目标检测的精度,同时模型还具有较大的泛化能力。

15、本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。



技术特征:

1.一种对象识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,根据所述投影矩阵、第一特征图以及第二特征图对目标知识接受模型进行模型训练后,得到所述目标识别模型包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述投影矩阵、所述第一特征图以及所述第二特征图对所述第一损失函数进行优化,得到第二损失函数包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述目标投影矩阵、所述第一目标中间层输出的第一目标特征图以及对应于所述第一目标中间层的所述第二预设中间层输出的第二目标特征图,确定所述第一目标中间层对应的损失函数约束项包括:

5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述根据所述目标知识输出模型的至少一个第一预设中间层输出的所述第一特征图确定所述投影矩阵包括:

7.根据权利要求6所述的方法,其特征在于,所述对所述第一特征图矩阵进行主成分分析pca分解后,根据分解结果确定所述第一预设中间层对应的所述投影矩阵包括:

8.根据权利要求5所述的方法,其特征在于,所述根据所述目标知识输出模型的至少一个第一预设中间层输出的所述第一特征图确定所述投影矩阵包括:

9.根据权利要求5所述的方法,其特征在于,所述根据所述目标知识输出模型的至少一个第一预设中间层输出的所述第一特征图确定所述投影矩阵包括:

10.一种对象识别装置,其特征在于,所述装置包括:

11.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现权利要求1-9中任一项所述方法的步骤。

12.一种电子设备,其特征在于,包括:


技术总结
本公开涉及一种对象识别方法、装置、可读介质和电子设备,可以获取待识别的目标对象;将所述目标对象输入目标识别模型后,得到识别结果;所述目标识别模型为根据投影矩阵、第一特征图以及第二特征图对目标知识接受模型进行模型训练后得到的识别模型;所述第一特征图为预先训练得到的目标知识输出模型的至少一个第一预设中间层输出的特征图,所述第二特征图为预先训练得到的所述目标知识接受模型的至少一个第二预设中间层输出的特征图;所述投影矩阵用于对所述第一特征图和所述第二特征图进行知识蒸馏。

技术研发人员:郭义,何义乾,李晓阳,禹梓林,秦浩桐,张阳,马泽君
受保护的技术使用者:北京有竹居网络技术有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1