本公开实施例涉及人工智能和机器视觉,尤其涉及一种图像识别模型生成方法、图像识别方法、装置及设备。
背景技术:
1、当前,随机人工智能技术的快速发展,人工智能技术在机器视觉领域有了广泛的应用,机器视觉是一种通过机器代替人眼来做测量和判断的技术,具体而言,即通过采集图像数据,基于图像识别模型对图像数据进行识别,从而获得图像中的信息,实现模拟人眼测量和判断的目的。
2、现有技术中,基于神经网络的图像识别模型在实际使用前,需要通过大量图像数据进行训练直至模型收敛,而训练样本通常是有标数据。
3、然而,由于有标数据的获取成本高,数据量有限,导致训练后生成的图像识别模型存在鲁棒性较差,在不同环境下的模型表现不稳定的问题。
技术实现思路
1、本公开实施例提供一种图像识别模型生成方法、图像识别方法、装置及设备,以克服图像识别模型存在鲁棒性较差,在不同环境下的模型表现不稳定的问题。
2、第一方面,本公开实施例提供一种图像识别模型生成方法,包括:
3、获取第一图像数据,并对所述第一图像数据进行分类增强,得到第一目标数据和第二目标数据,其中,所述第一图像数据为无标数据,所述第一目标数据和所述第二目标数据分别为对所述第一图像数据进行特征变换后得到的图像数据;基于所述第一目标数据和所述第二目标数据,对初始模型进行无监督训练,得到预训练模型;基于目标分类信息对预训练模型进行训练,得到图像识别模型,其中,所述目标分类信息表征图像的目标类别,所述图像识别模型用于识别所述目标类别的图像。
4、第二方面,本公开实施例提供一种图像识别方法,包括:
5、获取待识别图像;
6、通过训练至收敛的图像识别模型,对所述待识别图像进行识别,得到识别结果,所述识别结果表征所述待识别图像的目标类别,其中,所述图像识别模型是通过如上第一方面以及第一方面各种可能的设计所述的图像识别模型生成方法得到的。
7、第三方面,本公开实施例提供一种图像识别模型生成装置,包括:
8、获取模块,用于获取第一图像数据,并对所述第一图像数据进行分类增强,得到第一目标数据和第二目标数据,其中,所述第一图像数据为无标数据,所述第一目标数据和所述第二目标数据分别为对所述第一图像数据进行特征变换后得到的图像数据;
9、第一训练模块,用于基于所述第一目标数据和所述第二目标数据,对初始模型进行无监督训练,得到预训练模型;
10、第二训练模块,用于基于目标分类信息对预训练模型进行训练,得到图像识别模型,其中,所述目标分类信息表征图像的目标类别,所述图像识别模型用于识别所述目标类别的图像。
11、第四方面,本公开实施例提供一种图像识别装置,包括:
12、获取模块,用于获取待识别图像;
13、识别模块,用于通过训练至收敛的图像识别模型,对所述待识别图像进行识别,得到识别结果,所述识别结果表征所述待识别图像的目标类别,其中,所述图像识别模型是通过如上第一方面以及第一方面各种可能的设计所述的图像识别模型生成方法得到的。
14、第五方面,本公开实施例提供一种电子设备,包括:
15、处理器,以及与所述处理器通信连接的存储器;
16、所述存储器存储计算机执行指令;
17、所述处理器执行所述存储器存储的计算机执行指令,以实现如上第一方面以及第一方面各种可能的设计所述的方法,或者,以实现如上第二方面以及第二方面各种可能的设计所述的方法。
18、第六方面,本公开实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的方法,或者,以实现如上第二方面以及第二方面各种可能的设计所述的方法。
19、第五方面,本公开实施例提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上第一方面以及第一方面各种可能的设计所述的方法,或者,实现如上第二方面以及第二方面各种可能的设计所述的方法。
20、本公开实施例提供的图像识别模型生成方法、图像识别方法、装置及设备,通过获取第一图像数据,并对所述第一图像数据进行分类增强,得到第一目标数据和第二目标数据,其中,所述第一图像数据为无标数据,所述第一目标数据和所述第二目标数据分别为对所述第一图像数据进行特征变换后得到的图像数据;基于所述第一目标数据和所述第二目标数据,对初始模型进行无监督训练,得到预训练模型;基于目标分类信息对预训练模型进行训练,得到图像识别模型,其中,所述目标分类信息表征图像的目标类别,所述图像识别模型用于识别所述目标类别的图像,由于首先利用无标数据对模型进行了预训练,生所成的预训练模型具备一定的视觉鲁棒性,之后再针对该预训练模型进行特定类别的图像识别训练,可有效提高最终得到的图像识别模型的鲁棒性,提高模型在不同环境下的图像识别效果。
1.一种图像识别模型生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述第一图像数据包括无标记的第一图像,所述第一目标数据包括无标记的第一目标图像,所述第二目标数据包括无标记的第二目标图像;
3.根据权利要求2所述的方法,其特征在于,所述第一增强策略包括第一特征信息和对应的第一强度系数,所述第二增强策略包括第二特征信息和对应的第二强度系数;
4.根据权利要求2所述的方法,其特征在于,基于所述第一目标数据和所述第二目标数据,对初始模型进行无监督训练,得到预训练模型,包括:
5.根据权利要求1所述的方法,其特征在于,基于目标分类信息对预训练模型进行训练,得到图像识别模型,包括:
6.根据权利要求5所述的方法,其特征在于,所述根据所述第二图像数据,对所述预训练模型进行半监督训练,得到所述图像识别模型,包括:
7.根据权利要求6所述的方法,其特征在于,所述将所述第三图像输入所述预训练模型,得到所述第三图像对应的第二损失函数值,包括:
8.根据权利要求1-7任一项所述的方法,其特征在于,所述方法还包括:
9.根据权利要求8所述的方法,其特征在于,所述利用所述第三图像数据,对所述图像识别模型进行自蒸馏训练,得到所述图像识别模型对应的优化模型,包括:
10.一种图像识别方法,其特征在于,包括:
11.一种图像识别模型生成装置,其特征在于,包括:
12.一种图像识别装置,其特征在于,包括:
13.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至10任一项所述的方法。
15.一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法。