图像识别模型生成方法、图像识别方法、装置及设备与流程

文档序号：35667148发布日期：2023-10-07 10:16阅读：16来源：国知局

本公开实施例涉及人工智能和机器视觉，尤其涉及一种图像识别模型生成方法、图像识别方法、装置及设备。

背景技术：

1、当前，随机人工智能技术的快速发展，人工智能技术在机器视觉领域有了广泛的应用，机器视觉是一种通过机器代替人眼来做测量和判断的技术，具体而言，即通过采集图像数据，基于图像识别模型对图像数据进行识别，从而获得图像中的信息，实现模拟人眼测量和判断的目的。

2、现有技术中，基于神经网络的图像识别模型在实际使用前，需要通过大量图像数据进行训练直至模型收敛，而训练样本通常是有标数据。

3、然而，由于有标数据的获取成本高，数据量有限，导致训练后生成的图像识别模型存在鲁棒性较差，在不同环境下的模型表现不稳定的问题。

技术实现思路

1、本公开实施例提供一种图像识别模型生成方法、图像识别方法、装置及设备，以克服图像识别模型存在鲁棒性较差，在不同环境下的模型表现不稳定的问题。

2、第一方面，本公开实施例提供一种图像识别模型生成方法，包括：

3、获取第一图像数据，并对所述第一图像数据进行分类增强，得到第一目标数据和第二目标数据，其中，所述第一图像数据为无标数据，所述第一目标数据和所述第二目标数据分别为对所述第一图像数据进行特征变换后得到的图像数据；基于所述第一目标数据和所述第二目标数据，对初始模型进行无监督训练，得到预训练模型；基于目标分类信息对预训练模型进行训练，得到图像识别模型，其中，所述目标分类信息表征图像的目标类别，所述图像识别模型用于识别所述目标类别的图像。

4、第二方面，本公开实施例提供一种图像识别方法，包括：

5、获取待识别图像；

6、通过训练至收敛的图像识别模型，对所述待识别图像进行识别，得到识别结果，所述识别结果表征所述待识别图像的目标类别，其中，所述图像识别模型是通过如上第一方面以及第一方面各种可能的设计所述的图像识别模型生成方法得到的。

7、第三方面，本公开实施例提供一种图像识别模型生成装置，包括：

8、获取模块，用于获取第一图像数据，并对所述第一图像数据进行分类增强，得到第一目标数据和第二目标数据，其中，所述第一图像数据为无标数据，所述第一目标数据和所述第二目标数据分别为对所述第一图像数据进行特征变换后得到的图像数据；

9、第一训练模块，用于基于所述第一目标数据和所述第二目标数据，对初始模型进行无监督训练，得到预训练模型；

10、第二训练模块，用于基于目标分类信息对预训练模型进行训练，得到图像识别模型，其中，所述目标分类信息表征图像的目标类别，所述图像识别模型用于识别所述目标类别的图像。

11、第四方面，本公开实施例提供一种图像识别装置，包括：

12、获取模块，用于获取待识别图像；

13、识别模块，用于通过训练至收敛的图像识别模型，对所述待识别图像进行识别，得到识别结果，所述识别结果表征所述待识别图像的目标类别，其中，所述图像识别模型是通过如上第一方面以及第一方面各种可能的设计所述的图像识别模型生成方法得到的。

14、第五方面，本公开实施例提供一种电子设备，包括：

15、处理器，以及与所述处理器通信连接的存储器；

16、所述存储器存储计算机执行指令；

17、所述处理器执行所述存储器存储的计算机执行指令，以实现如上第一方面以及第一方面各种可能的设计所述的方法，或者，以实现如上第二方面以及第二方面各种可能的设计所述的方法。

18、第六方面，本公开实施例提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如上第一方面以及第一方面各种可能的设计所述的方法，或者，以实现如上第二方面以及第二方面各种可能的设计所述的方法。

19、第五方面，本公开实施例提供一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现如上第一方面以及第一方面各种可能的设计所述的方法，或者，实现如上第二方面以及第二方面各种可能的设计所述的方法。

20、本公开实施例提供的图像识别模型生成方法、图像识别方法、装置及设备，通过获取第一图像数据，并对所述第一图像数据进行分类增强，得到第一目标数据和第二目标数据，其中，所述第一图像数据为无标数据，所述第一目标数据和所述第二目标数据分别为对所述第一图像数据进行特征变换后得到的图像数据；基于所述第一目标数据和所述第二目标数据，对初始模型进行无监督训练，得到预训练模型；基于目标分类信息对预训练模型进行训练，得到图像识别模型，其中，所述目标分类信息表征图像的目标类别，所述图像识别模型用于识别所述目标类别的图像，由于首先利用无标数据对模型进行了预训练，生所成的预训练模型具备一定的视觉鲁棒性，之后再针对该预训练模型进行特定类别的图像识别训练，可有效提高最终得到的图像识别模型的鲁棒性，提高模型在不同环境下的图像识别效果。

技术特征：

1.一种图像识别模型生成方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述第一图像数据包括无标记的第一图像，所述第一目标数据包括无标记的第一目标图像，所述第二目标数据包括无标记的第二目标图像；

3.根据权利要求2所述的方法，其特征在于，所述第一增强策略包括第一特征信息和对应的第一强度系数，所述第二增强策略包括第二特征信息和对应的第二强度系数；

4.根据权利要求2所述的方法，其特征在于，基于所述第一目标数据和所述第二目标数据，对初始模型进行无监督训练，得到预训练模型，包括：

5.根据权利要求1所述的方法，其特征在于，基于目标分类信息对预训练模型进行训练，得到图像识别模型，包括：

6.根据权利要求5所述的方法，其特征在于，所述根据所述第二图像数据，对所述预训练模型进行半监督训练，得到所述图像识别模型，包括：

7.根据权利要求6所述的方法，其特征在于，所述将所述第三图像输入所述预训练模型，得到所述第三图像对应的第二损失函数值，包括：

8.根据权利要求1-7任一项所述的方法，其特征在于，所述方法还包括：

9.根据权利要求8所述的方法，其特征在于，所述利用所述第三图像数据，对所述图像识别模型进行自蒸馏训练，得到所述图像识别模型对应的优化模型，包括：

10.一种图像识别方法，其特征在于，包括：

11.一种图像识别模型生成装置，其特征在于，包括：

12.一种图像识别装置，其特征在于，包括：

13.一种电子设备，其特征在于，包括：处理器，以及与所述处理器通信连接的存储器；

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如权利要求1至10任一项所述的方法。

15.一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法。

技术总结
本公开实施例提供一种图像识别模型生成方法、图像识别方法、装置及设备，通过获取第一图像数据，并对第一图像数据进行分类增强，得到第一目标数据和第二目标数据，其中，第一图像数据为无标数据，第一目标数据和第二目标数据分别为对第一图像数据进行特征变换后得到的图像数据；基于第一目标数据和第二目标数据，对初始模型进行无监督训练，得到预训练模型；基于目标分类信息对预训练模型进行训练，得到图像识别模型，其中，目标分类信息表征图像的目标类别，图像识别模型用于识别目标类别的图像，可有效提高最终得到的图像识别模型的鲁棒性，提高模型在不同环境下的图像识别效果。

技术研发人员：吴捷
受保护的技术使用者：北京字跳网络技术有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴捷
技术所有人：北京字跳网络技术有限公司
我是此专利的发明人

上一篇：可拉伸显示面板及其制备方法、显示装置与流程
上一篇：一种基于机器视觉的自动拓扑方法及系统

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。