多任务学习模型的训练方法、装置、电子设备和存储介质与流程

文档序号：35872583发布日期：2023-10-28 08:13阅读：38来源：国知局

本公开涉及人工智能，尤其涉及深度学习、深度神经网络、图像处理，尤其涉及一种多任务学习模型的训练方法、图像处理方法、装置、电子设备、存储介质和计算机程序产品。

背景技术：

1、目前，随着人工智能技术的不断发展，mtl(multi-task learning，多任务学习)模型具有泛化性好等优点，在图像处理、语音处理、文本处理等领域中得到了广泛应用。然而，相关技术中的多任务学习模型的训练方法，存在训练好的多任务学习模型的效果和泛化性差的问题。

技术实现思路

1、本公开提出了一种多任务学习模型的训练方法、图像处理方法、装置、电子设备、存储介质和计算机程序产品。

2、根据本公开的第一方面，提出了一种多任务学习模型的训练方法，包括：获取第一训练样本的参考预测结果，其中，所述参考预测结果不是基于所述第一训练样本的标签得到的；将所述第一训练样本输入初始模型中，由所述初始模型输出所述第一训练样本的实际预测结果；基于所述参考预测结果和所述第一训练样本的实际预测结果，得到所述初始模型的总损失函数；基于所述总损失函数，对所述初始模型进行训练，得到多任务学习模型。

3、根据本公开的第二方面，提出了一种图像处理方法，包括：获取待处理图像；将所述待处理图像输入多任务学习图像模型中，由所述多任务学习图像模型输出所述待处理图像的处理结果，其中，所述多任务学习图像模型采用上述第一方面提出的多任务学习模型的训练方法得到。

4、根据本公开的第三方面，提出了一种多任务学习模型的训练装置，包括：第一获取模块，用于获取第一训练样本的参考预测结果，其中，所述参考预测结果不是基于所述第一训练样本的标签得到的；第二获取模块，用于将所述第一训练样本输入初始模型中，由所述初始模型输出所述第一训练样本的实际预测结果；第三获取模块，用于基于所述参考预测结果和所述第一训练样本的实际预测结果，得到所述初始模型的总损失函数；训练模块，用于基于所述总损失函数，对所述初始模型进行训练，得到多任务学习模型。

5、根据本公开的第四方面，提出了一种图像处理装置，包括：获取待处理图像；将所述待处理图像输入多任务学习图像模型中，由所述多任务学习图像模型输出所述待处理图像的处理结果，其中，所述多任务学习图像模型采用上述第一方面提出的多任务学习模型的训练方法得到。

6、根据本公开的第五方面，提出了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述第一方面提出的多任务学习模型的训练方法，或者执行上述第二方面提出的图像处理方法。

7、根据本公开的第六方面，提出了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行上述第一方面提出的多任务学习模型的训练方法，或者执行上述第二方面提出的图像处理方法。

8、根据本公开的第七方面，提出了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现上述第一方面提出的多任务学习模型的训练方法，或者实现上述第二方面提出的图像处理方法。

9、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种多任务学习模型的训练方法，包括：

2.根据权利要求1所述的方法，其中，所述获取第一训练样本的参考预测结果，包括：

3.根据权利要求2所述的方法，其中，所述获取预先训练好的参考模型，包括：

4.根据权利要求3所述的方法，其中，所述基于所述多任务学习模型、多个所述候选模型的推理任务，从多个所述候选模型中筛选出所述参考模型，包括：

5.根据权利要求1所述的方法，其中，所述基于所述参考预测结果和所述第一训练样本的实际预测结果，得到所述初始模型的总损失函数，包括：

6.根据权利要求5所述的方法，其中，所述基于所述参考预测结果、所述第一训练样本的实际预测结果和所述第一训练样本的标签，得到所述总损失函数，包括：

7.根据权利要求6所述的方法，其中，所述基于所述第一损失函数和所述第二损失函数，得到所述总损失函数，包括：

8.根据权利要求7所述的方法，其中，所述基于所述第一损失函数、所述第二损失函数和所述第三损失函数，得到所述总损失函数，包括：

9.一种图像处理方法，包括：

10.一种多任务学习模型的训练装置，包括：

11.根据权利要求10所述的装置，其中，所述第一获取模块，还用于：

12.根据权利要求11所述的装置，其中，所述第一获取模块，还用于：

13.根据权利要求12所述的装置，其中，所述第一获取模块，还用于：

14.根据权利要求10所述的装置，其中，所述第三获取模块，还用于：

15.根据权利要求14所述的装置，其中，所述第三获取模块，还用于：

16.根据权利要求15所述的装置，其中，所述第三获取模块，还用于：

17.根据权利要求16所述的装置，其中，所述第三获取模块，还用于：

18.一种图像处理装置，包括：

19.一种电子设备，包括：

20.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-9中任一项所述的方法。

21.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-9中任一项所述的方法。

技术总结
本公开提出了一种多任务学习模型的训练方法、装置、电子设备和存储介质，涉及人工智能技术领域，尤其涉及深度学习、深度神经网络、图像处理技术领域。方法包括：获取第一训练样本的参考预测结果，参考预测结果不是基于第一训练样本的标签得到的；将第一训练样本输入初始模型中，得到第一训练样本的实际预测结果；基于参考预测结果和第一训练样本的实际预测结果，得到初始模型的总损失函数；基于总损失函数，对初始模型进行训练，得到多任务学习模型。由此，可基于第一训练样本的标签以外的其他途径，得到参考预测结果，并综合考虑到参考预测结果和第一训练样本的实际预测结果，得到总损失函数，有助于提升多任务学习模型的效果和泛化性。

技术研发人员：许韩晨玺,张巨岩,许海洋,岳洪达
受保护的技术使用者：北京百度网讯科技有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：许韩晨玺张巨岩许海洋岳洪达
技术所有人：北京百度网讯科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。