模型处理方法、装置、设备及存储介质与流程

文档序号：36406029发布日期：2023-12-16 13:34阅读：62来源：国知局

本申请涉及人工智能领域，尤其涉及一种模型处理方法、装置、设备及存储介质。

背景技术：

1、在模型训练的相关场景中，通常需要大量的有标签样本来进行模型训练，以期望训练后的模型能达到较好的模型效果；一般来说，有标签样本对应的标签数据通常为人工标注的，当人工标注大量有标签样本时，标注成本过高，因此导致有标签样本的数量少，进而导致模型训练效果差。

技术实现思路

1、本申请实施例提供一种模型处理方法、装置、设备、存储介质及计算机程序产品，可实现对有标签样本的扩充，减少标签标注的成本，进而可提高模型训练效果。

2、一方面，本申请实施例提供了一种模型处理方法，包括：

3、获取模型集合；所述模型集合包括多个参考模型；

4、根据所述模型集合、集成模型训练样本集以及标注标签数据生成集成模型；其中，所述集成模型训练样本集中每一集成模型训练样本分别对应有标注标签数据，所述集成模型是根据所述模型集合中的多个参考模型以及决策模型得到的，所述模型集合中参考模型的输入为集成模型训练样本，所述决策模型的输入为所述模型集合中参考模型的输出；

5、获取第一样本集，并通过所述集成模型预测得到所述第一样本集中各个无标签样本对应的预测标签数据；

6、根据所述第一样本集以及所述第一样本集中各个无标签样本对应的预测标签数据，训练得到目标模型。

7、一方面，本申请实施例提供了一种模型处理装置，包括：

8、获取单元，用于获取模型集合；所述模型集合包括多个参考模型；

9、处理单元，用于根据所述模型集合、集成模型训练样本集以及标注标签数据生成集成模型；其中，所述集成模型训练样本集中每一集成模型训练样本分别对应有标注标签数据，所述集成模型是根据所述模型集合中的多个参考模型以及决策模型得到的，所述模型集合中参考模型的输入为集成模型训练样本，所述决策模型的输入为所述模型集合中参考模型的输出；

10、所述获取单元还用于获取第一样本集，所述处理单元还用于通过所述集成模型预测得到所述第一样本集中各个无标签样本对应的预测标签数据；

11、所述处理单元还用于根据所述第一样本集以及所述第一样本集中各个无标签样本对应的预测标签数据，训练得到目标模型。

12、一方面，本申请实施例提供了一种模型处理设备，其特征在于，所述模型处理设备包括输入接口和输出接口，还包括：

13、处理器，适于实现一条或多条指令；以及，

14、计算机存储介质，所述计算机存储介质存储有一条或多条指令，所述一条或多条指令适于由所述处理器加载并执行上述模型处理方法。

15、一方面，本申请实施例提供了一种计算机存储介质，其特征在于，所述计算机存储介质中存储有计算机程序指令，所述计算机程序指令被处理器执行时，用于执行上述模型处理方法。

16、一方面，本申请实施例提供了一种计算机程序产品，计算机程序产品包括计算机程序，该计算机程序存储在计算机存储介质中；模型处理设备的处理器从计算机存储介质中读取该计算机程序，处理器执行该计算机程序，使得模型处理设备执行上述模型处理方法。

17、本申请实施例中，当期望训练得到一个能实现目标功能的目标模型时，可以根据集成模型训练样本集以及标注标签数据，将模型集合中包括的，与实现目标功能相关联的多个参考模型集成得到一个集成模型，并通过集成模型预测得到第一样本集中各个无标签样本对应的预测标签数据，进而可以根据第一样本集以及第一样本集中各个无标签样本对应的预测标签数据，训练得到目标模型。也就是说，可以基于相对少量的有标签样本，对与实现目标功能相关联的多个参考模型进行集成，得到一个集成模型，并通过集成模型实现对有标签样本的扩充，减少标签标注的成本，进而可以提高模型训练效果，以及提高训练得到的目标模型的模型效果。并且，通过将多个参考模型进行集成得到一个集成模型，使得集成模型能够融合各个参考模型的学习能力，提高泛化能力，使得集成模型在预测无标签样本对应的预测标签数据时，可以引入各个参考模型对应的特征，能够准确预测无标签样本对应的预测标签数据。

技术特征：

1.一种模型处理方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述方法还包括：

3.如权利要求1所述的方法，其特征在于，所述根据所述模型集合、集成模型训练样本集以及标注标签数据生成集成模型，包括：

4.如权利要求1所述的方法，其特征在于，所述方法还包括：

5.如权利要求1所述的方法，其特征在于：

6.如权利要求1-5任一项所述的方法，其特征在于，所述决策模型是基于所述集成模型训练样本集中的集成模型训练样本、标注标签数据对初始决策模型进行有监督训练得到的，针对所述初始决策模型的有监督训练包括：

7.如权利要求6所述的方法，其特征在于：

8.如权利要求5所述的方法，其特征在于，所述第一样本集包括一个或多个无标签样本组，一个无标签样本组中各个无标签样本的模型训练查询文本相同，且模型训练召回文档不同；

9.如权利要求5所述的方法，其特征在于，所述第一样本集是从初始样本集中筛选得到的，所述初始样本集包括一个或多个无标签样本组，一个无标签样本组中各个无标签样本的模型训练查询文本相同，且模型训练召回文档不同；所述获取第一样本集包括：

10.如权利要求2所述的方法，其特征在于，所述应用模型训练样本集中的任一应用模型训练样本包括：应用训练查询文本以及应用训练召回文档，目标标签数据为：相应的应用模型训练样本中的应用训练查询文本与应用训练召回文档之间的相关度；

11.如权利要求10所述的方法，其特征在于：

12.如权利要求1-5任一项所述的方法，其特征在于，所述根据所述模型集合、集成模型训练样本集以及标注标签数据生成集成模型，包括：

13.一种模型处理装置，其特征在于，包括：

14.一种模型处理设备，其特征在于，所述模型处理设备包括输入接口和输出接口，还包括：

15.一种计算机存储介质，其特征在于，所述计算机存储介质中存储有计算机程序指令，所述计算机程序指令被处理器执行时，用于执行如权利要求1-12任一项所述的模型处理方法。

技术总结
本申请公开一种模型处理方法、装置、设备及存储介质，其相关实施例可应用于人工智能等场景中。该方法包括：获取包括多个参考模型的模型集合；根据模型集合、集成模型训练样本集以及标注标签数据生成集成模型；每一集成模型训练样本分别对应有标注标签数据，集成模型是根据模型集合中的多个参考模型以及决策模型得到的，参考模型的输入为集成模型训练样本，决策模型的输入为参考模型的输出；获取第一样本集，并通过集成模型预测得到第一样本集中各个无标签样本对应的预测标签数据；根据第一样本集以及第一样本集中各个无标签样本对应的预测标签数据，训练得到目标模型；可实现对有标签样本的扩充，减少标签标注的成本，进而可提高模型训练效果。

技术研发人员：李昂,杨帆,陈笑,刘杰,肖求根
受保护的技术使用者：北京搜狗科技发展有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李昂杨帆陈笑刘杰肖求根
技术所有人：北京搜狗科技发展有限公司
我是此专利的发明人

上一篇：一种外泌体中的制作方法
上一篇：用于多联机空调制热控制的方法及装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。