一种语言模型生成方法、装置、存储介质及电子设备与流程

文档序号：37943567发布日期：2024-05-11 00:24阅读：22来源：国知局

本申请涉及计算机，尤其涉及一种语言模型生成方法、装置、存储介质及电子设备。

背景技术：

1、大规模语言模型是一种人工智能技术，现如今被广泛应用于许多不同的应用中，例如语音识别、文本分类以及问答等情景中，而大规模语言模型的训练往往需要大量的样本数据来使得模型学习语法语义以及上下文联系，从而获得各种模型能力。想要提高模型训练效果需要提供正确标注的样本数据，现有技术中往往采用人工标注样本数据，若想要获取足够大规模语言模型进行学习训练的人工标注样本数据，需要耗费大量的人力和时间，提高了模型训练的人力成本，需要提供一种保证模型训练效果的同时，采用少量人工标注样本数据进行训练的模型训练方法。

技术实现思路

1、本申请实施例提供了一种语言模型生成方法、装置、存储介质及电子设备，可以通过将可信度高的伪标签标注样本加入标注样本集合中用于对模型进行训练，准确率更高的样本提高了模型训练效果和模型的泛化能力，同时减少对人工标注样本的需求量，降低模型训练成本。所述技术方案如下：

2、第一方面，本申请实施例提供了一种语言模型生成方法，所述方法包括：

3、获取基于目标能力训练任务对应的标注样本集合所训练得到的微调语言模型，获取所述目标能力训练任务对应的无标注样本集合，所述标注样本集合中的标注样本为问题信息，所述标注样本的标签为在所述目标能力下针对所述问题信息的答复信息；

4、将所述无标注样本集合中的无标注样本输入所述微调语言模型，获得伪标签标注样本；

5、获取所述伪标签标注样本的可信分值，将所述可信分值高于可信分值阈值的伪标签标注样本保存在所述标注样本集合中；

6、基于所述标注样本集合对所述微调语言模型进行模型训练，直至模型训练次数达到预设迭代次数，得到满足所述目标能力训练任务的语言模型。

7、第二方面，本申请实施例提供了一种语言模型生成装置，所述装置包括：

8、模型微调模块，用于获取基于目标能力训练任务对应的标注样本集合所训练得到的微调语言模型，获取所述目标能力训练任务对应的无标注样本集合，所述标注样本集合中的标注样本为问题信息，所述标注样本的标签为在所述目标能力下针对所述问题信息的答复信息；

9、伪标签获取模块，用于将所述无标注样本集合中的无标注样本输入所述微调语言模型，获得伪标签标注样本；

10、可信分值获取模块，用于获取所述伪标签标注样本的可信分值，将所述可信分值高于可信分值阈值的伪标签标注样本保存在所述标注样本集合中；

11、模型训练模块，用于基于所述标注样本集合对所述微调语言模型进行模型训练，直至模型训练次数达到预设迭代次数，得到满足所述目标能力训练任务的语言模型。

12、第三方面，本申请实施例提供一种计算机存储介质，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行上述的方法步骤。

13、第四方面，本申请实施例提供一种电子设备，可包括：处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行上述的方法步骤。

14、在本申请一个或多个实施例中，通过获取基于目标能力训练任务对应的标注样本集合所训练得到的微调语言模型，获取所述目标能力训练任务对应的无标注样本集合，所述标注样本集合中的标注样本为问题信息，所述标注样本的标签为在所述目标能力下针对所述问题信息的答复信息，将所述无标注样本集合中的无标注样本输入所述微调语言模型，获得伪标签标注样本，获取所述伪标签标注样本的可信分值，将所述可信分值高于可信分值阈值的伪标签标注样本保存在所述标注样本集合中，基于所述标注样本集合对所述微调语言模型进行模型训练，直至模型训练次数达到预设迭代次数，得到满足所述目标能力训练任务的语言模型。通过将可信度高的伪标签标注样本加入标注样本集合中用于对模型进行训练，准确率更高的样本提高了模型训练效果和模型的泛化能力，同时减少了对人工标注样本的需求量，降低了模型训练成本。

技术特征：

1.一种语言模型生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取基于目标能力训练任务对应的标注样本集合所训练得到的微调语言模型，包括：

3.根据权利要求1所述的方法，其特征在于，所述获取所述伪标签标注样本的可信分值，将所述可信分值高于可信分值阈值的伪标签标注样本保存在所述标注样本集合中，包括：

4.根据权利要求3所述的方法，其特征在于，所述对所述伪标签标注样本进行可信度判断处理，获得所述伪标签标注样本对应的可信分值，包括：

5.根据权利要求1所述的方法，其特征在于，所述基于所述标注样本集合对所述微调语言模型进行模型训练，直至模型训练次数达到预设迭代次数，得到满足所述目标能力训练任务的语言模型，包括：

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：

7.根据权利要求1所述的方法，其特征在于，所述方法还包括：

8.一种语言模型生成装置，其特征在于，所述装置包括：

9.一种计算机存储介质，其特征在于，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行如权利要求1～7任意一项的方法步骤。

10.一种电子设备，其特征在于，包括：处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行如权利要求1～7任意一项的方法步骤。

技术总结
本申请公开了一种语言模型生成方法、装置、存储介质及电子设备，其中，方法包括：获取基于目标能力训练任务对应的标注样本集合所训练得到的微调语言模型，获取目标能力训练任务对应的无标注样本集合，将无标注样本集合中的无标注样本输入微调语言模型，获得伪标签标注样本，获取伪标签标注样本的可信分值，将可信分值高于可信分值阈值的伪标签标注样本保存在标注样本集合中，基于标注样本集合对微调语言模型进行模型训练直至模型训练次数达到预设迭代次数得到满足目标能力训练任务的语言模型。采用本申请，通过将可信度高的伪标签标注样本用于对模型进行训练，准确率更高的样本提高模型训练效果和模型的泛化能力，减少对人工标注样本的需求量。

技术研发人员：黄绍莽,杨玉奇,潘剑锋
受保护的技术使用者：三六零数字安全科技集团有限公司
技术研发日：
技术公布日：2024/5/10

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄绍莽,杨玉奇,潘剑锋
技术所有人：三六零数字安全科技集团有限公司
我是此专利的发明人

上一篇：一种基于数字模拟目标的设备控制系统及方法与流程
上一篇：一种显示控制方法、装置、存储介质及终端设备与流程