本申请实施例涉及机器学习领域,特别涉及一种训练样本的生成方法、装置、设备、介质及程序产品。
背景技术:
1、随着大语言模型的技术发展,越来越多的领域采用训练后的大语言模型处理和理解语句内容,以便为使用对象提供智能化的文本生成、分析和交互服务。
2、相关技术中,通常会将对话语句输入至大语言模型中,大语言模型从对话语句中提取诸如词向量、句法结构等语句特征表示,进而对语句特征表示进行推理、解答等语句分析,并生成答复语句。
3、有时对话语句中还会包括用于限定答复语句中字符数量的字符限制条件,以期望大语言模型输出符合字符限制条件的答复语句。然而大语言模型通常并未经过字符限制的训练过程,且即便需要对大语言模型进行字符限制训练,也通常由人工设定解答文本长度的限制指令,如:人工对符合字符限制条件的答复语句进行标注,并通过标注后的答复语句和对话语句对大语言模型进行字符限制训练。该人工标注过程的效率较低,无法实现对大语言模型进行高效的字符限制训练的目的。
技术实现思路
1、本申请实施例提供了一种训练样本的生成方法、装置、设备、介质及程序产品,能够扩充对第一分析模型进行训练的样本数量,从而有利于提升第一分析模型的鲁棒性,提高第一分析模型生成符合字数限制条件的答复文本的准确性。所述技术方案如下。
2、一方面,提供了一种训练样本的生成方法,所述方法包括:
3、获取第一对话语句,所述第一对话语句中包括对话文本和第一字数限制条件,所述第一字数限制条件用于限制针对所述第一对话语句生成答复语句的第一字符数量范围;
4、通过第一分析模型对所述第一对话语句进行分析,生成答复所述第一对话语句的第一答复语句,所述第一答复语句对应第一字符数量;
5、对所述第一答复语句进行语句调整,得到第二答复语句,所述第二答复语句对应第二字符数量,所述第二字符数量与所述第一字符数量不同;
6、基于所述第二字符数量生成第二对话语句,所述第二对话语句中包括所述对话文本和第二字数限制条件,所述第二字数限制条件用于限制针对所述第二对话语句生成答复语句的第二字符数量范围;其中,所述第二对话语句和所述第二答复语句用于作为对所述第一分析模型进行字符限制训练的第一训练样本对。
7、另一方面,提供了一种训练样本的生成装置,所述装置包括:
8、获取模块,用于获取第一对话语句,所述第一对话语句中包括对话文本和第一字数限制条件,所述第一字数限制条件用于限制针对所述第一对话语句生成答复语句的第一字符数量范围;
9、分析模块,用于通过第一分析模型对所述第一对话语句进行分析,生成答复所述第一对话语句的第一答复语句,所述第一答复语句对应第一字符数量;
10、调整模块,用于对所述第一答复语句进行语句调整,得到第二答复语句,所述第二答复语句对应第二字符数量,所述第二字符数量与所述第一字符数量不同;
11、生成模块,用于基于所述第二字符数量生成第二对话语句,所述第二对话语句中包括所述对话文本和第二字数限制条件,所述第二字数限制条件用于限制针对所述第二对话语句生成答复语句的第二字符数量范围;其中,所述第二对话语句和所述第二答复语句用于作为对所述第一分析模型进行字符限制训练的第一训练样本对。
12、另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述本申请实施例中任一所述的训练样本的生成方法。
13、另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述本申请实施例中任一所述的训练样本的生成方法。
14、另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中任一所述的训练样本的生成方法。
15、本申请实施例提供的技术方案带来的有益效果至少包括:
16、获取包括对话文本和第一字数限制条件的第一对话语句,通过第一分析模型对第一对话语句进行分析,生成答复第一对话语句的第一答复语句,之后对第一答复语句进行语句调整得到第二答复语句,进而基于第二答复语句对应的第二字符数量生成第二对话语句,第二对话语句用于限制针对第二对话语句生成答复语句的第二字符数量范围。在给定第一对话语句的条件下,通过对第一答复语句的语句调整操作,可以得到与第一答复语句之间语义相同但字符数量不同的第二答复语句,进而以第二答复语句的第二字符数量作为生成第二对话语句时的约束内容,在第二字符数量符合第二字符数量范围的同时,结合第二对话语句和第二答复语句作为对第一分析模型进行字符限制训练的第一训练样本对,扩充了对第一分析模型进行训练的样本数量,从而有利于提升第一分析模型的鲁棒性,提高第一分析模型生成符合字数限制条件的答复文本的准确性。
1.一种训练样本的生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述第一答复语句进行语句调整,得到第二答复语句,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一答复语句生成字符调整语句,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述第一字符数量和所述第一字符数量范围之间的比较结果以及所述第一答复语句,生成所述字符调整语句,包括:
5.根据权利要求1至4任一所述的方法,其特征在于,所述基于所述第二字符数量生成第二对话语句,包括:
6.根据权利要求5所述的方法,其特征在于,所述基于所述第二字符数量确定所述第二字符数量范围,包括:
7.根据权利要求1至4任一所述的方法,其特征在于,所述基于所述第二字符数量生成第二对话语句之后,还包括:
8.根据权利要求7所述的方法,其特征在于,所述通过所述第一训练样本对对所述第一分析模型进行字符限制训练,得到第二分析模型,包括:
9.根据权利要求7所述的方法,其特征在于,所述方法还包括:
10.根据权利要求9所述的方法,其特征在于,所述筛选所述至少两个候选答复语句得到第三答复语句,包括:
11.根据权利要求10所述的方法,其特征在于,所述基于所述候选字符数量和所述第三字数限制条件筛选所述至少两个候选答复语句,得到所述第三答复语句,包括:
12.一种训练样本的生成装置,其特征在于,所述装置包括:
13.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一段程序,所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至11任一所述的训练样本的生成方法。
14.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一段程序,所述至少一段程序由处理器加载并执行以实现如权利要求1至11任一所述的训练样本的生成方法。
15.一种计算机程序产品,其特征在于,包括计算机程序或指令,所述计算机程序或指令被处理器执行时实现如权利要求1至11任一所述的训练样本的生成方法。