结果预测模型的训练方法、装置、设备、存储介质及产品与流程

文档序号:35902926发布日期:2023-10-29 01:36阅读:28来源:国知局
结果预测模型的训练方法、装置、设备、存储介质及产品与流程

本申请实施例涉及机器学习领域,特别涉及一种结果预测模型的训练方法、装置、设备、存储介质及产品。


背景技术:

1、随着人工智能技术的不断发展,结果预测是指将待预测内容输入提前训练好的结果预测模型中,输出得到待预测内容对应的预测结果,例如:针对疾病预测领域,将病历内容输入疾病预测模型,输出得到病历内容对应的预测疾病。因此,需要通过大量的样本数据对结果预测模型进行训练。

2、在相关技术中,以疾病预测模型为例,通过大量的样本文本数据对样本预测模型进行无监督训练,使训练完成的结果预测模型具备特征表示提取能力,样本文本数据可以为任意领域的文本数据。

3、然而,在相关技术中,虽然在训练阶段使用任意领域的文本数据对样本预测模型训练能够提高模型的泛化能力,但是任意领域的文本数据会存在不符合指定内容领域下的数据使用规范,导致最终训练得到的结果预测模型在针对指定内容领域下的输入内容进行预测时降低结果预测模型输出结果的准确度。


技术实现思路

1、本申请实施例提供了一种结果预测模型的训练方法、装置、设备、存储介质及产品,能够提高结果预测模型的准确度。所述技术方案如下。

2、一方面,提供了一种结果预测模型的训练方法,所述方法包括:

3、获取多个样本语句对,所述样本语句对中包括条件语句和结果语句,所述结果语句是在所述条件语句对应的条件限定下得到的结果内容,所述多个样本语句对是属于第一内容领域下的语句对;

4、提取第i个样本语句对中条件语句对应的第一特征表示,以及提取所述多个样本语句对中结果语句分别对应的第二特征表示,i为正整数;

5、获取所述第一特征表示与第n个结果语句对应的第二特征表示之间的第一特征相似度,以及获取所述第一特征表示与其他结果语句对应的第二特征表示之间的第二特征相似度,所述第n个结果语句是在符合所述第i个样本语句对中所述条件语句对应的条件限定下得到的结果内容,所述其他结果语句是除所述第n个样本语句对中的结果语句以外的结果语句,n为正整数;

6、基于所述第一特征相似度和所述第二特征相似度之间的差异对所述样本预测模型进行训练,得到所述结果预测模型,所述结果预测模型用于对所述第一内容领域下的条件输入内容进行预测,得到所述条件输入内容对应的预测结果。

7、另一方面,提供了一种结果预测模型的训练装置,所述装置包括:

8、获取模块,用于获取多个样本语句对,所述样本语句对中包括条件语句和结果语句,所述结果语句是在所述条件语句对应的条件限定下得到的结果内容,所述多个样本语句对是属于第一内容领域下的语句对;

9、提取模块,用于提取第i个样本语句对中条件语句对应的第一特征表示,以及提取所述多个样本语句对中结果语句分别对应的第二特征表示,i为正整数;

10、所述获取模块,还用于获取所述第一特征表示与第n个结果语句对应的第二特征表示之间的第一特征相似度,以及获取所述第一特征表示与其他结果语句对应的第二特征表示之间的第二特征相似度,所述第n个结果语句是在符合所述第i个样本语句对中所述条件语句对应的条件限定下得到的结果内容,所述其他结果语句是除所述第n个样本语句对中的结果语句以外的结果语句,n为正整数;

11、训练模块,用于基于所述第一特征相似度和所述第二特征相似度之间的差异对所述样本预测模型进行训练,得到所述结果预测模型,所述结果预测模型用于对所述第一内容领域下的条件输入内容进行预测,得到所述条件输入内容对应的预测结果。

12、另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述本申请实施例中任一所述结果预测模型的训练方法。

13、另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述本申请实施例中任一所述的结果预测模型的训练方法。

14、另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中任一所述的结果预测模型的训练方法。

15、本申请实施例提供的技术方案带来的有益效果至少包括:

16、通过构造第一内容领域下的多个包含条件语句和结果语句的样本语句对,提取第i个样本语句对中条件语句的第一特征表示,并提取多个样本语句对中结果语句分别对应的第二特征表示,获取第一特征表示和符合第i个样本语句对中条件语句对应的条件限定下的结果语句之间的第一特征相似度,以及获取第一特征表示和其他结果语句之间的第二特征相似度,根据第一特征相似度和第二特征相似度之间的差异对样本预测模型进行训练,从而得到用于对第一内容领域下的条件输入内容进行预测的结果预测模型。也即,通过构造包含条件语句和结果语句的样本语句对对样本预测模型进行训练,使得结果预测模型能够更靠近正确结果的同时远离错误结果,提高结果预测模型的模型准确度。



技术特征:

1.一种结果预测模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取多个样本语句对,包括:

3.根据权利要求2所述的方法,其特征在于,所述样本数据内容包括样本题目,所述样本题目中包括题干语句和多个答案选项;

4.根据权利要求2所述的方法,其特征在于,所述样本数据内容包括样本三元组数据,所述样本三元组数据中包括第一实体数据、第二实体数据以及所述第一实体数据和所述第二实体数据之间的实体关联关系数据;

5.根据权利要求2所述的方法,其特征在于,所述基于所述第k个样本数据内容对应的数据调整结果得到所述第k个样本数据内容对应的至少一个样本语句对之后,还包括:

6.根据权利要求2所述的方法,其特征在于,所述多个样本数据内容中包括多个不同数据类型的数据内容;

7.根据权利要求1至6任一所述的方法,其特征在于,所述获取所述第一特征表示与第n个结果语句对应的第二特征表示之间的第一特征相似度,以及获取所述第一特征表示与其他结果语句对应的第二特征表示之间的第二特征相似度,包括:

8.根据权利要求1至6任一所述的方法,其特征在于,所述提取第i个样本语句对中条件语句对应的第一特征表示,以及提取所述多个样本语句对中结果语句分别对应的第二特征表示,包括:

9.根据权利要求8所述的方法,其特征在于,所述第i个样本语句对中条件语句中包括m个字符,m为正整数;

10.根据权利要求1至6任一所述的方法,其特征在于,所述得到所述结果预测模型之后,还包括:

11.一种结果预测模型的训练装置,其特征在于,所述装置包括:

12.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一段程序,所述至少一段程序由所述处理器加载并执行以实现如权利要求1至10任一所述的结果预测模型的训练方法。

13.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一段程序,所述至少一段程序由处理器加载并执行以实现如权利要求1至10任一所述的结果预测模型的训练方法。

14.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序被处理器执行时实现如权利要求1至10任一所述的结果预测模型的训练方法。


技术总结
本申请公开一种结果预测模型的训练方法、装置、设备、存储介质及产品,涉及机器学习领域。该方法包括:获取多个样本语句对;提取第i个样本语句对中条件语句对应的第一特征表示,以及提取多个样本语句对中结果语句分别对应的第二特征表示,i为正整数;获取第一特征表示与第n个结果语句对应的第二特征表示之间的第一特征相似度,获取第一特征表示与其他结果语句对应的第二特征表示之间的第二特征相似度,n为正整数;基于第一特征相似度和第二特征相似度之间的差异对样本预测模型进行训练,得到结果预测模型。通过构造包含条件语句和结果语句的样本语句对对样本预测模型进行训练,提高结果预测模型的模型准确度。

技术研发人员:趙雨恬,王慧敏,孙继超,吴贤,郑冶枫
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1