一种基于智能问答场景的回答标注方法、装置及相关产品与流程

文档序号:36382202发布日期:2023-12-14 16:20阅读:35来源:国知局
一种基于智能问答场景的回答标注方法与流程

本申请涉及数据处理,尤其涉及一种基于智能问答场景的回答标注方法、装置及相关产品。


背景技术:

1、随着人工智能技术的研究与进步,人工智能技术在多个领域展开研究和应用,例如常见的大语言模型(llm,large language model),大语言模型可以处理多种自然语言任务,如智能问答等。为了使大语言模型能够更好地进行智能问答,在预训练好的大语言模型基础上对大语言模型进行微调,微调过程主要分为三个步骤:1、监督学习;2、训练rm(reward model,奖励模型);3、强化学习。其中rm的训练效果对微调后的大语言模型在表现上有显著影响,而rm的训练效果在很大程度上依赖于人工标注对于训练数据的质量。

2、因此在相关技术中anthropic(人工智能)公司的标注方案着重于关注rm的训练数据的人工标注质量,anthropic公司的人工标注方案为:利用步骤1中的sft(supervisedfine tuning,有监督微调模型)为一个问题生成两个回答,然后在训练rm阶段,标注对象分别判断这两个回答的有用性与无害性,从而确定出最佳回答。但是相关技术中anthropic公司的人工标注方案的标注规则不够细化,导致在实际标注过程不同标注对象的理念存在较大偏差,且标注出来的回答与正确回答相比一致性较低。

3、由此,如何提高标注回答与正确回答相比的一致性,已经成为当前领域亟待解决的技术问题。


技术实现思路

1、本申请实施例提供了一种基于智能问答场景的回答标注方法、装置及相关产品,旨在提高标注回答与正确回答相比的一致性。

2、本申请第一方面提供了一种基于智能问答场景的回答标注方法,包括:

3、获取目标问题的多个回答以及所述目标问题的正确回答;其中所述目标问题为智能问答场景中提问对象输入的问题,所述多个回答为有监督微调模型基于所述目标问题输出的回答;

4、利用标注规则集合中的回答内容占比规则、回答内容显著性规则、回答内容引用占比规则、回答内容质量规则、回答内容重复规则和回答内容逻辑规则,获得所述多个回答对应的标注得分;其中所述回答内容占比规则用于判断回答中正确内容的占比,所述回答内容显著性规则用于判断回答中正确内容是否具有显著性,所述回答内容引用占比规则用于判断回答中引用所述正确回答的片段占比,所述回答内容质量规则用于判断回答中是否存在编造内容,所述回答内容重复规则用于判断回答中是否存在重复内容,所述回答内容逻辑规则用于判断回答中内容逻辑是否正确;所述正确内容为所述正确回答中的内容,所述编造内容为在所述正确回答中未找到的内容;

5、对所述多个回答对应的标注得分进行比较,确定出所述多个回答对应的标注得分中得分最高的标注得分;

6、将所述得分最高的标注得分对应的回答标注为所述目标问题的目标回答。

7、本申请第二方面提供了一种基于智能问答场景的回答标注装置,包括:

8、问题回答获取单元,用于获取目标问题的多个回答以及所述目标问题的正确回答;其中所述目标问题为智能问答场景中提问对象输入的问题,所述多个回答为有监督微调模型基于所述目标问题输出的回答;

9、标注得分获得单元,用于利用标注规则集合中的回答内容占比规则、回答内容显著性规则、回答内容引用占比规则、回答内容质量规则、回答内容重复规则和回答内容逻辑规则,获得所述多个回答对应的标注得分;其中所述回答内容占比规则用于判断回答中正确内容的占比,所述回答内容显著性规则用于判断回答中正确内容是否具有显著性,所述回答内容引用占比规则用于判断回答中引用所述正确回答的片段占比,所述回答内容质量规则用于判断回答中是否存在编造内容,所述回答内容重复规则用于判断回答中是否存在重复内容,所述回答内容逻辑规则用于判断回答中内容逻辑是否正确;所述正确内容为所述正确回答中的内容,所述编造内容为在所述正确回答中未找到的内容;

10、标注得分比较单元,用于对所述多个回答对应的标注得分进行比较,确定出所述多个回答对应的标注得分中得分最高的标注得分;

11、目标回答标注单元,用于将所述得分最高的标注得分对应的回答标注为所述目标问题的目标回答。

12、本申请第三方面提供了一种计算机设备,所述设备包括处理器以及存储器:

13、所述存储器用于存储计算机程序,并将所述计算机程序传输给所述处理器;

14、所述处理器用于根据所述计算机程序中的指令执行第一方面提供的基于智能问答场景的回答标注方法的步骤。

15、本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序被计算机设备执行时实现第一方面提供的基于智能问答场景的回答标注方法的步骤。

16、本申请第五方面提供了一种计算机程序产品,包括计算机程序,该计算机程序被计算机设备执行时实现第一方面提供的基于智能问答场景的回答标注方法的步骤。

17、从以上技术方案可以看出,本申请实施例具有以下优点:

18、本申请技术方案中首先获取目标问题的多个回答以及目标问题的正确回答;在此阶段,利用标注规则集合中的回答内容占比规则、回答内容显著性规则、回答内容引用占比规则、回答内容质量规则、回答内容重复规则和回答内容逻辑规则,来获得多个回答对应的标注得分;然后将对多个回答对应的标注得分进行比较,并从多个回答对应的标注得分中确定出得分最高的标注得分;最后将得分最高的标注得分对应的回答标注为目标问题的目标回答。可见,相较于相关技术中的人工标注方案,本申请想到采用更细化的标注规则来获得多个回答对应的标注得分,也即通过回答内容占比规则、回答内容显著性规则、回答内容引用占比规则、回答内容质量规则、回答内容重复规则和回答内容逻辑规则来获得多个回答对应的标注得分,并通过比较得分的形式从多个回答对应的标注得分中确定出得分最高的标注得分,以及将得分最高的标注得分对应的回答标注为目标回答,如此提高了标注回答与正确回答相比的一致性。



技术特征:

1.一种基于智能问答场景的回答标注方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述利用标注规则集合中的回答内容占比规则、回答内容显著性规则、回答内容引用占比规则、回答内容质量规则、回答内容重复规则和回答内容逻辑规则,获得所述多个回答对应的标注得分,包括:

3.根据权利要求2所述的方法,其特征在于,所述利用所述标注规则集合中的回答内容占比规则、回答内容显著性规则、回答内容引用占比规则、回答内容质量规则、回答内容重复规则和回答内容逻辑规则,对同一回答逐一进行打分,获得同一回答针对于所述标注规则集合中的回答内容占比规则、回答内容显著性规则、回答内容引用占比规则、回答内容质量规则、回答内容重复规则和回答内容逻辑规则分别对应的初始标注得分,包括:

4.根据权利要求3所述的方法,其特征在于,所述利用所述标注规则集合中的回答内容显著性规则判断所述同一回答中正确内容是否具有显著性,并根据所述回答内容显著性规则的判断结果对所述同一回答进行打分,获得所述同一回答针对于所述回答内容显著性规则的初始标注得分,包括:

5.根据权利要求3所述的方法,其特征在于,所述同一回答中引用所述正确回答的片段的引用片段规则包括,判断所述同一回答中句子内容与所述正确回答中句子内容是否相似,且当所述同一回答中句子内容与所述正确回答中句子内容相似时,判断所述同一回答与所述正确回答的句子内容之间的相同内容占比,是否占所述正确回答中句子内容的预设阈值及以上;其中所述同一回答的句子长度与所述正确回答的句子长度相同。

6.根据权利要求2所述的方法,其特征在于,所述对所述同一回答针对于所述标注规则集合中的回答内容占比规则、回答内容显著性规则、回答内容引用占比规则、回答内容质量规则、回答内容重复规则和回答内容逻辑规则分别对应的初始标注得分进行处理,获得所述同一回答对应的标注得分,包括:

7.根据权利要求1所述的方法,其特征在于,所述对所述多个回答对应的标注得分进行比较,确定出所述多个回答对应的标注得分中得分最高的标注得分,包括:

8.根据权利要求1-7任一项所述的方法,其特征在于,还包括:

9.一种基于智能问答场景的回答标注装置,其特征在于,包括:

10.一种计算机设备,其特征在于,所述设备包括处理器以及存储器:

11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序被计算机设备执行时实现权利要求1至8中任一项所述的基于智能问答场景的回答标注方法的步骤。

12.一种计算机程序产品,其特征在于,包括计算机程序,该计算机程序被计算机设备执行时实现权利要求1至8中任一项所述的基于智能问答场景的回答标注方法的步骤。


技术总结
本申请公开了一种基于智能问答场景的回答标注方法、装置及相关产品。利用标注规则集合中的回答内容占比规则、回答内容显著性规则、回答内容引用占比规则、回答内容质量规则、回答内容重复规则和回答内容逻辑规则,获得多个回答对应的标注得分;对多个回答对应的标注得分进行比较,确定出多个回答对应的标注得分中得分最高的标注得分;将得分最高的标注得分对应的回答标注为目标问题的目标回答。可见,相较于相关技术中的人工标注方案,本申请想到采用更细化的标注规则来获得多个回答对应的标注得分,并通过比较得分的形式从多个回答对应的标注得分中确定出最高标注得分,如此提高了标注回答与正确回答相比的一致性。

技术研发人员:王佩璐,邓超,魏琳,李千,刘艾婷,沈卓,梁海金
受保护的技术使用者:腾讯科技(武汉)有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1