一种基于问答任务模型进行问题扩充的方法及存储介质与流程

文档序号：36231279发布日期：2023-12-01 00:12阅读：27来源：国知局

本发明涉及问答任务领域，特别是涉及一种基于问答任务模型进行问题扩充的方法及存储介质。

背景技术：

1、随着chatgpt的发展，使用模型进行ai问答越来越普遍，在我们对任一模型进行训练时，往往需要大量的训练样本，因此，常常基于样本问题使用ai问答进行问题扩充，然而，ai扩充的问题往往简单、重复、量大，对模型的后续训练帮助并不大，因此，在进行问题扩充时，如何设置扩充规则，并对模型输入满足合适的规则使得模型能够输出高质量的问题至关重要。

技术实现思路

1、针对上述技术问题，本发明采用的技术方案为：

2、一种基于问答任务模型进行问题扩充的方法，所述方法包括如下步骤：

3、s001，获取样本问题库b={b1，b2，…，bj，…，bn}和样本问题库b对应的目标原则列表集cb={cb1，cb2，…，cbj，…，cbn}，bj对应的目标原则列表cbj包括多条目标原则，所述目标原则是对样本问题进行问题扩充时所遵循的预设准则，bj是样本问题库中第j个样本问题，j的取值范围是1到n，n是样本问题库中样本问题的数量；

4、s002，获取bj基于问答任务模型进行扩充的第一问题；

5、s003，若第一问题和bj的相似度≥预设相似度阈值，将cbj作为第一问题的目标原则列表，使用第一问题和cbj输入问答任务模型继续进行扩充；

6、s004，若第一问题和bj的相似度＜预设相似度阈值，获取第一问题和样本问题库b中每一样本问题的相似度，从而获取相似度列表c={c1，c2，…，cj，…，cn}，获取c0=max{c1，c2，…，cj，…，cn}，并将c0对应的样本问题b0对应的目标原则列表cb0作为第一问题的目标原则列表，使用第一问题和cb0输入问答任务模型继续进行扩充。

7、一种非瞬时性计算机可读存储介质，所述存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如上述的基于问答任务模型进行问题扩充的方法。

8、本发明至少具有以下有益效果：

9、综上，获取样本问题库和每一样本问题对应的目标原则列表，基于任一样本问题和问答任务模型进行扩充，获取扩充的第一问题，若第一问题和该样本问题的相似度不小于预设相似度阈值，将该样本问题对应的目标原则列表作为第一问题对应的目标原则列表，并使用第一问题和第一问题对应的目标原则列表输入问答任务模型继续进行扩充；若第一问题和该样本问题的相似度小于预设相似度阈值，计算第一问题和样本问题库中所有样本问题的相似度，将最大的相似度对应的样本问题对应的目标原则列表作为第一问题对应的目标原则列表，通过获取样本问题的目标原则列表的对应关系，并获取基于样本问题进行扩充的第一问题，通过相似度判断，扩充出的第一问题可以继承该样本问题或其它样本问题的目标原则列表，使得扩充出的第一问题继续进行扩充时有合理的扩充规则，使得问答任务模型能够输出相对高质量的扩充问题。

技术特征：

1.一种基于问答任务模型进行问题扩充的方法，其特征在于，所述方法包括如下步骤：

2.根据权利要求1所述的基于问答任务模型进行问题扩充的方法，其特征在于，s003还包括：

3.根据权利要求1所述的基于问答任务模型进行问题扩充的方法，其特征在于，样本问题bj对应的目标原则列表cbj通过如下步骤获取：

4.根据权利要求1所述的基于问答任务模型进行问题扩充的方法，其特征在于，在s003中，使用第一问题和cbj输入问答任务模型继续进行扩充，包括如下步骤：

5.根据权利要求3所述的基于问答任务模型进行问题扩充的方法，其特征在于，s200中，对样本问题bj，从原则库a中按照预设规则抽取s个原则，形成样本问题bj对应的中间原则列表abj，包括如下步骤：

6.根据权利要求3所述的基于问答任务模型进行问题扩充的方法，其特征在于，所述预设扩充阈值＞1.5。

7.根据权利要求1所述的基于问答任务模型进行问题扩充的方法，其特征在于，s002，获取bj基于问答任务模型进行扩充的第一问题，具体包括如下步骤：

8.一种非瞬时性计算机可读存储介质，所述存储介质中存储有至少一条指令或至少一段程序，其特征在于，所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1-7中任意一项所述的基于问答任务模型进行问题扩充的方法。

技术总结
本发明提供了一种基于问答任务模型进行问题扩充的方法及存储介质，涉及问答任务领域，所述方法包括如下步骤：获取样本问题库和每一样本问题对应的目标原则列表，基于任一样本问题进行扩充，获取第一问题，若第一问题和样本问题的相似度≥预设相似度阈值，将该样本问题对应的目标原则列表作为第一问题对应的目标原则列表；若第一问题和该样本问题的相似度＜预设相似度阈值，计算第一问题和样本问题库中所有样本问题的相似度，将最大的相似度对应的样本问题对应的目标原则列表作为第一问题对应的目标原则列表，使得问答任务模型在扩充时能够输出相对高质量的扩充问题。

技术研发人员：于伟,靳雯,王全修,石江枫,赵洲洋,王明超
受保护的技术使用者：北京睿企信息科技有限公司
技术研发日：
技术公布日：2024/1/16

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：于伟靳雯王全修石江枫赵洲洋王明超
技术所有人：日照睿安信息科技有限公司
我是此专利的发明人

上一篇：一种水泥基结构电解质及其制备方法
上一篇：精密注射泵用多通道校准装置及改进的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。