基于知识图谱的文本生成方法、装置、设备及介质与流程

文档序号:36731897发布日期:2024-01-16 12:43阅读:16来源:国知局
基于知识图谱的文本生成方法、装置、设备及介质与流程

本申请涉及自然语言处理领域,尤其涉及一种基于知识图谱的文本生成方法、装置、设备及介质。


背景技术:

1、文本生成,是自然语言处理领域研究机器自动生成文本的技术。随着文本生成技术的发展,文本生成被广泛应用于各个领域,如文学创作、新闻报道、摘要生成、对话系统、机器翻译、智能客服、智能问答和聊天机器人等。

2、相关技术中,在利用大语言模型生成文本时,通常基于神经网络算法,获取适当的训练数据,通过训练数据学习规律和特征,学习自然语言文本的含义,以得到训练好的神经网络模型,并基于输入的文本和神经网络模型生成新的文本,但生成的文本依然存在不真实的问题。


技术实现思路

1、本申请提供一种基于知识图谱的文本生成方法、装置、设备及介质,用以解决相关技术中在利用大语言模型生成文本时,生成的文本依然存在不真实的问题。

2、第一方面,本申请提供一种基于知识图谱的文本生成方法,包括:

3、获取文本生成指令;

4、基于预先训练好的文本生成模型,生成文本生成指令对应的目标文本;

5、对目标文本进行三元组抽取,得到目标文本对应的三元组,该三元组包含实体、属性和属性值;

6、基于预先构建好的知识图谱,对三元组进行真实性校验,该知识图谱包含实体、属性和属性值的关系;

7、若真实性校验通过,则输出上述目标文本。

8、在一种可能的实施方式中,基于预先构建好的知识图谱,对三元组进行真实性校验,包括:基于预先构建好的知识图谱,对三元组进行实体校验、属性校验和属性值校验中的至少一种校验;若至少一种校验均通过,则确定对三元组的真实性校验通过;若任一种校验未通过,则确定对三元组的真实性校验未通过。

9、在一种可能的实施方式中,基于知识图谱的文本生成方法还包括以下至少一项:基于预先构建好的知识图谱,对三元组进行实体校验,包括:校验三元组包含的实体是否在知识图谱包含的实体中;若三元组包含的实体在知识图谱包含的实体中,则确定对三元组的实体校验通过;若三元组包含的实体不在知识图谱包含的实体中,则确定对三元组的实体校验未通过;基于预先构建好的知识图谱,对三元组进行属性校验,包括:校验三元组包含的属性是否在知识图谱包含的属性中;若三元组包含的属性在知识图谱包含的属性中,则确定对三元组的属性校验通过;若三元组包含的属性不在知识图谱包含的属性中,则确定对三元组的属性校验未通过;基于预先构建好的知识图谱,对三元组进行属性值校验,包括:校验三元组包含的属性值是否在知识图谱包含的属性值中;若三元组包含的属性值在知识图谱包含的属性值中,则确定对三元组的属性值校验通过;若三元组包含的属性值不在知识图谱包含的属性值中,则确定对三元组的属性值校验未通过。

10、在一种可能的实施方式中,基于预先构建好的知识图谱,对三元组进行实体校验、属性校验和属性值校验,包括:获取知识图谱包含的实体的实体集合;校验三元组包含的实体是否在实体集合中;若三元组包含的实体在实体集合中,则确定对三元组的实体校验通过,并基于知识图谱获取三元组包含的实体的属性集合;校验三元组包含的属性是否在属性集合中;若三元组包含的属性在属性集合中,则确定对三元组的属性校验通过,并基于知识图谱获取三元组包含的属性的属性值;校验三元组包含的属性值是否与获取的属性值相等;若三元组包含的属性值与获取的属性值相等,则确定对三元组的属性值校验通过。

11、在一种可能的实施方式中,基于知识图谱的文本生成方法还包括:若真实性校验未通过,则确定生成文本生成指令对应的目标文本的次数;若次数小于次数阈值,则返回执行基于预先训练好的文本生成模型,生成文本生成指令对应的目标文本的步骤。

12、在一种可能的实施方式中,基于知识图谱的文本生成方法还包括:若次数大于或等于次数阈值,则输出提示信息,该提示信息用于提示未成功生成文本的原因。

13、在一种可能的实施方式中,基于知识图谱的文本生成方法还包括:上述对目标文本进行三元组抽取,得到目标文本对应的三元组,包括:将目标文本输入至预先构建好的三元组抽取模型进行三元组抽取,得到三元组抽取模型输出的目标文本对应的三元组;和/或,文本生成模型为语言模型或序列到序列模型。

14、第二方面,本申请提供一种基于知识图谱的文本生成装置,包括:

15、获取模块,用于获取文本生成指令;

16、生成模块,用于基于预先训练好的文本生成模型,生成文本生成指令对应的目标文本;

17、抽取模块,用于对目标文本进行三元组抽取,得到目标文本对应的三元组,该三元组包含实体、属性和属性值;

18、校验模块,用于基于预先构建好的知识图谱,对三元组进行真实性校验,该知识图谱包含实体、属性和属性值的关系;

19、输出模块,用于在真实性校验通过时,输出目标文本。

20、第三方面,本申请提供一种电子设备,包括:处理器,以及与处理器通信连接的存储器;

21、存储器,用于存储计算机执行指令;

22、处理器,用于执行存储器存储的计算机执行指令,以实现第一方面任一项所述的方法。

23、第四方面,本申请提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机执行指令,计算机执行指令被执行时用于实现第一方面任一项所述的方法。

24、第五方面,本申请提供一种计算机程序产品,包括计算机程序,该计算机程序被执行时实现第一方面任一项所述的方法。

25、本申请提供的基于知识图谱的文本生成方法、装置、设备及介质,获取文本生成指令,基于预先训练好的文本生成模型,生成文本生成指令对应的目标文本,对目标文本进行三元组抽取,得到目标文本对应的三元组,该三元组包含实体、属性和属性值,基于预先构建好的知识图谱,对三元组进行真实性校验,该知识图谱包含实体、属性和属性值的关系,若真实性校验通过,则输出上述目标文本。在此过程中,在基于文本生成模型生成目标文本的基础上,基于知识图谱对目标文本的三元组进行真实性校验,并在真实性校验通过时输出目标文本,使得输出的目标文本是真实存在的,从而提升生成文本的真实性。



技术特征:

1.一种基于知识图谱的文本生成方法,其特征在于,包括:

2.根据权利要求1所述的基于知识图谱的文本生成方法,其特征在于,所述基于预先构建好的知识图谱,对所述三元组进行真实性校验,包括:

3.根据权利要求2所述的基于知识图谱的文本生成方法,其特征在于,还包括以下至少一项:

4.根据权利要求2所述的基于知识图谱的文本生成方法,其特征在于,基于预先构建好的知识图谱,对所述三元组进行实体校验、属性校验和属性值校验,包括:

5.根据权利要求1至4中任一项所述的基于知识图谱的文本生成方法,其特征在于,还包括:

6.根据权利要求5所述的基于知识图谱的文本生成方法,其特征在于,还包括:

7.根据权利要求1至4中任一项所述的基于知识图谱的文本生成方法,其特征在于,还包括:

8.一种基于知识图谱的文本生成装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被执行时用于实现如权利要求1至7中任一项所述的基于知识图谱的文本生成方法。


技术总结
本申请提供一种基于知识图谱的文本生成方法、装置、设备及介质,涉及自然语言处理领域。其中的方法包括:获取文本生成指令,基于预先训练好的文本生成模型,生成文本生成指令对应的目标文本,对目标文本进行三元组抽取,得到目标文本对应的三元组,基于预先构建好的知识图谱,对三元组进行真实性校验,若真实性校验通过,则输出上述目标文本。在基于文本生成模型生成目标文本的基础上,基于知识图谱对目标文本的三元组进行真实性校验,并在真实性校验通过时输出目标文本,使得输出的目标文本是真实存在的,从而提升生成文本的真实性。

技术研发人员:吴钟强,车皓阳,谷鹰,姚雷
受保护的技术使用者:浙江极氪智能科技有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1