一种基于大模型的知识图谱构建方法、装置及介质与流程

文档序号:37386904发布日期:2024-03-22 10:39阅读:18来源:国知局
一种基于大模型的知识图谱构建方法、装置及介质与流程

本技术涉及智慧家庭,具体而言,涉及一种基于大模型的知识图谱构建方法、装置及介质。


背景技术:

1、领域知识图谱是一个领域内最直接、最大程度展现其特有知识的一种形式,在基于知识图谱的问答、关系探索等方面也得到了广泛的应用,是当下最准确而且知识网络化的最佳形式。但是由于领域内知识比较多而杂乱,靠人工梳理知识比较困难,比如家电领域内,知识形式是文本形式的,想要形成有效的知识就需要归纳总结,然后得到整洁干净、结构化的知识。因此如何解决低效提取有效知识是知识图谱形成的重要一环,也是一项很大的挑战。

2、针对相关技术中,通过人工提取原始文本中的知识,进而根据提取的知识生成知识图谱,导致生成知识图谱的效率较低等问题,尚未提出有效的解决方案。


技术实现思路

1、本技术实施例提供了一种基于大模型的知识图谱构建方法、装置及介质,以至少解决相关技术中,通过人工提取原始文本中的知识,进而根据提取的知识生成知识图谱,导致生成知识图谱的效率较低等问题。

2、根据本技术实施例的一个实施例,提供了一种基于大模型的知识图谱构建方法,包括:将原始文本和提示信息输入至所述大模型中,以使所述大模型根据所述提示信息对所述原始文本进行信息抽取,得到第一元组信息,其中,所述原始文本至少用于描述目标对象的属性信息和使用说明;所述第一元组信息包括:第一信息和/或第二信息;所述第一信息包括:所述属性信息,以及所述属性信息和所述目标对象的关系,所述第二信息包括:所述使用说明,以及所述使用说明和所述目标对象的关系;将所述原始文本、所述第一元组信息和判别规则输入至所述大模型中,以使所述大模型根据所述原始文本和判别规则对所述第一元组信息进行判断,得到第一评价信息,其中,所述第一评价信息至少包括:第一评分和第二评分,所述第一评分为指示所述第一元组信息的准确性的评分,所述第二评分为指示所述第一元组信息的完整性的评分;基于第一公式对所述第一评分和所述第二评分进行计算,以确定所述第一元组信息的目标评分,其中,所述第一公式为:,其中,为所述第一元组信息的目标评分,n=2,为根据所述第一评分确定的数值,为根据所述第二评分确定的数值;根据所述第一元组信息的目标评分对所述第一元组信息进行调整,以及根据调整后的第一元组信息构建所述原始文本对应的知识图谱。

3、在一个示例性实施例中,在所述判别规则为第一判别规则、第二判别规则和第三判别规则的情况下,将所述原始文本、所述第一元组信息和判别规则输入至所述大模型中,以使所述大模型根据所述原始文本和判别规则对所述第一元组信息进行判断,得到第一评价信息,包括:将所述原始文本、所述第一元组信息、所述第一判别规则、所述第二判别规则和所述第三判别规则输入至所述大模型中,以使所述大模型根据所述原始文本和所述第一判别规则对所述第一元组信息进行判断,得到所述第一评分、所述第一元组信息中的错误元组信息以及所述错误元组信息对应的正确元组信息;以及以使所述大模型根据所述原始文本和所述第二判别规则对所述第一元组信息进行判断,得到所述第二评分,以及以使所述大模型根据所述原始文本和所述第三判别规则对所述第一元组信息进行判断,得到第二元组信息,其中,所述第一判别规则用于指示所述大模型对所述第一元组信息的准确性进行评分、确定所述第一元组信息中的错误元组信息以及确定所述错误元组信息对应的正确元组信息;所述第二判别规则用于指示所述大模型对所述第一元组信息的完整性进行评分;所述第三判别规则用于指示所述大模型对所述原始文本中除所述第一元组信息之外的信息再次根据所述提示信息进行信息抽取;所述第二元组信息为所述原始文本中除所述第一元组信息之外的元组信息。

4、在一个示例性实施例中,根据所述第一元组信息的目标评分对所述第一元组信息进行调整,包括:确定所述第一元组信息的目标评分与第一预设阈值的第一大小关系;在所述第一大小关系指示所述第一元组信息的目标评分大于或者等于所述第一预设阈值的情况下,将所述原始文本、所述第一元组信息和所述提示信息再次输入至所述大模型中,以使所述大模型根据所述原始文本、所述第一元组信息和提示信息再次对所述原始文本进行信息抽取,得到所述调整后的第一元组信息;在所述第一大小关系指示所述第一元组信息的目标评分小于所述第一预设阈值的情况下,确定所述第一元组信息中的正确元组信息和所述第二元组信息的并集。

5、在一个示例性实施例中,基于第一公式对所述第一评分和所述第二评分进行计算之前,所述方法还包括:确定所述第一评分是否位于第一数值范围,和/或,所述第二评分位于第二数值范围;在所述第一评分位于所述第一数值范围,和/或,所述第二评分位于所述第二数值范围的情况下,将所述原始文本、所述第一元组信息和所述提示信息再次输入至所述大模型中,以使所述大模型根据所述原始文本、所述第一元组信息和提示信息再次对所述原始文本进行信息抽取,得到所述调整后的第一元组信息;将所述原始文本、所述调整后的第一元组信息和判别规则输入至所述大模型中,以使所述大模型根据所述原始文本和所述判别规则对所述调整后的第一元组信息进行判断,得到第二评价信息,其中,所述第二评价信息至少包括:第三评分和第四评分,所述第三评分为指示所述第二元组信息的准确性的评分,所述第四评分为指示所述第二元组信息的完整性的评分;基于第二公式对所述第三评分和所述第四评分进行计算,以确定所述第二元组信息的目标评分,其中,所述第二公式为:,其中为所述第二元组信息的目标评分,p3为根据所述第三评分确定的数值,p4为根据所述第四评分确定的数值;根据所述第二元组信息的目标评分对所述调整后的第一元组信息再次进行调整,得到第三元组信息;根据所述第三元组信息构建所述原始文本对应的知识图谱。

6、在一个示例性实施例中,根据所述第二元组信息的目标评分对所述调整后的第一元组信息再次进行调整,包括:在所述第二元组信息的目标评分小于第一预设阈值的情况下,确定对所述原始文本进行信息抽取的次数;在所述次数大于或者等于预设次数的情况下,禁止根据所述第二元组信息的目标评分对所述调整后的第一元组信息再次进行调整;在所述次数小于所述预设次数的情况下,根据所述第二元组信息的目标评分对所述调整后的第一元组信息再次进行调整。

7、在一个示例性实施例中,基于第一公式对所述第一评分和所述第二评分进行计算之前,所述方法还包括:确定所述第一评分是否位于第三数值范围,且所述第二评分位于第四数值范围,其中,所述第三数值范围的最小值大于第一数值范围的最大值,所述第四数值范围的最小值大于第二数值范围的最大值;在所述第一评分位于所述第三数值范围,且第二评分位于所述第四数值范围的情况下,将所述第一元组信息中的错误元组信息更新为所述正确元组信息,以得到第四元组信息;根据所述第四元组信息构建所述原始文本对应的知识图谱。

8、在一个示例性实施例中,基于第一公式对所述第一评分和所述第二评分进行计算之前,所述方法还包括:确定所述第一评分是否位于第五数值范围,且所述第二评分位于第四数值范围,其中,所述第五数值范围的最小值大于第三数值范围的最大值,所述第四数值范围的最小值大于第二数值范围的最大值;在所述第一评分位于所述第五数值范围,且所述第二评分位于所述第四数值范围的情况下,确定所述正确元组信息和所述第二元组信息的并集;根据所述并集构建所述原始文本对应的知识图谱。

9、在一个示例性实施例中,基于第一公式对所述第一评分和所述第二评分进行计算,以确定所述第一元组信息的目标评分,包括:确定所述第一评分是否位于第一数值范围,且所述第二评分位于第六数值范围,其中,所述第六数值范围的最小值大于第二数值范围的最大值,所述第六数值范围的最大值小于第四数值范围的最小值;在所述第一评分不位于所述第一数值范围,且所述第二评分位于所述第六数值范围的情况下,确定所述第一评分与第一预设数值的第一差值,以及所述第二评分与第二预设数值的第二差值;将所述第一差值和所述第二差值输入至第一公式,以确定第一元组信息的目标评分,其中,所述第一公式为:,其中,y1为所述第一元组的目标评分,n=2,p1为所述第一差值,p2为所述第二差值。

10、在一个示例性实施例中,将原始文本和提示信息输入至所述大模型中,包括:确定所述原始文本对应的领域类型,以及确定所述领域类型对应的训练数据; 确定所述大模型的损失函数,根据所述损失函数和所述训练数据对所述大模型进行训练,以得到训练后的大模型;将所述原始文本和提示信息输入至所述训练后的大模型中。

11、在一个示例性实施例中,根据损失函数和所述训练数据对所述大模型进行训练,包括:确定所述训练数据的数据量,以及确定所述数据量与第二预设阈值的第二大小关系;在所述第二大小关系指示所述数据量大于或者等于所述第二预设阈值的情况下,根据所述损失函数和所述训练数据对所述大模型的每个神经网络层中的参数进行训练;在所述第二大小关系指示所述数据量小于所述第二预设阈值的情况下,冻结所述大模型中的目标神经网络层,并根据所述损失函数和所述训练数据对所述大模型的其他神经网络层中的参数进行训练,其中,所述其他神经网络层为所述大模型中除所述目标神经网络层之外的其他神经网络模型。

12、在一个示例性实施例中,将原始文本和提示信息输入至所述大模型中,以使所述大模型根据所述提示信息对所述原始文本进行信息抽取,得到第一元组信息,包括:将所述原始文本信息和所述提示信息输入至所述大模型中,以使所述大模型学习样例数据的数据格式,以及根据所述数据格式和输出指示对所述原始文本信息进行信息抽取,得到所述第一元组信息,其中,所述提示信息包括:所述样例数据和所述输出指示。

13、在一个示例性实施例中,根据调整后的第一元组信息构建所述原始文本对应的知识图谱,至少包括以下之一:在调整后的第一元组信息中包括:所述第一信息的情况下,根据所述目标对象的标识信息和所述目标对象的属性信息建立所述知识图谱中的第一节点和第二节点,以及根据所述属性信息和所述目标对象的关系确定所述第一节点和所述第二节点之间的边特征;在调整后的第一元组信息中包括:所述第二信息的情况下,根据所述目标对象的标识信息和所述目标对象的使用说明进行建立所述知识图谱中的第三节点和第四节点,以及根据所述使用说明和所述目标对象的关系确定所述第三节点和所述第四节点之间的边特征;在调整后的第一元组信息中包括:所述第一信息和所述第二信息的情况下,根据所述目标对象的标识信息和所述目标对象的属性信息进行建立所述知识图谱中的第一节点和第二节点,以及根据所述属性信息和所述目标对象的关系确定所述第一节点和所述第二节点之间的边特征;以及,根据所述目标对象的标识信息和所述目标对象的使用说明进行建立所述知识图谱中的第三节点和第四节点,以及根据所述使用说明和所述目标对象的关系确定所述第三节点和所述第四节点之间的边特征。

14、根据本技术实施例的另一个实施例,还提供了一种基于大模型的知识图谱构建装置,包括:第一输入模块,用于将原始文本和提示信息输入至所述大模型中,以使所述大模型根据所述提示信息对所述原始文本进行信息抽取,得到第一元组信息,其中,所述原始文本至少用于描述目标对象的属性信息和使用说明;所述第一元组信息包括:第一信息和/或第二信息;所述第一信息包括:所述属性信息,以及所述属性信息和所述目标对象的关系,所述第二信息包括:所述使用说明,以及所述使用说明和所述目标对象的关系;第二输入模块,用于将所述原始文本、所述第一元组信息和判别规则输入至所述大模型中,以使所述大模型根据所述原始文本和判别规则对所述第一元组信息进行判断,得到第一评价信息,其中,所述第一评价信息至少包括:第一评分和第二评分,所述第一评分为指示所述第一元组信息的准确性的评分,所述第二评分为指示所述第一元组信息的完整性的评分;计算模块,用于基于第一公式对所述第一评分和所述第二评分进行计算,以确定所述第一元组信息的目标评分,其中,所述第一公式为:,其中,为所述第一元组信息的目标评分,n=2,为根据所述第一评分确定的数值,为根据所述第二评分确定的数值;构建模块,用于根据所述第一元组信息的目标评分对所述第一元组信息进行调整,以及根据调整后的第一元组信息构建所述原始文本对应的知识图谱。

15、根据本技术实施例的又一方面,还提供了一种计算机可读的介质,该计算机可读的介质中存储有程序,其中,该程序被设置为运行时执行上述基于大模型的知识图谱构建方法。

16、根据本技术实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的基于大模型的知识图谱构建方法。

17、在本技术实施例中,将原始文本和提示信息输入至所述大模型中,以使所述大模型根据所述提示信息对所述原始文本进行信息抽取,得到第一元组信息,其中,所述原始文本至少用于描述目标对象的属性信息和使用说明;所述第一元组信息包括:第一信息和/或第二信息;所述第一信息包括:所述属性信息,以及所述属性信息和所述目标对象的关系,所述第二信息包括:所述使用说明,以及所述使用说明和所述目标对象的关系;将所述原始文本、所述第一元组信息和判别规则输入至所述大模型中,以使所述大模型根据所述原始文本和判别规则对所述第一元组信息进行判断,得到第一评价信息,其中,所述第一评价信息至少包括:第一评分和第二评分,所述第一评分为指示所述第一元组信息的准确性的评分,所述第二评分为指示所述第一元组信息的完整性的评分;基于第一公式对所述第一评分和所述第二评分进行计算,以确定所述第一元组信息的目标评分,其中,所述第一公式为:,其中,为所述第一元组信息的目标评分,n=2,为根据所述第一评分确定的数值,为根据所述第二评分确定的数值;根据所述第一元组信息的目标评分对所述第一元组信息进行调整,以及根据调整后的第一元组信息构建所述原始文本对应的知识图谱;即本技术实施例中,通过大模型根据输入的提示信息对原始文本进行信息抽取,得到元组信息,并将元组信息、原始文本和判别规则再次输入至大模型中,以使大模型对生成的元组信息进行评价,并根据评价信息对元组信息进行调整,最后根据调整后的元组信息生成知识图谱;采用上述技术方案,解决了通过人工提取原始文本中的知识,进而根据提取的知识生成知识图谱,导致生成知识图谱的效率较低等问题,进而提高了知识的提取速率,以及提高了生成知识图谱的效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1