生成知识图谱的方法、装置和存储介质与流程

文档序号:36836029发布日期:2024-01-26 16:53阅读:20来源:国知局
生成知识图谱的方法、装置和存储介质与流程

本发明的实施方式总体上涉及特定领域的知识图谱构建,更具体地,涉及一种生成知识图谱的方法、装置和存储介质。


背景技术:

1、在当前的人工智能领域,知识图谱作为一种重要的知识组织工具,被广泛应用于各种复杂的问题解决和决策支持场景中。知识图谱通过以图形方式表示实体及其关系,提供了一种直观、高效的知识获取和推理方式。然而,知识图谱的构建过程通常需要大量的人力投入,包括专业领域的知识抽取、实体和关系的标注、知识的验证等环节,成本高昂。

2、尽管大型语言模型在自然语言理解和生成方面展现出了强大的能力,但由于其知识无法更新,且专业和垂直领域知识在大语料库中占比非常少,使得大型语言模型在训练过程中很难学习到深度的专业知识。

3、因此,在具体的应用领域,如汽车的不同车型用户手册知识图谱的构建等,仍然需要依赖知识图谱。

4、另一方面,神经网络在解决事实性准确问题方面面临着挑战。为了提供确定的事实性信息,必须依赖准确的知识库。因此,在这种情况下,知识图谱的存在意义显得尤为重要。


技术实现思路

1、为了解决现有技术中的上述问题,在第一方面,本发明的实施方式提供了一种生成知识图谱的方法,所述方法包括以下步骤:

2、s101、接收用户输入的目标领域关键词,作为第一层级关键词;

3、s102、根据所述第一层级关键词生成第一层级本体构建提示信息,其中所述第一层级本体构建提示信息包括基于所述第一层级关键词、预先指定的来源限定信息和第一层级知识图谱本体格式来构建知识图谱本体的指令,其中所述第一层级知识图谱本体格式将第一层级知识图谱本体中的知识图谱本体条目限定为包括实体和属性;

4、s103、将所述第一层级本体构建提示信息传输至本体构建模型,以便由所述本体构建模型根据所述第一层级本体构建提示信息生成第一层级知识图谱本体,并且将所述第一层级知识图谱本体存储在本体库中;

5、s104、根据所述本体库中存储的前一层级知识图谱本体来生成实体扩展分配提示信息,其中,所述实体扩展分配提示信息包括所述前一层级知识图谱本体以及将所述前一层级知识图谱本体中的知识图谱本体条目的属性的可扩展性进行排序的指令;

6、s105、将所述实体扩展分配提示信息传输至实体扩展分配模型,以便由所述实体扩展分配模型根据所述实体扩展分配提示信息生成前一层级知识图谱本体的属性的可扩展性排序;

7、s106、按照可扩展性排序中属性可扩展性由高至低的次序,依次对前一层级知识图谱本体中的知识图谱本体条目执行以下处理:根据该知识图谱本体条目的实体和属性以及前一层级关键词,生成与该知识图谱本体条目相对应的当前层级关键词;

8、s107、根据所述当前层级关键词生成当前层级本体构建提示信息,其中所述当前层级本体构建提示信息包括基于所述当前层级关键词、预先指定的来源限定信息和当前层级知识图谱本体格式来构建当前层级知识图谱本体的指令,其中所述当前层级知识图谱本体格式将当前层级知识图谱本体中的知识图谱本体条目限定为包括实体和属性,并且指定当前层级知识图谱本体条目的实体是相对应的前一层级知识图谱本体条目的属性;

9、s108、将所述当前层级本体构建提示信息传输至所述本体构建模型,以便由所述本体构建模型根据所述当前层级本体构建提示信息生成当前层级知识图谱本体,并且将所述当前层级知识图谱本体存储在所述本体库中,其中,所述当前层级知识图谱本体条目的实体与相对应的前一层级知识图谱本体条目的属性相关联地存储;

10、s109、判断已生成的知识图谱本体的层级数目是否均达到预定义的层级数目阈值,如果是,则转到步骤s110;如果否,则转到步骤s104;

11、s110、根据所述本体库中存储的知识图谱本体来创建问题生成提示信息,并且将所述问题生成提示信息传输至问题生成模型,以便由所述问题生成模型针对所存储的知识图谱本体中的每个知识图谱本体条目的实体和属性生成问询语句;

12、s111、对所述问询语句进行向量化,生成问询语句向量;

13、s112、将预先存储的领域文档本文进行分块,生成领域文档文本块,并且对所述领域文档文本块进行向量化,生成领域文档文本向量,将所述领域文档文本向量存储在向量库中;

14、s113、在所述向量库中检索与所述问询语句向量相似的领域文档文本向量,并且将所述相似的领域文档文本向量相对应的领域文档文本块组合为检索上下文;

15、s114、根据所述问询语句和所述检索上下文来创建答案生成提示信息,其中,所述答案生成提示信息包括在所述检索上下文中检索所述问询语句的答案的指令;

16、s115、将所述答案生成提示信息传输至答案生成模型,以便由所述答案生成模型根据所述答案生成提示信息生成所述问询语句的答案;

17、s116、根据所述答案和与所述问询语句相对应的知识图谱本体条目的实体和属性来生成知识图谱的知识图谱条目,其中知识图谱条目包括实体、属性和属性值,并且其中知识图谱条目的实体和属性分别是相对应的知识图谱本体条目的实体和属性,知识图谱条目的属性值是所述答案。

18、在一些实施方式中,所述方法包括:在对前一层级知识图谱本体中待扩展的全部知识图谱本体条目均执行步骤s106-s108之后,再对当前层级知识图谱本体中的待扩展的知识图谱条目执行步骤s106-s108。

19、在一些实施方式中,所述方法包括:在对前一层级知识图谱本体中的特定知识图谱本体条目执行步骤s106-s108之后,针对与该特定知识图谱本体条目相对应的当前层级知识图谱本体执行步骤s106-s108,直到达到预定义的层级数目阈值,再针对所述前一层级知识图谱本体中的该特定知识图谱本体条目的下一知识图谱本体条目执行步骤s106-s108。

20、在一些实施方式中,步骤s106进一步包括:按照属性可扩展性由高至低的次序,取次序中居于前的预定扩展数目个知识图谱本体条目作为待扩展的知识图谱本体条目,针对所述待扩展的知识图谱本体条目执行以下处理:根据该知识图谱本体条目的实体和属性以及前一层级关键词,生成与该知识图谱本体条目相对应的当前层级关键词。

21、在一些实施方式中,根据当前层级的层数,来确定所述预定扩展数目。

22、在一些实施方式中,所述预定义的层级数目阈值是固定的,或者,所述预定义的层级数目阈值是根据指定层级中相对应的知识图谱条目的属性可扩展性排序的次序而确定的。

23、在一些实施方式中,所述方法还包括:显示所述本体库;接收用户对所述本体库中的选定知识图谱本体条目的操作指令,所述操作指令包括删除、编辑、添加;根据所述操作指令对所述选定知识图谱本体条目执行相应操作;和/或,显示所述知识图谱;接收用户对所述知识图谱中的选定知识图谱条目的操作指令,所述操作指令包括删除、编辑、添加;根据所述操作指令对所述选定知识图谱条目执行相应操作。

24、在一些实施方式中,预先指定的来源限定信息包括所述本体构建模型自身的数据库、指定数据库地址、指定搜索引擎中的一个或多个。

25、在第二方面,本发明的实施方式提出了一种生成知识图谱的装置,所述装置包括:目标领域关键词接收模块,配置用于接收用户输入的目标领域关键词,作为第一层级关键词;第一层级本体构建提示信息生成模块,配置用于根据所述第一层级关键词生成第一层级本体构建提示信息,其中所述第一层级本体构建提示信息包括基于所述第一层级关键词、预先指定的来源限定信息和第一层级知识图谱本体格式来构建知识图谱本体的指令,其中所述第一层级知识图谱本体格式将第一层级知识图谱本体中的知识图谱本体条目限定为包括实体和属性;第一层级知识图谱本体生成模块,配置用于将所述第一层级本体构建提示信息传输至本体构建模型,以便由所述本体构建模型根据所述第一层级本体构建提示信息生成第一层级知识图谱本体,并且将所述第一层级知识图谱本体存储在本体库中;实体扩展分配提示信息生成模块,配置用于根据所述本体库中存储的前一层级知识图谱本体来生成实体扩展分配提示信息,其中,所述实体扩展分配提示信息包括所述前一层级知识图谱本体以及将所述前一层级知识图谱本体中的知识图谱本体条目的属性的可扩展性进行排序的指令;可扩展性排序生成模块,配置用于将所述实体扩展分配提示信息传输至实体扩展分配模型,以便由所述实体扩展分配模型根据所述实体扩展分配提示信息生成前一层级知识图谱本体的属性的可扩展性排序;当前层级关键词生成模块,配置用于按照可扩展性排序中属性可扩展性由高至低的次序,依次对前一层级知识图谱本体中的知识图谱本体条目执行以下处理:根据该知识图谱本体条目的实体和属性以及前一层级关键词,生成与该知识图谱本体条目相对应的当前层级关键词;当前层级本体构建提示信息生成模块,配置用于根据所述当前层级关键词生成当前层级本体构建提示信息,其中所述当前层级本体构建提示信息包括基于所述当前层级关键词、预先指定的来源限定信息和当前层级知识图谱本体格式来构建当前层级知识图谱本体的指令,其中所述当前层级知识图谱本体格式将当前层级知识图谱本体中的知识图谱本体条目限定为包括实体和属性,并且指定当前层级知识图谱本体条目的实体是相对应的前一层级知识图谱本体条目的属性;当前层级知识图谱本体生成模块,配置用于将所述当前层级本体构建提示信息传输至所述本体构建模型,以便由所述本体构建模型根据所述当前层级本体构建提示信息生成当前层级知识图谱本体,并且将所述当前层级知识图谱本体存储在所述本体库中,其中,所述当前层级知识图谱本体条目的实体与相对应的前一层级知识图谱本体条目的属性相关联地存储;层级数目判断模块,配置用于判断已生成的知识图谱本体的层级数目是否均达到预定义的层级数目阈值,如果是,则转到问询语句生成模块;如果否,则转到实体扩展分配提示信息生成模块;问询语句生成模块,配置用于根据所述本体库中存储的知识图谱本体来创建问题生成提示信息,并且将所述问题生成提示信息传输至问题生成模型,以便由所述问题生成模型针对所存储的知识图谱本体中的每个知识图谱本体条目的实体和属性生成问询语句;问询语句向量化模块,配置用于对所述问询语句进行向量化,生成问询语句向量;领域文档本文向量化模块,配置用于将预先存储的领域文档本文进行分块,生成领域文档文本块,并且对所述领域文档文本块进行向量化,生成领域文档文本向量,将所述领域文档文本向量存储在向量库中;检索上下文生成模块,配置用于在所述向量库中检索与所述问询语句向量相似的领域文档文本向量,并且将所述相似的领域文档文本向量相对应的领域文档文本块组合为检索上下文;答案生成提示信息创建模块,配置用于根据所述问询语句和所述检索上下文来创建答案生成提示信息,其中,所述答案生成提示信息包括在所述检索上下文中检索所述问询语句的答案的指令;答案生成模块,配置用于将所述答案生成提示信息传输至答案生成模型,以便由所述答案生成模型根据所述答案生成提示信息生成所述问询语句的答案;知识图谱生成模块,配置用于根据所述答案和与所述问询语句相对应的知识图谱本体条目的实体和属性来生成知识图谱的知识图谱条目,其中知识图谱条目包括实体、属性和属性值,并且其中知识图谱条目的实体和属性分别是相对应的知识图谱本体条目的实体和属性,知识图谱条目的属性值是所述答案。

26、在第三方面,本发明的实施方式提出了一种存储介质,存储有计算机可读指令,当所述指令由处理器运行时,执行根据上述任何实施方式所述的方法。

27、本发明的实施方式提出了一种基于大语言模型的多智能体协作构建知识图谱的方案,旨在将知识图谱构建过程自主化和自动化,尽可能的减少人工的参与,降低人力成本。通过基于大语言模型的ai智能体,可以与环境互动执行长期和复杂的任务,并扮演不同的角色进行相互协作,从而实现知识图谱的自动化构建。

28、将知识图谱的构建流程自动化并利用多个模型来扮演不同的角色,会带来显著的效率提升。这种提升主要体现在以下两个方面:

29、1、知识图谱本体构建过程的自动化:各种模型的不同角色以及相互协作弥补了依赖单一领域专家所带来的知识覆盖面不足的问题。这种结合使得本体构建过程变得更为高效和准确。

30、2、知识图谱实体补全过程的自动化:传统的知识图谱构建过程通常需要人工查阅大量的文档资料,进行繁琐的人工梳理,这不仅耗费大量的人力物力,而且效率低下。通过自动化构建,可以从大量的非结构化数据中提取出有价值的信息,快速准确地补全知识图谱。这不仅大大提高了构建速度,也提升了知识图谱的质量和完整性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1