知识图谱的实体摘要确定方法、装置及电子设备与流程

文档序号:35459809发布日期:2023-09-15 20:46阅读:47来源:国知局
知识图谱的实体摘要确定方法、装置及电子设备与流程

本申请涉及知识图谱,可用于金融领域,特别涉及知识图谱的实体摘要确定方法、装置及电子设备。


背景技术:

1、知识图谱用图的形式描述客观事物,这里的图指的是数据结构中的图,也就是由节点和边组成的。知识图谱中的节点表示概念和实体,概念是抽象出来的事物,实体是具体的事物;边表示事物的关系和属性,事物的内部特征用属性来表示,外部联系用关系来表示。很多时候,人们简化了对知识图谱的描述,将实体和概念统称为实体,将关系和属性统称为关系,这样就可以说知识图谱就是描述实体以及实体之间的关系。实体可以是人,地方,组织机构,概念等等,关系的种类更多,可以是人与人之间的关系,人与组织之间的关系,概念与某个物体之间的关系等等。知识图谱能够为知识创新、知识优化等应用提供更好的支撑,进一步在银行风险控制领域发挥巨大价值。但是由于知识图谱规模的不断变大,其中本体概念和实体的数量都成倍增长,本体概念与本体概念之间、实体与实体之间、本体概念与实体之间的连接都更加错综复杂,给知识图谱的理解和快速应用都带来了新的挑战。实体摘要能够生成便于用户理解的原始知识图谱的精简版本,这为快速理解知识图谱提供了便利。通过实体摘要技术,可以实现对知识图谱的高效浏览。

2、现有技术通常根据各种指标来寻找知识图谱实体中的关键实体,例如,集成密度和覆盖率的拓扑度量来进行实体摘要,或者结合实体相关性与用户自定义参数进行个性化实体摘要。也即,现有技术基本是实体的拓扑结构角度确定关键实体,并基于关键实体生成实体摘要。

3、然而,现有技术所确定的实体摘要中容易缺失重要实体。


技术实现思路

1、本说明书提供一种知识图谱的实体摘要确定方法、装置及电子设备,以解决现有技术确定的实体摘要中容易缺失重要实体的问题。

2、为解决上述技术问题,本说明书第一方面提供一种知识图谱的实体摘要确定方法,包括:根据所述知识图谱中各实体的文本表述,计算各实体的外延参数;根据各实体的出度和入度,计算实体的结构参数;结合所述外延参数和所述结构参数,从所述知识图谱的多个实体中筛选出目标实体;根据所述目标实体确定所述知识图谱的实体摘要;所述实体摘要用于代替所述知识图谱呈现给用户或者被计算机处理。

3、在一些实施例中,所述知识图谱中的每个节点表示用户账户,节点之间的连线表示用户账户之间的交易。

4、在一些实施例中,结合所述外延参数和所述结构参数,从所述知识图谱的多个实体中筛选出目标实体,包括:结合所述外延参数和所述结构参数,计算各实体的重要度;筛选出重要度参数大于预定阈值的实体,作为候选实体集;从所述候选实体集选择目标实体。

5、在一些实施例中,一个实体的外延参数与所述实体的文本表述中的词语的数量呈反比例关系。

6、在一些实施例中,一个实体的结构参数正比于所述实体的出度和入度的加权和。

7、在一些实施例中,从所述候选实体集选择目标实体,包括:对候选实体集中的各实体进行聚类,得到多个簇;分别从每个簇中筛选出实体作为目标实体。

8、在一些实施例中,分别从每个簇中筛选出实体作为目标实体,包括:将离簇心最近的n个实体作为目标实体,其中,n为自然数。

9、在一些实施例中,所述n是根据簇中实体的数量确定的。

10、在一些实施例中,分别从每个簇中筛选出实体作为目标实体,包括:从每个簇中筛选出与簇心之间的距离在预定距离范围内的实体作为目标实体。

11、在一些实施例中,对候选实体集中的各实体进行聚类,得到多个簇,包括:分别将各实体的文本表述输入bert模型,将所述bert模型输出的向量作为实体的向量;采用各实体的向量进行聚类,得到多个簇。

12、本说明书第二方面提供一种知识图谱的实体摘要确定装置,包括:第一计算单元,用于根据所述知识图谱中各实体的文本表述,计算各实体的外延参数;第二计算单元,用于根据各实体的出度和入度,计算实体的结构参数;筛选单元,用于结合所述外延参数和所述结构参数,从所述知识图谱的多个实体中筛选出目标实体;确定单元,用于根据所述目标实体确定所述知识图谱的实体摘要;所述实体摘要用于代替所述知识图谱呈现给用户或者被计算机处理。

13、在一些实施例中,所述知识图谱中的每个节点表示用户账户,节点之间的连线表示用户账户之间的交易。

14、在一些实施例中,所述筛选单元包括:第一计算子单元,用于结合所述外延参数和所述结构参数,计算各实体的重要度;第一筛选子单元,用于筛选出重要度参数大于预定阈值的实体,作为候选实体集;选择子单元,用于从所述候选实体集选择目标实体。

15、在一些实施例中,一个实体的外延参数与所述实体的文本表述中的词语的数量呈反比例关系。

16、在一些实施例中,一个实体的结构参数正比于所述实体的出度和入度的加权和。

17、在一些实施例中,所述选择子单元包括:第一聚类子单元,用于对候选实体集中的各实体进行聚类,得到多个簇;第二筛选子单元,用于分别从每个簇中筛选出实体作为目标实体。

18、在一些实施例中,第二筛选子单元包括:第一确定子单元,用于将离簇心最近的n个实体作为目标实体,其中,n为自然数。

19、在一些实施例中,所述n是根据簇中实体的数量确定的。

20、在一些实施例中,第二筛选子单元包括:第二确定子单元,用于从每个簇中筛选出与簇心之间的距离在预定距离范围内的实体作为目标实体。

21、在一些实施例中,所述第一聚类子单元包括:处理子单元,用于分别将各实体的文本表述输入bert模型,将所述bert模型输出的向量作为实体的向量;第二聚类子单元,用于采用各实体的向量进行聚类,得到多个簇。

22、本说明书第三方面提供一种电子设备,包括:存储器和处理器,所述处理器和所述存储器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而实现第一方面任一项所述方法的步骤。

23、本说明书第四方面提供一种计算机存储介质,所述计算机存储介质存储有计算机程序指令,所述计算机程序指令被执行时实现第一方面任一项所述方法的步骤。

24、本说明书第五方面提供一种计算机程序产品,包含有计算机程序,所述计算机程序被处理器执行时实现第一方面任一项所述方法的步骤。

25、本说明书提供的知识图谱的实体摘要确定方法、装置及电子设备,结合根据文本表述计算得到的外延参数、根据出度和入度计算得到的结构参数,从知识图谱的多个实体中筛选出目标实体,然后根据目标实体确定实体摘要。本方案充分利用了实体的文本表述的语音信息,从语义和拓扑结构两个方面确定用于生成实体摘要的目标实体,能够使得知识图谱中保留虽然关联节点不多、但描述范围较大的重要实体,从而解决现有技术确定的实体摘要中容易缺失重要实体的问题。



技术特征:

1.一种知识图谱的实体摘要确定方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述知识图谱中的每个节点表示用户账户,节点之间的连线表示用户账户之间的交易。

3.根据权利要求1所述的方法,其特征在于,结合所述外延参数和所述结构参数,从所述知识图谱的多个实体中筛选出目标实体,包括:

4.根据权利要求1所述的方法,其特征在于,一个实体的外延参数与所述实体的文本表述中的词语的数量呈反比例关系。

5.根据权利要求1所述的方法,其特征在于,一个实体的结构参数正比于所述实体的出度和入度的加权和。

6.根据权利要求3所述的方法,其特征在于,从所述候选实体集选择目标实体,包括:

7.根据权利要求6所述的方法,其特征在于,分别从每个簇中筛选出实体作为目标实体,包括:

8.根据权利要求7所述的方法,其特征在于,所述n是根据簇中实体的数量确定的。

9.根据权利要求7所述的方法,其特征在于,分别从每个簇中筛选出实体作为目标实体,包括:

10.根据权利要求1所述的方法,其特征在于,对候选实体集中的各实体进行聚类,得到多个簇,包括:

11.一种知识图谱的实体摘要确定装置,其特征在于,包括:

12.一种电子设备,其特征在于,包括:

13.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序指令,所述计算机程序指令被执行时实现权利要求1至10任一项所述方法的步骤。

14.一种计算机程序产品,其特征在于,包含有计算机程序,所述计算机程序被处理器执行时实现权利要求1至10中任一项所述方法的步骤。


技术总结
本说明书公开了知识图谱的实体摘要确定方法、装置及电子设备,其中方法包括:根据所述知识图谱中各实体的文本表述,计算各实体的外延参数;根据各实体的出度和入度,计算实体的结构参数;结合所述外延参数和所述结构参数,从所述知识图谱的多个实体中筛选出目标实体;根据所述目标实体确定所述知识图谱的实体摘要;所述实体摘要用于代替所述知识图谱呈现给用户或者被计算机处理。本方案充分利用了实体的文本表述的语音信息,从语义和拓扑结构两个方面确定用于生成实体摘要的目标实体,能够使得知识图谱中保留虽然关联节点不多、但描述范围较大的重要实体,从而解决现有技术确定的实体摘要中容易缺失重要实体的问题。

技术研发人员:吴子仪
受保护的技术使用者:中国工商银行股份有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1