一种基于知识图谱的推演分组方法与流程

文档序号:27094816发布日期:2021-10-27 16:37阅读:167来源:国知局
一种基于知识图谱的推演分组方法与流程

1.本发明涉及知识图谱的推演分组技术领域,尤其涉及一种基于知识图谱的推演分组方法。


背景技术:

2.当我们拥有大批量的实体数据与关系数据时,需要将实体以组的形式进行区分,当实体与实体存在关系,即分为一组,然后以组为单位进行分析。好比某个地区的某段时间发生多起团伙犯罪案件,涉案人数过多,警方需要查清楚有几个犯罪团伙。传统的方法,如果要将已知的涉案人员与人员同伙数据进行分析,区分出所有的独立团伙,是不可能做到的。


技术实现要素:

3.本发明的目的是为了解决现有技术中存在的问题,提供一种基于知识图谱的推演分组方法。
4.为了实现上述目的,本发明采用了如下技术方案:
5.一种基于知识图谱的推演分组方法,包括如下方法:通过对每个实体设定一个祖先,再通过实体之间的关系更新祖先,达到对知识图谱数据进行分组的效果,其详细步骤如下:
6.1)首先将每个实体的祖先设定为自身;
7.2)通过靠左原则,将存在关系的实体选择左边的实体作为两个实体的祖先;
8.3)定义获取实体顶级祖先的方式,当实体的祖先不是自身时,获取祖先实体,当祖先实体的祖先依旧不是自身时,继续获取祖先实体的祖先,直到祖先是自身为止;
9.4)在获取实体顶级祖先的过程中,进行路径压缩,将查找过程找到的实体的祖先统一设定为顶级祖先实体,提升获取实体顶级祖先的效率;
10.5)合并实体集合。通过遍历每条关系,获取关系涉及实体的顶级祖先实体,当双方顶级祖先实体不一致时,通过靠左原则,将右边实体的祖先设定为左边实体;
11.6)遍历每个实体,当实体的祖先是自身时,则代表该实体是组内的顶级祖先,每有一个顶级祖先,就有多少个组,实体通过自身的顶级祖先纳入对应的组。
12.本专利的优点在于,通过本发明,可以将知识图谱的内容以毫无关系为依据进行分组,然后以组为单位进行分析,便于将大批量的实体数据与关系数据进行处理,条理性强,处理效率高。
附图说明
13.图1为本专利的一种基于知识图谱的推演分组方法的工作流程示意图
具体实施方式
14.通过对每个实体设定一个祖先,再通过实体之间的关系更新祖先,实体通过自身的顶级祖先纳入对应的组,达到对知识图谱数据进行分组的效果,细节如下:
15.1)首先将每个涉案人员的祖先设定为自身,在此场景下,祖先类似于团伙的首领;
16.2)通过靠左原则,将存在同伙关系的涉案人员选择左边的涉案人员作为两个涉案人员的祖先;
17.3)定义获取涉案人员顶级祖先的方式,当涉案人员的祖先不是自身时,获取祖先涉案人员,当祖先涉案人员的祖先依旧不是自身时,继续获取祖先涉案人员的祖先,直到祖先是自身为止;
18.4)在获取涉案人员顶级祖先的过程中,进行路径压缩,将查找过程找到的涉案人员的祖先统一设定为顶级祖先涉案人员,提升获取涉案人员顶级祖先的效率;
19.5)合并涉案人员集合。通过遍历每条同伙关系,获取关系涉及涉案人员的顶级祖先,当双方顶级祖先不一致时,通过靠左原则,将右边涉案人员的祖先设定为左边涉案人员;
20.6)最后,遍历每个涉案人员,当涉案人员的祖先是自身时,则代表该涉案人员是独立团伙内的顶级祖先,每有一个顶级祖先,就有多少个独立团伙,涉案人员通过自身的顶级祖先纳入对应的独立团伙。
21.通过本发明,可以将知识图谱的内容以毫无关系为依据进行分组,然后以组为单位进行分析。


技术特征:
1.一种基于知识图谱的推演分组方法,其特征在于,包括如下方法:通过对每个实体设定一个祖先,再通过实体之间的关系更新祖先,达到对知识图谱数据进行分组的效果,其详细步骤如下:1)首先将每个实体的祖先设定为自身;2)通过靠左原则,将存在关系的实体选择左边的实体作为两个实体的祖先;3)定义获取实体顶级祖先的方式,当实体的祖先不是自身时,获取祖先实体,当祖先实体的祖先依旧不是自身时,继续获取祖先实体的祖先,直到祖先是自身为止;4)在获取实体顶级祖先的过程中,进行路径压缩,将查找过程找到的实体的祖先统一设定为顶级祖先实体,提升获取实体顶级祖先的效率;5)合并实体集合,通过遍历每条关系,获取关系涉及实体的顶级祖先实体,当双方顶级祖先实体不一致时,通过靠左原则,将右边实体的祖先设定为左边实体;6)遍历每个实体,当实体的祖先是自身时,则代表该实体是组内的顶级祖先,每有一个顶级祖先,就有多少个组,实体通过自身的顶级祖先纳入对应的组。

技术总结
本发明提供了一种基于知识图谱的推演分组方法,包括如下方法:通过对每个实体设定一个祖先,再通过实体之间的关系更新祖先,达到对知识图谱数据进行分组的效果,其详细步骤如下:1)将每个实体的祖先设定为自身;2)将存在关系的实体选择左边的实体作为两个实体的祖先;3)定义获取实体顶级祖先的方式,直到祖先是自身为止;4)在获取实体顶级祖先的过程中,进行路径压缩;5)合并实体集合;6)实体通过自身的顶级祖先纳入对应的组。本专利的优点在于,通过本发明,可以将知识图谱的内容以毫无关系为依据进行分组,然后以组为单位进行分析,便于将大批量的实体数据与关系数据进行处理,条理性强,处理效率高。处理效率高。处理效率高。


技术研发人员:陈欣然
受保护的技术使用者:北京海致星图科技有限公司
技术研发日:2021.05.27
技术公布日:2021/10/26
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1