家族亲缘关系知识图谱构建方法与系统与流程

文档序号:17832681发布日期:2019-06-05 23:12阅读:2957来源:国知局
家族亲缘关系知识图谱构建方法与系统与流程

本发明属于大数据分析应用领域,具体涉及一种家族亲缘关系知识图谱的构建方法与系统。



背景技术:

家族亲缘关系包括婚姻关系和血缘关系,在公安信息领域和遗传代际分析中有重要意义。目前,查询家族亲缘关系的方式往往是提取人员的户号,通过其同户号下记录的人员和关系,来确定家族内部具体的人员关系。这种对户号信息的提取往往是扁平的,例如:对现有户号下人口进行计数获得人口数量、根据籍贯计数获取城乡地区分布、根据婚姻状况计数获得总体婚姻状况等。这些都是通过对单一户号进行查询,再根据查询结果进行汇总,而没有根据户号中“户主或与户主关系”,以及用户的历史户号记录,进行不同户号间的挖掘。

目前人员户号数据库系统提供的服务主要是:提供人员身份信息搜索人员户号及历史户号、提供户号信息搜索同户号的人员身份信息。这样只能搜索到最多三代的直系血亲家族,对于旁系血亲没有办法进行有效迅速的识别。而且,当家族中有人进行了户号变迁,基于现有服务的查询时,由于户号下记录的人员信息发生了更改,而由于目前系统的不足,不能将其还原,导致搜索结果的遗漏和失准。如果需要搜索完整,则需要人工手动通过人员历史户号进行关联搜索,费时费力,有可能一无所获。

申请公布号为cn108153840a的中国发明专利申请公开了一种利用预设的家族关系参考图谱建立家族关系图谱的方法,其中预设的家族关系参考图谱中完整地记录了家庭中各成员与其他成员之间的关系,任意两个成员间的关系都是已知的,是一种全量的家族关系。在实际中,很难获取到类似的全量家族关系,通过查询户籍信息等方式得到的家族成员和家族关系信息往往并不全面,甚至是零散的,依据上述方法建立的家族亲缘关系知识图谱无法覆盖家族实际成员。



技术实现要素:

发明目的:针对现有技术中存在的问题,本发明提供了一种利用家族成员关系数据建立家族亲缘关系知识图谱的方法,该方法可以通过大量零散的数据构建出覆盖家族实际成员的家族亲缘关系知识图谱。

技术方案:本发明一方面提供了家族亲缘关系知识图谱构建方法,包括:

(1)定义家族直接关系,根据家族直接关系定义家族间接关系,所述家族间接关系由多个家族直接关系按一定的顺序组成;家族直接关系和家族间接关系构成家族语义知识库;

(2)获取家族成员关系数据,提取家族人员、家族人员之间的关系描述;所述关系描述包括家族直接关系和家族间接关系;

(3)对提取出的每个家族人员建立家族亲缘关系子图谱,包括步骤:

以提取出的家族人员为节点,家族人员之间的直接关系或间接关系为边构建有向图;所述有向图中,边的起点对应的家族人员对所述边的终点对应的家族人员的称谓为所述边所对应的家族直接关系或间接关系;

根据家族语义知识库中的定义,将关系为间接关系的边修改为连接多个空白节点且关系为直接关系的边;

(4)将建立的所有家族亲缘关系子图谱进行推理合并,得到家族亲缘关系知识图谱。

另一方面,本发明提供了家族亲缘关系知识图谱构建系统,包括:

家族语义知识库生成模块,定义和保存家族语义知识库,所述家族语义知识库包括家族直接关系和家族间接关系;

家族成员关系数据提取模块,从现有数据源中提取家族人员、家族人员之间的关系描述;所述关系描述包括家族直接关系和家族间接关系;

家族亲缘关系子图谱建立模块,以提取出的家族人员为节点,家族人员之间的直接关系或间接关系为边构建有向图;所述有向图中,边的起点对应的家族人员对所述边的终点对应的家族人员的称谓为所述边所对应的家族直接关系或间接关系;根据家族语义知识库中的定义,将关系为间接关系的边修改为连接多个空白节点且关系为直接关系的边;

家族亲缘关系知识图谱建立模块,将建立的所有家族亲缘关系子图谱进行推理合并,构建出家族亲缘关系知识图谱。

有益效果:与现有技术相比,本发明公开的家族亲缘关系知识图谱构建方法具有以下优点:不要求利用全量的家族关系数据,而是通过实际中更易获取的、大量的、零散的数据构建家族亲缘关系知识图谱,因此该方法更易实现;该方法构建的家族亲缘关系知识图谱中,家庭人员之间为直接关系,有利于判断成员之间是否有血缘关系以及血缘关系的远近。

附图说明

图1为本发明公开的家族亲缘关系知识图谱构建方法的流程图;

图2为家族间接关系组成示意图;

图3为家族间接关系转化为家族直接关系的示意图;

图4为本发明公开的家族亲缘关系知识图谱构建系统的组成图。

具体实施方式

下面结合附图和具体实施方式,进一步阐明本发明。

如图1所示,家族亲缘关系知识图谱构建方法,包括:

步骤1、定义家族直接关系,根据家族直接关系定义家族间接关系,所述家族间接关系由多个家族直接关系按一定的顺序组成;家族直接关系和家族间接关系构成家族语义知识库;

本发明中家族直接关系包括父亲、母亲、丈夫、妻子,儿子、女儿这6中基本的关系;其中,父亲和母亲的属性为唯一性关系,丈夫、妻子,儿子、女儿的属性为非唯一性关系;设置父亲与儿子、母亲与儿子、父亲与女儿、母亲与女儿、丈夫和妻子为双向关系对。

间接关系由多个家族直接关系按顺序排列组成。如图2所示,列举了几种间接关系的组成。

步骤2、获取家族成员关系数据,提取家族人员、家族人员之间的关系描述;所述关系描述包括家族直接关系和家族间接关系;

本发明从户籍数据中获取家族成员关系。在户籍数据中,包括户号和历史户号、同一户号下每个人员的身份信息、同一户号中每个人员与户主的关系。

步骤3、对提取出的每个家族人员建立家族亲缘关系子图谱,包括步骤:

以提取出的家族人员为节点,家族人员之间的直接关系或间接关系为边构建有向图;所述有向图中,边的起点对应的家族人员对所述边的终点对应的家族人员的称谓为所述边所对应的家族直接关系或间接关系;根据家族语义知识库中的定义,将关系为间接关系的边修改为连接多个空白节点且关系为直接关系的边;

如图3所示,为将间接关系的边修改为直接关系的边示意图,其中,图3-(a)为修改前的示意图,节点1和节点3之间的关系为“孙女”,查找家族语义知识库,将家族间接关系“孙女”修改为直接关系“儿子-女儿”,并增加空白节点2,得到图3-(b)的示意图。

步骤4、将建立的所有家族亲缘关系子图谱进行推理合并,得到家族亲缘关系知识图谱;

由于户籍数据中仅记录每个户号中成员与户主的关系,因此家族亲缘关系子图谱无法充分体现出家族成员间的全部关系,需要对子图谱进行推理合并,包括:

(4.1)合并相同家族人员对应的节点,合并后的节点继承合并前节点的所有关系;

通过遍历所有非空白节点,将相同的节点进行合并,由此将多个子图谱融合在一起,融合后的图谱中存在大量重复信息和不确定信息。

(4.2)如果两个节点之间只有一条边且为直接关系,根据双向关系对增加已有边的反向边,并设置所述反向边的关系;

(4.3)以同一节点为起点的两条边分别为父亲和母亲,则将所述两条边的终点所对应的节点间补充关系为丈夫和妻子的边;

步骤(4.2)和(4.3)是对图谱中的边进行补全。

(4.4)如果以同一节点为起点存在多条关系相同且属性为唯一性关系的边,将这些边的终点所对应的节点合并,合并后的节点继承合并前节点的所有关系;

唯一性关系边的终点对于起点是唯一确定的,因此可以将这些边的终点进行合并。合并中可能会出现非空白节点和空白节点的合并,此时,合并后的节点为对应的非空白节点,这样进一步减少了重复和不确定信息。

(4.5)重复上述步骤(4.1)-(4.4),直至没有任何节点可以再进行合并,得到构建好的家族亲缘关系知识图谱。

经过上述步骤得到的家族亲缘关系知识图谱中,成员间的关系为直接关系,有利于判断成员之间亲缘关系的远近、是否有血缘关系以及血缘关系的远近。

例如,给定2个人员的身份,判断其亲缘关系。在构建好的家族亲缘关系知识图谱中查找所述2个人员,查找所述2个人员之间的最短路径,路径的长短反映出亲缘关系的远近,路径越短,说明亲缘关系越近。

又例如,给定2个人员的身份,判断其血缘关系。在构建好的家族亲缘关系知识图谱中查找所述2个人员,查找所述2个人员之间是否存在不包括丈夫和妻子关系的路径,如果存在,说明所述2个人员之间有血缘关系,否则,没有血缘关系。路径的长短反映出血缘关系的远近,路径越短,说明血缘关系越近。

又例如,给定一个人员,确定与其满足血缘关系条件的人员。将血缘关系条件转化为家族直接关系,在构建好的家庭关系知识图谱中确定给定的人员,按照转化后的家族直接关系查找对应节点,将查找到的节点对应的人员作为结果返回。

本发明中构建的家族亲缘关系知识图谱采用neo4j图数据库,将家族成员以及成员间的关系以知识的形式存储下来,可以将其以图的形式直观地进行展示。采用的neo4j中的cypher作为查询语言。

本实施例还公开了实现上述方法的系统,如图4所述,包括:家族语义知识库生成模块,定义和保存家族语义知识库,所述家族语义知识库包括家族直接关系和家族间接关系;家族语义知识库采用关系型数据库保存,由于家族语义知识库数量并不庞大,mysql、sqlserver或者oracle数据库都可满足要求;

家族成员关系数据提取模块,从现有数据源中提取家族人员、家族人员之间的关系描述;所述关系描述包括家族直接关系和家族间接关系;

家族亲缘关系子图谱建立模块,以提取出的家族人员为节点,家族人员之间的直接关系或间接关系为边构建有向图;所述有向图中,边的起点对应的家族人员对所述边的终点对应的家族人员的称谓为所述边所对应的家族直接关系或间接关系;根据家族语义知识库中的定义,将关系为间接关系的边修改为连接多个空白节点且关系为直接关系的边

家族亲缘关系知识图谱建立模块,将建立的所有家族亲缘关系子图谱进行推理合并,构建出家族亲缘关系知识图谱。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1