一种通用亲缘关系信息库遍历完善方法

文档序号:6514238阅读:122来源:国知局
一种通用亲缘关系信息库遍历完善方法
【专利摘要】本发明公开了一种通用亲缘关系信息库遍历完善方法,首先确定要推导的具体亲缘关系种类范围和检查规则,然后执行遍历完善过程,过程中按第一步所确定的要推导的具体亲缘关系种类范围进行关系推导以及按第一步所确定的检查规则进行检查处理,如果不设置任何检查规则,那么遍历完善的主要流程是对信息库中每一个记录与其它记录一一进行关系推导,关系推导包括两种,通过确定未知关系人来推导亲缘关系和通过确定未知关系种类来推导亲缘关系,从已有的信息中推导出常见的但尚未明知的信息,从而有利于更好的分析检索。也可在关系推导前根据确定的检查规则加入相应的检查步骤,从而满足消除某些数据冗余和数据冲突的需求,使信息库更加优化。
【专利说明】一种通用亲缘关系信息库遍历完善方法
【技术领域】
[0001]本发明属于计算机信息处理领域,尤其涉及一种通用亲缘关系信息库遍历完善方法。
【背景技术】
[0002]发明专利申请一种通用亲缘关系信息库存储组织方法,发明专利申请一种亲缘关系信息库构建方法,仅解决已识别亲缘关系信息的直接存储,而仅有已识别亲缘关系信息对于分析检索还是不够的,因为在通用亲缘关系信息库中相关的亲缘信息很难形成一个关系链,这就给查询分析带来很多困难。要提高分析检索的效率,应当尽量填满为空的属性或弥补关系链中缺失的环节,这就需要通过亲缘关系推导。而发明专利申请一种过确定未知关系人来推导亲缘关系方法、一种通过确定未知关系种类来推导亲缘关系方等方法及关系路径的概念等为弥补关系链中缺失的环节、进而提高分析检索效率提供了有效的途径。

【发明内容】

[0003]本发明要解决构建通用亲缘关系信息库时由于信息不完善而分析检索效率不高的问题,为解决上述问题,本发明的目的在于提供一种通用亲缘关系信息库遍历完善方法,使通用亲缘关系信息库能够得到尽可能的完善,从而提高其分析检索效率。
[0004]本发明提出的通用亲缘关系信息库遍历完善方法,是对信息库全库的一种检查完善,主要利用已有的亲缘关系推导方法,从已有亲缘关系信息推导出新的亲缘关系从而使信息库更加完善,另外还可根据需要进行相应的检查,消除数据冲突和数据冗余,进一步提升信息库的性能,遍历完善主要包括以下步骤:
第一步是确定要推导的具体亲缘关系种类范围和检查规则;由于通用亲缘关系信息库中存储的具体亲缘关系种类不受限制,如果对于推导结果也不做限制的话,那么其推导结果集将可能很大,而且对于提高分析检索效率也没有什么作用,因此应当限定为有利于提高分析检索效率的具体亲缘关系种类,一般应为两人之间最直接的亲缘关系,即关系路径长度为I的那些具体亲缘关系种类,由于通用亲缘关系信息库的分析检索有时不采取类似于指针的技术,为了分析检索更加快捷,有时也可将某些关系路径长度为2的那些具体亲缘关系种类等也纳入要推导的具体亲缘关系种类范围;检查规则主要包括消除数据冲突和数据冗余的规则,为了不至于在检查方面耗费过多,一般来说只有比较明显的数据冲突和不必要的数据冗余才消除,比较明显的数据冲突如不符合亲缘关系的相互性的数据,一个亲缘关系信息甲是乙的父亲和另一个亲缘关系信息乙是丙(男性)的儿子就是不符合亲缘关系的相互性的数据,不必要的数据冗余包括完全相同的两条信息、互为相互反向的等价的两条信息以及可以由其它两条或以上信息直接拼接而成的信息等,当然也可以根据需要确定更为严格或更为宽松的检查规则;此处假设不做任何检查,不对任何数据冲突和数据冗余进行检查和处理;
第二步:执行遍历完善过程,过程中按第一步所确定的要推导的具体亲缘关系种类范围进行关系推导以及按第一步所确定的检查规则进行检查处理。主要流程是对信息库中每一个记录与其它记录一一进行关系推导,关系推导包括两种,通过确定未知关系人来推导亲缘关系和通过确定未知关系种类来推导亲缘关系,从已有的信息中推导出常见的但尚未明知的信息,从而有利于更好的分析检索。为了实现遍历,这里用了两个定位器,第一个定位器用于定位在遍历信息库时当前访问的记录,第二个定位器用于定位配合进行推导的记录,由于第一步已确定不做任何检查,所以不包括任何对任何数据冲突和数据冗余进行检查和处理的步骤,具体包括以下步骤:
第I步:第一个定位器定位到信息库中第一个记录(外循环置初值),如果已经到达信息库末则执行第25步结束,否则执行下步;
第3步:第二个定位器定位到第一个定位器定位当前记录的后一记录(内循环置初值),如果已经到达信息库末则执行第25步结束,否则执行第8步(即开始执行循环体);
第8步:判断两个定位器定位的记录是否可以唯一匹配部分关系路径,用关系路径长度短的去匹配长的,如果长度相等则执行第11步,也可继续进行匹配但肯定是不能唯一匹配;假如第二个定位器定位的记录所描述的亲缘关系关系路径短,则看该记录是否可以唯一匹配第一个定位器定位的记录所描述的亲缘关系的部分关系路径,如果可以唯一匹配,按通过确定未知关系人来推导亲缘关系方法进行关系推导(结果集是第一步限定的,不在结果集的推导结果均属不可推导的范围,相关的推导规则中可只有推导结果属于第一步确定的推导的具体亲缘关系种类范围的规则),上述过程可统称为通过确定未知关系人来推导亲缘关系的过程;如果不可推导,那么执行第11步;若推导出另一组可直接描述或不可直接描述的两人之间亲缘关系信息,执行第14步进行处理;
第11步:判断第二个定位器定位的记录所描述的亲缘关系是否可以拟合第一个定位器定位的记录所描述的亲缘关系的部分关系路径,如果可以部分拟合,按通过确定未知关系种类来推导亲缘关系方法进行关系推导,上述过程可统称为通过确定未知关系种类来推导亲缘关系的过程;如果不可推导,那么执行第20步;若推导出另一组可直接描述或不可直接描述的两人之间亲缘关系信息,执行第14步进行处理;
第14步:将推导结果插入信息库末,完成推导结果的入库工作,然后执行第20步;
第20步:将第二个定位器定位到原定位记录的下一记录(内循环下移一条记录),如果已经到达信息库末则执行第22步(内循环全部结束),否则执行第5步;
第22步:将第一个定位器定位到原定位记录的下一记录(外循环下移一条记录),如果已经到达信息库末则执行第25步结束(外循环全部结束),否则执行第3步;
第25步:整个遍历完善的过程结束。
[0005]上述遍历完善方法中因为在第一步没有设置任何检查规则,因此在第二步遍历完善过程中没有进行任何检查,如果在检查规则中设置消除数据冗余的规则去掉完全相同的两条信息、互为相互反向的等价的两条信息这两种等价重复信息,那么应在上述步骤的基础上做如下调整:
第一步中增加确定不允许出现完全相同的两条信息、互为相互反向的等价的两条信息的检查规则;
第二步执行遍历完善过程中,应增加和调整有关步骤,具体如下:
增加第5步以检查原有记录中是否有相互等价记录:判断第二个定位器定位的记录与第一个定位器定位的记录是否等价,如果等价,则删除第一个定位器定位的记录,然后那么执行第22步(外循环下移一条记录),否则执行第8步继续判断;
修改第14步以检查所有记录中是否有与推导结果等价的记录:判断信息库是否已有与推导结果等价的记录,如果有则将该推导结果抛弃,没有则将推导结果插入信息库末如果没有设置插入标志则设置插入标志并记录插入位置,然后执行第20步;
也可以修改第20步以避免重复处理新推导的亲缘关系信息:将第二个定位器定位到原定位记录的下一记录(内循环下移一条记录),如果已经到达信息库末或在设置插入标志的情况下到达新插入位置,则取消插入标志,然后执行第22步(内循环全部结束),否则执行第5步。
[0006]上述遍历完善方法还可以是否存在可以由其它两条信息直接拼接而成的信息的情况,这种情况也是一种数据冗余,如果把这种冗余也作为不必要的冗余,那么继续对第14步进行修改;判断信息库是否已有与推导结果等价的记录,在如果有等价记录则将该推导结果抛弃的同时还删除第一个定位器定位的记录,然后执行第22步。
[0007]上述遍历完善方法中还可设置有关数据冲突的检查规则,设置最简单的数据冲突检查即不符合亲缘关系的相互性的数据的检查及处理,那么应在上述步骤的基础上做如下调整:
在第8步前且在第3步(如果有第5步则在第5步)后增加第6步,判断第二个定位器定位的记录与第一个定位器定位的记录是否不符合亲缘关系的相互性,如果不符合,则按照以下原则进行选择最佳的:如果内容相互矛盾,选择其中正确的信息,如果无法确认正确的信息则抛弃欲处理的信息;如果内容不一但均有可能,选择其中最优的,判断最优可以采用自动判断或人工判断,其一般原则是,当前的亲缘关系信息的优于非当前的,法律效力高的亲缘关系信息优于效力低的,信息来源可靠的亲缘关系信息优于可靠性低的,可能正确的亲缘关系信息优于可能错误的;如果第一个定位器定位的记录是最佳的,那么删除第二个定位器定位的记录,然后执行第20步(内循环下移一条记录),如果第二个定位器定位的记录是最佳的,那么删除第以个定位器定位的记录,然后执行第22步(外循环下移一条记录);如果不存在此种数据冲突,则执行第8步继续判断。
【专利附图】

【附图说明】
[0008]图1为通用未缘关系彳目息库遍历完善方法不意图;
图2为通用亲缘关系信息库遍历完善方法不进行检查情况下流程图;
图3为通用亲缘关系信息库遍历完善方法进行两项检查情况下修改部分流程图;
图4为通用亲缘关系信息库遍历完善方法进行拼接冗余检查情况下修改部分流程图; 图5为通用亲缘关系信息库遍历完善方法进行数据冲突检查情况下修改部分流程图; 下面结合附图对本发明进一步说明。
【具体实施方式】
[0009]实施例1
假设有在户籍管理系统中某个家庭有4个人V0、V1、V2、V3,户主为NO’ Vl的“与户主关系”的当前值为“妻”,V2的“与户主关系”的当前值为“儿子”,V3的“与户主关系”的当前值为“女儿”。从已知的上述亲缘关系可以获得3条规范的两人之间亲缘关系信息,用三元组表示如下:
(VO, VI,配偶)、(V0,V2,子女)、(V0,V3,子女)
三条亲缘关系信息存储到通用亲缘关系信息库后,该信息库构建完毕,下面进行遍历兀吾。
[0010]第一步:是确定要推导的具体亲缘关系种类范围和检查规则;这里将具体亲缘关系种类范围设置为配偶、父亲、母亲、子女、同父兄弟姐妹、同母兄弟姐妹等6种,不设置任何检查规则,因为本例中显而易见不存在数据冗余和数据冲突等情况。
[0011]第二步:执行遍历完善过程,过程中按第一步所确定的要推导的具体亲缘关系种类范围进行关系推导。先处理第一个记录,将其分别与第二个和第三个记录相结合进行关系推导,由于关系路径长度均为1,所以均只能执行通过确定未知关系种类来推导亲缘关系的过程,假设推导规则中包含两人具有配偶且两人之间其中一人与另外的某人具有父母子女关系那么两人之间另一人与另外的某人也具有父母子女关系(具体是父亲、母亲、儿子、女儿则根据关系人的性别确定),那么第一个和第二个记录进行关系推导可推导出V2是Vl的子女,即存在(VI,V2,子女),同样第一个和第三个记录进行关系推导可推导出(VI,V3,子女);第二个和第三个记录进行关系推导可推导出(V2,V3,同父兄弟姐妹);根据前面推导出来的(VI,V2,子女)和(VI,V3,子女)可推导出(V2,V3,同母兄弟姐妹)。于是经过推导后,该信息库中新增了(VI,V2,子女)、(V1,V3,子女)、(V2,V3,同父兄弟姐妹)、(V2, V3,同母兄弟姐妹)等四条通用亲缘关系信息。
【权利要求】
1.一种通用亲缘关系信息库遍历完善方法,其特征在于包括以下步骤: 第一步:确定要推导的具体亲缘关系种类范围和检查规则; 第二步:执行遍历完善过程,过程中按第一步所确定的要推导的具体亲缘关系种类范围进行关系推导以及按第一步所确定的检查规则进行检查处理。
2.根据权利要求1所述的一种通用亲缘关系信息库遍历完善方法,其特征在于: 第一步中不设置任何检查规则; 第二步的执行遍历完善过程具体包括以下步骤: 第I步:第一个定位器定位到信息库中第一个记录,如果已经到达信息库末则执行第25步结束,否则执行下步; 第3步:第二个定位器定位到第一个定位器定位当前记录的后一记录,如果已经到达信息库末则执行第25步结束,否则执行第8步; 第8步:执行通过确定未知关系人来推导亲缘关系的过程,如果不可推导,那么执行第11步;若推导出另一组可直接描述或不可直接描述的两人之间亲缘关系信息,执行第14步进行处理; 第11步:执行通过确定未知关系种类来推导亲缘关系的过程,如果不可推导,那么执行第20步;若推导出另一 组可直接描述或不可直接描述的两人之间亲缘关系信息,执行第14步进行处理; 第14步:将推导结果插入信息库末,完成推导结果的入库工作,然后执行第20步; 第20步:将第二个定位器定位到原定位记录的下一记录,如果已经到达信息库末则执行第22步,否则执行第5步; 第22步:将第一个定位器定位到原定位记录的下一记录,如果已经到达信息库末则执行第25步结束,否则执行第3步; 第25步:整个遍历完善的过程结束。
3.根据权利要求2所述的一种通用亲缘关系信息库遍历完善方法,其特征在于: 第一步中增加确定不允许出现完全相同的两条信息、互为相互反向的等价的两条信息的检查规则; 第二步执行遍历完善过程中应增加和调整有关步骤,具体如下: 增加第5步以检查原有记录中是否有相互等价记录:判断第二个定位器定位的记录与第一个定位器定位的记录是否等价,如果等价,则删除第一个定位器定位的记录,然后那么执行第22步,否则执行第8步继续判断; 修改第14步以检查所有记录中是否有与推导结果等价的记录:判断信息库是否已有与推导结果等价的记录,如果有则将该推导结果抛弃,没有则将推导结果插入信息库末如果没有设置插入标志则设置插入标志并记录插入位置,然后执行第20步; 也可以修改第20步以避免重复处理新推导的亲缘关系信息:将第二个定位器定位到原定位记录的下一记录,如果已经到达信息库末或在设置插入标志的情况下到达新插入位置,则取消插入标志,然后执行第22步,否则执行第5步。
4.根据权利要求3所述的一种通用亲缘关系信息库遍历完善方法,其特征在于: 第一步中增加确定不允许出现可以由其它两条信息直接拼接而成的信息的检查规则;第二步执行遍历完善过程中应调整有关步骤,具体如下:将第14步进行如下修改,在如果有等价记录则将该推导结果抛弃的同时还删除第一个定位器定位的记录,然后执行第22步。
5.根据权利要求2、3或4所述的一种通用亲缘关系信息库遍历完善方法,其特征在于: 第一步中增加确定不符合亲缘关系的相互性的数据冲突的检查规则; 第二步执行遍历完善过程中应增加有关步骤,具体如下: 在第8步前且在第3步(如果有第5步则在第5步)后增加第6步,判断第二个定位器定位的记录与第一个定位器定位的记录是否不符合亲缘关系的相互性,如果不符合则选择最佳的;如果第一个定位器定位的记录是最佳的,那么删除第二个定位器定位的记录,然后执行第20步,如果第二个定位器定位的记录是最佳的,那么删除第以个定位器定位的记录,然后执行第22步;如果不存在此种数据冲突,则执行第8步继续判断。
【文档编号】G06F17/30GK103544237SQ201310458964
【公开日】2014年1月29日 申请日期:2013年10月7日 优先权日:2013年10月7日
【发明者】倪龙 申请人:宁波芝立软件有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1