一种基于知识图谱的人员亲密度分析的方法与流程

文档序号:32426741发布日期:2022-12-03 00:04阅读:41来源:国知局
1.本发明涉及的是知识图谱领域,特别涉及一种基于知识图谱的人员亲密度分析的方法。
背景技术
::2.随着现代社会经济和技术的迅速发展,城市的感知设备不断完善,海量多维的人员与关系数据汇聚到信息管理系统,形成人与人、人与物、人与地、人与事的知识图谱,这些图谱数据拥有着巨大的挖掘潜力。传统工作的展开,依赖于海量数据中手动搜索、筛查目标人员及关系人的社会关系与历史事件,该方法存在以下缺点:3.对于目标人员与关系人的亲密度关系分析不够全面,不能完全发挥出知识图谱的关系数据的作用,工作效率低;4.依赖于人工技战法的分析,费时费力。5.因此,有必要基于知识图谱挖掘出一种人员亲密度分析的方法。技术实现要素:6.鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于知识图谱的人员亲密度分析的方法。7.为了解决上述技术问题,本技术实施例公开了如下技术方案:8.一种基于知识图谱的人员亲密度分析的方法,包括:9.s100.将人员、事件和关系数据直接存入或通过信息抽取存入知识图谱平台;s200.基于所述s100获取的数据,根据亲密度类型设定多个亲密度分析模型;10.s300.基于两个关系人对应的实体-关系数据,获取各类亲密度相关行为的时长、次数数据,通过加权算法计算两个关系人在各个模型下的组合亲密度。11.进一步地,s100中获取的人员、事件和关系数据包括人员户籍信息、人员通话信息、微信登记信息、旅馆住宿信息、人员涉事信息、银行转账信息、火车购票信息、车辆持有信息、车辆违章信息、事件信息中的一种或多种;12.进一步地,s100中,存入的数据包括人员姓名、曾用名、性别、身份证号码、手机号、行政区规划地址、户口类型、户口编号、持有车辆、宗教信仰、学历、职业、婚姻状况。13.进一步地,s200中,设定的亲密度规则包括同乘行为、同住行为、频繁通话行为、人车违章和人员持有行为、人员户籍关系行为、人员涉事与事件发现人行为。14.进一步地,同乘对应的亲密度行为包括两个关系人乘坐同时间同车次列车或同班次客车或同航班飞机或同航次轮船;15.同住对应的亲密度行为包括两个关系人同时间同宿同一家酒店或宾馆的同一房间;16.频繁通话对应的亲密度行为包括两个联系人在14天内通话次数超过2次或1次通话时间超过30分钟。17.进一步地,人车违章与人员持有对应的亲密度行为包括一个关系人的车辆违章记录为另一个关系人的持有车辆;18.人员户籍关系对应的亲密度行为包括两个关系人存在两代以内的直接血缘关系;19.人员涉事与事件发现人对应的亲密度行为包括一个关系人为事件涉事人员,另一个关系人为该事件的发现人。20.进一步地,s300中计算两个关系人在各个规则下的亲密度的计算公式如下:[0021][0022]在上述公式中,ωstable为户籍关系、事件发现人、人员涉事这几类相对静态权重值,ωflexible为频繁通话、同乘、同住这几类频繁更新权重值,m、n为类型数,f为关系人亲密度值。[0023]进一步地,一种基于知识图谱的人员亲密度分析的方法,其特征在于,还包括:通过可视化图由高到低列表排序展示目标人员亲密度关系人,并可通过关系人实体图标查看对应人员档案。[0024]本发明实施例提供的上述技术方案的有益效果至少包括:[0025]本发明提供的一种基于知识图谱的人员亲密度分析的方法,包括将人员、事件和关系数据直接存入或通过信息抽取存入知识图谱平台;基于获取的数据,根据亲密度类型设定多个亲密度分析模型;基于两个关系人对应的实体-关系数据,获取各类亲密度相关行为的时长、次数数据,通过加权算法计算两个关系人在各个模型下的组合亲密度。本发明根据人员现有关系及关联实体信息,加上以上关系被用户赋予的权重值,计算人员关系人的亲密度值,将用户关系人按亲密度从高到低展示,可以极大缩短用户分析时间,在案情分析等特殊事件中提高分析效率,加快破案速度。[0026]下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。附图说明[0027]附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:[0028]图1为本发明实施例1中,一种基于知识图谱的人员亲密度分析的方法的流程图;[0029]图2为本发明实施例1中,人员关系亲密度分析案例示意图。具体实施方式[0030]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。[0031]为了解决现有技术中存在的问题,本发明实施例提供一种基于知识图谱的人员亲密度分析的方法。[0032]实施例1[0033]本实施例公开了一种基于知识图谱的人员亲密度分析的方法,如图1,包括:[0034]s100.将人员、事件和关系数据直接存入或通过信息抽取存入知识图谱平台;[0035]具体的,本实施的s100中获取的人员、事件和关系数据包括人员户籍信息、人员通话信息、微信登记信息、旅馆住宿信息、人员涉事信息、银行转账信息、火车购票信息、车辆持有信息、车辆违章信息、事件信息中的一种或多种;[0036]在本实施例的s100中,存入的数据包括人员姓名、曾用名、性别、身份证号码、手机号、行政区规划地址、户口类型、户口编号、持有车辆、宗教信仰、学历、职业、婚姻状况。[0037]s200.基于所述s100获取的数据,根据亲密度类型设定多个亲密度分析模型;[0038]具体的,本实施例中,设定的亲密度规则包括同乘行为、同住行为、频繁通话行为、人车违章和人员持有行为、人员户籍关系行为。其中:[0039]同乘对应的亲密度行为包括两个关系人乘坐同时间同车次列车或同班次客车或同航班飞机或同航次轮船;[0040]同住对应的亲密度行为包括两个关系人同时间同宿同一家酒店或宾馆的同一房间;[0041]频繁通话对应的亲密度行为包括两个联系人在14天内通话次数超过2次或1次通话时间超过30分钟。[0042]人车违章与人员持有对应的亲密度行为包括一个关系人的车辆违章记录为另一个关系人的持有车辆;[0043]人员户籍关系对应的亲密度行为包括两个关系人存在两代以内的直接血缘关系;[0044]人员涉事与事件发现人对应的亲密度行为包括一个关系人为事件涉事人员,另一个关系人为该事件的发现人。[0045]s300.基于两个关系人对应的实体-关系数据,获取各类亲密度相关行为的时长、次数数据,通过加权算法计算两个关系人在各个模型下的组合亲密度。[0046]在本实施例中,计算两个关系人在各个规则下的亲密度的计算公式如下:[0047][0048]在上述公式中,ωstable为户籍关系、事件发现人、人员涉事这几类相对静态权重值,ωflexible为频繁通话、同乘、同住这几类频繁更新权重值,m、n为类型数,f为关系人亲密度值。[0049]具体的,对于待分析人员人车违章以及人员持有车辆数据,采用公式ωstable=ωuser计算,其中,ωuser为用户自定义权值。[0050]具体的,对于待分析人员的人员-车辆-人员关系,设定用户自定义权值ωuser,当待分析人与关系人其中一人为车辆持有人,另一人匹配该车辆违章记录时,本发明认定待分析人员与关系人存在亲密度关系,权重数据为ωstable=ωuser。[0051]对于待分析人员的户籍关系、事件发现人、人员涉事这几类数据,采用公式ωstable=ωuser*prel计算,其中,ωuser为用户自定义权值,prel为关系参数。[0052]具体的,对于待分析人员的户籍关系,根据血亲代际数匹配prel值,父亲、母亲、儿子、女儿这类直系血亲与配偶,prel为2,其余二代及更远的血亲prel为1;对于待分析人员的涉事关系,根据涉事程度匹配prel值,如待分析人员与关系人均为事件嫌疑人,prel为2,待分析人员与关系人其中一人为事件发现人或事件证人,另一人为事件嫌疑人,prel为1。[0053]根据14天内目标人员与关系人员通话时长l、通话次数t、上次通话距今时间z及用户自定义权值ωuser,频繁通话类权重数据ωflexible采用公式计算,其中,为通话时长参数,bt为通话次数参数,为最近通话参数。[0054]具体的,通话时长l越长,越大,为防止l过大导致过大,本发明实施例为设置最大阈值10,通常情况下,14天内目标人员与关系人员通话时长不会超过10小时,因此本发明实施例取a为1.12173来满足的最大阈值;通话次数t越多,bt越大,为防止t过大导致bt过大,本发明实施例为bt设置最大阈值10,通常情况下,14天内目标人员与关系人员通话次数不会超过150次,因此本发明取b为1.015来满足bt的最大阈值;最近通话距当前时间z越近,越高,本发明实施例设置最大阈值1以及最小阈值0.1,考虑目标人员与关系人员最近通话距当前时间最短为1小时,因此本发明实施例取c为0.9来满足的最大阈值。通过这种规则,本发明实例在算法逻辑清晰、实现简单的前提下,充分考虑用户联系时长、频率对频繁通话权重的影响。[0055]根据14天内与目标人员同乘/同住次数t、上次同乘/同住距今时间z及用户自定义权值ωuser,同乘/同住类权重数据ωflexible采用公式计算,其中,bt为同乘/同住次数参数,为最近同乘/同住参数。[0056]具体的,同乘/同住次数t越多,bt越大,为防止t过大导致bt过大,本发明实施例为bt设置最大阈值10,通常情况下,14天内与目标人员同乘/同住次数不会超过14次,因此本发明取b为1.17877来满足bt的最大阈值;上次同乘/同住距今时间z越近,越高,本发明实施例设置最大阈值1以及最小阈值0.1,考虑与目标人员同乘/同住距当前时间最短为1小时,因此本发明实施例取c为0.9来满足的最大阈值。通过这种规则,本发明实例在算法逻辑清晰、实现简单的前提下,充分考虑用户同乘/同住频率对同乘/同住权重的影响。[0057]根据30天内与目标人员的转账总金额g、转账次数t及用户自定义权值ωuser,多次转账类权重数据采用公式ωflexible=ωuser*pg*bt来计算,其中,pg为转账金额参数,bt为转账次数参数。[0058]具体的,pg根据转账总金额g梯度匹配参数值,0<g≤2000时,pg=1,2000<g≤10000时,pg=2,10000<g≤100000时,pg=3,g>100000时,pg=4;转账次数越多t,bt越大,为防止t过大导致bt过大,本发明实施例为bt设置最大阈值10。通常情况下,30天内与目标人员转账次数不会超过30次,而转账10次与30次在本发明中的亲密度权重可视为相等,因此本发明取b为1.25893来满足bt的最大阈值,且当t≥10时,bt恒定为10。[0059]根据上述各类ωstable及权重数据,计算目标人员每一位关系人的亲密度数据,m、n为类型数。[0060]当得到了目标人员每一位关系人的亲密度数据后,可以通过可视化图由高到低列表排序展示目标人员亲密度关系人,并可通过关系人实体图标查看对应人员档案。[0061]为了更好的理解本实施例,本发明提供一人员关系亲密度分析案例以说明:[0062]如图2所示案例中,李某丽与张三的14天内通话时长为1.5小时,通话次数为7次,最近通话距今时间为18小时,李某军与李某丽的转账金额为12000元,转账次数为3次,朱某恒与张三的转账金额为5000元,转账次数为5次,张三与李四的同乘次数为5次,最近一次同乘距今时间为24小时,当所有ωuser均设置为10时,对于李某丽和张三的亲密度分析结果如下表一:[0063]表一[0064][0065]本实施例提供的一种基于知识图谱的人员亲密度分析的方法,包括将人员、事件和关系数据直接存入或通过信息抽取存入知识图谱平台;基于获取的数据,根据亲密度类型设定多个亲密度分析模型;基于两个关系人对应的实体-关系数据,获取各类亲密度相关行为的时长、次数数据,通过加权算法计算两个关系人在各个模型下的组合亲密度。本发明根据人员现有关系及关联实体信息,加上以上关系被用户赋予的权重值,计算人员关系人的亲密度值,将用户关系人按亲密度从高到低展示,可以极大缩短用户分析时间,在案情分析等特殊事件中提高分析效率,加快破案速度。[0066]应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。[0067]在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。[0068]本领域技术人员还应当理解,结合本文的实施例描述的各种说明性的逻辑框、模块、电路和算法步骤均可以实现成电子硬件、计算机软件或其组合。为了清楚地说明硬件和软件之间的可交换性,上面对各种说明性的部件、框、模块、电路和步骤均围绕其功能进行了一般地描述。至于这种功能是实现成硬件还是实现成软件,取决于特定的应用和对整个系统所施加的设计约束条件。熟练的技术人员可以针对每个特定应用,以变通的方式实现所描述的功能,但是,这种实现决策不应解释为背离本公开的保护范围。[0069]结合本文的实施例所描述的方法或者算法的步骤可直接体现为硬件、由处理器执行的软件模块或其组合。软件模块可以位于ram存储器、闪存、rom存储器、eprom存储器、eeprom存储器、寄存器、硬盘、移动磁盘、cd-rom或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质连接至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于asic中。该asic可以位于用户终端中。当然,处理器和存储介质也可以作为分立组件存在于用户终端中。[0070]对于软件实现,本技术中描述的技术可用执行本技术所述功能的模块(例如,过程、函数等)来实现。这些软件代码可以存储在存储器单元并由处理器执行。存储器单元可以实现在处理器内,也可以实现在处理器外,在后一种情况下,它经由各种手段以通信方式耦合到处理器,这些都是本领域中所公知的。[0071]上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1