关联强度评估方法、装置、设备及存储介质与流程

文档序号:17762889发布日期:2019-05-24 21:51阅读:724来源:国知局
关联强度评估方法、装置、设备及存储介质与流程

本发明涉及关联图谱技术领域,尤其涉及一种关联强度评估方法、装置、设备及存储介质。



背景技术:

关联企业,是指存在直接或间接控制关系或影响关系,如担保关系、控股关系等预设关联关系的企业,相互之间具有预设关联关系的各企业互为关联企业。

在关联企业的相关应用,如营销、风控等应用领域中,关联企业间的关联强度具有较强的参考作用,对营销、风控等行为具有较大影响,因而需明确关联企业间的关联强度,现有技术尚无提出一种准确确定关联强度。



技术实现要素:

本发明的主要目的在于提供一种关联强度评估方法,旨在解决现有技术无法准确确定关联强度的技术问题。

为实现上述目的,本发明提供一种关联强度评估方法,其特征在于,所述关联强度评估方法包括以下步骤:

在检测到关联强度评估请求后,从预置关联网络中获取所述关联强度评估请求对应待评估的第一节点和第二节点;

基于transe模型获取所述第二节点指向所述第一节点的关系向量;

基于预设算法计算所述第二节点对所述第一节点的相对入度和相对出度;

基于所述第二节点指向所述第一节点的关系向量、相对入度和相对出度,计算获得所述第二节点对所述第一节点的关联强度。

可选地,所述基于预设算法计算所述第二节点对所述第一节点的相对入度和相对出度的步骤包括:

获取所述第一节点的总加权入度和总加权出度;

获取所述第二节点对所述第一节点的全链加权入度;

获取所述第二节点对所述第一节点的全链加权出度;

基于所述全链加权入度和所述总加权入度计算获得所述第二节点对所述第一节点的相对入度,基于所述全链加权出度和所述总加权出度计算获得所述第二节点对所述第一节点的相对出度。

可选地,所述获取所述第二节点对所述第一节点的全链加权入度的步骤包括:

获取所述第二节点指向所述第一节点的所有关系链条,并获得在各关系链条上所述第二节点对所述第一节点的单链加权入度;

基于各关系链条上的所述单链加权入度计算所述第二节点对所述第一节点的全链加权入度。

可选地,所述获得在各关系链条上所述第二节点对所述第一节点的单链加权入度的步骤包括:

获取各关系链条的关联类型和所述关联类型对应的预置类型权重;

在计算关联类型为金额类型的金额关系链条时,获取所述金额关系链条的金额系数;

基于所述金额类型对应的预置类型权重和所述金额系数计算所述金额关系链条的单链加权入度。

可选地,所述计算获得所述第二节点对所述第一节点的关联强度的步骤之后包括:

基于transe模型获取所述第一节点对所述第二节点的关系向量;

计算所述第一节点对所述第二节点的相对入度和相对出度;

基于所述第一节点对所述第二节点的关系向量、相对入度和相对出度,计算获得所述第一节点对所述第二节点的关联强度。

可选地,所述在检测到关联强度评估请求后,从预置关联网络中获取所述关联强度评估请求对应待评估的第一节点和第二节点的步骤之前包括:

在预置企业数据库中确定中心企业,并从预置企业数据库中获取所述中心企业的高管信息,所述高管信息包括高管人员;

获取与所述中心企业的高管人员具有预设关联关系的关联人员,并获得所述关联人员任职高管的所有企业,将所述关联人员任职高管的所有企业作为所述中心企业的关联企业;

基于所述中心企业及所述关联企业建立预置关联网络。

可选地,所述获取与所述中心企业的高管人员具有预设关联关系的关联人员,并获得所述关联人员任职高管的所有企业,将所述关联人员任职高管的所有企业作为所述中心企业的关联企业的步骤包括:

获取所述中心企业的高管人员所任职高级管理职位的所有兼职企业,将所述兼职企业作为所述中心企业的关联企业,其中,所述高级管理职位为法定代表人和/或总经理和/或财务负责人和/或实际控制人。

此外,为实现上述目的,本发明还提供一种关联强度评估装置,所述关联强度评估装置包括:

节点获取模块,用于在检测到关联强度评估请求后,从预置关联网络中获取所述关联强度评估请求对应待评估的第一节点和第二节点;

关系向量计算模块,用于基于transe模型获取所述第二节点指向所述第一节点的关系向量;

相对度计算模块,用于基于预设算法计算所述第二节点对所述第一节点的相对入度和相对出度;

强度计算模块,用于基于所述第二节点指向所述第一节点的关系向量、相对入度和相对出度,计算获得所述第二节点对所述第一节点的关联强度。

此外,为实现上述目的,本发明还提供一种关联强度评估设备,所述关联强度评估设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的关联强度评估程序,其中所述关联强度评估程序被所述处理器执行时,实现如上述的关联强度评估方法的步骤。

此外,为实现上述目的,本发明还提供一种存储介质,所述存储介质上存储有关联强度评估程序,其中所述关联强度评估程序被处理器执行时,实现如上述的关联强度评估方法的步骤。

本发明实施例通过在检测到关联强度评估请求后,从预置关联网络中获取所述关联强度评估请求对应待评估的第一节点和第二节点;基于双向关联关系强弱模型计算节点间的双向关联强度,双向关联关系强弱模型的具体实现包括:基于transe模型获取所述第二节点指向所述第一节点的关系向量;基于预设算法计算所述第二节点对所述第一节点的相对入度和相对出度;基于所述第二节点指向所述第一节点的关系向量、相对入度和相对出度,计算获得所述第二节点对所述第一节点的关联强度,实现对关联网络中节点间关联强度的计算,为对公业务的营销、风控起到重要的参考作用,节省大量人力成本。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的关联强度评估设备结构示意图;

图2为本发明关联强度评估方法第一实施例的流程示意图;

图3为本发明关联强度评估装置第一实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

请参见图1,图1为本发明所提供的关联强度评估设备的硬件结构示意图。

所述关联强度评估设备可以是pc,也可以是智能手机、平板电脑、便携计算机、台式计算机等具有显示功能的设备,可选地,所述关联强度评估设备可以是服务器设备,存在关联强度评估的后端管理系统,用户通过所述后端管理系统对关联强度评估设备进行管理。

所述关联强度评估设备可以包括:处理器101以及存储器201等部件。在所述关联强度评估设备中,所述处理器101与所述存储器201连接,所述存储器201上存储有关联强度评估程序,处理器101可以调用存储器201中存储的关联强度评估程序,并实现如下述关联强度评估方法各实施例的步骤。

所述存储器201,可用于存储软件程序以及各种数据。存储器201可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如关联强度评估程序)等;存储数据区可包括数据库,例如关联网络中节点的节点信息等。此外,存储器201可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器101,是关联强度评估设备的控制中心,利用各种接口和线路连接整个关联强度评估设备的各个部分,通过运行或执行存储在存储器201内的软件程序和/或模块,以及调用存储在存储器201内的数据,执行关联强度评估设备的各种功能和处理数据,从而对关联强度评估设备进行整体监控。处理器101可包括一个或多个处理单元;可选地,处理器101可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器101中。

本领域技术人员可以理解,图1中示出的关联强度评估设备结构并不构成对关联强度评估设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

基于上述硬件结构,提出本发明方法各个实施例,下文中“评估设备”为关联强度评估设备的简称。

本发明提供了一种关联强度评估方法。

参照图2,图2为本发明关联强度评估方法第一实施例的流程示意图。

本实施例中,所述关联强度评估方法包括以下步骤:

步骤s10,在检测到关联强度评估请求后,从预置关联网络中获取所述关联强度评估请求对应待评估的第一节点和第二节点;

关联强度评估请求,即对预置关联网络中特定两个节点进行关联强度评估的请求,可通过解析关联强度评估请求获得待进行关联强度评估的两个节点,第一节点和第二节点可以是预置关联网络中直接关联或间接关联的任意节点。关联强度评估请求,可以由用户操作触发,如用户点击预设关联强度评估控件触发,也可由系统预设条件触发,例如由系统定时任务触发,或者在建立节点间的关联关系后,触发关联强度评估请求。不同触发方式对应着不同的应用场景,因而可能出现如下实施方式:

一、由用户操作触发关联强度评估请求:当预置关联网络中的节点以地图形式/网状形式/列表形式等形式显示在评估设备的人机交互界面时,用户选定两个节点,再点击关联强度评估控件,生成指向用户所选节点的关联强度评估请求,其中,用户的选定操作和关联强度评估控件点击操作可以为触屏输入/语音输入/键盘输入/鼠标点击输入等方式;

二、由系统预设条件触发关联强度评估请求:系统预设条件可以为定时触发,即在预设时间点或间隔预设时间段就触发生成指向预设的两个节点的关联强度评估请求;系统预设条件还可以为更新触发,即对于预置关联网络中的任意节点,在检测到节点间的关联影响因子出现变化时,触发指向该节点的关联强度评估请求,其中,关联影响因子指影响节点间关联强度的参数,关联影响因子可以为关联类型或金额系数;系统预设条件还可以为关联强度评估请求生成模块之外的其他模块的功能调用,即其他模块可调用关联强度评估请求生成模块的模块接口,生成关联强度评估请求,例如:风险评估模块在评估节点间风险传导强度时,需获取节点间的关联强度,此时,风险评估模块直接调用关联强度评估请求生成模块,触发生成关联强度评估请求,以获得节点间的关联强度。

预置关联网络是由具有关联关系的企业与企业、个人与个人以及企业与个人作为节点组成的关系网络,在下文中,用“节点”表示关联网络中的企业或个人。预置关联网络中的关系网络由单向关系链条组成,关系链条的方向由预置方向规则确定,例如,担保关系的方向为担保人指向被担保人、控股关系的方向为控股企业指向被控股企业、集团母子公司的方向为母公司指向子公司等,在下文中,若有节点m直接或间接指向节点n,则这一指向关系对应的关系链条的方向为节点m指向节点n。预置方向规则由系统预置,在建立预置关联网络时,基于节点关系类型与预置方向规则确定各关系链条的方向。预置关联网络可以为关联图谱形式。

关联关系具有方向性,关联强度也具有方向性,处于关联关系对立方的两节点互相之间关联强度不同。例如,节点a为节点b担保债款,在这段担保关系中,节点a是节点b的担保人,节点b是节点a的被担保人,担保人与被担保人之间相对的身份地位是固定的,不可以说节点b是节点a的担保人、节点a是节点b的被担保人,在这段担保关系中,从节点a的视角看节点b对节点a的关联强度,与从节点b的视角看节点a对节点b的关联强度是不同的,关联强度越大,风险传导强度越大,若是以风险传导强度表征节点a与节点b间的关联强度,则在节点b发生风险导致节点b无法偿还债款时,节点a得承担债务,而在节点a发生风险导致节点a无担保能力时,节点b无需承担风险;再比如,节点c有三个子公司:节点d、e、f,则节点c是节点d、e、f的母公司,从节点c的角度看,节点c与节点d的关联强度为1/3,而反过来,从节点d的角度看,节点d与节点c的关联强度为100%,同样以风险传导强度表征节点c与节点d、e、f间的关联强度,在节点c发生风险时,节点d、e、f受到的传导风险会较大,而在节点d、e、f任一一个节点发生风险时,节点c受到的传导风险会相对较小。因此,在计算两节点间的关联强度时,可根据系统预设规则或用户自定义设置计算单向关联强度或双向关联强度,即计算两个方向或一个方向的关联关系强度,例如根据系统预设规则或用户自定义设置从节点a的视角看节点b对节点a的关联强度,或从节点b的视角看节点a对节的点b关联强度。

可选地,解析关联强度评估请求,获取关联强度评估的中心节点,将该中心节点作为第一节点,将待评估的另一节点作为第二节点,计算第二节点对第一节点的关联强度,即仅计算单向的关联强度;可选地,解析关联强度评估请求,首先在待评估两节点中任选一个节点作为第一节点,将待评估的另一节点作为第二节点,计算从第一节点的视角看,第二节点对第一节点的关联强度,再计算反向的关联强度,即从第二节点的视角看,第一节点对第二节点的关联强度。

步骤s20,基于transe模型获取所述第二节点指向所述第一节点的关系向量;

transe模型(即translatingembeddingsformodelingmulti-relationaldata),用于把预置关联网络中的节点与节点间关系映射到低维向量空间中,从而计算出节点间隐含的关系。在transe模型中,对于给定一个由三元组(h,r,t)组成的训练集,其中h,t为属于实体集合e的实体节点,h为头结点,t为尾节点,r属于头尾节点的关系,即头尾节点的关系向量,通过不断的调整h,r,t,使得每种关系对应的向量r对于所有的头尾节点都尽量满足h+r=t。根据transe的原理可知,r的模|r|越大,两者之间的关系越远。transe模型对预置关联网络上的每个节点信息进行学习,包括节点的关系信息,如:关系类型、关系特征等,也包括节点企业的自身状态特征信息。

步骤s30,基于预设算法计算所述第二节点对所述第一节点的相对入度和相对出度;

第二节点对第一节点的相对入度指:从第一节点的视角看,第二节点对第一节点的加权入度与第一节点的总加权入度的比值,其中,第一节点的总加权入度指:从第一节点的视角看,预置关联网络中除第一节点以外的所有节点对第一节点的加权入度的总和;第二节点对第一节点的相对出度指:从第一节点的视角看,第二节点对第一节点的加权出度与第一节点的总加权出度的比值,其中,第一节点的总加权出度指:从第一节点的视角看,预置关联网络中除第一节点以外的所有节点对第一节点的加权出度的总和;第二节点对所述第一节点的相对入度和相对出度,与从第一节点的视角看第二节点与第一节点的关联强度为正相关关系,第二节点对所述第一节点的相对入度和相对出度越大,从第一节点的视角看,第二节点与第一节点的关联强度越强。

在计算关联强度时,对于预置关联网络这一有向图结构中的任意两节点组成的有向边(指代两节点间的关系;若该两节点为间接关联,则该有向边为经过多节点的关系链条),如果该有向边的头节点为第二节点、尾节点为第一节点,则从第一节点的视角看,该有向边的权重为第二节点对第一节点的加权入度;反之,如果该有向边的头节点为第一节点、尾节点为第二节点,则从第一节点的视角看,该有向边的权重为第二节点对第一节点的加权出度。

进一步地,所述步骤s30包括:

步骤s31,获取所述第一节点的总加权入度和总加权出度;

第一节点的总加权入度指:从第一节点的视角看,预置关联网络中除第一节点以外、与第一节点具有关联关系的所有节点对第一节点的加权入度的总和;第一节点的总加权出度指:从第一节点的视角看,预置关联网络中除第一节点以外、与第一节点具有关联关系的所有节点对第一节点的加权出度的总和。

以节点a、b为例,其中,节点a为上述第一节点,节点b为上述第二节点,假设从节点a的视角看:

计算节点a的总加权入度m:m=f(m1)+f(m2)+…+f(mn),f为求权重值的函数;计算节点a的总加权出度n:n=f(n1)+f(n2)+…+f(nn),f为求权重值的函数。其中,m1,m2,...mn从节点a的视角看,为预置关联网络中所有直接或间接指向节点a的节点,n1,n2...nn为从节点a的视角看,预置关联网络中节点a直接或间接指向的所有节点。

第一节点的总加权入度和总加权出度,可以临时计算;也可以定时计算并存储,在需要用于计算节点间的关联强度时,直接获取。

步骤s32,获取所述第二节点对所述第一节点的全链加权入度;

第二节点对第一节点的全链加权入度,即从第一节点的视角看,第二节点作为头节点直接或间接指向第一节点的总权重。第二节点可能在多个关系链条上直接或间接指向第一节点,例如,在一段担保关系上,第二节点是第一节点的担保人;在一段投资关系上,第二节点是第一节点的投资人;在母子关系上,第二节点是第一节点的母公司,则在计算第二节点对第一节点的全链加权入度时,需确定第二节点直接或间接指向第一节点的所有关系链条,并基于各关系链条的权重计算第二节点对第一节点的总的加权入度,即全链加权入度。

一实施方式中,预置关联网络中任意两节点间的全链加权入度可以直接从预置数据库中获取,另一实施方式中,直接基于第二节点直接或间接指向第一节点的各关系链条的权重计算第二节点对第一节点的全链加权入度。具体地,所述步骤s32包括:

步骤s321,获取所述第二节点指向所述第一节点的所有关系链条,并获得在各关系链条上所述第二节点对所述第一节点的单链加权入度;

单链加权入度指第二节点直接或间接指向第一节点的单个关系链条上的加权入度。

建立预置关联网络时,将各节点之间涉及的关联关系信息存储为预置关联网络的节点信息,关联关系信息包括两节点的所有关系链条及其方向、各关系链条的关联类型以及关联类型的权重设置、金额系数等;此外,通过实时/定时监控预置关联网络中各节点间关系链条的变化,如增加关系链条、删减关系链条、关系链条涉及金额变化等,将关系链条的变化更新到预置关联网络中对应的节点信息。

从节点信息中获取第二节点直接或间接指向第一节点的所有关系链条,并获得在各关系链条上第二节点对第一节点的单链加权入度。

步骤s322,基于各关系链条上的所述单链加权入度计算所述第二节点对所述第一节点的全链加权入度。

一实施例中,可通过预置的权重模型计算第二节点对第一节点的全链加权入度,通过将第一节点、第二节点的预置数据库(包括第二节点直接或间接指向第一节点的各关系链条上的单链加权入度)输入预置的权重模型,输出第二节点对第一节点的全链加权入度。对于预置的权重模型,预先建立训练样本,训练样本包括两节点信息以及两节点双向的权重值,通过迭代算法计算出权重模型的最优模型参数,训练出含最优模型参数的权重模型,用于计算第二节点对第一节点的全链加权入度。另一实施例中,各关系链条上的所述单链加权入度之和为所述第二节点对所述第一节点的全链加权入度。

其中,具体地,所述步骤s321中所述获得在各关系链条上所述第二节点对所述第一节点的单链加权入度的步骤包括:

步骤s3211,获取各关系链条的关联类型和所述关联类型对应的预置类型权重;

关联类型,包括金额类型和非金额类型,金额类型即涉及到金额的关系类型,如商品/服务交易关联类型、债权抵押/动产不动产抵押关联类型、股权交易关联类型以及投资关联类型、控股企业与被控股企业、集团母子公司等;非金额类型即不涉及金额的关联类型,如竞争关系关联(两节点为竞争关系,则两节点可能具有正相关的关联关系)、法律关系关联(诉讼中的共同原被告、原被告、原被告与第三人)等,非金额类型还包括基于企业高管(如实际控制人/法人代表/总经理等)兼职的关联类型、基于企业高管间的个人关系的关联类型等,非金额类型还包括“兄弟”或同一企业,主要通过管理者和/或工作人员是否具有较大重合,是否共用域名、地址、邮箱、电话号码等进行判断。

预置类型权重即关联类型的关联权重,不同关联类型具有对应的预置类型权重。例如:将担保关系对应的预置类型权重设置为抵押关系对应预置类型权重的两倍。关联类型对应的预置类型权重用于表征节点间该关联类型对关联强度的大小,预置类型权重越大,对应的关联类型对关联强度越大。

关联类型与其对应的预置类型权重的对应关系可存储在数据库中,节点间各关系链条的关联类型和所述关联类型对应的预置类型权重存储在节点信息中,可直接从节点信息中获取。

步骤s3212,在计算关联类型为金额类型的金额关系链条时,获取所述金额关系链条的金额系数;

获取各关系链条的关联类型和所述关联类型对应的预置类型权重后,分别计算各关系链条的单链加权入度。不同关系类型对应不同的加权入度计算方式,在关联类型为金额类型时,对应的关系链条为金额关系链条。

金额关系链条的金额系数,指在金额关系链条上,基于第一节点和第二节点间的关联金额计算获得的表征金额对关联关系影响程度的系数,具体计算方式根据金额关系链条的关联类型确定。例如,担保关系中金额系数为担保金额在担保人注册资本/实际资本的占比、投资关系中金额系数为投资人的投资占被投资企业资本的比例或投资人的投资占投资人的资本的比例等。

步骤s3213,基于所述金额类型对应的预置类型权重和所述金额系数计算所述金额关系链条的单链加权入度。

对于第一节点和第二节点间同一关联类型的关系链条上,金额系数越大,关联强度越大。不同关系类型对应不同的加权入度计算方式,获取所述金额关系链条对应关联类型的加权入度计算方式,一实施例中,可将金额关系链条对应的预置类型权重与金额系数的乘积作为金额关系链条的单链加权入度。

在计算关联类型为非金额类型的非金额关系链条时,获取所述非金额类型对应的预置类型权重,该预置类型权重为该非金额关系链条的单链加权入度。

步骤s33,获取所述第二节点对所述第一节点的全链加权出度;

全链加权出度,即从第一节点的视角看,第一节点作为头节点直接或间接指向第二节点的总权重,全链加权出度基于第一节点直接或间接指向第二节点的所有关系链条上的单链加权出度计算获得。一实施方式中,预置关联网络中任意两节点间的全链加权出度可以直接从预置数据库中获取,另一实施方式中,直接基于第一节点直接或间接指向第二节点的各关系链条的权重计算第二节点对所述第一节点的全链加权出度。具体地,所述步骤s33包括:

获取第一节点直接或间接指向第二节点的所有关系链条,并获得在各关系链条上第一节点对第二节点的单链加权出度;基于各关系链条上的单链加权出度计算第二节点对第一节点的全链加权出度。

单链加权出度指第一节点直接或间接指向第二节点的单个关系链条上的加权出度。

一实施例中,可通过预置的权重模型计算第一节点对第二节点的全链加权出度,通过将第一节点、第二节点的预置数据库(包括第一节点直接或间接指向第二节点的各关系链条上的单链加权入度)输入预置的权重模型,输出第二节点对第一节点的全链加权出度。对于预置的权重模型,预先建立训练样本,训练样本包括两节点信息以及两节点双向的权重值,通过迭代算法计算出权重模型的最优模型参数,训练出含最优模型参数的权重模型,用于计算第二节点对第一节点的全链加权出度。另一实施例中,各关系链条上的所述单链加权出度之和为第二节点对第一节点的全链加权出度。

步骤s34,基于所述全链加权入度和所述总加权入度计算获得所述第二节点对所述第一节点的相对入度,基于所述全链加权出度和所述总加权出度计算获得所述第二节点对所述第一节点的相对出度。

全链加权入度与总加权入度的比值为第二节点对第一节点的相对入度,全链加权出度与总加权出度的比值为第二节点对第一节点的相对出度。

以节点a、节点b为例,其中,节点a为上述第一节点,节点b为上述第二节点,即假设从a的视角看:

计算节点a的总加权入度m:m=f(m1)+f(m2)+…+f(mn),f为求权重值的函数;计算节点a的总加权出度n:n=f(n1)+f(n2)+…+f(nn),f为求权重值的函数。其中,m1,m2,...mn从节点a的视角看,为预置关联网络中所有直接或间接指向节点a的节点,n1,n2...nn为从节点a的视角看,预置关联网络中节点a直接或间接指向的所有节点。

节点b作为头节点,对于节点a的相对入度hf(m)=((∑f(m))/m)*100%,其中∑f(m)为节点b作为头节点直接或间接指向节点a的所有关系链条的加权入度(即全链加权入度),m为节点a作为尾节点的总加权入度;

节点b作为尾节点,对于节点a的相对出度hf(n)=((∑f(n))/n)*100%,其中∑f(n)为节点b对节点a的所有被指向性链条的加权出度(即节点a直接或间接指向节点b的所有关系链条,即全链加权出度),n为节点a的总加权出度。

步骤s40,基于所述第二节点指向所述第一节点的关系向量、相对入度和相对出度,计算获得所述第二节点对所述第一节点的关联强度。

基于预置的双向关联关系强弱模型计算第二节点对第一节点的关联强度,预置的双向关联关系强弱模型的具体实现如上文步骤所述,在计算获得第二节点对第一节点的关系向量、相对入度和相对出度后,再基于训练好的模型参数,结合第二节点对第一节点的关系向量、相对入度和相对出度计算获得第二节点对第一节点的关联强度。

以上文中的节点a、节点b为例,从节点a的视角看,节点b相对节点a的关联强度为w=f(|r|,hf(m),hf(n)),r为transe模型得到的节点b对节点a的关系向量。

可选地,预置关联网络以关联图谱显示时,自动显示关联图谱上任意两个节点的双向关联强度。

本实施例通过在检测到关联强度评估请求后,从预置关联网络中获取所述关联强度评估请求对应待评估的第一节点和第二节点;基于双向关联关系强弱模型计算节点间的双向关联强度,双向关联关系强弱模型的具体实现包括:基于transe模型获取所述第二节点指向所述第一节点的关系向量;基于预设算法计算所述第二节点对所述第一节点的相对入度和相对出度;基于所述第二节点指向所述第一节点的关系向量、相对入度和相对出度,计算获得所述第二节点对所述第一节点的关联强度,实现对关联网络中节点间关联强度的计算,为对公业务的营销、风控起到重要的参考作用,节省大量人力成本。

可选地,所述步骤s40之后还包括反向关联强度计算,即从第二节点的视角看,第一节点对第二节点的关联强度,具体包括:

基于transe模型获取所述第一节点对所述第二节点的关系向量;计算所述第一节点对所述第二节点的相对入度和相对出度;基于所述第一节点对所述第二节点的关系向量、相对入度和相对出度,计算获得所述第一节点对所述第二节点的关联强度。

双向关联关系强弱模型可计算两节点间双向的关联强度,在计算完从第一节点视角看第二节点对第一节点的关联强度后,再计算从第二节点视角看第一节点对第二节点的关联强度。从第二节点视角看第一节点对第二节点的关联强度,与上文中从第一节点视角看第二节点对第一节点的关联强度的计算方式一一对应,具体包括:

第一节点对第二节点的相对入度指:从第二节点的视角看,第一节点对第二节点的加权入度与第二节点的总加权入度的比值,其中,第二节点的总加权入度指:从第二节点的视角看,预置关联网络中除第二节点以外的所有节点对第二节点的加权入度的总和;第一节点对第二节点的相对出度指:从第二节点的视角看,第一节点对第二节点的加权出度与第二节点的总加权出度的比值,其中,第二节点的总加权出度指:从第二节点的视角看,预置关联网络中除第二节点以外的所有节点对第二节点的加权出度的总和;第一节点对所述第二节点的相对入度和相对出度表征:从第二节点的视角看,第一节点与第二节点的关联强度。

进一步地,所述计算所述第一节点对所述第二节点的相对入度和相对出度这一步骤包括:

获取所述第二节点的总加权入度和总加权出度;获取所述第一节点对所述第二节点的全链加权入度;获取所述第一节点对所述第二节点的全链加权出度;基于所述全链加权入度和所述总加权入度计算获得所述第一节点对所述第二节点的相对入度,基于所述全链加权出度和所述总加权出度计算获得所述第一节点对所述第二节点的相对出度。

其中,第二节点的总加权入度指:从第二节点的视角看,预置关联网络中除第二节点以外、与第二节点具有关联关系的所有节点对第二节点的加权入度的总和;第二节点的总加权出度指:从第二节点的视角看,预置关联网络中除第二节点以外、与第二节点具有关联关系的所有节点对第二节点的加权出度的总和。

第一节点对第二节点的全链加权入度,即从第二节点的视角看,第一节点作为头节点直接或间接指向第二节点的总权重,全链加权入度基于第一节点直接或间接指向第二节点的所有关系链条上的单链加权入度计算获得。第一节点对第二节点的全链加权出度,即从第二节点的视角看,第二节点作为头节点直接或间接指向第一节点的总权重,全链加权出度基于第二节点直接或间接指向第一节点的所有关系链条上的单链加权出度计算获得。

进一步地,在本发明关联强度评估方法第二实施例,所述步骤s10之前包括预置关联网络的建立步骤,具体包括:

步骤s50,在预置企业数据库中确定中心企业,并从预置企业数据库中获取所述中心企业的高管信息,所述高管信息包括高管人员;

预置企业数据库中包括企业和与企业相关的个人数据,如企业的高管信息。可基于保险数据、工商数据、爬虫技术抓取的企业数据等建立预置企业数据库。

中心企业可以是预置企业数据库中任意企业,可选地,遍历预置企业数据库中所有企业,执行所述步骤s50、步骤s51、步骤s52,以建立包含较大数据量关联信息的预置关联网络。

高管人员可以是实际控制人、法定代表人、总经理、财务负责人等,可通过收集公开的工商数据或保险保单中的投保人与被保险人的关系,建立企业与高管人员之间的关联关系。

步骤s51,获取与所述中心企业的高管人员具有预设关联关系的关联人员,并获得所述关联人员任职高管的所有企业,将所述关联人员任职高管的所有企业作为所述中心企业的关联企业;

两企业的高管人员之间具有关联关系,则该两企业具有关联关系,该两企业可能为家族企业团,或朋友、家人、老乡代持企业。预设关联关系可以为朋友、家人、同学、老乡等,可通过收集保险保单中的投保人与被保险人的关系,建立个人关系库,还可以通过办理贷款、保险等业务中收集的信息完善个人之间的关联关系。

可选地,为识别更多企业间的关联关系,还可根据企业高管人员在其他企业的兼职状况确定企业间的关联关系,具体地,所述步骤s51还包括:

步骤s53,获取所述中心企业的高管人员所任职高级管理职位的所有兼职企业,将所述兼职企业作为所述中心企业的关联企业,其中,所述高级管理职位为法定代表人和/或总经理和/或财务负责人和/或实际控制人。

实际控制人,是指能够实际支配公司行为的人。在一个高管人员同时任职多个企业的高级管理职位时,其任职的多个企业之间就具有了隐秘的关联关系。

可选地,在获取所述中心企业的高管人员所任职高级管理职位的所有兼职企业的步骤之后包括:分别获取所述中心企业与所述兼职企业的高管信息,将所述中心企业的高管信息与所述兼职企业的高管信息进行比较,统计高管重合比例,若高管重合比例大于重合阈值,则所述中心企业与所述兼职企业的关联类型为关联强度较强的“兄弟”企业。

本实施例通过企业高管兼职状况挖掘企业间的关联关系,可挖掘出更多隐秘关联关系,丰富预置关联网络的维度。

可选地,为识别更多企业间的关联关系,还可基于nlp(自然语言处理)技术,通过文本分析,抓取上下游企业、具有担保关系的企业、具有抵押关系(债权抵押、动产不动产抵押)的企业、具有股权交易的企业、具有法律关系的企业、具有竞争关系的企业等;还可基于爬虫技术从网络数据(包括工商数据)中获取共用同一个域名、地址、邮箱、电话号码的企业。

步骤s52,基于所述中心企业及所述关联企业建立预置关联网络。

将中心企业及其关联企业作为节点建立预置关联网络,并将相关关联信息存储在预置关联网络。

进一步地,可通过预置关联网络实现对代持公司的识别,从预置关联网络中获取由多个关联企业组成的关联谱系(例如,平安集团谱系,平安集团下包括众多企业,如平安科技、平安金融等);根据所述多个关联企业间的关联关系确定该关联谱系的核心企业,该核心企业的实际控制人即所述关联谱系的实际控制人;获取所述关联谱系内的其他关联企业的实际控制人,并确定其他关联企业的实际控制人与所述关联谱系的实际控制人的关联关系;若其他关联企业的实际控制人与该谱系的实际控制人有家人,老乡,朋友关系,则该其他企业可能为代持公司。

本实施例基于企业高管与其关联人员之间的关联关系确定企业高管所在企业与关联人员所在企业之间的关联关系,可挖掘出更多隐秘关联关系,丰富预置关联网络(关联图谱)的维度,挖掘出平时只能依靠举报或实地勘察才能获得的维度,适用场景更广,不仅是营销及风控,政府部门、监管机构对企业、人员的监管也可适用,极大降低了实地勘察的成本。

此外,本发明还提供一种与上述关联强度评估方法各步骤对应的关联强度评估装置。

参照图3,图3为本发明关联强度评估装置第一实施例的功能模块示意图。

在本实施例中,本发明关联强度评估装置包括:

节点获取模块10,用于在检测到关联强度评估请求后,从预置关联网络中获取所述关联强度评估请求对应待评估的第一节点和第二节点;

关系向量计算模块20,用于基于transe模型获取所述第二节点指向所述第一节点的关系向量;

相对度计算模块30,用于基于预设算法计算所述第二节点对所述第一节点的相对入度和相对出度;

强度计算模块40,用于基于所述第二节点指向所述第一节点的关系向量、相对入度和相对出度,计算获得所述第二节点对所述第一节点的关联强度。

进一步地,所述相对度计算模块30,还用于获取所述第一节点的总加权入度和总加权出度;获取所述第二节点对所述第一节点的全链加权入度;获取所述第二节点对所述第一节点的全链加权出度;基于所述全链加权入度和所述总加权入度计算获得所述第二节点对所述第一节点的相对入度,基于所述全链加权出度和所述总加权出度计算获得所述第二节点对所述第一节点的相对出度。

进一步地,所述相对度计算模块30,还用于获取所述第二节点指向所述第一节点的所有关系链条,并获得在各关系链条上所述第二节点对所述第一节点的单链加权入度;基于各关系链条上的所述单链加权入度计算所述第二节点对所述第一节点的全链加权入度。

进一步地,所述相对度计算模块30,还用于获取各关系链条的关联类型和所述关联类型对应的预置类型权重;在计算关联类型为金额类型的金额关系链条时,获取所述金额关系链条的金额系数;基于所述金额类型对应的预置类型权重和所述金额系数计算所述金额关系链条的单链加权入度。

进一步地,所述关系向量计算模块20,还用于基于transe模型获取所述第一节点对所述第二节点的关系向量;

所述相对度计算模块30,还用于计算所述第一节点对所述第二节点的相对入度和相对出度;

所述强度计算模块40,还用于基于所述第一节点对所述第二节点的关系向量、相对入度和相对出度,计算获得所述第一节点对所述第二节点的关联强度。

进一步地,所述关联强度评估装置还包括:

数据获取模块,用于在预置企业数据库中确定中心企业,并从预置企业数据库中获取所述中心企业的高管信息,所述高管信息包括高管人员;

关联挖掘模块,用于获取与所述中心企业的高管人员具有预设关联关系的关联人员,并获得所述关联人员任职高管的所有企业,将所述关联人员任职高管的所有企业作为所述中心企业的关联企业;

关联网络建立模块,用于基于所述中心企业及所述关联企业建立预置关联网络。

进一步地,所述关联挖掘模块,还用于获取所述中心企业的高管人员所任职高级管理职位的所有兼职企业,将所述兼职企业作为所述中心企业的关联企业,其中,所述高级管理职位为法定代表人和/或总经理和/或财务负责人和/或实际控制人。

本发明还提出一种存储介质,其上存储有计算机程序。所述存储介质可以是图1的关联强度评估设备中的存储器201,也可以是如rom(read-onlymemory,只读存储器)/ram(randomaccessmemory,随机存取存储器)、磁碟、光盘中的至少一种,所述存储介质包括若干指令用以使得一台具有处理器的设备(可以是手机,计算机,服务器,网络设备或本发明实施例中的关联强度评估设备等)执行本发明各个实施例所述的方法。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者服务端不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者服务端所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者服务端中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1