用于预测实体间业务关系的模型训练方法及装置与流程

文档序号:21783889发布日期:2020-08-07 20:21阅读:178来源:国知局
用于预测实体间业务关系的模型训练方法及装置与流程

本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种用于预测实体间业务关系的模型训练方法及装置,一种实体业务关系图谱的构建方法及装置,一种实体业务风险的预测方法及装置。



背景技术:

随着社会的发展和科技的进步,近年来企业、机构、商户等实体的数量猛增。相应地,衍生出针对这些实体的多种分析需求,如对实体信息进行管理,包括划分实体所涉及的领域或行业类别等,又例如,对实体进行业务分析,包括确定实体的业务风险等。为了满足这些分析需求,需要采集实体自身的信息数据,如成立时间、实体规模、招聘信息等。然而,对实体信息进行全面采集通常较为困难,同时,难以保证采集到的数据能够直观、有效地反映实体的真实情况。

因此,迫切需要一种方案,能够利用采集到的有限的实体数据,实现对实体的精准分析,从而满足针对实体的多种分析需求。



技术实现要素:

本说明书一个或多个实施例描述了一种用于预测实体间业务关系的模型训练方法及装置,利用采集到的实体基础数据构建基础关系图谱,从而利用实体间已知的上下游业务关系,训练包含第一图神经网络和第一分类网络的业务关系预测模型,用于挖掘未知的上下游业务关系。进一步地,本说明书一个或多个实施例还描述了一种实体业务关系图谱的构建方法及装置,通过利用训练后的业务关系预测模型,挖掘出未知的上下游业务关系,进而结合已知的实体间业务关系,构建实体业务关系图谱。更进一步地,本说明书一个或多个实施例还描述了一种实体业务风险的预测方法及装置,基于构建出的实体业务关系图谱,实现对实体节点进行精准的业务风险预测。

具体地,根据第一方面,提供一种用于预测实体间业务关系的模型训练方法,包括:获取预先构建的基础关系图谱,其中至少包括对应于多个实体的多个实体节点,以及实体节点之间存在交互关系时形成的连接边;基于上述多个实体中已知的实体间业务关系,获取多个训练样本,其中任意的第一训练样本包括第一实体、第二实体和对应的类别标签,该类别标签指示上述第一实体和上述第二实体之间的业务上下游关系;通过利用第一图神经网络对上述基础关系图谱进行图嵌入处理,确定上述第一实体的第一特征向量和上述第二实体的第二特征向量;对上述第一特征向量和第二特征向量进行融合处理,并将处理得到的融合向量输入第一分类网络中,得到分类预测结果;基于上述分类预测结果和类别标签,训练上述第一图神经网络和上述第一分类网络,训练后的上述第一图神经网络和第一分类网络构成业务关系预测模型,用于预测未知的实体间业务关系。

根据第二方面,提供一种实体业务关系图谱的构建方法,包括:获取业务关系预测模型,其基于上述第一方面提供的训练方法而得到,且包括上述训练后的第一图神经网络和第一分类网络;基于上述多个实体中未知的实体间业务关系,确定待预测业务关系的多个实体对,其中任意的第一实体对中包括第三实体和第四实体;通过利用上述第一图神经网络对上述基础关系图谱进行图嵌入处理,确定上述第三实体的第三特征向量和上述第四实体的第四特征向量;对上述第三特征向量和第四特征向量进行融合处理,并将处理得到的融合向量输入第一分类网络中,得到针对上述第一实体对的分类预测结果;基于上述多个实体中已知的实体间业务关系,以及得到的针对上述多个实体对的多个分类预测结果,构建实体业务关系图谱,用于表征上述多个实体之间的业务关系。

根据第三方面,提供一种实体业务风险的预测方法,包括:获取实体业务关系图谱,其基于上述第二方面提供的构建方法而得到,且用于表征多个实体之间的业务上下游关系;基于上述多个实体中已知的业务风险数据,获取多个训练样本,其中任意的第二训练样本中包括第五实体和对应的风险类别标签;通过利用第二图神经网络对上述实体业务关系图谱进行图嵌入处理,确定上述第五实体的第五特征向量;将上述第五特征向量输入第二分类网络中,得到针对上述第五实体的业务风险预测结果;基于上述业务风险预测结果和风险类别标签,训练上述第二图神经网络和第二分类网络,训练后的上述第二图神经网络和第二分类网络构成业务风险预测模型,用于预测未知的实体业务风险。

根据第四方面,提供一种用于预测实体间业务关系的模型训练装置,包括:基础图谱获取单元,配置为获取预先构建的基础关系图谱,其中至少包括对应于多个实体的多个实体节点,以及实体节点之间存在交互关系时形成的连接边;第一样本获取单元,配置为基于上述多个实体中已知的实体间业务关系,获取多个训练样本,其中任意的第一训练样本包括第一实体、第二实体和对应的类别标签,该类别标签指示上述第一实体和上述第二实体之间的业务上下游关系;第一向量确定单元,配置为通过利用第一图神经网络对上述基础关系图谱进行图嵌入处理,确定上述第一实体的第一特征向量和上述第二实体的第二特征向量;第一向量融合单元,配置为对上述第一特征向量和第二特征向量进行融合处理,并将处理得到的融合向量输入第一分类网络中,得到分类预测结果;关系模型训练单元,配置为基于上述分类预测结果和类别标签,训练上述第一图神经网络和上述第一分类网络,训练后的上述第一图神经网络和第一分类网络构成业务关系预测模型,用于预测未知的实体间业务关系。

根据第五方面,提供一种实体业务关系图谱的构建装置,包括:关系模型获取单元,配置为获取业务关系预测模型,其基于上述第四方面提供的训练装置而得到,且包括上述训练后的第一图神经网络和第一分类网络;实体对确定单元,配置为基于上述多个实体中未知的实体间业务关系,确定待预测业务关系的多个实体对,其中任意的第一实体对中包括第三实体和第四实体;第二向量确定单元,配置为通过利用上述第一图神经网络对上述基础关系图谱进行图嵌入处理,确定上述第三实体的第三特征向量和上述第四实体的第四特征向量;第二向量融合单元,配置为对上述第三特征向量和第四特征向量进行融合处理,并将处理得到的融合向量输入第一分类网络中,得到针对上述第一实体对的分类预测结果;关系图谱构建单元,配置为基于上述多个实体中已知的实体间业务关系,以及得到的针对上述多个实体对的多个分类预测结果,构建实体业务关系图谱,用于表征上述多个实体之间的业务关系。

根据第六方面,提供一种实体业务风险的预测装置,包括:关系图谱获取单元,配置为获取实体业务关系图谱,其基于上述第五方面的构建装置而得到,且用于表征多个实体之间的业务上下游关系;第二样本获取单元,配置为基于上述多个实体中已知的业务风险数据,获取多个训练样本,其中任意的第二训练样本中包括第五实体和对应的风险类别标签;第三向量确定单元,配置为通过利用第二图神经网络对上述实体业务关系图谱进行图嵌入处理,确定上述第五实体的第五特征向量;风险预测单元,配置为将上述第五特征向量输入第二分类网络中,得到针对上述第五实体的业务风险预测结果;风险模型训练的单元,配置为基于上述业务风险预测结果和风险类别标签,训练上述第二图神经网络和第二分类网络,训练后的上述第二图神经网络和第二分类网络构成业务风险预测模型,用于预测未知的实体业务风险。

根据第七方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当上述计算机程序在计算机中执行时,令计算机执行上述第一方面或第二方面或第三方面的方法。

根据第八方面,提供了一种计算设备,包括存储器和处理器,上述存储器中存储有可执行代码,上述处理器执行上述可执行代码时,实现上述第一方面或第二方面或第三方面的方法。

综上,采用本说明书实施例披露的一种对企业间上下游关系进行预测的方法及装置,利用采集到的各实体的基础数据,构建基础关系图谱,再基于该基础关系图谱和已知的实体间业务关系,训练上述业务关系预测模型,用于对实体间未知的业务关系进行预测、挖掘。由此训练出的业务关系预测模型可以实现对实体间业务关系进行高效、准确地预测。再者,在本说明书实施例披露的实体业务关系图谱的构建方法及装置中,利用上述业务关系预测模型和基础关系图谱,实现对实体间未知业务关系的预测,再结合已知的业务关系,构建实体业务关系图谱,用于对实体的精准分析。另外,在本说明书实施例披露的实体业务风险的预测方法及装置中,通过上述构建的实体上下游图谱,引入与目标实体强相关的实体的数据,可以实现对目标实体的业务风险的精准预测,从而有效提高预测结果的准确度、可信度和可用性。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1示出根据一个实施例的用于预测实体间业务关系的模型训练方法的实施架构图;

图2示出本说明书实施例披露的用于预测实体间业务关系的模型训练方法流程图;

图3示出根据一个实施例的构建的基础关系图谱;

图4示出根据一个实施例的实体业务关系图谱的构建方法流程示意图;

图5示出根据一个实施例的基于图3中数据构建出的实体业务关系图谱;

图6示出根据一个实施例的实体业务风险的预测方法流程示意图;

图7示出本说明书实施例披露的用于预测实体间业务关系的模型训练装置结构图;

图8示出根据一个实施例的实体业务关系图谱的构建装置结构图;

图9示出根据一个实施例的实体业务风险的预测装置结构图。

具体实施方式

下面结合附图,对本说明书提供的方案进行描述。

如前所述,目前,对于实体信息进行全面采集通常较为困难,尤其是对规模较小(如实体中成员数量较少)的实体,能够采集到的实体基础数据更加有限。如何利用有限的实体基础数据,实现对实体的精准分析,无疑是一个挑战。

具体地,发明人发现,在对某个目标实体进行分析时,如果只利用该目标实体的自身数据,例如,实体规模(例如,10-50人)、招聘信息(如在招职位10个)、专利申请数量(如100个)、成立年限(如5年)等进行分析,则得到的分析结果具有较强的局限性,可信度和可用性不高。由此,提出通过引入与该目标实体相关联实体的数据,对该目标实体进行分析。在一种实施方式中,可以通过实体间交互数据,如实体之间的历史业务往来,实体关键成员(如企业主或机构领导或商户经营者)之间的好友关系等,初步判断出实体之间存在一定关联。然而,如果将与该目标实体进行过交互的实体,都作为分析该目标实体时引入的关联实体,会存在引入数据弱相关、数据有效性低和数据量过大等问题。

在另一种实施方式中,提出根据实体之间的业务上下游关系(以下或简称业务关系,具体可以包括供应关系、或物资流动关系或信息数据流动关系等),引入与目标实体存在强关联实体的数据。然而,采集到足量、可信的业务关系实际是十分困难的,而仅根据存在历史交互来判定两个实体之间存在业务关系,例如,如果存在实体a向实体b进行转账的历史记录,则判定实体a是实体b的上游实体,所得到的判定结果是存疑的。

基于以上观察和分析,发明人提出一种用于预测实体间业务关系的模型训练方法,在此方法中,利用采集到的各实体的基础数据,构建基础关系图谱,再基于该基础关系图谱和已知的实体间业务关系,对实体间未知的业务关系进行预测、挖掘。由此,可以根据已知的和预测出的实体间业务关系,确定目标实体的上游实体和/或下游实体,作为该目标实体的强关联实体,进而通过引入强关联实体的数据实现对目标实体的精准分析。

在一个实施例中,图1示出根据一个实施例的对实体间上下游关系进行预测的方法实施架构图,如图1所示,利用实体间已知的业务关系构建训练样本集,并结合上述基础关系图谱,训练第一图神经网络和第一分类网络,具体地,假定其中任意一个训练样本中包括第一实体和第二实体,以及包括指示第一实体和第二实体间业务关系的类别标签,基于此,将从基础关系图谱中获取的与第一实体相关的数据,以及与第二实体相关的数据,分别输入第一图神经网络中,得到第一实体的第一特征向量和第二实体的第二特征向量,再对两个向量进行融合处理,并将得到的融合向量输入第一分类网络中,得到分类预测结果,进而根据该分类预测结果和上述类别标签,训练上述第一图神经网络和第一分类网络。如此,利用上述训练样本集进行多轮迭代训练后,可以得到训练后的第一图神经网络和第一分类网络,构成业务关系预测模型,用于对实体间未知的业务关系进行预测式挖掘。

下面结合具体的实施例,对上述方法进行描述。

具体地,图2示出本说明书实施例披露的一种对企业间上下游关系进行预测的方法流程图,所述方法的执行主体可以为任何具有计算、处理能力的装置、设备或设备集群。如图2所示,所述方法包括以下步骤:

步骤s210,获取预先构建的基础关系图谱,其中至少包括对应于多个实体的多个实体节点,以及实体节点之间存在交互关系时形成的连接边;步骤s220,基于上述多个实体中已知的实体间业务关系,获取多个训练样本,其中任意的第一训练样本包括第一实体、第二实体和对应的类别标签,该类别标签指示上述第一实体和上述第二实体之间的业务上下游关系;步骤s230,通过利用第一图神经网络对上述基础关系图谱进行图嵌入处理,确定上述第一实体的第一特征向量和上述第二实体的第二特征向量;步骤s240,对上述第一特征向量和第二特征向量进行融合处理,并将处理得到的融合向量输入第一分类网络中,得到分类预测结果;步骤s250,基于上述分类预测结果和类别标签,训练上述第一图神经网络和上述第一分类网络,训练后的上述第一图神经网络和第一分类网络构成业务关系预测模型,用于预测未知的实体间业务关系。

针对以上步骤,首先需要说明的是,上述“第一实体”、“第一特征向量”等中的“第一”,“第二实体”、“第二特征向量”等中的“第二”,以及下文中的类似用语,仅为了描述的清楚性,用于区分同类事物,不具有排序等其他限定作用。

以上步骤具体如下:

首先,在步骤s210,获取预先构建的基础关系图谱。该基础关系图谱用于表征,可获取到的大量实体基础数据中存在的拓扑关系。为便于理解,下面先对上述基础关系图谱的构建进行介绍。

具体地,获取到的大量实体基础数据中至少涉及多个实体,具体包括各个实体的基础属性特征以及实体间的交互数据。

一方面,在一个实施例中,上述多个实体所属的实体类别包括企业类实体,相应地,获取的大量实体基础数据可以包括企业基础数据。在一个具体的实施例中,企业基础数据中包括企业的基础属性特征,具体可以包括企业规模(例如,500-1000人)、企业注册地址(如北京)、招聘信息(如在招职位100个)、注册资金(如5000万)、企业年利润(如1000万)、发生交易的企业数量(如128家)。在一个具体的实施例中,企业基础数据中包括企业间交互数据,具体可以包括交易数据,如订单创建时间、订单完成时间、订单金额等,还可以包括借款数据,如借款总金额、已还款总金额、借款时间等。

在另一个实施例中,上述多个实体所属的实体类别包括机构类实体,相应地,获取的大量实体基础数据可以包括机构基础数据。在一个具体的实施例中,机构基础数据中包括机构的基础属性特征,具体可以包括机构成立时间、机构类别、机构所在地。在一个具体的实施例中,机构基础数据中包括机构间交互数据,具体包括信息传递或信息共享数据,如信息传输时间、传输信息所占的存储空间等,还可以包括机构共同承办活动的活动数据,如活动举办时间、活动主题等。

在又一个实施例中,上述多个实体所属的实体类别包括商户类实体,相应地,获取的大量实体基础数据可以包括商户基础数据。在一个具体的实施例中,商户基础数据中包括商户的基础属性特征,具体可以包括商户开业时间、商户线下门店的数量、商户入驻电商平台的时间、商户注册的商标数量、商户年利润、商户经营的品牌数量等。在一个具体的实施例中,商户基础数据中包括商户间交互数据,具体可以包括资金往来数据,如支付金额、转账金额、支付次数或转账次数等,还可以包括线上联合营销的数据,具体可以包括促销活动的次数、促销活动的时间、促销活动涉及的线上活动数量等。

以上,对获取到的大量实体基础数据中涵盖的,多个实体中各个实体的基础属性特征,以及实体间的交互数据进行介绍。据此,可以确定与该多个实体对应的多个实体节点,并根据实体间交互数据,在产生过交互的实体所对应的实体节点之间建立连接边,进而构建出包含多个实体节点以及实体间具有交互关系时形成的连接边的基础关系图谱。同时,还可以将各个实体的基础属性特征确定为对应实体节点的节点特征,根据交互数据确定各条连接边的边特征,归入该基础关系图谱的数据内容中。

根据一个具体的实施例,在上述多个实体的实体类别主要包括企业类实体的情况下,可以建立企业基础关系图谱,其中包括对应于多个企业的多个企业节点,以及企业节点间存在交互关系时形成的连接边。此外,企业节点间的连接边对应的关系类型可以为交易关系或借贷关系,相应地,对应交易关系的连接边具有的边特征可以包括:交易金额、交易时间、交易满意度等,而对应借贷关系的连接边具有的边特征可以包括:借贷本金数额、已还金额、待还金额、还款年限等。

另一方面,在一个实施例中,上述大量实体基础数据中还可以包括与上述多个实体相关的实体成员的数据,具体包括实体成员之间的交互数据,实体成员与实体之间的关联数据。在一个具体的实施例中,实体成员的数据可以包括实体成员的基础属性特征,如性别、年龄等。在一个具体的实施例中,与企业实体相关的企业成员,可以是企业主、企业股东、企业投资人等,企业成员之间的交互数据可以包括企业成员之间的交易数据(如转账数据或支付数据)或社交数据(如是否为社交好友,或在社交平台上进行互动的次数)等。在另一个具体的实施例中,与机构实体相关的机构成员,可以是机构领导、机构负责人等,机构成员之间的交互数据可以包括社交数据。在又一个具体的实施例中,与商户实体相关的商户成员,可以是商户经营者、商户合伙人等,商户成员之间的交互数据可以包括交易数据或社交数据。据此,上述构建的基础关系图谱中还包括对应于多个实体成员的多个成员节点,以及,以下多种连接边中的至少一种:成员节点与实体节点之间存在关联关系时形成的连接边,成员节点之间存在交互关系时形成的连接边。

根据一个具体的实施例,上述企业基础关系图谱中还可以包括对应于多个企业成员的多个成员节点,成员节点与实体节点之间存在关联关系时形成的连接边、以及成员节点之间存在交互关系时形成的连接边。此外,在一个更具体的实施例中,其中关联关系可以包括从属关系,如某个成员就职于某家企业,相应的连接边的边特征可以包括:就职时长、职位等级、年收入等。在另一个更具体的实施例中,其中关联关系可以包括投资关系,如某个成员向某家企业进行投资,相应的连接边的边特征可以包括:投资时间、投资金额等。在一个更具体的实施例中,其中交互关系可以包括社交关系,相应的连接边的边特征可以包括:会话次数、会话时间段等。在另一个更具体的实施例中,其中交互关系可以包括交易关系,相应的连接边的边特征可以包括:交易次数、交易金额等。

示例性的,图3示出根据一个实施例的构建的基础关系图谱,其中包括与企业对应的企业节点(以圆圈示出)和与企业主对应的企业主节点(以方块示出),为便于说明,在圆圈和方块中示出节点编号;图中的连接边涉及的关系类型包括:交易关系、好友关系、企业主和企业之间的关联关系、转账关系(需知,图中对转账和交易进行区分,在其他实施方式中,还可以将转账归为交易)。由图3可知,其中节点3与节点4存在转账关系,图中表示转账关系的连接边带有箭头指向,由节点4指向节点3表示节点4曾向节点3转账;其中企业主a和企业主b之间存在好友关系和转账关系,其他内容可相应推知,不作赘述。

以上,对预先构建的基础关系图谱中涉及的多个实体,实体间的交互关系,以及相应包含的多个实体节点的节点特征,实体节点间存在交互关系时形成的连接边的边特征进行介绍。并且,对可能涉及的多个成员,成员间、成员与实体间的交互关系,以及响应包含的多个成员节点的节点特征,成员节点间存在交互关系或成员节点与实体节点间存在关联关系时形成的连接边的边特征进行介绍。

在执行步骤s210之前,之后,或同时,可以执行步骤s220,基于上述多个实体中已知的实体间业务关系,获取多个训练样本。

具体地,其中任意的第一训练样本包括第一实体、第二实体和对应的类别标签,该类别标签指示第一实体和第二实体之间的业务上下游关系。在一个实施例中,该类别标签指示第一实体和第二实体之间存在业务上下游关系,或者,不存在业务上下游关系。在另一个实施例中,该类别标签指示第一实体是第二实体的上游实体,或者,不是该第二实体的上游实体(包括第一实体是第二实体的下游实体以及两个实体之间不存在业务上下游关系的情况)。在又一个实施例中,该类别标签指示该第一实体是该第二实体的上游实体,或者,该第二实体是该第一实体的上游实体,或者,该第一实体和该第二实体之间不存在业务上下游关系。

在一种表示方式中,上述第一训练样本可以表示为(u,v,y),其中u、v和y分别表示上述第一实体、第二实体和业务类别标签。根据一个实施例,y∈{1,2,3},具体地,y=1表示第一实体是第二实体的上游实体,y=2表示第二实体是第一实体的上游实体,y=3表示第一实体和第二实体之间没有业务上下游关系。

由上,可以根据采集到的实体间业务关系,得到多个训练样本。针对其中任意的第一训练样本,在步骤s230,通过利用第一图神经网络对上述基础关系图谱进行图嵌入处理,确定上述第一实体的第一特征向量和上述第二实体的第二特征向量。在一个实施例中,其中第一图神经网络可以采用以下中的任一种:图卷积神经网络(graphconvolutionalnetwork,简称gcn),图注意力网络(graphattentionnetwork,gan),graphsage,geniepath等。

在一个实施例中,本步骤中可以包括:首先,针对上述第一实体和第二实体中的每个实体,从上述基础关系图谱中,确定对应的实体节点与其若干邻居节点;然后,将该对应的实体节点和若干邻居节点的节点特征,输入上第一图神经网络中,得到该每个实体的特征向量。

在一个具体的实施例中,可以从基础关系图谱的邻接信息中,确定上述对应的实体节点与其若干邻居节点。其中邻接信息可以体现为多种形式,如邻接矩阵,邻接表等,具体与基础关系图谱的存储方式有关。

在一个具体的实施例中,上述若干邻居节点,可以是上述对应的实体系节点的t阶以内的邻居节点,其中t为正整数,可以为超参,人为预先设定,如可设定为1或5等。

在一个具体的实施例中,可以通过第一图神经网络,对该对应的实体节点和若干邻居节点的节点特征,进行多级特征聚合,从而得到上述每个实体对应的特征向量。在一个例子中,假定上述第一实体对应于图3中的节点2,在针对节点2进行2级特征聚合的实施方式中,可以聚合与节点2相连接的一阶邻居节点1、3的特征,以及二阶邻居节点4、6和7的特征,从而得到节点2的特征向量。

在另一个实施例中,本步骤中可以包括:首先,针对上述第一实体和第二实体中的每个实体,从上述基础关系图谱中,确定对应的实体节点与其若干邻居节点,以及该对应的实体节点与其若干邻居节点之间的若干连接边;然后,将该对应的实体节点和若干邻居节点的节点特征,以及该若干连接边的边特征,输入上第一图神经网络中,得到该每个实体的特征向量。换言之,从基础关系图谱中,确定对应于第一实体的第一实体节点,该第一实体节点的若干第一邻居节点,以及该第一实体节点与若干第一邻居节点之间的若干第一连接边;然后,将该第一实体节点的节点特征、若干第一邻居节点的节点特征以及若干第一连接边的边特征,共同输入上述第一图神经网络中,得到上述第一特征向量。同理,可以得到第二特征向量。

由上,可以得到上述第一实体的第一特征向量和第二实体的第二特征向量。据此,在步骤s240,对所述第一特征向量和第二特征向量进行融合处理,并将处理得到的融合向量输入第一分类网络中,得到分类预测结果。在一个实施例中,其中第一分类网络可以包括一个全连接层和一个softmax层。在另一个实施例中,第一分类网络可以采用以下神经网络实现:深度神经网络(deepneuralnetworks,简称dnn)、卷积神经网络(convolutionalneuralnetworks,简称cnn)。

具体地,若分类任务中需要预测的实体间业务上下游关系,是具体的业务上游关系或业务下游关系,则在上述融合处理时,需要使得融合向量可以体现第一特征向量和第二特征向量的相对顺序;若仅需预测是否存在业务上下游关系,而无需对业务上游关系和业务下游关系进行区分,则在上述融合处理时,可以不考虑两个特征向量的相对顺序。

在一个实施例中,分类任务中需要预测第一实体是否为第二实体的上游实体,可以理解,上述类别标签指示第一实体是否为第二实体的上游实体的实际情况。相应地,在本步骤中,上述融合处理可以包括:按照预定顺序,对第一特征向量和第二特征向量进行拼接,例如,第一特征向量在前或第二特征向量在前。由此可以将得到的拼接向量输入上述第一分类网络,得到上述分类预测结果,为针对第一实体是否为第二实体的上游实体的预测结果。

在另一个实施例中,分类任务中需要预测第一实体和第二实体之间是否存在业务上下游关系。相应地,在本步骤中,上述融合处理可以包括:拼接处理、相加处理、相减处理或对位相乘处理等。由此可以将得到的融合向量输入上述第一分类网络,得到上述分类预测结果,为针对第一实体和第二实体之间是否存在业务上下游关系的预测结果。

以上,可以得到针对第一实体和第二实体的分类预测结果。然后,在步骤s250,基于上述分类预测结果和类别标签,训练上述第一图神经网络和第一分类网络。具体可以利用反向传播法等实现训练,对现有技术不作赘述。

如此,利用上述多个训练样本,对上述第一图神经网络和第一分类网络进行多次迭代训练,直到迭代收敛或达到预定的迭代次数,可以得到训练后的上述第一图神经网络和第一分类网络,构成用于预测未知的实体间业务关系的业务关系预测模型。

综上,采用本说明书实施例披露的一种对企业间上下游关系进行预测的方法,利用采集到的各实体的基础数据,构建基础关系图谱,再基于该基础关系图谱和已知的实体间业务关系,训练上述业务关系预测模型,用于对实体间未知的业务关系进行预测、挖掘。由此训练出的业务关系预测模型可以实现对实体间业务关系进行高效、准确地预测。

以上,在得到业务关系预测模型后,可以基于该业务关系预测模型和上述基础关系图谱,对未知的实体间业务关系进行预测。在一种应用场景下,预测出的业务上下游关系,可以反映两个实体之间未来建立业务上下游关系的可能性,因此,得到的预测结果,可以辅助决策两个实体之间是否可以寻求建立业务上下游关系,或者,建立业务上的合作关系。比如说,如预测出两个实体存在业务上下游关系的概率大于预定阈值,则说明这两个实体有望建立业务关系。

在另一种应用场景下,可以通过预测出未知的业务关系,并结合已知的业务关系,构建实体业务关系图谱,用于对实体的精准分析。具体地,图4示出根据一个实施例的实体业务关系图谱的构建方法流程示意图,所述方法的执行主体可以为任何具有计算、处理能力的装置、设备或设备集群。如图4所示,所述方法包括以下步骤:

步骤s410,获取上述业务关系预测模型,其中包括上述训练后的第一图神经网络和第一分类网络;步骤s420,基于上述多个实体中未知的实体间业务关系,确定待预测业务关系的多个实体对,其中任意的第一实体对中包括第三实体和第四实体;步骤s430,通过利用上述第一图神经网络对上述基础关系图谱进行图嵌入处理,确定上述第三实体的第三特征向量和上述第四实体的第四特征向量;步骤s440,对上述第三特征向量和第四特征向量进行融合处理,并将处理得到的融合向量输入第一分类网络中,得到针对上述第一实体对的分类预测结果;步骤s450,基于上述多个实体中已知的实体间业务关系,以及得到的针对上述多个实体对的多个分类预测结果,构建实体业务关系图谱,用于表征上述多个实体之间的业务关系。

以上步骤具体如下:

首先,在步骤s410,获取上述业务关系预测模型。需要理解,该业务关系模型为采用图2中示出方法而训练得到的业务关系预测模型,其中包括上述训练后的第一图神经网络和第一分类网络。

在执行步骤s410之前、之后或同时,执行步骤s420,基于上述多个实体中未知的实体间业务关系,确定待预测业务关系的多个实体对,其中任意的第一实体对中包括第三实体和第四实体。

在一个实施例中,可以将多个实体中,实体间业务关系未知的每组实体,都归入待预测业务关系的多个实体对。在另一个实施例中,考虑到实体数量较多的场景下,对业务关系未知的每组实体都进行预测,将耗费大量的计算资源,因此,可以根据一定的筛选机制,确定出参与后续业务关系预测的多个实体对。比如,对于某个实体,可以先确定出与其业务关系未知的所有实体,然后,从基础关系图谱中,筛选出所有实体中对应的实体节点,是该某个实体所对应节点的n(为正整数)阶邻居节点的实体节点,进而将该某个实体,与筛选出的实体节点所对应的各实体,分别组成待预测的实体对,由此可知,在上述基础关系图谱中,确定出的所对应的两个实体节点是n阶之内的邻居。

由上可以确定待预测业务关系的多个实体对。然后,在步骤s430,通过利用上述第一图神经网络对上述基础关系图谱进行图嵌入处理,确定上述第三实体的第三特征向量和上述第四实体的第四特征向量。需要说明,对步骤s430的描述,可以参见对上述步骤s230的描述。

如此,在确定出上述第三特征向量和第四特征向量后。接着在步骤s440,对上述第三特征向量和第四特征向量进行融合处理,并将处理得到的融合向量输入第一分类网络中,得到针对上述第一实体对的分类预测结果。如此,可以得到针对多个实体对的多个分类预测结果,进而在步骤s450,基于得到的该多个分类预测结果以及上述多个实体中已知的实体间业务关系,构建实体业务关系图谱,用于表征上述多个实体之间的业务关系。

在一个实施例中,上述步骤s440可以包括:对所述第三特征向量和第四特征向量进行顺序拼接,并将得到的第一拼接向量输入上述第一分类网络中,得到针对第一实体对的第一分类预测结果,指示所述第三实体是否为所述第四实体的上游实体。

进一步地,在该第一分类预测结果指示第三实体是第四实体的上游实体的情况下,步骤s450可以包括:在上述实体业务关系图谱中建立,由第三实体所对应节点指向第四实体所对应节点的有向连接边,或者,由第四实体所对应节点指向第三实体所对应节点的有向边。在一个具体的实施例中,该第一分类预测结果中还包括第三实体是第四实体的上游实体的置信度(如0.8),此时,还可以将该置信度作为该有向连接边的边特征。此外,在步骤s450中还可以包括:对于根据已知业务关系建立的有向连接边,可以将置信度1作为其边特征。

而在该第一分类预测结果指示第三实体不是第四实体的上游实体的情况下,上述构建方法还可以包括:对上述第四特征向量和第三特征向量进行顺序拼接,并将得到的第二拼接向量输入上述第一分类网络中,得到针对上述第一实体对的第二分类预测结果,指示上述第四实体是否为上述第三实体的上游实体。更进一步地,在该第二分类预测结果指示第四实体不是第三实体的上游实体的情况下,不在上述实体业务关系图谱中建立二者之间的连接边。

根据一个具体的例子,图5示出根据一个实施例的基于图3中数据构建出的实体业务关系图谱,其中由节点1指向节点2的连接边表示,原材料供应商是服装制造商b的上游企业,其中有向连接边上的数字表示置信度,如节点2指向节点4的有向连接边对应的置信度为0.9。

在另一个实施例中,上述步骤s440中可以包括:对第三特征向量和第四特征向量进行任意拼接,并将得到的拼接向量输入上述第一分类网络中,得到针对第一实体对的分类预测结果,指示第三实体和第四实体之间是否存在业务上下游关系。进一步地,在该分类预测结果指示存在的情况下,步骤s450可以包括:在上述实体业务关系图谱中建立,第三实体和第四实体所对应两个节点之间的无向连接边;而在该分类预测结果指示不存在的情况下,步骤s450可以包括:在上述实体业务关系图谱中,不建立第三实体和第四实体所对应两个节点之间的连接边。另外需要说明,对步骤s440的描述,还可以参见前述对步骤s240的描述。

如此,可以实现对实体业务关系图谱的构建。

综上,在本说明书实施例披露的实体业务关系图谱的构建方法中,利用上述业务关系预测模型和基础关系图谱,实现对实体间未知业务关系的预测,再结合已知的业务关系,构建实体业务关系图谱,用于对实体的精准分析。

上述构建出的实体业务关系图谱,可以用于对实体进行精准分析。在一种应用场景下,可以用于对实体进行行业或领域分类。在另一种应用场景下,可以用于对实体进行业务风险分析。具体地,图6示出根据一个实施例的实体业务风险的预测方法流程示意图,所述方法的执行主体可以为任何具有计算、处理能力的装置、设备或设备集群。

如图6所示,所述方法包括以下步骤:

步骤s610,获取实体业务关系图谱,其用于表征多个实体之间的业务上下游关系;步骤s620,基于上述多个实体中已知的业务风险数据,获取多个训练样本,其中任意的第二训练样本中包括第五实体和对应的风险类别标签;步骤s630,通过利用第二图神经网络对上述实体业务关系图谱进行图嵌入处理,确定上述第五实体的第五特征向量;步骤s640,将上述第五特征向量输入第二分类网络中,得到针对上述第五实体的业务风险预测结果;步骤s650,基于上述业务风险预测结果和风险类别标签,训练上述第二图神经网络和第二分类网络,训练后的上述第二图神经网络和第二分类网络构成业务风险预测模型,用于预测未知的实体业务风险。

以上步骤具体如下:

首先,在步骤s610,获取实体业务关系图谱,其用于表征多个实体之间的业务上下游关系。需要理解,该实体业务关系图谱为采用图4中示出方法而构建出的实体业务关系图谱。

接着,在步骤s620,基于上述多个实体中已知的业务风险数据,获取多个训练样本,其中任意的第二训练样本中包括第五实体和对应的风险类别标签。在一个实施例中,其中风险类别标签指示对应实体的信用风险等级,例如,包括信用风险高、信用风险低或信用风险极高,又例如,包括信用风险高、信用风险中等、信用风险低或信用风险极低。需要理解,信用风险越高,说明实体的信用越差。在另一个实施例中,其中风险类别标签指示对应实体的业务违约风险等级,例如,包括违约风险高或违约风险低,又例如,包括违约风险极高、违约风险高和违约风险中等。其中业务违约可以包括借贷违约、业务订单处理违约等。

然后,在步骤s630,通过利用第二图神经网络对上述实体业务关系图谱进行图嵌入处理,确定上述第五实体的第五特征向量。需要理解,其中第二图神经网络不同于上述第一图神经网络,此处第二图神经网络用于预测实体业务风险,而上述第一图神经网络用于预测未知的业务上下游关系。并且,第二图神经网络和第一图神经网络所基于的图神经网络算法可以相同,也可以不同。

在一个实施例中,上述实体业务关系图谱中包括对应于上述多个实体的多个实体节点,以及实体节点间存在业务上下游关系时形成的有向连接边,该有向连接边由上游实体指向下游实体。相应地,本步骤中可以包括:首先,从上述实体业务关系图谱中,至少确定对应于上述第五实体的第五实体节点,以及对应于上述第五实体的若干上游实体的若干邻居节点;然后,至少将上述第五实体节点和上述若干邻居节点的节点特征,输入上述第二图神经网络中,得到上述第五特征向量。

进一步地,其中至少确定对应于上述第五实体的第五实体节点,以及对应于上述第五实体的若干上游实体的若干邻居节点,还可以包括:确定上述第五实体节点与上述若干邻居节点之间的若干连接边,其中各条连接边的边特征中包括对应上下游业务关系的置信度;其中至少将上述第五实体节点的节点特征和上述若干邻居节点的节点特征,输入上述第二图神经网络中,得到上述第五特征向量,包括:将上述节点特征和上述各条连接边的边特征,输入上述第二图神经网络中,得到上述第五特征向量。

需要说明,对步骤s630的描述,还可以参见上文中的相关描述。

如此,可以得到第五特征向量。接着,在步骤s640,将上述第五特征向量输入第二分类网络中,得到针对上述第五实体的业务风险预测结果。需要理解,其中第二分类网络不同于上述第一分类网络,此处第二分类网络用于预测实体业务风险,而上述第一分类网络用于预测未知的业务上下游关系。并且,第二分类网络和第一分类网络所基于的神经网络算法可以相同,也可以不同。

步骤s650,基于上述业务风险预测结果和风险类别标签,训练上述第二图神经网络和第二分类网络,训练后的上述第二图神经网络和第二分类网络构成业务风险预测模型,用于预测未知的实体业务风险。

综上,在本说明书实施例披露的实体业务风险的预测方法中,通过上述构建的实体上下游图谱,引入与目标实体强相关的实体的数据,可以实现对目标实体的业务风险的精准预测,从而有效提高预测结果的准确度、可信度和可用性。

根据又一方面的实施例,与上述披露的方法相对应的,还提供以下几种装置。具体地,图7示出本说明书实施例披露的用于预测实体间业务关系的模型训练装置结构图。如图7所示,该训练装置700包括:

基础图谱获取单元710,配置为获取预先构建的基础关系图谱,其中至少包括对应于多个实体的多个实体节点,以及实体节点之间存在交互关系时形成的连接边;第一样本获取单元720,配置为基于上述多个实体中已知的实体间业务关系,获取多个训练样本,其中任意的第一训练样本包括第一实体、第二实体和对应的类别标签,该类别标签指示上述第一实体和上述第二实体之间的业务上下游关系;第一向量确定单元730,配置为通过利用第一图神经网络对上述基础关系图谱进行图嵌入处理,确定上述第一实体的第一特征向量和上述第二实体的第二特征向量;第一向量融合单元740,配置为对上述第一特征向量和第二特征向量进行融合处理,并将处理得到的融合向量输入第一分类网络中,得到分类预测结果;关系模型训练单元750,配置为基于上述分类预测结果和类别标签,训练上述第一图神经网络和上述第一分类网络,训练后的上述第一图神经网络和第一分类网络构成业务关系预测模型,用于预测未知的实体间业务关系。

在一个实施例中,上述多个实体所属的实体类别包括以下中的至少一种:企业类实体、机构类实体、商户类实体。

在一个实施例中,上述基础关系图谱中还包括对应于多个实体成员的多个成员节点,以及以下多种连接边中的至少一种:成员节点与实体节点之间存在关联关系时形成的连接边,成员节点之间存在交互关系时形成的连接边。

在一个实施例中,第一向量确定单元730包括:第一节点确定模块,配置为针对上述第一实体和第二实体中的每个实体,从上述基础关系图谱中,至少确定对应的实体节点与其若干邻居节点;第一向量确定模块,配置为至少将上述对应的实体节点和上述若干邻居节点的节点特征,输入上述第一图神经网络中,得到上述每个实体的特征向量。

在一个具体的实施例中,其中第一节点确定模块还配置为:确定上述对应的实体节点和上述若干邻居节点之间的若干连接边;其中第一向量确定模块具体配置为:将上述节点特征和上述若干连接边的边特征,输入上述第一图神经网络中,得到上述每个实体的特征向量。

在一个实施例中,上述类别标签指示上述第一实体是否为上述第二实体的上游实体;其中,第一向量融合单元740具体配置为:对上述第一特征向量和第二特征向量进行顺序拼接,并将得到的拼接向量输入上述第一分类网络中,得到上述分类预测结果。

图8示出根据一个实施例的实体业务关系图谱的构建装置结构图。如图8所示,该构建装置800包括:关系模型获取单元810,配置为获取业务关系预测模型,其上述训练装置700而得到,且包括上述训练后的第一图神经网络和第一分类网络;实体对确定单元820,配置为基于上述多个实体中未知的实体间业务关系,确定待预测业务关系的多个实体对,其中任意的第一实体对中包括第三实体和第四实体;第二向量确定单元830,配置为通过利用上述第一图神经网络对上述基础关系图谱进行图嵌入处理,确定上述第三实体的第三特征向量和上述第四实体的第四特征向量;第二向量融合单元840,配置为对上述第三特征向量和第四特征向量进行融合处理,并将处理得到的融合向量输入第一分类网络中,得到针对上述第一实体对的分类预测结果;关系图谱构建单元850,配置为基于上述多个实体中已知的实体间业务关系,以及得到的针对上述多个实体对的多个分类预测结果,构建实体业务关系图谱,用于表征上述多个实体之间的业务关系。

在一个实施例中,在上述基础关系图谱中,上述第三实体和第四实体所对应的两个实体节点是n阶之内的邻居,其中n为正整数。

在一个实施例中,第二向量融合单元840具体配置为:对上述第三特征向量和第四特征向量进行顺序拼接,并将得到的第一拼接向量输入上述第一分类网络中,得到针对上述第一实体对的第一分类预测结果,指示上述第三实体是否为上述第四实体的上游实体。

在一个具体的实施例中,其中关系图谱构建单元850具体配置为:在上述第一分类预测结果指示是的情况下,在上述实体业务关系图谱中建立,由上述第三实体所对应节点指向上述第四实体所对应节点的有向连接边。

在一个更具体的实施例中,上述第一分类预测结果中包括上述第三实体是上述第四实体的上游实体的置信度,其中关系图谱构建单元850还配置为:将上述置信度作为上述有向连接边的边特征。

在一个具体的实施例中,上述构建装置800还包括:关系预测单元860,配置为在上述第一分类预测结果指示否的情况下,对上述第四特征向量和第三特征向量进行顺序拼接,并将得到的第二拼接向量输入上述第一分类网络中,得到针对上述第一实体对的第二分类预测结果,指示上述第四实体是否为上述第三实体的上游实体。

图9示出根据一个实施例的实体业务风险的预测装置结构图。如图9所示,该预测装置900包括:

关系图谱获取单元910,配置为获取实体业务关系图谱,其基于上述构建装置800而得到,且用于表征多个实体之间的业务上下游关系;第二样本获取单元920,配置为基于上述多个实体中已知的业务风险数据,获取多个训练样本,其中任意的第二训练样本中包括第五实体和对应的风险类别标签;第三向量确定单元930,配置为通过利用第二图神经网络对上述实体业务关系图谱进行图嵌入处理,确定上述第五实体的第五特征向量;风险预测单元940,配置为将上述第五特征向量输入第二分类网络中,得到针对上述第五实体的业务风险预测结果;风险模型训练的单元950,配置为基于上述业务风险预测结果和风险类别标签,训练上述第二图神经网络和第二分类网络,训练后的上述第二图神经网络和第二分类网络构成业务风险预测模型,用于预测未知的实体业务风险。

在一个实施例中,上述实体业务关系图谱中包括对应于上述多个实体的多个实体节点,以及实体节点间存在业务上下游关系时形成的有向连接边,该有向连接边由上游实体指向下游实体。其中第三向量确定单元930包括:第二节点确定模块,配置为从上述实体业务关系图谱中,至少确定对应于上述第五实体的第五实体节点,以及对应于上述第五实体的若干上游实体的若干邻居节点;第二向量确定模块,配置为至少将该第五实体节点和上述若干邻居节点的节点特征,输入上述第二图神经网络中,得到上述第五特征向量。

在一个具体的实施例中,上述第二节点确定模块还配置为:确定上述第五实体节点与上述若干邻居节点之间的若干连接边,其中各条连接边的边特征中包括对应上下游业务关系的置信度;上述第二向量确定模块具体配置为:将上述节点特征和上述各条连接边的边特征,输入上述第二图神经网络中,得到上述第五特征向量。

根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2、图4或图6所描述的方法。

根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2、图4或图6所描述的方法。

本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1