风险识别方法及装置与流程

文档序号:16267734发布日期:2018-12-14 22:02阅读:226来源:国知局
风险识别方法及装置与流程
本发明涉及机器学习领域,尤其涉及一种基于机器学习的风险识别系统与方法。
背景技术
随着互联网和移动通讯技术的快速发展,网上交易呈现爆发式增长,线上渠道给客户带来了巨大便利,同时线上欺诈风险也急速加剧。当前欺诈风险识别系统主要通过业务规则引擎和模型引擎相结合的手段进行评估。但是,目前模型引擎主要基于个体行为和属性,如单个客户或账户的交易行为、单个客户的画像信息。随着大数据不断增长,以及数据内部依赖、复杂程度的不断增加,网络关系无处不在,如个人社交网络、交通网络、企业关系网、账户交易网络、个人信息网络。个体的行为和属性已经难以表达数据内部隐藏的特征,如账户a和b预留了同一个手机号,如果a为风险客户,仅考虑b的个体行为很难发现其为风险客户。因此,目前基于个体行为和属性的欺诈风险识别系统,明显存在较大风险隐患。而个体之间的各种网络关系又极其复杂,信息量非常大,现有信息系统无法完成,人工处理更是不可能完成。技术实现要素:为了解决现有交易中欺诈风险的识别问题,本发明提出了一种风险识别方法及装置,以提高欺诈风险的识别能力。本发明实施例的一种风险识别方法,包括:获取客户的基础数据和账户的基础数据,所述基础数据包括基本属性和行为数据;根据所述客户的基础数据和账户的基础数据构建金融交易关系网络,所述金融交易关系网络为基于图的数据结构,包括:节点、边,所述节点为所述基础数据中的实体,所述边为所述节点间的所述实体的关系;根据金融交易关系网络及所述节点的类型,定义多个元路径模式;根据所述多个元路径模式及所述属性基础数据,计算所述目标实体在金融交易关系网络中的特征表示;根据所述关系网络以及样本数据,形成训练数据集;根据所述训练数据集,使用机器学习法训练并确定风险评估模型;计算查询对象的特征表示、所述风险评估模型,计算所述查询对象的风险评分。进一步的,所述获取客户的基础数据和账户的基础数据的步骤之后,包括:清洗所述客户的基础数据和账户的基础数据。进一步的,所述金融交易关系网络采用图计算引擎计算获得,并采用图数据库或关系型数据库存储,所述图计算引擎包括graphx,所述图数据库包括neo4j。进一步的,所述元路径模式包括:账户-客户-账户模式、账户-客户-手机号-客户-账户模式、账户-客户-地址-客户-账户模式、账户-ip-账户模式、账户-设备-账户模式、账户-账户模式。进一步的,所述根据所述多个元路径模式及所述属性基础数据,计算所述目标实体在金融交易关系网络中的特征表示,包括:根据所述多个元路径模式及所述属性基础数据,计算图关系特征表示、图结构特征表示、个性特征表示;汇总所述图关系特征表示、图结构特征表示、个性特征表示,生成所述目标实体在金融交易关系网络中的特征表示。进一步的,所述根据所述多个元路径模式及所述属性基础数据,计算图关系特征表示、图结构特征表示、个性特征表示的步骤包括:计算每个所述节点与已知所有风险节点在所述多个元路径模式下的相似性度量,确定其中最大值作为所述图关系特征表示,相似性度量计算方法包括:pathsim相似性、余弦相似性、euclidean距离、pearson相关系数。进一步的,所述根据所述多个元路径模式及所述属性基础数据,计算图关系特征表示、图结构特征表示、个性特征表示的步骤包括:计算每个所述节点在所述金融交易关系网络中的度中心性、聚集系数作为所述图结构特征表示。进一步的,所述根据所述多个元路径模式及所述属性基础数据,计算图关系特征表示、图结构特征表示、个性特征表示的步骤包括:确定每个所述节点的行为信息、属性信息作为个性特征表示,所述行为信息包括:某段时间的最大交易额、最小交易额,所述属性信息包括:是否为贵金属客户、是否为理财金账户、是否为代发工资客户、性别、年龄、开户时长。进一步的,所述根据所述训练数据集,使用机器学习法训练并确定风险评估模型的步骤中,所述机器学习法包括:梯度提升决策树算法、逻辑回归算法、随机森林算法、神经网络算法。为了达到上述目的,本发明实施例还提出了一种风险识别装置,包括:基础数据获取模块,用于获取客户的基础数据和账户的基础数据,所述基础数据包括基本属性和行为数据;网络构建模块,用于根据所述客户的基础数据和账户的基础数据构建金融交易关系网络,所述金融交易关系网络为基于图的数据结构,包括:节点、边,所述节点为所述基础数据中的实体,所述边为所述节点间的所述实体的关系;元路径定义模块,用于根据金融交易关系网络及所述节点的类型,定义多个元路径模式;特征表示计算模块,用于根据所述多个元路径模式及所述属性基础数据,计算所述目标实体在金融交易关系网络中的特征表示;数据集形成模块,用于根据所述关系网络以及样本数据,形成训练数据集;评估模型确定模块,用于根据所述训练数据集,使用机器学习法训练并确定风险评估模型;风险评分计算模块,用于计算查询对象的特征表示、所述风险评估模型,计算所述查询对象的风险评分。进一步的,还包括:数据清洗模块,用于清洗所述客户的基础数据和账户的基础数据。进一步的,所述网络构建模块的所述金融交易关系网络采用图计算引擎计算获得,并采用图数据库或关系型数据库存储,所述图计算引擎包括graphx,所述图数据库包括neo4j。进一步的,所述元路径定义模块的所述元路径模式包括:账户-客户-账户模式、账户-客户-手机号-客户-账户模式、账户-客户-地址-客户-账户模式、账户-ip-账户模式、账户-设备-账户模式、账户-账户模式。进一步的,所述特征表示计算模块,包括:特征表示计算单元,用于根据所述多个元路径模式及所述属性基础数据,计算图关系特征表示、图结构特征表示、个性特征表示;特征表示汇总单元,用于汇总所述图关系特征表示、图结构特征表示、个性特征表示,生成所述目标实体在金融交易关系网络中的特征表示。进一步的,所述特征表示计算单元包括:图关系特征表示计算单元,用于计算每个所述节点与已知所有风险节点在所述多个元路径模式下的相似性度量,确定其中最大值作为所述图关系特征表示,相似性度量计算方法包括:pathsim相似性、余弦相似性、euclidean距离、pearson相关系数。进一步的,所述特征表示计算单元包括:图结构特征表示计算单元,用于计算每个所述节点在所述金融交易关系网络中的度中心性、聚集系数作为所述图结构特征表示。进一步的,所述特征表示计算单元包括:个性特征确定单元,用于确定每个所述节点的行为信息、属性信息作为个性特征表示,所述行为信息包括:某段时间的最大交易额、最小交易额,所述属性信息包括:是否为贵金属客户、是否为理财金账户、是否为代发工资客户、性别、年龄、开户时长。进一步的,所述评估模型确定模块的所述机器学习法包括:梯度提升决策树算法、逻辑回归算法、随机森林算法、神经网络算法。为了达到上述目的,本发明实施例还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取客户的基础数据和账户的基础数据,所述基础数据包括基本属性和行为数据;根据所述客户的基础数据和账户的基础数据构建金融交易关系网络,所述金融交易关系网络为基于图的数据结构,包括:节点、边,所述节点为所述基础数据中的实体,所述边为所述节点间的所述实体的关系;根据金融交易关系网络及所述节点的类型,定义多个元路径模式;根据所述多个元路径模式及所述属性基础数据,计算所述目标实体在金融交易关系网络中的特征表示;根据所述关系网络以及样本数据,形成训练数据集;根据所述训练数据集,使用机器学习法训练并确定风险评估模型;计算查询对象的特征表示、所述风险评估模型,计算所述查询对象的风险评分。为了达到上述目的,本发明实施例还提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取客户的基础数据和账户的基础数据,所述基础数据包括基本属性和行为数据;根据所述客户的基础数据和账户的基础数据构建金融交易关系网络,所述金融交易关系网络为基于图的数据结构,包括:节点、边,所述节点为所述基础数据中的实体,所述边为所述节点间的所述实体的关系;根据金融交易关系网络及所述节点的类型,定义多个元路径模式;根据所述多个元路径模式及所述属性基础数据,计算所述目标实体在金融交易关系网络中的特征表示;根据所述关系网络特征向量以及样本数据,形成训练数据集;根据所述训练数据集,使用机器学习法训练并确定风险评估模型;计算查询对象的特征表示、所述风险评估模型,计算所述查询对象的风险评分。本发明实施例的风险识别方法及装置的技术效果在于,通过从金融交易关系网络中抽取网络图关系特征、图结构特征及节点和边本身的个体特征,将识别对象放在一个关系网络中全方位挖掘其潜在的风险特征,并通过机器学习方法进行建模训练,从而可以大大提高欺诈风险的识别能力,可以更有效防范欺诈行为,提高反欺诈风险防控识别准确率,降低误报率,保障客户资金安全,提高企业的风险管理水平。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例的风险识别方法的步骤流程图。图2为本发明实施例的金融交易关系网络的示意图。图3为本发明实施例的元路径模式为ada下对应的子图的示意图。图4为本发明实施例的风险识别装置的结构示意图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域相关技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护的范围。根据本发明的实施方式,提出了一种风险识别方法及装置,具体的讲是一种基于机器学习的风险识别方法及装置。图1为本发明实施例的风险识别方法的步骤流程图,参照图1,本实施例的风险识别方法,包括:s100,获取客户的基础数据和账户的基础数据,所述基础数据包括基本属性和行为数据;s200,根据所述客户的基础数据和账户的基础数据构建金融交易关系网络,所述金融交易关系网络为基于图的数据结构,包括:节点、边,所述节点为所述基础数据中的实体,所述边为所述节点间的所述实体的关系;s300,根据金融交易关系网络及所述节点的类型,定义多个元路径模式;s400,根据所述多个元路径模式及所述属性基础数据,计算所述目标实体在金融交易关系网络中的特征表示;s500,根据所述关系网络以及样本数据,形成训练数据集;s600,根据所述训练数据集,使用机器学习法训练并确定风险评估模型;s700,计算查询对象的特征表示、所述风险评估模型,计算所述查询对象的风险评分。在步骤s100中,获取客户的基础数据和账户的基础数据,基础数据包括基本属性和行为数据。该步骤所获取的基础数据包括但不限于对象行为数据、属性信息及对象之间的关系数据以及与业务相关的数据,如已知欺诈风险名单。在具体实施过程中,可以在此步骤后,对获取的基础数据进行清洗,以筛选可靠、可利用的基础数据。在步骤s200中,根据所述客户的基础数据和账户的基础数据构建金融交易关系网络,所述金融交易关系网络为基于图的数据结构,包括:节点、边,所述节点为所述基础数据中的实体,所述边为所述节点间的所述实体的关系。基于在步骤s100获取客户的基础数据和账户的基础数据,本步骤中构建金融交易关系网络,生成各种类型的节点、边的文件,该节点为数据实体,边为实体与实体之间的关系,节点和边都可以拥有自己的属性,不同的实体可以通过各种不同的关系关联起来。本质上金融交易关系网络,是一个基于图的数据结构,在具体实施过程中,可以采用图数据库如neo4j或图计算引擎如graphx进行存储和计算,该数据库(或计算引擎)适合处理复杂的关系网络。根据账户及客户的行为数据以及客户的属性信息等,金融交易关系网络的节点可以抽象多种不同类型实体,包括账户、客户、手机号、ip、设备号、地址等。同时,金融交易关系网络的边也可以抽象多种不同的关系,如客户拥有某个账户、某个账户通过某个ip进行过登陆操作、某个客户预留了某个手机号等。根据抽象出的实体及关系,加载到图数据库或图计算引擎中,形成账户的关系网络。图2为本发明实施例的金融交易关系网络的示意图,在图2中,圆圈代表节点,圆圈之间的连线代表边,其中圆圈内的英文字母代表实体类型,其中a为账户类型、c为客户类型、m为手机号类型,n为ip地址类型,d为设备类型,p为地址类型。在图2中,a2与a3相连,表示账户2与账户3之间存在过转账关系;c1与m1相连,表示客户1的预留了手机号1;a1与n1相连,表示账户1曾在该ip地址进行过操作,其他关联关系以此类推。在该关系网络中,节点和边都可以拥有属性,如客户类型节点的属性可以包括但不限于性别、年龄、是否为待发工资客户、是否为理财金客户等客户基本信息及画像信息,账户与账户关系的属性可以包括但不限于转账金额、时间、渠道等,账户与设备关系的属性可以包括但不限于登陆次数等。在步骤s300中,根据金融交易关系网络及所述节点的类型,定义多个元路径模式。该步骤中,元路径模式是指多个节点之间的关系模式,以账户的关系网络为例,本实施例总共定义了aca、acmca、acpca、ana、ada、aa六种元路径模式,即账户-客户-账户模式、账户-客户-手机号-客户-账户模式、账户-客户-地址-客户-账户模式、账户-ip-账户模式、账户-设备-账户模式、账户-账户模式。如a1-c1-a2为aca模式,表示账户1与账户2都属于客户1,a1-d2-a2为ada模式,表示账户1与账户2都曾用设备号2进行过操作。类似定义的元路径模式及意义,可由本领域技术人员类推得到,在此不再一一列举。在步骤s400中,根据所述多个元路径模式及所述属性基础数据,计算所述目标实体在金融交易关系网络中的特征表示。从不同维度计算目标对象的特征向量,特征可以包括但不限于图的关系特征,图的结构特征和图的个体特征。图关系特征反映了节点与已知风险节点的关联信息,例如与已知风险节点共用同一个手机号的节点,其为风险节点的概率会大;图结构特征反映了节点的结构信息,例如风险节点其设备类型的节点个数较多,符合该结构特点的其他节点风险概率也较大;图的个体特征反映了节点个体的行为和属性。图的个体特征包括客户的年龄、是否代发工资客户、某段时间内登陆融e行的次数等,这反映了个体的行为和属性。本步骤中,基于关系网络的特征计算,具体为图关系特征的计算,图结构特征的计算和其他个体特征的分析统计。具体实施依赖于计算引擎可以包括但不局限于graphx、graphlab等图计算引擎及mapreduce等其他计算引擎。在步骤s500中,根据所述关系网络特征向量以及样本数据,形成训练数据集。在本发明实施例中,样本数据包括正样本和负样本,其中,正样本可以是经业务核实的欺诈风险账户,负样本可以是其他账户。依据步骤s400特征表示的计算方法,计算每个账户的特征,形成欺诈风险识别模型的训练数据集。在步骤s600中,根据所述训练数据集,使用机器学习法训练并确定风险评估模型。在具体实施过程中,机器学习方法包括但不限于梯度提升决策树算法(gbdt)、逻辑回归算法(lr)、随机森林算法、神经网络算法等。本发明尝试了多种方法,其中优选的为梯度提升决策树算法。在具体实施过程中,在通过步骤s500获取到训练数据集后,使用机器学习方法训练模型,目前,用于机器学习的框架或工具很多,包括h2o、sparkmllib、pythonscikit-learn等,本实施例使用了h2o,将训练数据按照要求的格式导入到h2o,选择适合的机器学习分类器,并调整参数参数,待f1、准确率、召回率等评估指标达到预设的目标时,形成最终的模型。在步骤s700中,计算查询对象的特征表示、所述风险评估模型,计算所述查询对象的风险评分。根据待查询的对象及其特征数据,输入到训练好的风险评估模型进行风险评分的有效的预测,即可得到查询对象的风险评分。其中,有效的预测是指根据业务实际情况制定规则,本实施例中有效的预测指的是规定时长内的预测结果。本实施例中,可以根据生成的特征向量及生成的风险评估模型,预测待查询对象的风险评分,该风险评分为0-1之间的一个概率值。该风险评分仅用于表征待查询对象的发生风险概率。例如,对于一个账户的风险评分,其模型预测的评分越高,其为风险账户的概率越大,反之模型预测的评分越低,其为风险账户的概率越小。本实施例的风险识别方法,克服了目前模型引擎主要基于个体行为和属性难以表达数据内部隐藏的特征,很难挖掘潜在风险的问题,在考虑账户本身的行为及属性特征的基础上,基于风险评价关系网络,从其中抽取网络图的关系特征、结构特征及节点和边本身的个体特征,将实体放在一个关系网络中,充分挖掘账户在关系网络中的图特征,丰富了账户的特征信息,提升反欺诈风险防控模型的准确率,降低误报率,保障客户资金安全。在具体实施过程中,步骤s400根据所述多个元路径模式及所述属性基础数据,计算所述目标实体在金融交易关系网络中的特征表示,包括:根据所述多个元路径模式及所述属性基础数据,计算图关系特征表示、图结构特征表示、个性特征表示;汇总所述图关系特征表示、图结构特征表示、个性特征表示,生成所述目标实体在金融交易关系网络中的特征表示。根据所述多个元路径模式及所述属性基础数据,计算图关系特征表示、图结构特征表示、个性特征表示的步骤包括:计算每个所述节点与已知所有风险节点在所述多个元路径模式下的相似性度量,确定其中最大值作为所述图关系特征表示,相似性度量计算方法包括:pathsim相似性、余弦相似性、euclidean距离、pearson相关系数,图关系特征表示是计算账户型节点与已知欺诈账户的相似性度量。首先,计算各节点与已知所有风险节点在各元路径模式下的相似性度量,然后统计其最大值,作为关系特征向量。在本发明实施例中,根据元路径模式构建不同子图,并分别在子图上计算账户类型节点与已知风险节点的相似性度量,统计其最大值作为关系特征向量。相似性度量计算方法包括但不限于pathsim相似性(公式1)、余弦相似性、euclidean距离、pearson相关系数。本实施例中,其中,px->y表示x、y之间的路径实例数,px->x表示x、x之间的路径实例数,py->y表示y、y之间的路径实例数。图3为本发明实施例的元路径模式为ada下对应的子图的示意图。如图3所示,边上的数字为边的属性值,实心圆圈代表已知风险节点,空心圆圈代表未知风险节点,并以共轭矩阵表示。根据图3所示账户a2、a4、a5、a6为风险节点,a1、a3为未知节点,图3的共轭矩阵表示如表1所示。表1d1d2d3d4a110100a29000a30010a40005a501010a60004根据上述共轭矩阵,依次计算每个账户类型节点(i)与已知风险节点(j)的相似性其中l1为未知风险节点集合、l2为已知风险节点集合。那么账户1与已知所有风险节点的pathsim度量分别为:其最大度量为按此计算账户3的最大度量这反映了账户1与风险节点的距离更近,其为风险节点的概率更大,风险节点的关系特征默认为1。本实施例中选取了6种元路径模式,因此一个账户可以表示为6维的特征向量(τ1,τ2,...,τ6)。在具体实施过程中,计算得到图关系特征表示后,图结构特征表示是通过计算每个所述节点在所述金融交易关系网络中的度中心性、聚集系数得到的。图结构特征表示反映了节点在关系网络中结构特性。其中,度中心特征包括一阶邻居的度数、二阶邻居的度数,本实例根据定义的6种元路径模式单独计算每个节点的邻居度数及全模式下的邻居度数,那么每个账户可表示为14维的特征向量(ξ1,ξ2,...,ξ14)。例如账户登录的设备越多,其欺诈风险的概率越大;手机号对应的账户越多,说明与其关联的账户的欺诈概率越大,由此可见度可以反映账户的欺诈概率。本实例仅选取了度中心性特征,也可以通过中介中心性、接近中心性来表示其为欺诈的概率。聚集系数反映节点在关系网络中稳定性,如账户1与账户2之间有关系,账户2与账户3也有关系,如果账户1给账户3转账欺诈概率较小,因其聚集系数高。聚集系数的计算见公式2。本实例根据所定义的6种元路径模式分别计算每个节点的聚集系数,及全模式下的聚集系数,每个账户表示为7维的特征向量(ξ15,ξ16,...,ξ21)。其中,全模式指的是6种元路径模式下的并集。其中,ni表示与节点i直接相邻的节点个数。节点在金融交易关系网络中的结构特征,可以包括但不限于度中心性特征、聚集系数等。本实施例中计算了账户类型的节点在其关系网络中的度中心性、聚集系数等结构特征。度中心性可以反映账户欺诈风险的概率,例如账户登录的设备越多,其欺诈风险的概率越大;手机号对应的账户越多,说明与其关联的账户的欺诈概率越大。本实例仅选取了度中心性特征,也可以通过中介中心性、接近中心性来表示其为欺诈的概率。聚集系数反映了节点在关系网络中稳定性,如账户1与账户2之间有关系,账户2与账户3也有关系,如果账户1给账户3转账欺诈概率较小,因其聚集系数高。在具体实施过程中,计算得到图结构特征表示后,确定每个所述节点的行为信息、属性信息作为个性特征表示,该个性特征表示用于反映个体的行为及属性信息,包括节点的属性和边的属性。所述行为信息包括:某段时间的最大交易额、最小交易额,所述属性信息包括:是否为贵金属客户、是否为理财金账户、是否为代发工资客户、性别、年龄、开户时长。在计算时,将其归一化形成(θ1,θ2,....,θn)。其中,个性特征表示分为连续特征和离散特征两种。如某段时间的最大交易金额、开户时长等属于连续特征,通过取log的方式进行归一化处理;离散特征按照其取值拆分成多个“0/1”变量,如性别,可拆分为女、男两个特征,年龄可拆成[0,10),[11,20),[20,30),[30,40)...多个特征。在统计交易金额等特征时,采用了时间窗口统计特征的方法,如:样本时间为t日,依次计算t日与t-1的交易金额之差tmdt、t-1与t-2的交易金额之差tmdt-1、t-n+1与t-n的交易金额之差tmdt-n+1,最后统计作为个体行为特征变量之一。在上述分别计算图关系特征表示、图结构特征表示、个性特征表示后,汇总图关系特征表示、图结构特征表示、个性特征表示,生成所述目标实体在金融交易关系网络中的特征表示。以上述图关系特征表示(τ1,τ2,...,τ6)、图结构特征表示(ξ1...,ξ21)、个性特征表示(θ1,...θn),汇总后形成的金融交易关系网络的特征表示为(τ1,τ2,...,τ6,ξ1...,ξ21,θ1,...θn)。本发明实施例的风险识别方法及装置的技术效果在于,通过从金融交易关系网络中抽取网络图关系特征、图结构特征及节点和边本身的个体特征,将识别对象放在一个关系网络中全方位挖掘其潜在的风险特征,并通过机器学习方法进行建模训练,从而可以大大提高欺诈风险的识别能力,可以更有效防范欺诈行为,提高反欺诈风险防控识别准确率,降低误报率,保障客户资金安全,提高企业的风险管理水平。在介绍了本发明实施例的风险识别方法之后,接下来,对本发明实施例的风险识别装置进行介绍。该装置的实施可以参见上述方法的实施,重复之处不再赘述。以下所使用的术语“模块”、“单元”,可以是实现预定功能的软件和/或硬件。图4为本发明实施例的风险识别装置的结构示意图,如图4所示,本发明实施例的风险识别装置,包括:基础数据获取模块100,用于获取客户的基础数据和账户的基础数据,所述基础数据包括基本属性和行为数据;关系网络构建模块200,用于根据所述客户的基础数据和账户的基础数据构建金融交易关系网络,所述金融交易关系网络为基于图的数据结构,包括:节点、边,所述节点为所述基础数据中的实体,所述边为所述节点间的所述实体的关系;元路径定义模块300,用于根据金融交易关系网络及所述节点的类型,定义多个元路径模式;特征表示计算模块400,用于根据所述多个元路径模式及所述属性基础数据,计算所述目标实体在金融交易关系网络中的特征表示;数据集形成模块500,用于根据所述关系网络以及样本数据,形成训练数据集;评估模型确定模块600,用于根据所述训练数据集,使用机器学习法训练并确定风险评估模型;风险评分计算模块700,用于计算查询对象的特征表示、所述风险评估模型,计算所述查询对象的风险评分。在具体实施过程中,本实施例的风险识别装置还包括:数据清洗模块,用于清洗所述客户的基础数据和账户的基础数据。在具体实施过程中,本实施例的风险识别装置的网络构建模块的所述金融交易关系网络采用图计算引擎计算获得,并采用图数据库或关系型数据库存储,所述图计算引擎包括graphx,所述数据库包括neo4j。具体实施过程中,可以设置存储单元,用于数据存储,主要存储关系网络、所有目标对象及其计算出的各维度的特征和模型的预测值,存储方式可以包括但不限于图数据库或其他关系型数据库。在具体实施过程中,本实施例的风险识别装置的元路径定义模块的所述元路径模式包括:账户-客户-账户模式、账户-客户-手机号-客户-账户模式、账户-客户-地址-客户-账户模式、账户-ip-账户模式、账户-设备-账户模式、账户-账户模式。在具体实施过程中,本实施例的风险识别装置的特征表示计算模块,包括:特征表示计算单元,用于根据所述多个元路径模式及所述属性基础数据,计算图关系特征表示、图结构特征表示、个性特征表示;特征表示汇总单元,用于汇总所述图关系特征表示、图结构特征表示、个性特征表示,生成所述目标实体在金融交易关系网络中的特征表示。在具体实施过程中,本实施例的风险识别装置的特征表示计算单元包括:图关系特征表示计算单元,用于计算每个所述节点与已知所有风险节点在所述多个元路径模式下的相似性度量,确定其中最大值作为所述图关系特征表示,相似性度量计算方法包括:pathsim相似性、余弦相似性、euclidean距离、pearson相关系数。在具体实施过程中,本实施例的风险识别装置的特征表示计算单元包括:图结构特征表示计算单元,用于计算每个所述节点在所述金融交易关系网络中的度中心性、聚集系数作为所述图结构特征表示。在具体实施过程中,本实施例的风险识别装置的特征表示计算单元包括:个性特征确定单元,用于确定每个所述节点的行为信息、属性信息作为个性特征表示,所述行为信息包括:某段时间的最大交易额、最小交易额,所述属性信息包括:是否为贵金属客户、是否为理财金账户、是否为代发工资客户、性别、年龄、开户时长。在具体实施过程中,本实施例的风险识别装置的评估模型确定模块的所述机器学习法包括:梯度提升决策树算法、逻辑回归算法、随机森林算法、神经网络算法。本发明实施例还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取客户的基础数据和账户的基础数据,所述基础数据包括基本属性和行为数据;根据所述客户的基础数据和账户的基础数据构建金融交易关系网络,所述金融交易关系网络为基于图的数据结构,包括:节点、边,所述节点为所述基础数据中的实体,所述边为所述节点间的所述实体的关系;根据金融交易关系网络及所述节点的类型,定义多个元路径模式;根据所述多个元路径模式及所述属性基础数据,计算所述目标实体在金融交易关系网络中的特征表示;根据所述关系网络以及样本数据,形成训练数据集;根据所述训练数据集,使用机器学习法训练并确定风险评估模型;计算查询对象的特征表示、所述风险评估模型,计算所述查询对象的风险评分。本发明实施例还提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取客户的基础数据和账户的基础数据,所述基础数据包括基本属性和行为数据;根据所述客户的基础数据和账户的基础数据构建金融交易关系网络,所述金融交易关系网络为基于图的数据结构,包括:节点、边,所述节点为所述基础数据中的实体,所述边为所述节点间的所述实体的关系;根据金融交易关系网络及所述节点的类型,定义多个元路径模式;根据所述多个元路径模式及所述属性基础数据,计算所述目标实体在金融交易关系网络中的特征表示;根据所述关系网络以及样本数据,形成训练数据集;根据所述训练数据集,使用机器学习法训练并确定风险评估模型;计算查询对象的特征表示、所述风险评估模型,计算所述查询对象的风险评分。本发明实施例的风险识别系统与方法,克服了目前模型引擎主要基于个体行为和属性难以表达数据内部隐藏的特征,很难挖掘潜在风险的问题,在考虑账户本身的行为及属性特征的基础上,基于金融交易关系网络,通过从其中抽取网络图的关系特征、结构特征及节点和边本身的个体特征,将实体放在一个关系网络中,充分挖掘账户在关系网络中的图特征,丰富了账户的特征信息,提升反欺诈风险防控模型的准确率,降低误报率,保障客户资金安全。以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1