一种风险信息识别、确定、模型训练方法及装置与流程

文档序号:21699326发布日期:2020-07-31 22:59阅读:302来源:国知局
一种风险信息识别、确定、模型训练方法及装置与流程

本发明涉及数据处理技术领域,尤其涉及一种风险信息识别、确定、模型训练方法及装置。



背景技术:

随着互联网金融行业的迅速扩大,各类信贷产品的消费群体范围日益增长。银行、金融机构、保险等行业每年都会因为各种各样的欺诈行为导致巨额损失。因此不论是传统金融机构,还是新兴的互联网金融企业,都要面临如何更高效的筛选客户和预防欺诈行为,在这种情况下金融反欺诈服务市场应运而生。而团体欺诈由于具备较高的危害性,成为反欺诈领域的重要研究对象。

目前国内做反欺诈的厂商主要有两大类,一类是风控平台(如百融,同盾),通过第三方渠道获取数据,积累丰富的黑名单库,以此作为反欺诈的基础。另一类是类似于互联网公司,利用自身体系以及数据的优势进行反欺诈。

传统的反欺诈方法主要围绕着以下三部分进行,如图1所示:

以终端为中心:分析用户的终端设备;以用户行为为中心:分析可疑网络行为;以账户为中心:进行逻辑对应关系检验,分析用户的异常信息。

综上,现有技术的反欺诈策略为:通过企业采用的“黑白名单”进行欺诈预防或者基于规则的防范机制进行预防,因此现有的反欺诈策略无法做到预先进行风险评估,对于欺诈行为无法有效识别。



技术实现要素:

本发明实施例提供一种风险信息识别、确定、模型训练方法及装置,以解决现有技术中反欺诈策略无法做到预先进行风险评估,对于欺诈行为无法有效识别的问题。

为了解决上述问题,本发明实施例是这样实现的:

第一方面,本发明实施例提供一种风险信息识别方法,包括:

获取用户的数据信息;

根据数据信息确定用户间的关联关系并生成信息识别网络;

根据信息识别网络确定至少一个目标团体以及与目标团体对应的第一风险评估指标,以在获取到目标用户时,根据目标用户与目标团体的匹配结果,确定目标用户所对应的风险评估指标。

第二方面,本发明实施例提供一种风险信息确定方法,应用于上述的风险信息识别方法,包括:

获取目标用户的数据信息;

确定与目标用户的数据信息中的第一数据匹配的第一目标团体;

获取第一数据对应的第一权重以及第一目标团体对应的第一风险评估指标;

根据第一权重与第一风险评估指标,确定目标用户对应的风险评估指标。

第三方面,本发明实施例提供一种风险信息识别模型训练方法,包括:

获取用户的数据信息;

根据数据信息确定用户间的关联关系并生成信息识别网络;

根据信息识别网络确定至少一个目标团体以及与目标团体对应的第一风险评估指标;

利用目标用户与目标团体对应的第一风险评估指标训练风险信息识别模型。

第四方面,本发明实施例提供一种风险信息识别装置,包括:

第一获取模块,用于获取用户的数据信息;

第一生成模块,用于根据数据信息确定用户间的关联关系并生成信息识别网络;

第一确定模块,用于根据信息识别网络确定至少一个目标团体以及与目标团体对应的第一风险评估指标,以在获取到目标用户时,根据目标用户与目标团体的匹配结果,确定目标用户所对应的风险评估指标。

第五方面,本发明实施例提供一种风险信息确定装置,应用于上述的风险信息识别装置,包括:

第二获取模块,用于获取所述目标用户的数据信息;

第二确定模块,用于确定与所述目标用户的数据信息中的第一数据匹配的第一目标团体;

第三获取模块,用于获取所述第一数据对应的第一权重以及所述第一目标团体对应的第一风险评估指标;

第三确定模块,用于根据所述第一权重与所述第一风险评估指标,确定所述目标用户对应的风险评估指标。

第六方面,本发明实施例提供一种风险信息识别模型训练装置,包括:

第四获取模块,获取用户的数据信息;

第二生成模块,用于根据数据信息确定用户间的关联关系并生成信息识别网络;

第四确定模块,用于根据信息识别网络确定至少一个目标团体以及与目标团体对应的第一风险评估指标;

训练模块,用于利用目标用户与目标团体对应的第一风险评估指标训练风险信息识别模型。

第七方面,本发明实施例还提供一种电子设备,包括处理器、存储器及存储在所述存储器上并可在处理器上运行的程序,

处理器,用于读取存储器中的程序实现上述风险信息识别方法中的步骤;或者实现上述风险信息确定方法中的步骤;或者实现上述风险信息识别模型训练方法中的步骤。

第八方面,本发明实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述风险信息识别方法中的步骤;或者实现上述风险信息确定方法中的步骤;或者实现上述风险信息识别模型训练方法中的步骤。

本发明技术方案,通过获取用户的数据信息,根据数据信息确定用户间的关联关系并生成信息识别网络,依据信息识别网络确定至少一个目标团体以及对应的第一风险评估指标,以在获取到目标用户时,根据目标用户与目标团体的匹配结果,确定目标用户所对应的风险评估指标,可以实现通过分团的方式实时进行风险评估,预先对欺诈行为进行识别,保证风险识别的有效性。

附图说明

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1表示现有技术反欺诈策略对应的示意图;

图2表示本发明实施例风险信息识别方法示意图;

图3表示本发明实施例风险信息确定方法示意图;

图4表示本发明实施例风险信息识别模型训练方法示意图;

图5表示本发明实施例风险信息识别、确定、模型训练方法的架构图;

图6表示本发明实施例提供的风险信息识别装置的结构图;

图7表示本发明实施例提供的风险信息确定装置的结构图;

图8表示本发明实施例提供的风险信息识别模型训练装置的结构图;

图9表示本发明又一实施例提供的风险信息识别装置的结构图;

图10表示本发明又一实施例提供的风险信息确定装置的结构图;

图11表示本发明又一实施例提供的风险信息识别模型训练装置的结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供一种风险信息识别方法,如图2所示,包括:

步骤201、获取用户的数据信息。

本发明实施例的风险信息识别方法在获取数据信息时,需要在用户授权的前提下进行数据采集,获取多个用户的数据信息,也可以直接接入第三方数据源,获取多个用户的数据信息。

步骤202、根据数据信息确定用户间的关联关系并生成信息识别网络。

在获取多个用户的数据信息之后,可以根据所获取的数据信息,确定用户之间的关联关系,根据所确定的关联关系以及数据信息生成信息识别网络。

步骤203、根据信息识别网络确定至少一个目标团体以及与目标团体对应的第一风险评估指标,以在获取到目标用户时,根据目标用户与目标团体的匹配结果,确定目标用户所对应的风险评估指标。

在生成信息识别网络之后,可以根据信息识别网络构建至少一个目标团体,并根据信息识别网络确定每个目标团体所对应的第一风险评估指标。在针对目标团体确定对应的第一风险评估指标之后,在目标用户(新用户)进入之后,可以将目标用户与各个目标团体进行匹配,确定与目标用户相匹配的一目标团体,然后根据与目标用户相匹配的目标团体的第一风险评估指标,确定目标用户所对应的风险评估指标。

上述实施过程,通过预计算提前将用户进行分团处理,并且确定目标团体所对应的第一风险评估指标,将实时进来的目标用户与目标团体进行匹配,根据匹配的目标团体实时判断目标用户的风险度,可以预先对欺诈行为进行识别,保证风险识别的有效性。

可选的,在本发明一实施例中,数据信息包括以下信息中的至少一项:用户所使用的电子设备的号码信息、用户的身份信息、电子设备的标识信息、电子设备的ip(internetprotocol,网际互连协议)地址、电子设备所连接的wifi(wirelessfidelity,无线局域网)信息、用户的地理位置信息、用户的社交信息;其中用户的社交信息至少包括:用户的联系人信息和与联系人的交互内容。

在获取用户的数据信息时,需要获取以下数据中的至少一项:用户所使用的电子设备的号码信息、用户的身份信息、电子设备的标识信息、电子设备的ip地址、电子设备所连接的wifi信息、用户的地理位置信息、用户的社交信息。

其中,通过各用户所使用的电子设备的号码信息,可以查找到用户之间的关联,如用户a在完善个人信息的过程中,在紧急联系人中填写了用户b的号码信息,则可以根据号码信息确定两用户之间存在关联。通过各用户的身份信息,可以查找到用户之间的关联,如用户a和用户b均为欺诈团伙的成员,则根据身份信息可以确定两者之间存在关联。通过电子设备的标识信息,可以查找到用户之间的关联,如用户a和用户b所使用的电子设备均为黑名单设备,则可以确定两者之间存在关联。电子设备的ip地址用于对电子设备进行标识,通过各电子设备的公网ip,可以查找到用户之间的关联,如同一时段内用户a的电子设备和用户b的电子设备所对应的公网ip相同,则表明用户a的电子设备和用户b的电子设备位于同一局域网内,则可以确定两者之间存在关联。通过电子设备所连接的wifi信息,可以查找到用户之间的关联,如根据电子设备所连接的wifi信息可以生成wifi列表,若用户a和用户b的wifi列表中均存在第一wifi信息,则可以确定两者之间存在关联。通过用户的地理位置信息,可以查找到用户之间的关联,如用户a和用户b位于同一地理位置,则可以确定两者之间存在关联。通过用户的社交信息,可以查找到用户之间的关联,如用户a存在于用户b的通讯录中,则可以确定两者之间存在关联。其中,数据信息不局限于上述信息,还可以包括其他类型的信息,这里不再一一阐述。

可选的,在本发明一实施例中,根据数据信息确定用户间的关联关系并生成信息识别网络,包括:

将多个用户所对应的数据信息存储至图数据库中;

根据多个用户的数据信息,确定至少一组关联用户,其中每组关联用户中包括至少两个用户;

针对每组关联用户,形成关联关系;

根据关联关系和数据信息生成信息识别网络。

在获取多个用户所对应的数据信息之后,可以将所获取的数据信息进行加工存储,这里的加工为首先进行空值过滤,然后将过滤后的数据进行格式标准化,最后将标准格式的数据信息存储至图数据库中,其中,图数据库是nosql(notonlysql,非关系型数据库)的一种类型,它应用图形理论存储实体之间的关系信息。

在进行数据存储时,可以按照预设数据存储规则进行数据存储。在本实施例中,图数据库包括信息识别网络,其中信息识别网络包括数据信息以及用户间的关联关系。具体的预设数据存储规则为按照每个用户对应一个顶点的规则进行数据存储,则每个用户的数据信息构成各个顶点,即每一用户对应于一个实体,每一实体对应于一顶点。在按照上述规则进行数据信息存储之后,可以根据数据信息确定至少一组关联用户,每组关联用户中包括至少两个用户。在确定至少一组关联用户之后,可以针对每组关联用户,连接对应的关联顶点,形成实体间的关联。其中,通过连接关联顶点,可以使得连线形成实体间的关联关系。然后根据所形成的关联关系以及所获取的数据信息生成信息识别网络。

上述过程,基于图数据库进行数据信息的关联存储,形成关联关系,可以保证关联关系的准确性以及完整性,根据关联关系以及数据信息生成信息识别网络,可以将用户数据以及关联关系清楚的呈现。

可选的,在本发明一实施例中,根据多个用户的数据信息,确定至少一组关联用户时,包括:

根据电子设备的号码信息、用户的身份信息、电子设备的标识信息、电子设备的ip地址、电子设备所连接的wifi信息、用户的地理位置信息以及用户的社交信息中的至少一项,查找相关联的用户,确定至少一组关联用户。

可以根据多个用户的数据信息,采用以下至少一种策略确定关联用户:

根据各用户所使用的电子设备的号码信息,查找用户之间的关联,进而确定至少一组关联用户;根据各用户的身份信息,查找用户之间的关联,进而确定至少一组关联用户;根据电子设备的标识信息,查找用户之间的关联,进而确定至少一组关联用户;根据电子设备的ip地址,查找用户之间的关联,进而确定至少一组关联用户;根据电子设备所连接的wifi信息,查找用户之间的关联,进而确定至少一组关联用户;根据用户的地理位置信息,查找用户之间的关联,进而确定至少一组关联用户;根据用户的社交信息,查找用户之间的关联,进而确定至少一组关联用户。其中,上述策略可以任意组合,以保证一组关联用户内可以包括至少两个用户。

可选的,在本发明一实施例中,根据信息识别网络确定至少一个目标团体以及与目标团体对应的第一风险评估指标,包括:

对信息识别网络进行分团计算,确定目标团体;

根据信息识别网络中所存储的数据信息,确定目标团体所对应的第一风险评估指标。

在根据信息识别网络确定至少一个目标团体时,可以根据信息识别网络采用分团算法进行分团计算,以确定目标团体,其中这里的分团算法可以为标签传播,联通组件算法,也可以为其他算法,这里不再一一列举。在确定目标团体之后,可以根据信息识别网络中所存储的数据信息,确定各目标团体所对应的第一风险评估指标。

上述过程通过进行分团处理并确定每个目标团体所对应的第一风险评估指标,可以实现根据第一风险评估指标实时判断用户的风险度,预先对欺诈行为进行识别,保证风险识别的有效性。

可选的,在本发明一实施例中,根据信息识别网络中所存储的数据信息,确定目标团体所对应的第一风险评估指标,包括:

根据数据信息,获取目标团体所对应的特征标签;

采用预设模型和/或预设规则,对特征标签进行处理,获取目标团体所对应的第一风险评估指标。

在确定目标团体所对应的第一风险评估指标时,首先需要根据数据信息获取目标团体所对应的特征标签,这里的特征标签至少为一个。然后针对所获取的特征标签,采用预设模型和/或预设规则进行处理,获取目标团体所对应的第一风险评估指标。其中,特征标签的数量越多,根据特征标签所确定的第一风险评估指标的价值越大。

即,在获取特征标签之后,可以采用预设模型对特征标签进行模型训练,根据训练结果获取目标团体所对应的第一风险评估值,也可以通过预设规则对特征标签进行处理,获取第一风险评估指标。其中这里所选用的预设模型和/或预设规则较为灵活,且也可以根据需求采用部分特征标签进行处理。

如,可以在目标团体所对应的多个特征标签中选择部分特征标签,针对所选中的特征标签,设置每个特征标签所对应的权重值,计算权重值与相应特征标签对应的评分的乘积,将各乘积累加获取第一风险评估指标。或者,可以针对目标团体所对应的多个特征标签,获取各个特征标签所对应的评分,将评分进行累加,获取第一风险评估指标。以上为两个具体实施方式,还可以采用其他方式获取目标团体所对应的第一风险评估指标。

可选的,在本发明一实施例中,数据信息包括:用户的身份信息、用户所使用的电子设备的号码信息以及电子设备的标识信息中的至少一项;

根据数据信息,获取目标团体所对应的特征标签,包括:

根据目标团体中各用户的身份信息、电子设备的号码信息以及电子设备的标识信息中的至少一项,获取目标团体所对应的特征标签。

虽然数据信息包括多种,但是用户的身份信息、电子设备的号码信息以及电子设备的标识信息是固定不变的且和用户的关系最紧密,因此在分团之后,可以将用户的身份信息、电子设备的号码信息以及电子设备的标识信息单独拿出,作为目标团体的基本实体,根据基本实体确定对应的特征标签。

可选的,在本发明一实施例中,根据目标团体中各用户的身份信息、电子设备的号码信息以及电子设备的标识信息中的至少一项,获取目标团体所对应的特征标签,包括以下方案至少之一:

根据目标团体中各用户的身份信息获取以下特征标签中的至少一项:用户黑名单数比例、借款申请通过率、逾期合同比率;

根据目标团体中的电子设备的号码信息获取以下特征标签中的至少一项:号码黑名单比率、欺诈号码比率、虚拟号码比率;

根据目标团体中的电子设备的标识信息获取以下特征标签中的至少一项:黑名单设备、中介设备。

其中,根据用户所使用的电子设备的号码信息,可以确定号码信息是否属于黑名单号码、欺诈号码或者虚拟号码;根据用户的身份信息,可以确定用户的借款还款情况;根据电子设备的标识信息,可以确定电子设备是否属于黑名单设备、中介设备。

在获取目标团体所对应的特征标签时,可以利用大数据平台的计算能力,通过调度任务,关联历史数据或者第三方数据源,统计计算各种特征标签。具体为:

根据目标团体中各用户的身份信息获取目标团体中用户黑名单数比例、借款申请通过率和逾期合同比率中的至少一项,根据目标团体中的电子设备的号码信息获取目标团体中号码黑名单比率、欺诈号码比率和虚拟号码比率中的至少一项,根据目标团体中的电子设备的标识信息获取黑名单设备和中介设备中的至少一项。

其中,还可以根据目标团体中各用户的身份信息获取团体内用户数量、团体内用户黑名单数、团体内借款申请单数,团体内合同数,团体内逾期合同数,团体内借款申请通过的单数,根据团体内用户黑名单数与用户数量的比例确定用户黑名单数比例,根据团体内借款申请通过的单数与团体内借款申请单数的比例确定借款申请通过率,根据团体内逾期合同数与团体内合同数,确定逾期合同比率。

也可以根据目标团体中的电子设备的号码信息获取团体内号码数量,团体内号码黑名单数量、团体内欺诈号码数量、团体内虚拟号码数量,然后计算团体内号码黑名单数量与团体内号码数量的比例确定号码黑名单比率,计算团体内欺诈号码数量与团体内号码数量的比例确定欺诈号码比率,计算团体内虚拟号码数量与团体内号码数量的比例确定虚拟号码比率。

其中,具体的团体特征标签根据所持有的数据进行计算统计,特征标签越多,产生有价值的特征标签的可能性越大。

综上为本发明风险信息识别方法的实施过程,通过获取用户的数据信息,根据数据信息确定用户间的关联关系并生成信息识别网络,依据信息识别网络确定至少一个目标团体以及对应的第一风险评估指标,以在获取到目标用户时,根据目标用户与目标团体的匹配结果,确定目标用户所对应的风险评估指标,可以实现通过分团的方式实时进行风险评估,预先对欺诈行为进行识别,保证风险识别的有效性。

本发明实施例还提供一种风险信息确定方法,应用于上述的风险信息识别方法,如图3所示,包括:

步骤301、获取目标用户的数据信息。

步骤302、确定与目标用户的数据信息中的第一数据匹配的第一目标团体。

步骤303、获取第一数据对应的第一权重以及第一目标团体对应的第一风险评估指标。

步骤304、根据第一权重与第一风险评估指标,确定目标用户对应的风险评估指标。

在依据风险信息识别方法获取目标团体所对应的第一风险评估指标之后,可以将目标团体以及对应的第一风险评估指标,同步至生产环境进行投入使用,实时侦测用户的风险度。具体为:在目标用户(新用户)进入之后,可以获取目标用户的数据信息,其中目标用户的数据信息至少包括以下信息中的至少一项:目标用户所使用的电子设备的号码信息、目标用户的身份信息、电子设备的标识信息、电子设备的ip地址、电子设备所连接的wifi信息、目标用户的地理位置信息、目标用户的社交信息;其中目标用户的社交信息至少包括:目标用户的联系人信息和与联系人的交互内容。

在获取目标用户的数据信息之后,可以根据目标用户的数据信息中的第一数据,确定匹配的第一目标团体,然后针对第一数据获取对应的第一权重,针对第一目标团体,获取对应的第一风险评估指标,根据第一权重与第一风险评估指标的乘积,确定目标用户所对应的风险评估指标,以实现对目标用户进行实时风险评估。

可选的,获取第一数据对应的第一权重,包括:

确定第一数据在数据信息中所对应的目标重要等级;

根据预先建立的重要等级与权重的对应关系,确定与目标重要等级对应的第一权重。

在根据数据信息中的第一数据确定与目标用户匹配的第一目标团体之后,可以根据预先对数据信息所划分的重要等级结果,确定与第一数据所对应的目标重要等级,然后根据重要等级与权重的对应关系,确定与第一数据对应的第一权重。

上述实施过程,通过将目标用户与目标团体进行匹配,可以根据匹配结果实时的进行风险评估,对风险进行预防,减免损失。

本发明实施例还提供一种风险信息识别模型训练方法,如图4所示,包括:

步骤401、获取用户的数据信息;

步骤402、根据数据信息确定用户间的关联关系并生成信息识别网络;

步骤403、根据信息识别网络确定至少一个目标团体以及与目标团体对应的第一风险评估指标;

步骤404、利用目标用户与目标团体对应的第一风险评估指标训练风险信息识别模型。

通过提供风险信息识别模型训练方法,可以在获取目标团体对应的第一风险评估指标的基础上,利用目标用户与第一风险评估指标进行模型训练,以获取风险信息识别模型,进而可以实现利用风险信息识别模型对新用户的风险程度进行准确判定。

如图5所示,本发明实施例还提供一种风险信息识别、确定、模型训练方法的架构图,下面结合附图5,按照数据流的流向对本发明实施例的一具体实施方式进行阐述:

整个架构从架构层级上分为4层,分别为数据源层,图计算引擎,图服务层,数据应用层。数据采集可以划分为数据源层。

数据源层

通过实时收集各个业务应用系统产生的数据,对数据进行清洗,将清洗后的数据实时写入大数据分析平台的图数据库中以及开源数据库进行存储,其中通过存储至图数据库,可以构建用户之间的关联关系,根据关联关系和数据可生成信息识别网络,通过存储至开源数据库可以进行数据备份。

图计算引擎

通过大数据分析平台spark集群提供分团算法,根据关联关系和数据信息进行计算,通过将图数据与业务数据统一在大数据分析平台,便于模型训练和数据分析,利用模型训练对团进行各个维度的特征标签追加,计算出团的风险评估指标,并同步至生产环境。其中,图计算引擎中的图分割用来对图数据进行分团,机器学习是利用历史业务数据进行数据分析。

图服务层

将所分的团体丰富其关联维度,同步至实时数据库,具体为:在分团的团体中只保留了用户的身份信息、电子设备的号码信息以及电子设备的标识信息中的至少一项,为了能实时直接关联查询,可以在用户的身份信息、电子设备的号码信息以及电子设备的标识信息的基础上,结合用户的其他数据信息(如电子设备的ip地址、电子设备所连接的wifi信息、用户的地理位置信息以及用户的社交信息中)进行组网,并对每一种数据信息设置对应的权重。

组网后同步至线上的图数据库中,线上的图数据库选型为neo4j,可以实现毫秒级响应。

开发应用接口,通过目标用户的各维度信息作为参数,去命中已经分好团的各个团体,获取命中的团体,所命中的团体的风险评估指标、命中的数据信息的权重。

其中,图服务层中的oltp(on-linetransactionprocessing,联机事务处理过程)查询就是把上述分团好的结果同步至线上生产环境之后,进行实时目标命中的查询,即对应于上述开发应用接口的查询过程;图服务层中的olap(onlineanalyticalprocessing,联机分析处理)分析,即指离线的批量查询;图服务层中的图算法,就是在查询过程中,所采用的一些图的算法,例如使用目标用户的参数去命中分好的团体时,可以用到图的最短路径算法,确定目标用户与哪个团的哪个用户关系最紧密。

数据应用层

将目标用户的各维度信息作为入参,调用图服务层的开发应用接口,返回该用户命中的团体,所命中的团体的风险评估指标,配合决策引擎或者模型,获取目标用户所对应的风险评估指标。

进一步而言,数据应用层是根据图服务层所能提供业务场景进行实时的业务应用,比如风险判断,中介判定,人工调查等业务场景,即通过图服务层的某个查询接口(里面集成预设的算法)来返回目标用户的风险度,或者判定目标用户是否为中介等。或者利用图服务层提供的多种接口进行人工调查,例如查询目标用户所关联的团体里其他用户的信息。

上述过程,通过对用户进行分团处理,然后为各团评分打标签,再用于实时的目标用户风险判断,可以实现对一个新来用户是否是团伙进行评估,而现有的风险评估方法是识别单一用户的风险水平,因此本发明与现有技术属于完全不同的两种做法,二者相互补充,互不冲突。

参见图6,图6是本发明实施例提供的风险信息识别装置的结构图。如图6所示,风险信息识别装置600包括:

第一获取模块601,用于获取用户的数据信息;

第一生成模块602,用于根据数据信息确定用户间的关联关系并生成信息识别网络;

第一确定模块603,用于根据信息识别网络确定至少一个目标团体以及与目标团体对应的第一风险评估指标,以在获取到目标用户时,根据目标用户与目标团体的匹配结果,确定目标用户所对应的风险评估指标。

可选的,第一生成模块包括:

存储子模块,用于将多个用户所对应的数据信息存储至图数据库中;

第一确定子模块,用于根据多个用户的数据信息,确定至少一组关联用户,其中每组关联用户中包括至少两个用户;

连接子模块,用于针对每组关联用户,形成关联关系;

生成子模块,用于根据关联关系和数据信息生成信息识别网络。

可选的,第一确定模块包括:

第二确定子模块,用于对信息识别网络进行分团计算,确定目标团体;

第三确定子模块,用于根据信息识别网络中所存储的数据信息,确定目标团体所对应的第一风险评估指标。

可选的,第三确定子模块包括:

第一获取单元,用于根据数据信息,获取目标团体所对应的特征标签;

第二获取单元,用于采用预设模型和/或预设规则,对特征标签进行处理,获取目标团体所对应的第一风险评估指标。

可选的,数据信息包括:用户的身份信息、用户所使用的电子设备的号码信息以及电子设备的标识信息中的至少一项;

第一获取单元进一步用于:

根据目标团体中各用户的身份信息、电子设备的号码信息以及电子设备的标识信息中的至少一项,获取目标团体所对应的特征标签。

可选的,第一获取单元包括以下子单元至少之一:

第一获取子单元,用于根据目标团体中各用户的身份信息获取以下特征标签中的至少一项:用户黑名单数比例、借款申请通过率、逾期合同比率;

第二获取子单元,用于根据目标团体中的电子设备的号码信息获取以下特征标签中的至少一项:号码黑名单比率、欺诈号码比率、虚拟号码比率;

第三获取子单元,用于根据目标团体中的电子设备的标识信息获取以下特征标签中的至少一项:黑名单设备、中介设备。

本发明实施例提供的风险信息识别装置600能够实现上述风险信息识别方法实施例中的各个过程,为避免重复,这里不再赘述。

本发明实施例的风险信息识别装置,通过获取用户的数据信息,根据数据信息确定用户间的关联关系并生成信息识别网络,依据信息识别网络确定至少一个目标团体以及对应的第一风险评估指标,以在获取到目标用户时,根据目标用户与目标团体的匹配结果,确定目标用户所对应的风险评估指标,可以实现通过分团的方式实时进行风险评估,预先对欺诈行为进行识别,保证风险识别的有效性。

本发明实施例还提供一种风险信息确定装置,应用于上述的风险信息识别装置,如图7所示,包括:

第二获取模块701,用于获取目标用户的数据信息;

第二确定模块702,用于确定与目标用户的数据信息中的第一数据匹配的第一目标团体;

第三获取模块704,用于获取第一数据对应的第一权重以及第一目标团体对应的第一风险评估指标;

第三确定模块704,用于根据第一权重与第一风险评估指标,确定目标用户对应的风险评估指标。

可选的,第三获取模块进一步用于:

确定第一数据在数据信息中所对应的目标重要等级;

根据预先建立的重要等级与权重的对应关系,确定与目标重要等级对应的第一权重。

本发明实施例提供的风险信息确定装置700能够实现上述风险信息确定方法实施例中的各个过程,为避免重复,这里不再赘述。

通过上述风险信息确定装置,可以将目标用户与目标团体进行匹配,根据匹配结果实时的进行风险评估,对风险进行预防,减免损失。

本发明实施例还提供一种风险信息识别模型训练装置,如图8所示,包括:

第四获取模块801,获取用户的数据信息;

第二生成模块802,用于根据数据信息确定用户间的关联关系并生成信息识别网络;

第四确定模块803,用于根据信息识别网络确定至少一个目标团体以及与目标团体对应的第一风险评估指标;

训练模块804,用于利用目标用户与目标团体对应的第一风险评估指标训练风险信息识别模型。

本发明实施例提供的风险信息识别模型训练装置800能够实现上述风险信息识别模型训练方法实施例中的各个过程,为避免重复,这里不再赘述。

通过上述的风险信息识别模型训练装置,可以在获取目标团体对应的第一风险评估指标的基础上,利用目标用户与第一风险评估指标进行模型训练,以获取风险信息识别模型,进而可以实现利用风险信息识别模型对新用户的风险程度进行准确判定。

参见图9,图9是本发明又一实施提供的风险信息识别装置的结构图,如图9所示,风险信息识别装置900包括:处理器901、存储器902及存储在所述存储器902上并可在处理器上运行的计算机程序,风险信息识别装置900中的各个组件通过总线接口903耦合在一起,计算机程序被所述处理器901执行时实现如下步骤:获取用户的数据信息;根据数据信息确定用户间的关联关系并生成信息识别网络;根据信息识别网络确定至少一个目标团体以及与目标团体对应的第一风险评估指标,以在获取到目标用户时,根据目标用户与目标团体的匹配结果,确定目标用户所对应的风险评估指标。

可选的,计算机程序被处理器901执行时还用于:将多个用户所对应的数据信息存储至图数据库中;根据多个用户的数据信息,确定至少一组关联用户,其中每组关联用户中包括至少两个用户;针对每组关联用户,形成关联关系;根据关联关系和数据信息生成信息识别网络。

可选的,计算机程序被处理器901执行时还用于:对信息识别网络进行分团计算,确定目标团体;根据信息识别网络中所存储的数据信息,确定目标团体所对应的第一风险评估指标。

可选的,计算机程序被处理器901执行时还用于:根据数据信息,获取目标团体所对应的特征标签;采用预设模型和/或预设规则,对特征标签进行处理,获取目标团体所对应的第一风险评估指标。

可选的,数据信息包括:用户的身份信息、用户所使用的电子设备的号码信息以及电子设备的标识信息中的至少一项;计算机程序被处理器901执行时还用于:根据目标团体中各用户的身份信息、电子设备的号码信息以及电子设备的标识信息中的至少一项,获取目标团体所对应的特征标签。

可选的,计算机程序被处理器901执行时还用于执行以下方案至少之一:

根据目标团体中各用户的身份信息获取以下特征标签中的至少一项:用户黑名单数比例、借款申请通过率、逾期合同比率;

根据目标团体中的电子设备的号码信息获取以下特征标签中的至少一项:号码黑名单比率、欺诈号码比率、虚拟号码比率;

根据目标团体中的电子设备的标识信息获取以下特征标签中的至少一项:黑名单设备、中介设备。

参见图10,图10是本发明又一实施提供的风险信息确定装置的结构图,如图10所示,风险信息确定装置1000包括:处理器1001、存储器1002及存储在所述存储器1002上并可在处理器1001上运行的计算机程序,风险信息确定装置1000中的各个组件通过总线接口1003耦合在一起,计算机程序被处理器1001执行时实现如下步骤:获取目标用户的数据信息;确定与目标用户的数据信息中的第一数据匹配的第一目标团体;获取第一数据对应的第一权重以及第一目标团体对应的第一风险评估指标;根据第一权重与第一风险评估指标,确定目标用户对应的风险评估指标。

可选的,计算机程序被处理器1001执行时还用于:确定第一数据在数据信息中所对应的目标重要等级;根据预先建立的重要等级与权重的对应关系,确定与目标重要等级对应的第一权重。

参见图11,图11是本发明又一实施提供的风险信息识别模型训练装置的结构图,如图11所示,风险信息识别模型训练装置1100包括:处理器1101、存储器1102及存储在所述存储器1102上并可在处理器1101上运行的计算机程序,风险信息识别模型训练装置1100中的各个组件通过总线接口1103耦合在一起,计算机程序被处理器1101执行时实现如下步骤:获取用户的数据信息;根据数据信息确定用户间的关联关系并生成信息识别网络;根据信息识别网络确定至少一个目标团体以及与目标团体对应的第一风险评估指标;利用目标用户与目标团体对应的第一风险评估指标训练风险信息识别模型。

本发明实施例还提供一种电子设备,包括处理器,存储器,存储在存储器上并可在处理器上运行的程序,其中处理器用于读取存储器中的程序实现上述风险信息识别方法实施例的各个过程;或者实现上述风险信息确定方法实施例的各个过程;或者实现上述风险信息识别模型训练方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。

本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述风险信息识别方法实施例的各个过程;或者实现上述风险信息确定方法实施例的各个过程;或者实现上述风险信息识别模型训练方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(read-onlymemory,简称rom)、随机存取存储器(randomaccessmemory,简称ram)、磁碟或者光盘等。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1