可疑交易账户的识别方法、装置、存储介质和服务器与流程

文档序号:19741366发布日期:2020-01-18 05:16阅读:644来源:国知局
可疑交易账户的识别方法、装置、存储介质和服务器与流程

【技术领域】

本发明实施例涉及互联网技术领域,特别涉及一种可疑交易账户的识别方法、装置、存储介质和服务器。



背景技术:

与传统的现金交易、银行转账等传统支付方式相比,网络支付在效率和便捷性等方面都具有明显的优势。同时,如何在网络支付中有效保障用户的资金安全,也是支付机构需要重点关注的问题。

用户资金安全的问题,理论上可以通过人工稽核的方式解决。但是网络支付场景具有业务量大、高并发等特点,这使得传统的人工稽核难以适应网络支付场景的需求。以“支付宝”为例,目前已有约9亿活跃用户,每天需要处理大量的金融业务,而且很可能出现多笔业务同时并发的情况。人工稽核的方式不仅需要投入大量的人力资源,而且难以在短时间内对用户的支付请求做出响应。

中国人民银行制订的《非金融机构支付服务管理办法》第32条也规定了:支付机构应当具备必要的技术手段,确保支付指令的完整性、一致性和不可抵赖性,支付业务处理的及时性、准确性和支付业务的安全性;具备灾难恢复处理能力和应急处理能力,确保支付业务的连续性。

可见,网络支付场景中的风险管理,除了要设计合理的风控规则或制度之外,还需要进一步考虑如何通过技术手段在保证及时性、准确性的同时,解决用户资金的安全性问题。

随着网络支付业务的发展,活跃商户的数量也日益激增,而一些不法商户趁机利用网络支付业务进行赌博等违法行为。

目前,可以通过商户的介质关系链或者资金关系链的单层关联信息对赌博商户进行识别。但是,仅通过介质关系链或者资金关系链的单层关联信息对赌博商户进行识别存在识别结果准确度低的问题。



技术实现要素:

有鉴于此,本发明实施例提供了一种可疑交易账户的识别方法、装置、存储介质和服务器,用于提高识别可疑交易账户的准确率。

一方面,本发明实施例提供了一种可疑交易账户的识别方法,所述方法包括:

根据已确定可疑交易账户的资金关系链,确定出与所述已确定可疑交易账户匹配的关联账户;

根据多个不同的可疑交易成员角色对应的至少二个参数占比值,计算所述关联账户与多个不同的可疑交易成员角色之间的角色距离分;

根据多个所述角色距离分,识别出所述关联账户是否为可疑交易账户。

可选地,所述根据已确定可疑交易账户的资金关系链,确定出与所述已确定可疑交易账户匹配的关联账户之前,还包括:

采集第一设定时间段内所述已确定可疑交易账户的资金流水数据;

对所述已确定可疑交易账户的资金流水数据进行数据清洗;

根据数据清洗后的已确定可疑交易账户的资金流水数据,生成所述已确定可疑交易账户的资金关系链。

可选地,所述根据已确定可疑交易账户的资金关系链,确定出与所述已确定可疑交易账户匹配的关联账户包括:

将所述已确定可疑交易账户资金转出到的账户确定为第一级的关联账户和/或将所述已确定可疑交易账户自身确定为第一级的关联账户。

可选地,所述根据已确定可疑交易账户的资金关系链,确定出与所述已确定可疑交易账户匹配的关联账户还包括:

将向所述第一级的关联账户转入资金的账户确定为第二级的关联账户。

可选地,所述根据已确定可疑交易账户的资金关系链,确定出与所述已确定可疑交易账户匹配的关联账户还包括:

将所述第一级的关联账户资金转出到的账户确定为第三级的关联账户、将所述第二级的关联账户资金转出到的第一级的关联账户之外的账户确定为第三级的关联账户和将向所述第二级的关联账户转入资金的账户确定为第三级的关联账户中之一或其任意组合。

可选地,所述根据多个不同赌博成员角色对应的至少二个参数占比值,计算所述关联账户与多个不同的赌博成员角色之间的角色距离分包括:

根据已确定可疑交易账户的资金关系链中所述关联账户的资金流水数据,获取不同的可疑交易成员角色对应的至少二个参数占比值;

计算出每个可疑交易成员角色对应的至少二个参数占比值组成的坐标点与占比最高可能性对应的坐标点之间的角色距离分。

可选地,所述至少二个参数占比值包括可疑交易成员角色的入账金额占比值、可疑交易成员角色的入账次数占比值和可疑交易成员角色的入账人数占比值。

可选地,所述根据多个所述角色距离分,识别出所述关联账户是否为可疑交易账户包括:

从多个所述角色距离分中确定出最小的角色距离分;

判断最小的角色距离分是否小于角色距离分阈值;

若判断出最小的角色距离分小于角色距离分阈值,识别出所述关联账户为可疑交易账户。

可选地,所述从多个所述角色距离分中确定出最小的角色距离分包括:

对多个所述角色距离分进行比较,选取出最小的至少一个角色距离分;

若选取出的至少一个角色距离分的数量为一个,将选取出的一个角色距离分确定为最小的角色距离分;

若选取出的至少一个角色距离分的数量为多个,按照预先设置的优先级顺序从选取出的多个角色距离分中选取出优先级最高的角色距离分,将优先级最高的角色距离分确定为最小的角色距离分,其中,优先级顺序包括第一角色距离分的优先级大于第二角色距离分的优先级以及第二角色距离分大于第三角色距离分。

可选地,所述识别出所述关联账户为可疑交易账户之后还包括:

根据最小的角色距离分,确定出该关联账户在可疑交易团伙中的可疑交易成员角色。

可选地,所述根据最小的角色距离分,确定出该关联账户在可疑交易团伙中的可疑交易成员角色包括:

若所述最小的角色距离分为第一角色距离分时,确定出该关联账户在可疑交易团伙中的可疑交易成员角色为第二成员角色;或者,

若所述最小的角色距离分为第二角色距离分时,确定出该关联账户在可疑交易团伙中的可疑交易成员角色为前端的第三成员角色,其中,前端的第三成员角色为资金关系链中接收第二成员角色转出资金的第三成员角色;或者,

若所述最小的角色距离分为第三角色距离分时,确定出该关联账户在可疑交易团伙中的可疑交易成员角色为后端的第三成员角色,其中,后端的第三成员角色为资金关系链中接收前端的第三成员角色转出资金的第三成员角色。

可选地所述根据最小的角色距离分,确定出该关联账户在可疑交易团伙中的可疑交易成员角色之后还包括:

判断获取的所述关联账户的入账金额是否大于最低金额阈值且获取的所述关联账户的入账人数是否大于最低人数阈值;

若判断出所述关联账户的入账金额大于最低金额阈值且所述关联账户的入账人数大于最低人数阈值,将所述关联账户添加入可疑交易团伙名单中。

可选地,所述将所述关联账户添加入赌博团伙名单中之后还包括:

根据所述可疑交易团伙名单中的关联账户在可疑交易团伙中的可疑交易成员角色,对所述可疑交易团伙名单中的关联账户进行与可疑交易成员角色对应的管控。

可选地,所述可疑交易成员角色包括第一成员角色、第二成员角色或者第三成员角色,其中,所述第一成员角色包括赌徒账户,所述第二成员角色包括赌博庄家账户,所述第三成员角色包括集资账户。

可选地,所述已确定可疑交易账户包括已确定赌博庄家账户。

可选地,所述可疑交易账户包括赌博商户账户或者赌博个人账户。

另一方面,本发明实施例提供了一种可疑交易账户的识别装置,包括:

第一确定模块,用于根据已确定可疑交易账户的资金关系链,确定出与所述已确定可疑交易账户匹配的关联账户;

计算模块,用于根据多个不同的可疑交易成员角色对应的至少二个参数占比值,计算所述关联账户与多个不同的赌博成员角色之间的角色距离分;

识别模块,用于根据多个所述角色距离分,识别出所述关联账户是否为可疑交易账户。

可选地还包括:

采集模块,用于采集第一设定时间段内所述已确定可疑交易账户的资金流水数据;

数据清洗模块,用于对所述已确定可疑交易账户的资金流水数据进行数据清洗;

生成模块,用于根据数据清洗后的已确定可疑交易账户的资金流水数据,生成所述已确定可疑交易账户的资金关系链。

可选地,所述第一确定模块具体用于将所述已确定可疑交易账户资金转出到的账户确定为第一级的关联账户和/或将所述已确定可疑交易账户自身确定为第一级的关联账户。

可选地,所述第一确定模块具体用于将向所述第一级的关联账户转入资金的账户确定为第二级的关联账户。

可选地,所述第一确定模块具体用于将所述第一级的关联账户资金转出到的账户确定为第三级的关联账户、将所述第二级的关联账户资金转出到的第一级的关联账户之外的账户确定为第三级的关联账户和将向所述第二级的关联账户转入资金的账户确定为第三级的关联账户中之一或其任意组合。

可选地,所述计算模块包括:

获取子模块,用于根据已确定可疑交易账户的资金关系链中所述关联账户的资金流水数据,获取不同的可疑交易成员角色对应的至少二个参数占比值;

计算子模块,用于计算出每个可疑交易成员角色对应的至少二个参数占比值组成的坐标点与占比最高可能性对应的坐标点之间的角色距离分。

可选地,所述至少二个参数占比值包括可疑交易成员角色的入账金额占比值、可疑交易成员角色的入账次数占比值和可疑交易成员角色的入账人数占比值。

可选地,所述识别模块包括:

确定子模块,用于从多个所述角色距离分中确定出最小的角色距离分;

判断子模块,用于判断最小的角色距离分是否小于角色距离分阈值;

识别子模块,用于若所述判断子模块判断出最小的角色距离分小于角色距离分阈值,识别出所述关联账户为可疑交易账户。

可选地,还包括:

第二确认模块,用于根据最小的角色距离分,确定出该关联账户在赌博团伙中的可疑交易成员角色。

可选地,所述第二确认模块具体用于若所述最小的角色距离分为第一角色距离分时,确定出该关联账户在可疑交易团伙中的可疑交易成员角色为第二成员角色;或者,若所述最小的角色距离分为第二角色距离分时,确定出该关联账户在可疑交易团伙中的可疑交易成员角色为前端的第三成员角色,其中,前端的第三成员角色为资金关系链中接收第二成员角色转出资金的第三成员角色;或者,若所述最小的角色距离分为第三角色距离分时,确定出该关联账户在可疑交易团伙中的可疑交易成员角色为后端的第三成员角色,其中,后端的第三成员角色为资金关系链中接收前端的第三成员角色转出资金的第三成员角色。

可选地,还包括:

判断模块,用于判断获取的所述关联账户的入账金额是否大于最低金额阈值且获取的所述关联账户的入账人数是否大于最低人数阈值;

添加模块,用于若所述判断模块判断出所述关联账户的入账金额大于最低金额阈值且所述关联账户的入账人数大于最低人数阈值,将所述关联账户添加入可疑交易团伙名单中。

可选地,还包括:

管控模块,用于根据所述可疑交易团伙名单中的关联账户在可疑交易团伙中的可疑交易成员角色,对所述可疑交易团伙名单中的关联账户进行与可疑交易成员角色对应的管控。

另一方面,本发明实施例提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述可疑交易账户的识别方法。

另一方面,本发明实施例提供了一种服务器,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,所述程序指令被处理器加载并执行时实现上述可疑交易账户的识别方法的步骤。

本发明实施例的方案中,根据已确定可疑交易账户的资金关系链确定出与已确定可疑交易账户匹配的关联账户,根据多个不同的可疑交易成员角色对应的至少二个参数占比值计算关联账户与多个不同的可疑交易成员角色之间的角色距离分,根据多个角色距离分识别出关联账户是否为可疑交易账户,本发明实施例通过计算出的角色距离分识别可疑交易账户,从而提高了识别可疑交易账户的准确率。

【附图说明】

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。

图1为本发明实施例中赌博团伙的示意图;

图2为本发明一实施例提供的一种可疑交易账户的识别方法的流程图;

图3为本发明实施例中生成已确定可疑交易账户的资金关系链的流程图;

图4为已确定可疑交易账户的资金关系链的示意图;

图5为本发明实施例中确定关联账户的流程图;

图6为本发明实施例中计算角色距离分的流程图;

图7为本发明实施例中识别可疑交易账户的流程图;

图8为本发明实施例中确定出最小的角色距离分的一种示意图;

图9为本发明实施例中确定出最小的角色距离分的另一种示意图;

图10为本发明一实施例提供的一种可疑交易账户的识别装置的结构示意图;

图11是本发明一实施例提供的一种服务器的示意图。

【具体实施方式】

为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。

应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。

应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,甲和/或乙,可以表示:单独存在甲,同时存在甲和乙,单独存在乙这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。

目前,随着网络支付的支付业务进一步拓展,活跃的账户数量也日益激增,而一些不法账户趁机利用网络支付业务进行可疑交易等违法行为。其中,账户可包括商户账户或者个人账户。无论是商户账户或者是个人账户,其可疑交易行为通常需要通过可疑交易团伙来实现。以可疑交易团伙为赌博团伙且可疑交易账户为赌博账户为例进行说明,图1为本发明实施例中赌博团伙的示意图,如图1所示,赌博团伙包括多个不同的赌博成员角色,赌博成员角色可包括赌徒账户、赌博庄家账户或者集资账户,则赌博团伙可包括赌徒账户、赌博庄家账户和集资账户。其中,赌博庄家账户可收集赌徒账户的资金,集资账户可汇集赌博庄家账户的资金。

相关技术中,对赌博账户的识别可通过已确定赌博账户的介质关系链实现。其中,介质关系链可包括与已确定赌博账户的身份证、手机设备、营业执照、通讯录、微信好友等介质产生关联的账户。利用已确定赌博账户的介质关系链查询出与已确定赌博账户关联较强的账户,而后将查询出的处于介质关系链上且与已确定赌博账户关联较强的账户确定为在同个赌博团伙中的赌博账户。但是,通过介质关系链识别出账户为赌博账户的方式,虽然能够保证与已确定赌博账户在介质关系链上的强关联关系,但不能确定这些账户是否也存在赌博风险,即无法证明这些账户是否是赌博账户。另外对于通过介质关系链识别出的赌博账户,无法定位这些账户在赌博团伙中的成员角色。

相关技术中,对赌博账户的识别还可通过已确定赌博账户的资金关系链实现。其中,资金关系链包括与已确定赌博账户存在资金关系(如交易、转账、发红包、分润分账等)的账户。利用已确定赌博账户的资金关系链反查出资金上游中给已确定赌博账户转入资金的赌徒账户,同时由于赌徒具有较难转移的赌性,利用赌徒账户的资金下游关系链识别出更多的赌博庄家账户。上述方式主要是采用资金关系链的单层关联信息识别出赌博账户。但是,通过资金关系链的单层关联信息识别出账户为赌博账户的方式,虽然能够保证与已确定赌博账户在资金关系链上的关联关系,但不能确定这些账户是否也存在赌博风险,即无法证明这些账户是否是赌博账户。另外,通过资金关系链的单层关联信息识别出账户为赌博账户的方式只能识别出赌博庄家账户,无法定位出赌博账户在赌博团伙中的其它成员角色,因此导致识别赌博成员角色的覆盖面不够广泛。

综上所述,相关技术中赌博账户的识别方法,使得识别结果的准确率较低且覆盖面不够广泛。为解决上述技术问题,本发明实施例中,根据已确定赌博账户的资金关系链确定出与已确定赌博账户匹配的关联账户,计算关联账户与多个不同的赌博成员角色之间的角色距离分,再根据多个角色距离分识别出关联账户是否为赌博账户,从而提高了识别赌博账户的准确率。本发明实施例中,还可根据多个角色距离分中最小的角色距离分确定出该关联账户在赌博团伙中的赌博成员角色,相比于采用介质关系链无法定位成员角色以及采用资金关系链的单层关联信息仅能识别出赌博庄家账户的方案,提高了识别赌博成员角色的覆盖面。

图2为本发明一实施例提供的一种可疑交易账户的识别方法的流程图,如图2所示,该方法包括:

步骤101、根据已确定可疑交易账户的资金关系链,确定出与已确定可疑交易账户匹配的关联账户。

本发明实施例中的各步骤可以由服务器执行。

本发明实施例中,已确定可疑交易账户为已被处罚的可疑交易账户。例如,可疑交易账户包括赌博账户,则已确定可疑交易账户包括已确定赌博庄家账户,则该已确定赌博庄家账户为已被处罚的赌博庄家账户。

步骤102、根据多个不同的可疑交易成员角色对应的至少二个参数占比值,计算关联账户与多个不同的可疑交易成员角色之间的角色距离分。

本发明实施例中,可疑交易成员角色可包括第一成员角色、第二成员角色或者第三成员角色,其中,第一成员角色可包括赌徒账户,第二成员角色可包括赌博庄家账户,第三成员角色可包括集资账户;则相应地,角色距离分可包括第一角色距离分、第二角色距离分或者第三角色距离分,其中,第一角色距离分包括赌徒距离分、第二角色距离分包括赌博庄家距离分,第三角色距离分包括集资账户距离分。

步骤103、根据多个角色距离分,识别出关联账户是否为可疑交易账户。

本发明实施例中,通过计算出的关联账户与多个不同的可疑交易成员角色之间的角色距离分识别出关联账户是否为可疑交易账户,提高了识别可疑交易账户的准确率。

图3为本发明实施例中生成已确定可疑交易账户的资金关系链的流程图,图4为已确定可疑交易账户的资金关系链的示意图,如图3和图4所示,在步骤101之前还包括:

步骤100a、采集第一设定时间段内已确定可疑交易账户的资金流水数据。

本发明实施例中,第一设定时间段可以为已确定可疑交易账户被处罚前的一段时间,例如,该第一设定时间段为已确定可疑交易账户被处罚前的14天。在实际应用中,第一设定时间段可根据实际需要进行设置。

本步骤中,可采集第一设定时间段内已确定可疑交易账户的资金流水数据。其中,资金流水数据可包括资金流入数据和资金流出数据。资金流入数据包括红包转账数据、分润分账数据、转账中心转账数据、商业中心转账数据和交易数据;资金流出数据包括红包转账数据、分润分账数据、转账中心转账数据、商业中心转账数据、交易数据和提现到卡数据。其中,资金流入数据和资金流出数据中的交易数据均不包括内部商户交易的数据。

本步骤中,每一条资金流水数据均具备一已确定可疑交易账户的标识,换言之,每一条资金流水数据均与已确定可疑交易账户的标识对应。因此,可根据已确定可疑交易账户的标识,采集第一设定时间段内与已确定可疑交易账户的标识对应的资金流水数据。由于个人持身份证件可注册一个或者多个个人账户,也可注册一个或者多个商户账户,因此,当已确定可疑交易账户为赌博商户账户时,已确定可疑交易账户的标识为商户账户id;当已确定可疑交易账户为赌博个人账户时,已确定可疑交易账户的标识可以为个人账户id。

步骤100b、对已确定可疑交易账户的资金流水数据进行数据清洗。

本步骤中,例如,数据清洗可包括处理无效值和缺失值等。对资金流水数据进行数据清洗可纠正错误数据,从而为后续生成资金关系链提供数据基础。

步骤100c、根据数据清洗后的已确定可疑交易账户的资金流水数据,生成已确定可疑交易账户的资金关系链。

如图4所示,根据已确定赌博账户的资金流水数据生成资金关系链。在该资金关系链中,已确定赌博账户为已确定赌博庄家账户。赌徒账户会将资金转出到包括已确定赌博庄家账户在内的多个赌博庄家账户;已确定赌博庄家账户会将资金转出到集资账户(位于图中靠左边的集资账户),已确定赌博庄家账户也可将自身转化为集资账户(位于图中靠右边的集资账户);其余的赌博庄家账户可将资金转出到各个集资账户;集资账户可将资金转出到集资账户或赌博庄家账户。

如图4所示,根据资金关系链的资金流转,该资金关系链中从已确定赌博庄家账户开始可匹配出第一级的关联账户、第二级的关联账户和第三级的关联账户。

图5为本发明实施例中确定关联账户的流程图,如图5所示,步骤101具体可包括:

步骤1011、将已确定可疑交易账户资金转出到的账户确定为第一级的关联账户和将已确定可疑交易账户自身确定为第一级的关联账户。

如图4所示,由于已确定赌博庄家账户会向集资账户转出资金,换言之,接收已确定赌博庄家账户转出资金的账户与已确定赌博庄家账户存在关联,因此可将已确定赌博账户资金转出到的账户确定为第一级的关联账户。

如图4所示,由于已确定赌博庄家账户自身也可能转换化为集资账户,因此,还可将已确定赌博账户自身确定为第一级的关联账户。

需要说明的是:在步骤1011中,可仅将已确定可疑交易账户资金转出到的账户确定为第一级的关联账户或仅将已确定可疑交易账户自身确定为第一级的关联账户,此种情况不再具体画出。

步骤1012、将向第一级的关联账户转入资金的账户确定为第二级的关联账户。

如图4所示,由于集资账户和/或赌博庄家账户会向第一级的关联账户转入资金,换言之,向第一级的关联账户转入资金的账户与第一级的关联账户存在关联,因此可将向第一级的关联账户转入资金的账户确定为第二级的关联账户。

步骤1013、将第一级的关联账户资金转出到的账户确定为第三级的关联账户、将第二级的关联账户资金转出到的第一级的关联账户之外的账户确定为第三级的关联账户和将向第二级的关联账户转入资金的账户确定为第三级的关联账户。

如图4所示,由于第一级的关联账户会将资金转出到集资账户或赌博庄家账户,第二级的关联账户会将资金转出到集资账户或赌博庄家账户,赌博庄家账户会向第二级的关联账户转入资金,换言之,第一级的关联账户和第二级的关联账户转出资金的账户与第一级的关联账户和第二级的关联账户存在关联,以及向第二级的关联账户转入资金的账户与第二级的关联账户存在关联,因此可将第一级的关联账户资金转出到的账户确定为第三级的关联账户、将第二级的关联账户资金转出到的第一级的关联账户之外的账户确定为第三级的关联账户和将向第二级的关联账户转入资金的账户确定为第三级的关联账户。

需要说明的是:在步骤1013中,可执行将第一级的关联账户资金转出到的账户确定为第三级的关联账户、将第二级的关联账户资金转出到的第一级的关联账户之外的账户确定为第三级的关联账户和将向第二级的关联账户转入资金的账户确定为第三级的关联账户中之一或其任意组合,此种情况不再具体画出。

本发明实施例中,采用资金关系链进行三级关联账户的匹配,将匹配的关联账户限制在三级内,从而保证了匹配的准确性。

图6为本发明实施例中计算角色距离分的流程图,如图6所示,步骤102具体可包括:

步骤1021、根据已确定可疑交易账户的资金关系链中关联账户的资金流水数据,获取不同赌博成员角色对应的至少二个参数占比值。

本发明实施例中,步骤1021具体可包括:根据已确定可疑交易账户的资金关系链中关联账户的资金流水数据,获取不同的可疑交易成员角色对应的三个参数占比值,则至少二个参数占比值包括可疑交易成员角色的入账金额占比值、可疑交易成员角色的入账次数占比值和可疑交易成员角色的入账人数占比值。

作为一个优选方案,步骤1021具体可包括:根据已确定赌博账户的资金关系链中关联账户的资金流水数据,获取不同赌博成员角色对应的三个参数占比值。则至少二个参数占比值包括赌博成员角色的入账金额占比值、赌博成员角色的入账次数占比值和赌博成员角色的入账人数占比值,则不同赌博成员角色对应的至少二个参数占比值可包括赌徒账户的入账金额占比值、赌徒账户的入账次数占比值、赌徒账户的入账人数占比值、赌博庄家账户的入账金额占比值、赌博庄家账户的入账次数占比值、赌博庄家账户的入账人数占比值、集资账户的入账金额占比值、集资账户的入账次数占比值、集资账户的入账人数占比值。

如图4所示,以赌徒账户的入账金额占比值为例,根据已确定赌博账户的资金关系链,从关联账户的资金流水数据中统计出关联账户的总入账金额中赌徒账户的入账金额以及总入账金额,并将赌徒账户的入账金额除以总入账金额得出赌徒账户的入账金额占比值。依次类推,计算出其余的参数占比值。

步骤1022、计算出每个可疑交易成员角色对应的至少二个参数占比值组成的坐标点与占比最高可能性对应的坐标点之间的角色距离分。

本发明实施例中,步骤1022具体可包括:计算出每个可疑交易成员角色对应的三个参数占比值组成的坐标点与占比最高可能性对应的坐标点之间的角色距离分。

作为一个优选方案,步骤1022具体可包括:计算出每个赌博成员角色对应的三个参数占比值组成的坐标点与占比最高可能性对应的坐标点之间的角色距离分。

本步骤中,可通过公式φ=d([赌博成员角色的入账金额占比值,赌博成员角色的入账次数占比值,赌博成员角色的入账人数占比值],[1,1,1]),计算出角色距离分,其中,φ为角色距离分,d为距离计算公式,[1,1,1]为占比最高可能性对应的坐标点。

本步骤中,角色距离分包括赌徒距离分、赌博庄家距离分或集资账户距离分。则可通过公式φ=d([赌徒账户的入账金额占比值,赌徒账户的入账次数占比值,赌徒账户的入账人数占比值],[1,1,1]),计算出赌徒距离分;可通过公式φ=d([赌博庄家账户的入账金额占比值,赌博庄家账户的入账次数占比值,赌博庄家账户的入账人数占比值],[1,1,1]),计算出赌博庄家距离分;可通过公式φ=d([集资账户的入账金额占比值,集资账户的入账次数占比值,集资账户的入账人数占比值],[1,1,1]),计算出集资账户距离分。

本发明实施例中,可通过欧式距离公式,计算出[赌博成员角色的入账金额占比值,赌博成员角色的入账次数占比值,赌博成员角色的入账人数占比值]与[1,1,1]之间的距离,该距离即为角色距离分。

具体地,通过公式:计算出角色距离分,其中,x1为赌博成员角色的入账金额占比值,x2为赌博成员角色的入账次数占比值,x3为赌博成员角色的入账人数占比值。以计算赌徒距离分为例,若x1、x2和x3均为0.8,则赌徒距离分为0.346;若x1、x2和x3均为1,则赌徒距离分为0。

需要说明的是:在实际应用中,还可以通过其它距离公式计算出角色距离分,例如:曼哈顿距离公式,此处不再一一列举。

需要说明的是:至少二个参数占比值包括还可包括其它参数占比值,例如:入账时间占比值或者入账终端设备占比值,此处不再一一列举。

图7为本发明实施例中识别可疑交易账户的流程图,如图7所示,步骤103具体可包括:

步骤1031、从多个角色距离分中确定出最小的角色距离分。

具体地,可从赌徒距离分、赌博庄家距离分和集资账户距离分中确定出最小的角色距离分。

对多个角色距离分进行比较,选取出最小的至少一个角色距离分。

若选取出的至少一个角色距离分的数量为一个,将选取出的一个角色距离分确定为最小的角色距离分。例如,若选取出的最小的一个角色距离分为赌徒距离分,则将赌徒距离分确定为最小的角色距离分。图8为本发明实施例中确定出最小的角色距离分的一种示意图,如图8所示,多个角色距离分包括赌徒距离分a、赌博庄家距离分b和集资账户距离分c,赌徒账户对应的坐标点为a,赌徒账户对应的三个参数占比值组成的坐标点为b,赌博庄家账户对应的三个参数占比值组成的坐标点为c,集资账户对应的三个参数占比值组成的坐标点为d,其中,a为[1,1,1]。从图8可以看出,赌徒账户对应的三个参数占比值组成的坐标点b离赌徒账户对应的坐标点为a最近,因此赌徒距离分a最小,可将赌徒距离分a确定为最小的角色距离分。

若选取出的至少一个角色距离分的数量为多个,按照预先设置的优先级顺序从选取出的多个角色距离分中选取出优先级最高的角色距离分,将优先级最高的角色距离分确定为最小的角色距离分,其中,优先级顺序包括第一角色距离分的优先级大于第二角色距离分的优先级以及第二角色距离分大于第三角色距离分。具体地,优先级顺序包括赌徒距离分的优先级大于赌博庄家距离分的优先级以及赌博庄家距离分大于集资账户距离分。例如,若选取出两个最小的角色距离分包括相等的赌徒距离分和赌博庄家距离分,则由于赌徒距离分的优先级大于赌博庄家距离分的优先级,因此将赌徒距离分确定为最小的角色距离分。图9为本发明实施例中确定出最小的角色距离分的另一种示意图,如图9所示,多个角色距离分包括赌徒距离分a、赌博庄家距离分b和集资账户距离分c,赌徒账户对应的坐标点为a,赌徒账户对应的三个参数占比值组成的坐标点为b,赌博庄家账户对应的三个参数占比值组成的坐标点为c,集资账户对应的三个参数占比值组成的坐标点为d,其中,a为[1,1,1]。从图9可以看出,赌徒账户对应的三个参数占比值组成的坐标点b离赌徒账户对应的坐标点a以及赌博庄家账户对应的三个参数占比值组成的坐标点c离赌徒账户对应的坐标点a均最近,因此赌徒距离分a以及赌博庄家距离分b均最小,由于赌徒距离分的优先级大于赌博庄家距离分的优先级,所以将赌徒距离分a确定为最小的角色距离分。

步骤1032、判断最小的角色距离分是否小于角色距离分阈值,若是,则执行步骤1033;若否,则执行步骤1034。

本发明实施例中,可预先确定角色距离分阈值。其中,确定角色距离分阈值的步骤具体可包括:采集第二设定时间段内多个其它已确定可疑交易账户与多个不同的可疑交易成员角色之间的角色距离分;根据采集的多个角色距离分生成正态分布曲线,该正态分布曲线的横轴为角色距离分,该正态分布曲线的纵轴为概率密度;将正态分布曲线中概率密度的最大值对应的角色距离分确定为角色距离分阈值。本发明实施例中,第二设定时间段可以为已确定可疑交易账户被处罚前的一段时间,例如,该第二设定时间段为已确定可疑交易账户被处罚前的14天。按照本发明实施提供的方法,可计算出在第二时间段内多个其它已确定可疑交易账户与多个不同的可疑交易成员角色之间的角色距离分。

步骤1033、识别出关联账户为可疑交易账户。

本发明实施例中,识别出的赌博账户可包括赌博商户账户或者赌博个人账户。

步骤1034、识别出关联账户不是可疑交易账户。

本发明实施例中,如图2所示,在步骤103之后,该方法还包括:

步骤104、若识别出关联账户为可疑交易账户,根据最小的角色距离分,确定出该关联账户在可疑交易团伙中的可疑交易成员角色。

具体地,若识别出关联账户为赌博账户,根据最小的角色距离分,确定出该关联账户在赌博团伙中的赌博成员角色。

本步骤中,若所述最小的角色距离分为第一角色距离分时,确定出该关联账户在可疑交易团伙中的可疑交易成员角色为第二成员角色。具体地,若最小的角色距离分为赌徒距离分时,表明该关联账户在资金关系链中离赌徒账户的距离最近,则确定出该关联账户在赌博团伙中的赌博成员角色为赌博庄家账户。

或者,本步骤中,若所述最小的角色距离分为第二角色距离分时,确定出该关联账户在可疑交易团伙中的可疑交易成员角色为前端的第三成员角色,其中,前端的第三成员角色为资金关系链中接收第二成员角色转出资金的第三成员角色。具体地,若最小的角色距离分为赌博庄家距离分时,表明该关联账户在资金关系链中离前端的集资账户最近,则确定出该关联账户在赌博团伙中的赌博成员角色为前端的集资账户,其中,前端的集资账户为资金关系链中接收赌博庄家账户转出资金的集资账户。

或者,本步骤中,若所述最小的角色距离分为第三角色距离分时,确定出该关联账户在可疑交易团伙中的可疑交易成员角色为后端的第三成员角色,其中,后端的第三成员角色为资金关系链中接收前端的第三成员角色转出资金的第三成员角色。具体地,若最小的角色距离分为集资账户距离分时,表明该关联账户在资金关系链中离后端的集资账户最近,则确定出该关联账户在赌博团伙中的赌博成员角色为后端的集资账户,其中,后端的集资账户为资金关系链中接收前端的集资账户转出资金的集资账户。

本发明实施例中确定出关联账户在赌博团伙中的赌博成员角色,解决了一部分存在异常资金流水但赌博特征不明显的赌博账户的成员角色的识别问题,摸清了商户场景下整个风险大盘的赌博风险水位,另外在面对人行监管调查时,也能保证从赌博团伙层面对识别出的赌博账户进行打击,减小了监管压力。

本发明实施例中,如图2所示,在步骤104之后,该方法还包括:

步骤105、判断获取的关联账户的入账金额是否大于最低金额阈值且获取的关联账户的入账人数是否大于最低人数阈值,若是,则执行步骤106;若否,则执行步骤108。

本发明实施例中,可从已确定可疑交易账户的资金关系链中关联账户的资金流水数据中获取到该关联账户的入账金额,以及从已确定可疑交易账户的资金关系链中关联账户的资金流水数据中获取到该关联账户的入账人数。

本发明实施例中,可预先确定最低金额阈值。其中,确定最低金额阈值的步骤具体可包括:采集第三设定时间段内多个其它已确定可疑交易账户的入账金额;根据采集的多个入账金额生成正态分布曲线,该正态分布曲线的横轴为入账金额,该正态分布曲线的纵轴为概率密度;将正态分布曲线中概率密度的最大值对应的入账金额确定为最低金额阈值。

本发明实施例中,可预先确定最低人数阈值。其中,确定最低人数阈值的步骤具体可包括:采集第三设定时间段内多个其它已确定可疑交易账户的入账人数;根据采集的多个入账人数生成正态分布曲线,该正态分布曲线的横轴为入账人数,该正态分布曲线的纵轴为概率密度;将正态分布曲线中概率密度的最大值对应的入账人数确定为最低人数阈值。

本发明实施例中,第三设定时间段可以为已确定可疑交易账户被处罚前的一段时间,例如,该第三设定时间段为已确定可疑交易账户被处罚前的14天。

本发明实施例中,第一设定时间段、第二设定时间段和第三设定时间段可以相同。

本步骤中,若判断出关联账户的入账金额大于最低金额阈值且关联账户的入账人数大于最低人数阈值时,表明该关联账户有足够的资金入账以及有足够多的账户为其转入资金,该关联账户符合后续被进一步管控的条件,因此可继续执行步骤106。本步骤中,通过判断获取的关联账户的入账金额是否大于最低金额阈值且获取的关联账户的入账人数是否大于最低人数阈值,进一步提高了识别可疑交易账户的准确率。

本步骤中,若判断出关联账户的入账金额小于或等于最低金额阈值和/或关联账户的入账人数小于或等于最低人数阈值时,表明该关联账户没有足够的资金入账以及也没有足够多的账户为其转入资金,该关联账户暂时不符合后续被进一步管控的条件,因此可继续执行步骤108。

步骤106、将关联账户添加入可疑交易团伙名单中。

具体地,将关联账户添加入赌博团伙名单中。

步骤107、根据可疑交易团伙名单中的关联账户在可疑交易团伙中的可疑交易成员角色,对可疑交易团伙名单中的关联账户进行与可疑交易成员角色对应的管控。

具体地,根据赌博团伙名单中的关联账户在赌博团伙中的赌博成员角色,对赌博团伙名单中的关联账户进行与赌博成员角色对应的管控。

若该关联账户在赌博团伙中的赌博成员角色为赌博庄家账户时,可对该关联账户在线上进行稽核,以实现对该关联账户进行管控。

若该关联账户在赌博团伙中的赌博成员角色为集资账户时,可根据该集资账户获取该集资账户对应的赌博庄家账户,并在该集资账户的生命周期的后期对该集资账户进行清退处理并拦截该集资账户的资金,以实现对该关联账户进行管控。

步骤108、记录该关联账户的多个角色距离分和该关联账户的可疑交易成员角色。

本步骤中,由于此种情况下暂时不对该关联账户进行监管,可记录该关联账户的多个角色距离分和该关联账户的可疑交易成员角色,以便于后续需要对该关联账户进行管控时能够随时调取上述记录的数据。

可选地,在步骤107之后也可以继续执行步骤108,以实现对关联账户的多个角色距离分和该关联账户的可疑交易成员角色的记录,以便于后续随时能够调取上述记录的数据。

本发明实施例中,步骤108的执行顺序仅为一种示例,例如,步骤108中记录该关联账户的多个角色距离分和该关联账户的可疑交易成员角色也可以在步骤104之后执行。

本发明实施例提供的可疑交易账户的识别方法中,根据已确定可疑交易账户的资金关系链确定出与已确定可疑交易账户匹配的关联账户,根据多个不同的可疑交易成员角色对应的至少二个参数占比值计算关联账户与多个不同的可疑交易成员角色之间的角色距离分,根据多个角色距离分识别出关联账户是否为可疑交易账户,本发明实施例通过计算出的角色距离分识别可疑交易账户,从而提高了识别可疑交易账户的准确率。本发明实施例可根据多个角色距离分中最小的角色距离分确定出该关联账户在可疑交易团伙中的多种可疑交易成员角色,从而提高了识别可疑交易成员角色的覆盖面。

图10为本发明一实施例提供的一种可疑交易账户的识别装置的结构示意图,如图10所示,该装置包括:第一确定模块11、计算模块12和识别模块13。

第一确定模块11用于根据已确定可疑交易账户的资金关系链,确定出与所述已确定可疑交易账户匹配的关联账户。

计算模块12用于根据多个不同的可疑交易成员角色对应的至少二个参数占比值,计算所述关联账户与多个不同的赌博成员角色之间的角色距离分。

识别模块13用于根据多个所述角色距离分,识别出所述关联账户是否为可疑交易账户。

本发明实施例中,该装置还包括:采集模块14、数据清洗模块15和生成模块16。

采集模块14用于采集第一设定时间段内所述已确定可疑交易账户的资金流水数据;

数据清洗模块15用于对所述已确定可疑交易账户的资金流水数据进行数据清洗;

生成模块16用于根据数据清洗后的已确定可疑交易账户的资金流水数据,生成所述已确定可疑交易账户的资金关系链。

本发明实施例中,第一确定模块11具体用于将所述已确定可疑交易账户资金转出到的账户确定为第一级的关联账户和/或将所述已确定可疑交易账户自身确定为第一级的关联账户。

本发明实施例中,第一确定模块11具体用于将向所述第一级的关联账户转入资金的账户确定为第二级的关联账户。

本发明实施例中,第一确定模块11具体用于将所述第一级的关联账户资金转出到的账户确定为第三级的关联账户、将所述第二级的关联账户资金转出到的第一级的关联账户之外的账户确定为第三级的关联账户和将向所述第二级的关联账户转入资金的账户确定为第三级的关联账户中之一或其任意组合。

本发明实施例中,计算模块12包括:获取子模块121和计算子模块122。

获取子模块121用于根据已确定可疑交易账户的资金关系链中所述关联账户的资金流水数据,获取不同可疑交易成员角色对应的至少二个参数占比值。

计算子模块122用于计算出每个赌博成员角色对应的至少二个参数占比值组成的坐标点与占比最高可能性对应的坐标点之间的角色距离分。

本发明实施例中,所述至少二个参数占比值包括可疑交易成员角色的入账金额占比值、可疑交易成员角色的入账次数占比值和可疑交易成员角色的入账人数占比值。作为一种优选方案,计算子模块122具体用于通过公式φ=d([赌博成员角色的入账金额占比,赌博成员角色的入账次数占比,赌博成员角色的入账人数占比],[1,1,1]),计算出角色距离分,其中,φ为角色距离分,d为距离计算公式,[1,1,1]为占比最高可能性对应的坐标点。

本发明实施例中,识别模块13包括:确定子模块131、判断子模块132和识别子模块133。

确定子模块131用于从多个所述角色距离分中确定出最小的角色距离分;

判断子模块132用于判断最小的角色距离分是否小于角色距离分阈值;

识别子模块133用于若判断子模块132判断出最小的角色距离分小于角色距离分阈值,识别出所述关联账户为可疑交易账户。

本发明实施例中,确定子模块131具体用于对多个所述角色距离分进行比较,选取出最小的至少一个角色距离分;若选取出的至少一个角色距离分的数量为一个,将选取出的一个角色距离分确定为最小的角色距离分;若选取出的至少一个角色距离分的数量为多个,按照预先设置的优先级顺序从选取出的多个角色距离分中选取出优先级最高的角色距离分,将优先级最高的角色距离分确定为最小的角色距离分,其中,优先级顺序包括第一角色距离分的优先级大于第二角色距离分的优先级以及第二角色距离分大于第三角色距离分。

本发明实施例中,该装置还包括:第二确认模块17。

第二确认模块17用于根据最小的角色距离分,确定出该关联账户在可以交易团伙中的可疑交易成员角色。

本发明实施例中,第二确认模块17具体用于若所述最小的角色距离分为第一角色距离分时,确定出该关联账户在可疑交易团伙中的可疑交易成员角色为第二成员角色;或者,若所述最小的角色距离分为第二角色距离分时,确定出该关联账户在可疑交易团伙中的可疑交易成员角色为前端的第三成员角色,其中,前端的第三成员角色为资金关系链中接收第二成员角色转出资金的第三成员角色;或者,若所述最小的角色距离分为第三角色距离分时,确定出该关联账户在可疑交易团伙中的可疑交易成员角色为后端的第三成员角色,其中,后端的第三成员角色为资金关系链中接收前端的第三成员角色转出资金的第三成员角色。

本发明实施例中,该装置还包括:判断模块18和添加模块19。

判断模块18用于判断获取的所述关联账户的入账金额是否大于最低金额阈值且获取的所述关联账户的入账人数是否大于最低人数阈值;

添加模块19用于若判断模块18判断出所述关联账户的入账金额大于最低金额阈值且所述关联账户的入账人数大于最低人数阈值,将所述关联账户添加入可疑交易团伙名单中。

本发明实施例中,该装置还包括:管控模块20。

管控模块20用于根据所述可疑交易团伙名单中的关联账户在可疑交易团伙中的可疑交易成员角色,对所述可疑交易团伙名单中的关联账户进行与可疑交易成员角色对应的管控。

本发明实施例提供的可疑交易账户的识别装置中,根据已确定可疑交易账户的资金关系链确定出与已确定可疑交易账户匹配的关联账户,根据多个不同的可疑交易成员角色对应的至少二个参数占比值计算关联账户与多个不同的可疑交易成员角色之间的角色距离分,根据多个角色距离分识别出关联账户是否为可疑交易账户,本发明实施例通过计算出的角色距离分识别可疑交易账户,从而提高了识别可疑交易账户的准确率。本发明实施例可根据多个角色距离分中最小的角色距离分确定出该关联账户在可疑交易团伙中的多种可疑交易成员角色,从而提高了识别可疑交易成员角色的覆盖面。

本发明实施例提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述可疑交易账户的识别方法的实施例的各步骤,具体描述可参见上述可疑交易账户的识别方法的实施例。

本发明实施例提供了一种服务器,包括存储器和处理器,存储器用于存储包括程序指令的信息,处理器用于控制程序指令的执行,程序指令被处理器加载并执行时实现上述可疑交易账户的识别方法的实施例的各步骤,具体描述可参见上述可疑交易账户的识别方法的实施例。

图11是本发明一实施例提供的一种服务器的示意图,如图11所示,该实施例的服务器24包括:处理器21、存储器22以及存储在存储22中并可在处理器21上运行的计算机程序23,该计算机程序23被处理器21执行时实现实施例中的应用于可疑交易账户的识别方法,为避免重复,此处不一一赘述。或者,该计算机程序被处理器21执行时实现实施例中应用于可疑交易账户的识别装置中各模型/单元的功能,为避免重复,此处不一一赘述。

服务器24可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。服务器24可包括,但不仅限于,处理器21、存储器22。本领域技术人员可以理解,图11仅仅是服务器24的示例,并不构成对服务器24的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如服务器还可以包括输入输出设备、网络接入设备、总线等。

所称处理器21可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器22可以是服务器24的内部存储单元,例如服务器24的硬盘或内存。存储器22也可以是服务器24的外部存储设备,例如服务器24上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,存储器22还可以既包括服务器24的内部存储单元也包括外部存储设备。存储器22用于存储计算机程序以及服务器所需的其他程序和数据。存储器22还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1