一种数据处理方法、装置、设备及存储介质与流程

文档序号:25994685发布日期:2021-07-23 21:08阅读:124来源:国知局
一种数据处理方法、装置、设备及存储介质与流程

本申请涉及人工智能(artificialintelligence,ai)技术领域,尤其涉及一种数据处理方法、装置、设备及存储介质。



背景技术:

现如今,很多游戏平台均可支持游戏账号之间进行资源转移(也可以理解为资源交易),例如,在大型多人在线(massivemultiplayeronline,mmo)类游戏中游戏账号间可以交易虚拟物品、虚拟金币等虚拟资源。在该种模式下,一些通过使用不等价交易的方式将虚拟资源变现的游戏账号不断地涌现出来,此类游戏账号在业界被称为中转账号;在一种常见的场景中,中转账号可以从打金账号(即专用于通过游戏赚取虚拟金币等虚拟资源的账号)处换取或者买入虚拟金币等虚拟资源,进而将买入的虚拟资源倒卖给游戏平台上其它的游戏账号,从而获得线下收益。

由于中转账号倒卖的虚拟资源的价格相对于游戏平台上正常售卖的虚拟资源的价格更低,因此很多游戏账号更倾向于从中转账号处购买虚拟资源,这会影响游戏平台上的正常交易秩序,同时对游戏平台的经济系统的稳定性也有所影响。如何准确地检测识别游戏平台上的中转账号,并对其进行相应地制裁管理,已成为目前亟待解决的问题。



技术实现要素:

本申请实施例提供了一种数据处理方法、装置、设备及存储介质,能够准确地检测识别游戏平台上的中转账号,有助于维护游戏平台上的交易秩序和游戏平台的经济系统的稳定性。

有鉴于此,本申请第一方面提供了一种数据处理方法,所述方法包括:

将目标平台的资源转移网络拆分为资源转入网络和资源转出网络;所述资源转入网络用于表征账号间的资源转入关系,所述资源转出网络用于表征账号间的资源转出关系;

针对所述目标平台上待识别的目标账号,通过账号类型检测模型,根据所述目标账号在所述目标平台上的目标资源转移数据和目标资源转移关系,确定所述目标账号对应的检测结果;所述目标资源转移数据包括所述目标账号的资源转入数据和资源转出数据,所述目标资源转移关系包括所述资源转入网络中所述目标账号的资源转入关系和所述资源转出网络中所述目标账号的资源转出关系;所述目标账号对应的检测结果用于表征所述目标账号是否为资源转入异常账号、以及是否为资源转出异常账号;

若所述目标账号对应的检测结果表征所述目标账号为资源转入异常账号、且为资源转出异常账号,则确定所述目标账号为中转账号。

本申请第二方面提供了一种数据处理装置,所述装置包括:

网络拆分单元,用于将目标平台的资源转移网络拆分为资源转入网络和资源转出网络;所述资源转入网络用于表征账号间的资源转入关系,所述资源转出网络用于表征账号间的资源转出关系;

异常账号识别单元,用于针对所述目标平台上待识别的目标账号,通过账号类型检测模型,根据所述目标账号在所述目标平台上的目标资源转移数据和目标资源转移关系,确定所述目标账号对应的检测结果;所述目标资源转移数据包括所述目标账号的资源转入数据和资源转出数据,所述目标资源转移关系包括所述资源转入网络中所述目标账号的资源转入关系和所述资源转出网络中所述目标账号的资源转出关系;所述目标账号对应的检测结果用于表征所述目标账号是否为资源转入异常账号、以及是否为资源转出异常账号;

中转账号识别单元,用于若所述目标账号对应的检测结果表征所述目标账号为资源转入异常账号、且为资源转出异常账号,则确定所述目标账号为中转账号。

本申请第三方面提供了一种设备,所述设备包括处理器以及存储器:

所述存储器用于存储计算机程序;

所述处理器用于根据所述计算机程序,执行上述第一方面所述的数据处理方法的步骤。

本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述第一方面所述的数据处理方法的步骤。

本申请第五方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面所述的数据处理方法的步骤。

从以上技术方案可以看出,本申请实施例具有以下优点:

本申请实施例提供了一种数据处理方法,该方法创新性地将中转账号的检测任务拆分成了资源转入异常账号的检测任务和资源转出异常账号的检测任务,进而,将同时被检测为资源转入异常账号和资源转出异常账号的账号确定为中转账号。一方面,本申请考虑到中转账号的标注难度高且标注数据少,因此借助中转账号在资源转入和资源转出中均表现异常的特点,通过用于检测资源转入异常账号和资源转出异常账号的账号类型检测模型,检测账号是否为资源转入异常账号以及资源转出异常账号,并将被检测为既是资源转入异常账号、又是资源转出异常账号的账号确定为中转账号;由于资源转入异常账号和资源转出异常账号的标注难度较低且标注数据较多,因此可以容易地获取到大量的用于训练上述账号类型检测模型的训练样本数据,相应地,基于大量的训练样本数据训练得到的账号类型检测模型的模型性能较优,检测资源转入异常账号和资源转出异常账号的准确度较高,相应地能进一步保证基于该模型的检测结果确定的中转账号的准确度较高。另一方面,本申请中的账号类型检测模型检测资源转入异常账号和资源转出异常账号时,还综合考虑了账号间的资源转入关系和资源转出关系,由于资源转入关系和资源转出关系能够提供较高的参考价值,因此有助于进一步提高该账号类型检测模型的检测结果的准确性。本申请通过上述方式巧妙地实现了对于中转账号的检测,并且能够保证中转账号检测的准确性,进而有利于维护各种网络平台的正常交易秩序以及经济系统的稳定性。

附图说明

图1为本申请实施例提供的数据处理方法的应用场景示意图;

图2为本申请实施例提供的数据处理方法的流程示意图;

图3为本申请实施例提供的转入账号类型检测模型和转出账号类型检测模型的训练原理示意图;

图4为本申请实施例提供的账号类型检测模型的工作过程示意图;

图5为本申请实施例提供的账号类型检测模型的工作原理示意图;

图6为本申请实施例提供的统计特征建模模块和序列特征建模模块组成的双塔结构的结构示意图;

图7为本申请实施例提供的统计特征建模模块的工作原理示意图;

图8为本申请实施例提供的统计特征建模模块的工作原理示意图;

图9为本申请实施例提供的多变量交易序列embedding表示层的工作原理示意图;

图10为本申请实施例提供的残差门控单元的结构示意图;

图11为本申请实施例提供的transformer编码器的工作原理示意图;

图12为本申请实施例提供的全局特征建模模块的工作原理示意图;

图13为本申请实施例提供的模型训练、应用一体化的实现过程示意图;

图14为本申请实施例提供的第一种数据处理装置的结构示意图;

图15为本申请实施例提供的第二种数据处理装置的结构示意图;

图16为本申请实施例提供的第三种数据处理装置的结构示意图;

图17为本申请实施例提供的第四种数据处理装置的结构示意图;

图18为本申请实施例提供的终端设备的结构示意图;

图19为本申请实施例提供的服务器的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

人工智能(artificialintelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本申请实施例提供的方案涉及人工智能技术,具体通过如下实施例进行说明:

如今,各种支持账号之间进行资源转移(如资源交易)的网络平台上普遍存在影响交易秩序的中转账号,为了准确地检测识别这种中转账号,并对其进行相应地制裁和管理,本申请实施例提供了一种数据处理方法。

在本申请实施例提供的数据处理方法中,先将目标平台的资源转移网络拆分为资源转入网络和资源转出网络,其中,资源转入网络用于表征账号间的资源转入关系,资源转出网络用于表征账号间的资源转出关系。进而,针对该目标平台上待识别的目标账号,通过账号类型检测模型根据该目标账号在该目标平台上的目标资源转移数据和目标资源转移关系,确定该目标账号对应的检测结果;其中,目标资源转移数据包括该目标账号的资源转入数据和资源转出数据,目标资源转移关系包括资源转入网络中该目标账号的资源转入关系和资源转出网络中该目标账号的资源转出关系,目标账号对应的检测结果用于表征该目标账号是否为资源转入异常账号以及是否为资源转出异常账号。若该目标账号对应的检测结果表征该目标账号为资源转入异常账号且为资源转出异常账号,则确定该目标账号为中转账号。

上述数据处理方法考虑到中转账号的标注难度高且标注数据少,因此借助中转账号在资源转入和资源转出中均表现异常的特点,通过用于检测资源转入异常账号和资源转出异常账号的账号类型检测模型,检测账号是否为资源转入异常账号以及资源转出异常账号,并将被检测为既是资源转入异常账号、又是资源转出异常账号的账号确定为中转账号;由于资源转入异常账号和资源转出异常账号的标注难度较低且标注数据较多,因此可以容易地获取到大量的用于训练上述账号类型检测模型的训练样本数据,相应地,基于大量的训练样本数据训练得到的账号类型检测模型的模型性能较优,检测资源转入异常账号和资源转出异常账号的准确度较高,能够进一步保证基于该模型的检测结果确定的中转账号的准确度较高。此外,上述账号类型检测模型检测资源转入异常账号和资源转出异常账号时,综合考虑了账号间的资源转入关系和资源转出关系,由于资源转入关系和资源转出关系具有较高的参考价值,因此有助于进一步提高该账号类型检测模型的检测结果的准确性。如此,通过上述方式巧妙地实现了对于中转账号的检测,并且能够保证中转账号检测的准确性,从而有利于维护各种网络平台的正常交易秩序以及经济系统的稳定性。

应理解,本申请实施例提供的数据处理方法可以应用于具备数据处理能力的设备,如终端设备或服务器。其中,终端设备具体可以为智能手机、计算机、平板电脑、个人数字助理(personaldigitalassitant,pda)、车载终端等;服务器具体可以为应用服务器或web服务器,实际部署时,可以为独立服务器,也可以为集群服务器或云服务器。本申请实施例公开的数据处理方法中涉及的数据(如交易数据、交易关系等),可以保存于区块链上。

为了便于理解本申请实施例提供的数据处理方法,下面以本申请实施例提供的数据处理方法的执行主体为服务器为例,对该数据处理方法的应用场景进行示例性介绍。

参见图1,图1为本申请实施例提供的数据处理方法的应用场景示意图。如图1所示,该应用场景中包括服务器110和数据库120,服务器110可以通过网络从数据库120中调取所需的资源转移数据,或者数据库120也可以集成在服务器110中。其中,服务器110为目标平台的后台服务器,目标平台是支持账号之间进行资源转移的网络平台,如mmo类游戏平台等,服务器110用于执行本申请实施例提供的数据处理方法;数据库120用于存储目标平台上产生的资源转移数据。

服务器110针对目标平台上的目标账号识别其是否为中转账号时,可以先将该目标平台的资源转移网络拆分为资源转入网络和资源转出网络,资源转入网络能够表征目标平台上的账号间的资源转入关系,资源转出网络能够表征目标平台上的账号间的资源转出关系。

然后,服务器110可以从数据库120中调取目标账号在目标平台上产生的资源转移数据;并调用预先训练好的账号类型检测模型,根据目标账号在目标平台上的目标资源转移数据和目标资源转移关系,确定该目标账号对应的检测结果。其中,目标资源转移数据包括该目标账号的资源转入数据和资源转出数据;目标资源转移关系包括资源转入网络中体现的该目标账号的资源转入关系、和资源转出网络中体现的该目标账号的资源转出关系;目标账号对应的检测结果能够表征该目标账号是否为资源转入异常账号、以及是否为资源转出异常账号。

示例性的,账号类型检测模型可以包括转入账号类型检测模型和转出账号类型检测模型;相应地,服务器110可以利用转入账号类型检测模型,根据目标账号的资源转入数据和资源转入网络中该目标账号的资源转入关系,确定目标账号是否为资源转入异常账号;并且利用转出账号类型检测模型,根据目标账号的资源转出数据和资源转出网络中该目标账号的资源转出关系,确定该目标账号是否为资源转出异常账号。或者,账号类型检测模型也可以为用于检测账号分别属于资源转入正常账号、资源转入异常账号、资源转出正常账号和资源转出异常账号的概率的四分类模型;相应地,服务器110可以利用该账号类型检测模型,根据该目标账号的资源转入数据和资源转入网络中该目标账号的资源转入关系、以及该目标账号的资源转出数据和资源转出网络中该目标账号的资源转出关系,确定该目标账号分别属于资源转入正常账号、资源转入异常账号、资源转出正常账号和资源转出异常账号的概率,作为该目标账号对应的检测结果。

服务器110若根据该目标账号对应的检测结果,确定该目标账号既属于资源转入异常账号、又属于资源转出异常账号,则进一步确定该目标账号为中转账号,进而服务器110可以采取相应的处罚措施(如封号、收益制裁等),对该目标账号进行制裁管理,如此维护目标平台的正常交易秩序。

应理解,图1所示的应用场景仅为示例,在实际应用中,服务器110除了可以从数据库120中获取账号的资源转移数据外,还可以独立采集账号在目标平台上产生的资源转移数据;此外,除了可以由服务器110执行本申请实施例提供的数据处理方法外,还可以由相关终端设备执行本申请实施例提供的数据处理方法。在此不对本申请实施例提供的数据处理方法的应用场景做任何限定。

下面通过方法实施例对本申请提供的数据处理方法进行详细介绍。

参见图2,图2为本申请实施例提供的数据处理方法的流程示意图。为了便于描述,下述实施例仍以该数据处理方法的执行主体为服务器为例进行介绍。如图2所示,该数据处理方法包括以下步骤:

步骤201:将目标平台的资源转移网络拆分为资源转入网络和资源卖出网络;所述资源转入网络用于表征账号间的资源转入关系,所述资源转出网络用于表征账号间的资源转出关系。

服务器针对目标平台上的账号识别其是否为中转账号时,需要先将目标平台的资源转移网络拆分为资源转入网络和资源转出网络。目标平台可以是任一支持账号间进行资源转移(如资源交易)的网络平台,例如mmo类游戏平台等。目标平台的资源转移网络是根据该目标平台上账号间的资源转移关系构建的图结构数据;示例性的,目标平台的资源转移网络中可以包括各账号各自对应的节点,若两个节点之间具有连接边,则表示这两个节点各自对应的账号之间具有资源转移关系(即交易关系),若两个节点之间不具有连接边,则表示这两个节点各自对应的账号之间不具有资源转移关系,资源转移网络可以通过不同形式的连接边来表示不同的资源转移关系类型。资源转入网络是用于表示目标平台上账号间的资源转入关系(可以理解为买入交易关系)的图结构数据,其中仅包括资源转入关系对应的连接边。资源转出网络是用于表示目标平台上账号间的资源转出关系(可以理解为卖出交易关系)的图结构数据,其中仅包括资源转出关系对应的连接边。

作为一种示例,服务器可以根据目标平台的资源转移网络中各连接边各自对应的资源转移关系类型,将该资源转移网络拆分为资源转入网络和资源转出网络。即利用彼此间具有资源转入关系对应的连接边的节点构建资源转入网络,利用彼此间具有资源转出关系对应的连接边的节点构建资源转出网络。

当然,在实际应用中,服务器也可以采用其它方式对资源转移网络进行拆分,得到资源转入网络和资源转出网络,本申请在此不对拆分资源转移网络得到资源转入网络和资源转出网络的实现方式做任何限定。

步骤202:针对所述目标平台上待识别的目标账号,通过账号类型检测模型,根据所述目标账号在所述目标平台上的目标资源转移数据和目标资源转移关系,确定所述目标账号对应的检测结果;所述目标资源转移数据包括所述目标账号的资源转入数据和资源转出数据,所述目标资源转移关系包括所述资源转入网络中所述目标账号的资源转入关系和所述资源转出网络中所述目标账号的资源转出关系;所述目标账号对应的检测结果用于表征所述目标账号是否为资源转入异常账号、以及是否为资源转出异常账号。

服务器检测目标账号是否为中转账号时,需要先利用预先训练好的账号类型检测模型,根据该目标账号在目标平台上的目标资源转移数据和目标资源转移关系,确定该目标账号对应的检测结果。其中,目标资源转移数据包括该目标账号在目标平台上产生的资源转入数据和资源转出数据,资源转入数据具体可以是服务器根据目标账号产生的资源转入行为(如买入交易行为)生成的资源转入行为日志数据,资源转出数据具体可以是服务器根据目标账号产生的资源转出行为(如卖出交易行为)生成的资源转出行为日志数据。目标资源转移关系包括资源转入网络中该目标账号的资源转入关系和资源转出网络中该目标账号的资源转出关系,示例性的,目标账号的资源转入关系具体可以由资源转入网络中与目标账号对应的节点之间具有连接关系的各节点来体现,目标账号的资源转出关系可以由资源转出网络中与目标账号对应的节点之间具有连接关系的各节点来体现。目标账号对应的检测结果能够表征该目标账号是否为资源转入异常账号、以及是否为资源转出异常账号。

在一种可能的实现方式中,账号类型检测模型可以包括转入账号类型检测模型和转出账号类型检测模型。相应地,服务器可以通过转入账号类型检测模型,根据目标账号的资源转入数据和资源转入网络中该目标账号的资源转入关系,确定该目标账号对应的转入检测结果,该转入检测结果用于表征目标账号是否为资源转入异常账号;并且,通过转出账号类型检测模型,根据该目标账号的资源转出数据和资源转出网络中该目标账号的资源转出关系,确定该目标账号对应的转出检测结果,该转出检测结果用于表征目标账号是否为资源转出异常账号。

具体的,服务器可以利用转入账号类型检测模型和转出账号类型检测模型,分别实现资源转入异常账号的检测任务和资源转出异常账号的检测任务。执行资源转入异常账号的检测任务时,服务器可以将目标账号的资源转入数据和资源转入网络中该目标账号的资源转入关系,输入预先训练好的转入账号类型检测模型中,该转入账号类型检测模型对输入的资源转入数据和资源转入关系进行分析处理后,将相应地输出该目标账号分别属于资源转入正常账号和资源转入异常账号的概率,即该目标账号对应的转入检测结果。执行资源转出异常账号的检测任务时,服务器可以将目标账号的资源转出数据和资源转出网络中该目标账号的资源转出关系,输入预先训练好的转出账号类型检测模型中,该转出账号类型检测模型对输入的资源转出数据和资源转出关系进行分析处理后,将相应地输出该目标账号分别属于资源转出正常账号和资源转出异常账号的概率,即该目标账号对应的转出检测结果。

应理解,转入账号类型检测模型输出的目标账号分别属于资源转入正常账号和资源转入异常账号的概率,能够相应地表征该目标账号是否属于资源转入异常账号;转出账号类型检测模型输出的目标账号分别属于资源转出正常账号和资源转出异常账号的概率,能够相应地表征该目标账号是否属于资源转出异常账号。示例性的,可以预先设置概率阈值,若转入账号类型检测模型输出的目标账号属于资源转入异常账号的概率大于或等于该概率阈值,则说明目标账号属于资源转入异常账号,若转出账号类型检测模型输出的目标账号属于资源转出异常账号的概率大于或等于该概率阈值,则说明目标账号属于资源转出异常账号。

如此,通过两个二分类模型(即转入账号类型检测模型和转出账号类型检测模型),分别实现资源转入异常账号的检测任务和资源转出异常账号的检测任务,可以在一定程度上简化模型的训练过程,降低模型的训练难度,同时分别保证转入账号类型检测模型和转出账号类型检测模型均具有较高的准确度。

在另一种可能的实现方式中,账号类型检测模型可以为四分类模型,其用于检测目标平台上的账号分别属于资源转入正常账号、资源转入异常账号、资源转出正常账号和资源转出异常账号的概率。相应地,服务器可以通过该账号类型检测模型,根据目标账号的资源转入数据和资源转入网络中该目标账号的资源转入关系、以及目标账号的资源转出数据和资源转出网络中该目标账号的资源转出关系,确定该目标账号分别属于资源转入正常账号、资源转入异常账号、资源转出正常账号和资源转出异常账号的概率;进而,服务器可以根据目标账号分别属于资源转入正常账号、资源转入异常账号、资源转出正常账号和资源转出异常账号的概率,确定该目标账号对应的检测结果。

具体的,服务器可以利用能够综合识别资源转入异常账号和资源转出异常账号的四分类模型,同时实现资源转入异常账号的检测任务和资源转出异常账号的检测任务。具体实现时,服务器可以将目标账号的资源转入数据和资源转入网络中该目标账号的资源转入关系、以及目标账号的资源转出数据和资源转出网络中该目标账号的资源转出关系,一同输入预先训练好的账号类型检测模型;应理解,不同的数据应当通过其对应的输入通道输入,以实现数据的区分;账号类型检测模型对输入的资源转入数据和资源转入关系、以及资源转出数据和资源转出关系进行分析处理后,将相应地输出四个概率值,分别是目标账号属于资源转入正常账号的概率、属于资源转入异常账号的概率、属于资源转出正常账号的概率和属于资源转出异常账号的概率。

账号类型检测模型输出的四个概率值能够相应地表征目标账号是否属于资源转入异常账号、以及是否属于资源转出异常账号。示例性的,可以预先设定概率阈值,若某项概率值大于或等于该概率阈值,则说明目标账号属于该概率值对应的账号类型;例如,假设预先设定的概率阈值为0.3,账号类型检测模型输出的目标账号属于资源转入正常账号的概率、属于资源转入异常账号的概率、属于资源转出正常账号的概率和属于资源转出异常账号的概率分别为0.2、0.4、0.1和0.3,其中,目标账号属于资源转入异常账号的概率和属于资源转出异常账号的概率均大于或等于0.3,则说明目标账号既是资源转入异常账号,又是资源转出异常账号。

如此,通过一个四分类模型同时实现资源转入异常账号的检测任务和资源转出异常账号的检测任务,可以简化两个检测任务的实现过程,有利于提高中转账号的检测效率。

应理解,上述资源转入数据可以是对资源转入数据进行加工处理后得到的数据(如资源转入统计数据、资源转入序列数据等);同理,上述资源转出数据也可以是对资源转出数据进行加工处理后得到的数据(如资源转出统计数据、资源转出序列数据等)。上述资源转入关系实质上可以是根据与目标账号相关的资源转入关系生成的邻接矩阵;同理,上述资源转出关系实质上也可以是根据与目标账号相关的资源转出关系生成的邻接矩阵。

需要说明的是,对于上述账号类型检测模型,服务器可以通过以下方式进行训练:根据目标平台对应的黑名单,确定该目标平台上的历史资源转入异常账号和历史资源转出异常账号,并利用历史资源转入异常账号的资源转入数据和历史资源转出异常账号的资源转出数据构建负训练样本;从该目标平台上抽取没有被列入该黑名单的账号,作为历史资源转入正常账号和历史资源转出正常账号,并利用历史资源转入正常账号的资源转入数据和历史资源转出正常账号的资源转出数据构建正训练样本;进而,基于包括负训练样本和正训练样本的训练样本集,对待训练的账号类型检测模型进行训练。

应理解,目标平台对应的黑名单用于记录目标平台上资源转移行为异常的账号,其中包括资源转入行为异常的账号和资源转出行为异常的账号。在本申请实施例中,服务器可以根据目标平台的黑名单,确定被列入该黑名单的资源转入行为异常的账号作为历史资源转入异常账号,确定被列入该黑名单的资源转出行为异常的账号作为历史资源转出异常账号。相应地,目标平台上其它未被列入该黑名单的账号应当为资源转移行为正常的账号,因此,服务器可以从未被列入该黑名单的账号中,随机抽取具有资源转入行为的账号作为历史资源转入正常账号,随机抽取具有资源转出行为的账号作为历史资源转出正常账号。

当账号类型检测模型包括转入账号类型检测模型和转出账号类型检测模型时,转入账号类型检测模型和转出账号类型检测模型的训练原理如图3所示;服务器可以利用历史资源转入异常账号的资源转入数据构建资源转入负样本(图3中资源转入训练样本集中的黑色圆圈),利用历史资源转入正常账号的资源转入数据构建资源转入正样本(图3中资源转入训练样本集中的白色圆圈),进而利用包括多个资源转入正样本和多个资源转入负样本的资源转入训练样本集,对待训练的转入账号类型检测模型进行训练。相类似地,服务器可以利用历史资源转出异常账号的资源转出数据构建资源转出负样本(图3中资源转出训练样本集中的黑色圆圈),利用历史资源转出正常账号的资源转出数据构建资源转出正样本(图3中资源转出训练样本集中的白色圆圈),进而利用包括多个资源转出正样本和多个资源转出负样本的资源转出训练样本集,对待训练的转出账号类型检测模型进行训练。

当账号类型检测模型为用于同时识别资源转入异常账号和资源转出异常账号的四分类模型时,服务器可以利用历史资源转入异常账号的资源转入数据构建资源转入负样本,利用历史资源转入正常账号的资源转入数据构建资源转入正样本,进而利用包括多个资源转入正样本和多个资源转入负样本的资源转入训练样本集,对该账号类型检测模型中的转入账号类型检测结构进行训练。服务器可以利用历史资源转出异常账号的资源转出数据构建资源转出负样本,利用历史资源转出正常账号的资源转出数据构建资源转出正样本,进而利用包括多个资源转出正样本和多个资源转出负样本的资源转出训练样本集,对该账号类型检测模型中的转出账号类型检测结构进行训练。进而,再利用少量黑名单中资源转入行为和资源转出行为均异常的账号的资源转移数据构建融合负样本,利用资源转入行为和资源转出行为均正常的账号的资源转移数据构建融合正样本,进而利用包括多个融合正样本和多个融合负样本的融合训练样本集,对该账号类型检测模型进行综合训练。

示例性的,上述模型训练过程可以使用基于softmax的多分类(二分类或四分类)交叉熵目标函数进行优化,例如可以采用adam算法优化模型中各层结构的参数,学习速率例如可以设置为0.0001。为了避免过拟合,可以对模型中最后的全连接层的权重参数添加l1和l2正则化。

上述模型训练方式,利用目标平台的黑名单确定该目标平台上的资源转入异常账号和资源转出异常账号,进而利用资源转入异常账号的资源转入数据和资源转出异常账号的资源转出数据构建对应的负训练样本,以用于对模型进行训练。由于各种网络平台的黑名单中通常记录有大量的资源转入异常账号和资源转出异常账号,因此可以相应地获取到大量的标注负样本,基于包括充足训练数据量的训练样本集对模型进行训练,有利于模型更好地学习资源转入异常账号和资源转出异常账号的特征,进而能够更准确地识别资源转入异常账号和资源转出异常账号。

在一种可能的实现方式中,为了使账号类型检测模型能够更准确地检测资源转入异常账号和资源转出异常账号,服务器还可以在利用账号类型检测模型对目标资源转移数据和目标资源转移关系进行处理之前,对目标资源转移数据进行加工处理,得到更有助于账号类型检测模型检测目标账号类型的目标资源转移统计数据和目标资源转移序列数据。

即,服务器可以根据目标资源转移数据生成目标资源转移统计数据,该目标资源转移统计数据包括多种统计指标下的资源转移统计数据;当目标资源转移数据为资源转入数据时,该目标资源转移统计数据包括多种资源转入统计指标下的资源转入统计数据;当目标资源转移数据为资源转出数据时,该目标资源转移统计数据包括多种资源转出统计指标下的资源转出统计数据。服务器还可以根据目标资源转移数据生成目标资源转移序列数据,该目标资源转移序列数据包括多笔资源转移各自的资源转移描述数据;当目标资源转移数据为资源转入数据时,该目标资源转移序列数据包括多笔资源转入各自的资源转入描述数据;当目标资源转移数据为资源转出数据时,该目标资源转移序列数据包括多笔资源转出各自的资源转出描述数据。进而,服务器将通过账号类型检测模型,根据目标资源转移统计数据、目标资源转移序列数据和目标资源转移关系,确定目标账号对应的检测结果。

需要说明的是,目标资源转移数据通常是目标账号的资源转移行为日志数据,其中记录有与目标账号产生的资源转移行为相关的各种参数;例如,假设目标账号产生了资源转入行为,则与该资源转入行为对应的资源转入行为日志数据中应当包括该资源转入行为对应的买入物品类型、物品单价、买入物品数量、买入总额、以及买入时间等参数。服务器通过账号类型检测模型检测目标账号的类型时,通常需要获取特定时间范围内目标账号产生的目标资源转移数据,如在一天内目标账号产生的目标资源转移数据;一般情况下,服务器所获取的目标资源转移数据中包括目标账号产生的多个资源转移行为(资源转入行为或者资源转出行为)各自对应的资源转移行为日志数据。基于此,服务器可以基于获取的目标资源转移数据生成目标资源转移统计数据和目标资源转移序列数据。

示例性的,服务器可以按照特定的统计指标,对所获取的目标资源转移数据进行统计,从而得到多种统计指标下的资源转移统计数据。例如,假设目标资源转移数据为资源转入数据,并且预先设定有买入物品数量均值、买入物品数量方差、买入物品极大值、买入物品总值、买入交易金额均值、买入交易金额方差、买入交易金额极大值、买入交易金额总值、不同类型的买入物品的买入频次等资源转入统计指标,则服务器可以根据所获取的目标资源转移统计数据,确定上述各种资源转入统计指标下的资源转入统计数据。又例如,假设目标资源转移数据为资源转出数据,并且预先设定有卖出物品数量均值、卖出物品数量方差、卖出物品极大值、卖出物品总值、卖出交易金额均值、卖出交易金额方差、卖出交易金额极大值、卖出交易金额总值、不同类型的卖出物品的卖出频次等资源转出统计指标,则服务器可以根据所获取的目标资源转移统计数据,确定上述各种资源转出统计指标下的资源转出统计数据。

应理解,在实际应用中,资源转入统计指标和资源转出统计指标均可根据实际需求设定,本申请在此不对资源转入统计指标和资源转出统计指标做任何限定。

示例性的,服务器可以按照特定的资源转移描述数据模板,将所获取的各笔资源转移的资源转移行为日志数据(即目标资源转移数据)相应地转换为资源转移描述数据,进而利用各笔资源转移的资源转移描述数据组成目标资源转移序列数据。例如,假设目标资源转移数据为资源转入数据,资源转入描述数据的模板包括买入物品类型、买入物品单价和买入交易总额,则服务器可以按照该资源转入描述数据的模板,将资源转入数据转换为对应的资源转入描述数据,并利用目标账号产生的多笔资源转入各自对应的资源转入描述数据组成资源转入序列数据。又例如,假设目标资源转移数据为资源转出数据,资源转出描述数据的模板包括卖出物品类型、卖出物品单价和卖出交易总额,则服务器可以按照该资源转出描述数据的模板,将资源转出数据转换为对应的资源转出描述数据,并利用目标账号产生的多笔资源转出各自对应的资源转出描述数据组成资源转出序列数据。

此外,服务器还可以对所构建的目标资源转移序列数据的长度进行限制,如限制目标资源转移序列数据中包括的资源转移描述数据的上限为100条,若目标账号产生的资源转移过多,则服务器可以根据各笔资源转移的资源转移总额对资源转移描述数据进行筛选,例如,服务器可以利用资源转移总额排序较大的100条资源转移描述数据构建目标资源转移序列数据。

应理解,在实际应用中,资源转入描述数据的模板和资源转出描述数据的模板均可根据实际需求设定,本申请在此也不对该资源转入描述数据的模板和资源转出描述数据的模板做任何限定。

进而,服务器可以利用账号类型检测模型,根据目标资源转移统计数据、目标资源转移序列数据和目标资源转移关系,确定目标账号对应的检测结果。当账号类型检测模型包括转入账号类型检测模型和转出账号类型检测模型时,服务器可以利用转入账号类型检测模型,根据资源转入统计数据、资源转入序列数据和资源转入关系,确定目标账号是否为资源转入异常账号;并且利用转出账号类型检测模型,根据资源转出统计数据、资源转出序列数据和资源转出关系,确定目标账号是否为资源转出异常账号。当账号类型检测模型为四分类模型时,服务器可以利用该账号类型检测模型,根据资源转入统计数据、资源转入序列数据、资源转入关系、资源转出统计数据、资源转出序列数据和资源转出关系,确定目标账号是否为资源转入异常账号、以及是否为资源转出异常账号。

本申请实施例提供的方法在利用账号类型检测模型检测目标账号的类型时,综合考虑了资源转移统计数据、资源转移序列数据和资源转移关系,用于反映各资源转移统计指标下的数据分布情况的资源转移统计数据、以及用于反映账号实际资源转移情况的资源转移序列数据,对于检测目标账号的类型均能提供较高的参考价值,有助于进一步提高账号类型检测模型的检测结果的准确性。

此外,本申请实施例还创新性地提出了一种适用于处理序列特征的节点图注意力网络(seqgraphattentionnetwork,seqgat)模型,作为账号类型检测模型(包括转入账号类型检测模型、转出账号类型检测模型和四分类的账号类型检测模型),该模型能够建模同时含有序列数据、统计数据和节点间网络关系的数据。

具体的,该账号类型检测模型包括:统计特征建模模块、序列特征建模模块、特征融合模块、全局特征建模模块和分类模块。具体工作时,通过该统计特征建模模块,根据目标资源转移统计数据确定目标账号的统计特征向量;通过该序列特征建模模块,根据目标资源转移序列数据确定目标账号的序列特征向量;通过特征融合模块,融合目标账号的统计特征向量和序列特征向量,得到该目标账号的资源转移行为特征向量;进而,通过全局特征建模模块,根据该目标账号的资源转移行为特征向量、以及该目标账号对应的关联账号的资源转移行为特征向量,确定该目标账号的资源转移全局特征向量,当目标资源转移关系为资源转入网络中目标账号的资源转入关系时,该目标账号对应的关联账号为资源转入网络中与该目标账号具有资源转入关系的账号,当目标资源转移关系为资源转出网络中目标账号的资源转出关系时,该目标账号对应的关联账号为资源转出网络中与该目标账号具有资源转出关系的账号;最终,通过分类模块,根据目标账号的资源转移全局特征向量,确定目标账号对应的检测结果。

图4所示为上述账号类型检测模型的工作过程示意图,图5所示为上述账号类型检测模型的工作原理示意图。下面结合图4和图5,以账号类型检测模型为买入账号类型检测模型为例,对上述账号类型检测模型的工作过程进行示例性介绍。

如图4所示,从资源转入网络中可以拆分出各账号间的资源转入关系,并且还可以获得各账号的资源转入数据。以待识别的目标账号为账号1为例,服务器可以根据账号1的资源转入数据,相应地生成该账号1的资源转入统计数据和资源转入序列数据。如图5所示,转入账号类型检测模型中的统计特征建模模块和序列特征建模模块构成了双塔结构,其中,统计特征建模模块可以根据账号1的资源转入统计数据生成账号1的统计特征向量,序列特征建模模块可以根据账号1的资源转入序列数据生成账号1的序列特征向量;转入账号类型检测模型中的特征融合模块会将账号1的统计特征向量和序列特征向量融合起来,得到账号1的资源转移行为特征向量。进而,获取资源转入网络中与账号1具有资源转入关系的各关联账号(即账号2、账号3和账号4)各自的资源转移行为特征向量,通过转入账号类型检测模型中的全局特征建模模块,基于图注意力神经网络结构融合账号1、账号2、账号3和账号4各自的资源转移行为特征向量,得到该账号1的资源转移全局特征向量;最终,通过转入账号类型检测模型中二分类的分类模块,根据该账号1的资源转移全局特征向量确定该账号1是否为资源转入异常账号。

应理解,转出账号类型检测模型与上述转入账号类型检测模型的工作原理相类似,此处不再赘述。四分类的账号类型检测模型本质上是包括转入账号类型检测结构和转出账号类型检测结构的四分类模型,其中的转入账号类型检测结构和转出账号类型检测结构分别与上述转入账号类型检测模型和转出账号类型检测模型的工作原理相类似,区别仅在于其中的转入账号类型检测结构和转出账号类型检测结构中不包括分类模块,转入账号类型检测结构和转出账号类型检测结构分别构建出账号的转入全局特征向量和转出全局特征向量后,由四分类模块根据该转入全局特征向量和转出全局特征向量确定检测结果。

为了便于进一步理解上述账号类型检测模型的工作原理,下面对该账号类型检测模型中的统计特征建模模块、序列特征建模模块以及全局特征建模模块的工作原理分别进行详细介绍。其中,统计特征建模模块和序列特征建模模块共同组成了双塔结构,如图6所示。

下面先介绍统计特征建模模块的工作原理。账号类型检测模型中的统计特征建模模块,可以对目标资源转移统计数据中各种统计指标下的资源转移统计数据,分别进行一阶特征映射处理,得到各种统计指标下的一阶子统计特征向量,并融合各种统计指标下的一阶子统计特征向量,得到一阶统计特征向量。该统计特征建模模块,还可以针对目标资源转移统计数据中每种统计指标下的资源转移统计数据,根据该统计指标的特征编号的映射向量和资源转移统计数据,确定该统计指标的基础统计特征向量,进而对各种统计指标的基础统计特征向量进行两两交叉组合,得到二阶统计特征向量。最终,统计特征建模模块可以拼接一阶统计特征向量和二阶统计特征向量,得到目标账号的统计特征向量。

在实际应用中,各种统计指标下的资源转移统计数据可以从不同的维度描述账号的资源转移行为,其是通常是人工统计分析确定的能够体现账号资源转移是否异常的统计特征维度。考虑到不同统计特征维度的组合能够更好地描述资源转移行为,因此,本申请中的账号类型检测模型中的统计特征建模模块还可以通过自动学习二阶交叉特征的方式,来综合考虑不同统计特征维度的组合构建账号的统计特征向量,使得所构建的统计特征向量能够更准确、更全面地反映账号的交易情况。

图7所示为上述统计特征建模模块的工作原理示意图。如图7所示,统计特征建模模块可以对目标资源转移统计数据中各种统计指标下的资源转移统计数据,进行一阶特征映射处理,得到各种统计指标下的一阶子统计特征向量。例如,假设目标资源转移统计数据为资源转入统计数据,其中包括买入物品数量均值、买入物品数量方差、买入物品极大值、买入物品总值、买入交易金额均值、买入交易金额方差、买入交易金额极大值、买入交易金额总值八种资源转入统计指标下的资源转入统计数据,则统计特征建模模块可以通过全连接映射结构,对这八种资源转入统计指标下的资源转入统计数据分别进行一阶映射处理,从而得到这八种资源转入统计指标下的一阶子统计特征向量。进而,加权融合各种统计指标下的一阶子统计特征向量,得到一阶统计特征向量。

统计特征建模模块生成二阶统计特征向量时,需要先通过embedding层将各种统计指标各自的特征编号均映射至特定的维度,得到各种统计指标的特征编号各自对应的映射向量;此处统计指标的特征编号是预先配置的。然后,针对每种统计指标,计算该种统计指标的特征编号对应的映射向量与该种统计指标下的特征值(即该种统计指标下的资源转移统计数据)的乘积,得到该种统计指标的基础统计特征向量。进而,两两交叉组合各种统计指标的基础统计特征向量,得到二阶统计特征向量。

具体两两交叉组合各种统计指标的基础统计特征向量时,可以先对所有基础统计特征向量两两做对应元素相乘,然后再做对应元素相加的操作,以实现对不同域的特征做二阶的特征交叉,此处的对应元素是指向量中位于同一位置的元素。二阶特征交叉的计算原理具体如式(1)所示:

其中,xi和xj表示原始的特征值(即统计指标下的资源转移统计数据),ei和ej表示统计指标对应的映射向量,f表示统计指标的总个数,也是目标资源转移统计数据中包括的资源转移统计数据的个数,⊙表示对应元素相乘。

为了提高计算效率,可以对上述二阶特征较差的计算方法做进一步优化,其原理与推荐算法(neuralfactorizationmachine,nfm)和deepfm(deepfactorizationmachine)相类似,其等价公式如式(2)所示:

即,直接对所有基础统计特征向量中的对应元素求和再求平方和,如此避免了特征交叉需要两次循环遍历所有特征的操作。

最终,统计特征建模模块将一阶统计特征向量和二阶统计特征向量拼接起来,通过全连接层做融合,即可得到目标账号的统计特征向量,该统计特征向量可以交全面地表达账号资源转移行为的整体情况。

接下来介绍序列特征建模模块的工作原理。账号类型检测模型中的序列特征建模模块,可以针对目标资源转移序列数据中每笔资源转移的资源转移描述数据,根据该资源转移描述数据中包括的各种资源转移基础特征各自的特征编号以及各种资源转移基础特征的特征值,生成该资源转移的浅层表示向量;然后,根据目标资源转移序列数据中各笔资源转移各自的浅层表示向量,生成各笔资源转移各自的深层表示向量;进而,基于注意力机制,对各笔资源转移各自的深层表示向量进行加权融合处理,得到该目标账号的序列特征向量。

图8所示为上述序列特征建模模块的工作原理示意图。如图8所示,该序列特征建模模块中包括多变量交易序列embedding表示层、transformer编码器和基于注意力机制的向量融合层。其中,多变量交易序列embedding表示层用于根据目标资源转移序列数据中各笔资源转移各自对应的资源转移描述数据,相应地生成各笔资源转移各自的浅层表示向量。transformer编码器用于对各笔资源转移各自的浅层表示向量进行高层映射,综合考虑各笔资源转移各自的浅层表示向量来生成各笔资源转移各自的深层表示向量,以更好地表示每笔资源转移在目标账号的各笔资源转移中的位置,使得资源转移价格异常的交易更具区分性。基于注意力机制的向量融合层用于对各笔资源转移各自的深层表示向量进行加权融合处理,从而得到目标账号的序列特征向量。

多变量交易序列embedding表示层具体生成每笔资源转移的浅层表示向量时,可以针对每种资源转移基础特征,根据该资源转移基础特征的特征编号的映射向量和该资源转移基础特征的特征值,生成该资源转移基础特征的表示向量,此处对应于不同资源转移内容的同种资源转移基础特征的特征编号不同;进而,通过残差门控单元,对各种资源转移基础特征的表示向量进行加权融合处理,得到该资源转移的浅层表示向量。

图9所示为多变量交易序列embedding表示层的工作原理示意图。下面以一笔资源转移对应的资源转移描述数据中包括交易物品类型、交易单价和交易总额这三种资源转移基础特征以及这三种资源转移基础特征各自的特征值为例,对该多变量交易序列embedding表示层的工作原理进行示例性介绍。应理解,此处的资源转移基础特征是指资源转移描述数据所包括的数据类型。

具体实现时,服务器可以预先针对资源转移描述数据中的每种资源转移基础特征分别配置不同的特征编号,并且考虑到资源转移场景中不同的资源转移内容具有相同的交易价格所表示的含义不同,因此配置特征编号时可以将各种资源转移基础特征的特征编号与资源转移内容做绑定。例如,假设目标平台上包括三种交易物品(即资源转移内容),且资源转移描述数据中包括的资源转移基础特征有交易物品类型、交易单价和交易总额,则服务器可以针对第一种交易物品的交易物品类型这一资源转移基础特征配置特征编号001、针对第二种交易物品的交易物品类型这一资源转移基础特征配置特征编号002、针对第三种交易物品的交易物品类型这一资源转移基础特征配置特征编号003,服务器可以针对第一种交易物品的交易单价这一资源转移基础特征配置特征编号101、针对第二种交易物品的交易单价这一资源转移基础特征配置特征编号102、针对第三种交易物品的交易单价这一资源转移基础特征配置特征编号103,服务器可以针对第一种交易物品的交易总额这一资源转移基础特征配置特征编号201、针对第二种交易物品的交易总额这一资源转移基础特征配置特征编号202、针对第三种交易物品的交易总额这一资源转移基础特征配置特征编号203。如此,通过资源转移基础特征的特征编号来区分资源转移内容。

如图9所示,生成交易的浅层表示向量时,需要先通过embedding层对资源转移描述数据中各种资源转移基础特征的特征编号分别进行映射处理,得到各种资源转移基础特征的特征编号的映射向量;进而,针对每种资源转移基础特征,计算该种资源转移基础特征的特征编号的映射向量与该种资源转移基础特征的特征值的乘积,得到该种资源转移基础特征的表示向量。对于离散型的资源转移基础特征(如交易物品类型等),其对应的特征值可以被默认设置为1;对于连续性的资源转移基础特征(如交易单价、交易总额等),其对应的特征值可以是归一化处理后得到的特征值,例如对交易单价进行归一化处理后的特征值。

得到各种资源转移基础特征的表示向量后,可以进一步通过残差门控单元,确定各种资源转移基础特征各自的表示向量对应的权重值,进而基于该权重值对各种资源转移基础特征各自的表示向量进行加权融合处理,得到该资源转移的浅层表示向量。图10所示为一种示例性的残差门控单元的结构示意图,示例性的,该残差门控单元的输入可以为n*24维的向量,其中n表示资源转移基础特征的数量,例如当资源转移描述数据中包括交易物品类型、交易单价和交易总额三种资源转移基础特征时,n应当等于3;经过图10所示的残差门控单元的结构,将分别确定三种资源转移基础特征各自的表示向量对应的权重值,利用该权重值对三种资源转移基础特征各自的表示向量进行加权求和处理,将得到1*24维的浅层表示向量。

transformer编码器具体生成每笔资源转移的深层表示向量时,可以通过该transformer编码器,根据目标资源转移序列数据中各笔资源转移各自的浅层表示向量,生成各笔资源转移各自的深层表示向量,该transformer编码器中包括多头注意力层和前馈神经网络层。

图11所示为transformer编码器的工作原理示意图。transformer编码器用于对各笔资源转移的浅层表示特征做进一步的转换和融合,具体实现时,可以通过transformer编码器对各笔资源转移各自的浅层表示向量重复进行多次处理,例如可以重复进行三次处理,从而得到各笔资源转移各自的深层表示向量。此处transformer编码器所起的作用在于,对无序的多笔资源转移各自的浅层表示向量做高层映射,参考目标资源转移序列数据中的各笔资源转移的浅层表示向量,来确定各笔资源转移各自的深层表示向量,每笔资源转移的深层表示向量能更好地表示该笔资源转移在目标账号的所有资源转移中的位置,使得价格异常的交易更具区分性。

得到目标资源转移序列数据中各笔资源转移各自的深层表示向量后,可以使用基于注意力机制的向量融合层,对各笔资源转移各自的深层表示向量进行加权融合,此处使用注意力机制能够综合考虑各笔资源转移的深层表示向量,增加其中大额资源转移的深层表示向量的权重,减小其中小额资源转移的深层表示向量的权重,进而得到目标账号的序列特征向量。此处使用的注意力机制的具体原理如式(3)和式(4)所示:

ai=softmax(vitanh(wiht)(3)

其中,h为由各笔资源转移各自的深层表示向量组成的矩阵(l,24),l为目标资源交易序列中包括的资源转移描述数据的数目;w和v是可学习的模型参数;ai为各笔资源转移各自的深层表示向量对应的权重值。p是加权融合各笔资源转移各自的深层表示向量后得到的序列特征向量。

需要说明的是,此处使用的注意力机制可以是多头注意力机制,即可以并行地通过模型参数不同的式(3)和式(4),确定多个融合各笔资源转移各自的深层表示向量后得到的序列特征向量;进而,对所确定的多个序列特征向量再做进一步的融合处理,得到该目标账号的序列特征向量。

通过上述序列特征建模模块得到的账号的序列特征向量,可以更全面、准确地表达账号的资源转移序列特征,即构建更优的序列特征向量,从而有利于后续根据该资源转移序列特征,更好地确定账号的资源转移行为特征向量和资源转移全局特征向量,进而有利于根据该资源转移全局特征向量,更准确地识别账号的类型。

通过上述统计特征建模模块得到目标账号的统计特征向量,通过上述序列特征建模模块得到目标账号的序列特征向量后,账号类型检测模型可以通过特征融合模块,将目标账号的统计特征向量和序列特征向量拼接起来,进而通过全连接层对该拼接后的特征向量进行处理,得到目标账号的资源转移行为特征向量。

接下来介绍全局特征建模模块的工作原理。账号类型检测模型中的全局特征建模模块,可以通过基于多头注意力机制的图神经网络结构,根据目标账号的资源转移行为特征向量、以及目标账号对应的关联账号的资源转移行为特征向量,确定该目标账号的资源转移关系融合特征向量;进而,根据该目标账号的资源转移行为特征向量和资源转移关系融合特征向量,生成该目标账号的资源转移全局特征向量。

图12所示为该全局特征建模模块的工作原理示意图。如图12所示,假设目标账号为账号1,目标账号对应的关联账号包括账号2、账号3和账号4,具体实现时,可以将账号1的资源转移行为特征向量、以及账号2、账号3和账号4各自的资源转移行为特征向量,输入基于多头注意力机制的图神经网络结构,该图神经网络结构对账号1的资源转移行为特征向量、以及账号2、账号3和账号4各自的资源转移行为特征向量进行分析处理后,将相应地输出账号1的资源转移关系融合特征向量,其中融合有与账号1具有资源转移关系的账号2、账号3和账号4各自的资源转移行为特征。考虑到在上述图神经网络结构的处理过程中可能存在信息丢失,因此,全局特征建模模块会对账号1的资源转移行为特征向量与账号1的资源转移关系融合特征向量再次进行拼接融合,从而得到账号1的资源转移全局特征向量。应理解,上述账号2、账号3和账号4各自的资源转移行为特征向量与账号1的资源转移行为特征向量的构建方式相同,均是通过账号类型检测模型中的统计特征建模模块、序列特征建模模块和特征融合模块处理得到的。

需要说明的是,为了减少计算资源和内存使用率,上述图神经网络结构采用了邻接矩阵和注意力机制的稀疏编码方式。为了更好地学习具有资源转移关系的账号之间的多维度特征,上述图神经网络结构可以使用四头或更多头的注意力机制。同时,由于资源转移行为特征对于判断账号是否为资源转移异常账号来说至关重要,因此可以使用两层带残差连接的注意力模块,融合账号的资源转移行为特征向量和资源转移关系融合特征向量,以更好地保留账号资源转移行为的特征信息。

通过上述全局特征建模模块,得到目标账号的资源转移全局特征向量后,账号类型检测模型中的分类模块,可以进一步根据该目标账号的资源转移全局特征向量,确定该目标账号属于各种账号类型的概率。例如,当账号类型检测模型为转入账号类型检测模型时,通过该分类模块可以确定目标账号分别属于资源转入正常账号的概率和资源转入异常账号的概率;当账号类型检测模型为转出账号类型检测模型时,通过该分类模块可以确定目标账号分别属于资源转出正常账号的概率和资源转出异常账号的概率。又例如,当账号类型检测模型为四分类模型时,通过该分类模块可以确定目标账号分别属于资源转入正常账号、资源转入异常账号、资源转出正常账号和资源转出异常账号的概率。

步骤203:若所述目标账号对应的检测结果表征所述目标账号为资源转入异常账号、且为资源转出异常账号,则确定所述目标账号为中转账号。

正如上文步骤202中提及的,账号类型检测模型输出的目标账号对应的检测结果能够表征该目标账号是否为资源转入异常账号以及是否为资源转出异常账号,相应地,服务器可以直接根据该目标账号对应的检测结果判断该目标账号是否为资源转入异常账号以及是否为资源转出异常账号,若确定该目标账号既是资源转入异常账号,又是资源转出异常账号,则可以确定该目标账号为中转账号,进而对该目标账号进行相应地制裁处理,如封号、经济制裁等等。

需要说明的是,本申请实施例提供的方法还可以通用地适用于各种支持账号间进行资源转移的网络平台,即本申请实施例提供的方法可以针对各种网络平台训练其适用的账号类型检测模型,并利用训练得到的账号类型检测模型,对相应的网络平台进行中转账号的检测。实现模型训练和模型应用的一体化、流程化和自动化。

具体的,服务器可以获取目标平台的平台标识和训练时间范围;根据该平台标识和该训练时间范围,确定用于训练该目标平台对应的账号类型检测模型的训练数据集,并基于该训练数据集对该目标平台对应的账号类型检测模型进行训练。此外,服务器可以获取目标平台的平台标识和检测时间周期,根据该平台标识调取该目标平台对应的账号类型检测模型,并根据该检测时间周期,通过账号类型检测模型对该目标平台上的账号进行中转账号的检测。

图13所示为上述模型训练和模型应用一体化的实现过程示意图。具体实现时,服务器接收到目标平台的平台标识和训练时间范围后,可以确定当前需要训练适用于目标平台的账号类型检测模型。此时服务器可以调用预处理脚本,根据目标平台的平台标识,从用于存储各网络平台上账号之间的资源转移数据和资源转移关系的数据库中,调取训练时间范围内在目标平台上产生的资源转移数据和资源转移关系,并基于所调取的资源转移数据和资源转移关系构建用于训练适用于该目标平台的账号类型检测模型的训练数据集。构建训练数据集的具体实现方式可参见上文中账号类型检测模型的训练方式中的相关内容。

训练适用于目标平台的账号类型检测模型时,服务器可以利用配置文件初始化待训练的账号类型检测模型的模型参数,进而基于所构建的训练数据集对该账号类型检测模型进行迭代训练。在对账号类型检测模型进行迭代训练的过程中,服务器可以阶段性的测试训练得到的账号类型检测模型的模型性能,以得到模型性能最优的账号类型检测模型作为该目标平台对应的账号类型检测模型,并将其存储至特定的模型文件中。

后续需要使用目标平台对应的账号类型检测模型时,使用者可以向服务器发送该目标平台的平台标识和检测时间周期(如每天检测一次、每周检测一次等),服务器接收到该目标平台的平台标识和检测时间周期后,可以基于该检测时间周期从数据库中调取目标平台上待检测的目标账号的资源转移数据和资源转移关系,并基于该目标平台的平台标识从模型文件中调取该目标平台对应的账号类型检测模型。进而,服务器将通过配置文件向该账号类型检测模型下发检测时间周期,从而使得账号类型检测模型可以基于该检测时间周期,检测目标平台上的账号是否为中转账号,具体检测过程参见上文中步骤201至步骤203的介绍。

如此,对于不同的网络平台,只需要通过修改平台标识和训练时间范围,即可训练得到适配于该网络平台的账号类型检测模型,使得本申请提供的技术方案可以适用于各种需要检测中转账号的网络平台,具有较好的通用性,实现了模型训练和模型应用的一体化、流程化和自动化。

上述数据处理方法考虑到中转账号的标注难度高且标注数据少,因此借助中转账号在资源转入和资源转出中均表现异常的特点,通过用于检测资源转入异常账号和资源转出异常账号的账号类型检测模型,检测账号是否为资源转入异常账号以及资源转出异常账号,并将被检测为既是资源转入异常账号、又是资源转出异常账号的账号确定为中转账号;由于资源转入异常账号和资源转出异常账号的标注难度较低且标注数据较多,因此可以容易地获取到大量的用于训练上述账号类型检测模型的训练样本数据,相应地,基于大量的训练样本数据训练得到的账号类型检测模型的模型性能较优,检测资源转入异常账号和资源转出异常账号的准确度较高,能够进一步保证基于该模型的检测结果确定的中转账号的准确度较高。此外,上述账号类型检测模型检测资源转入异常账号和资源转出异常账号时,综合考虑了账号间的资源转入关系和资源转出关系,由于资源转入关系和资源转出关系具有较高的参考价值,因此有助于进一步提高该账号类型检测模型的检测结果的准确性。如此,通过上述方式巧妙地实现了对于中转账号的检测,并且能够保证中转账号检测的准确性,从而有利于维护各种网络平台的正常交易秩序以及经济系统的稳定性。

为了便于进一步理解本申请实施例提供的技术方案,下面以本申请实施例提供的数据处理方法用于检测mmo游戏平台上的中转账号为例,对本申请实施例提供的数据处理方法进行整体示例性介绍。

服务器针对mmo游戏平台上某游戏账号检测其是否为中转账号时,可以获取该游戏账号在mmo游戏平台上产生的买入交易数据(即上文中的资源转入数据)和卖出交易数据(即上文中的资源转出数据),其中,买入交易数据可以是因该游戏账号买入虚拟金币等虚拟资源而产生的交易行为日志数据,卖出交易数据可以是因该游戏账号卖出虚拟道具等虚拟资源而产生的交易行为日志数据。此外,服务器还可以获取mmo游戏平台的交易网络(即上文中的资源转移网络),并根据该交易网络中包括的连接边的类型,将该交易网络拆分为仅包括买入交易类型对应的连接边的买入网络(即上文中的资源转入网络)和仅包括卖出交易类型对应的连接边的卖出网络(即上文中的资源转出网络);进而,确定该游戏账号在买入网络中的买入交易关系和在卖出网络中的卖出交易关系。

进而,服务器可以利用预先训练好的买入账号类型检测模型(即上文中的转入账号类型检测模型),根据该游戏账号的买入交易数据和买入交易关系,确定该游戏账号是否为买入交易异常账号;并且,利用预先训练好的卖出账号类型检测模型(即上文中的转出账号类型检测模型),根据该游戏账号的卖出交易数据和卖出交易关系,确定该游戏账号是否为卖出交易异常账号。若通过买入账号类型检测模型确定该游戏账号为买入交易异常账号,且通过卖出账号类型检测模型确定该游戏账号为卖出交易异常账号,则可以确定该游戏账号即为中转账号,相应地,服务器可以对该游戏账号进行制裁管理。

需要说明的是,训练上述买入账号类型检测模型和卖出账号类型检测模型时,服务器可以根据mmo游戏平台的黑名单,确定其中记录的买入交易行为异常的账号和卖出交易行为异常的账号;进而,利用买入交易行为异常的账号的买入交易数据和买入交易关系,构建用于训练买入账号类型检测模型的负样本,利用卖出交易行为异常的账号的卖出交易数据和卖出交易关系,构建用于训练卖出账号类型检测模型的负样本。

需要说明的是,上述买入账号类型检测模型和卖出账号类型检测模型均可以是seqgat模型,下面对该买入账号类型检测模型的工作原理进行介绍;应理解,卖出账号类型检测模型的工作原理与该买入账号类型检测模型的工作原理相类似。

服务器利用买入账号类型检测模型检测该游戏账号是否为买入交易异常账号之前,可以先对该游戏账号的买入交易数据进行加工处理。示例性的,根据该游戏账号的买入交易数据,生成多种买入统计指标下的买入交易统计数据,例如,生成买入物品数量均值、买入物品数量方差、买入物品极大值、买入物品总值、买入交易金额均值、买入交易金额方差、买入交易金额极大值、买入交易金额总值、买入频次等买入统计指标下的交易统计数据;以及,根据该游戏账号的买入交易数据,按照特定的买入交易描述数据的模板生成各笔买入交易各自的买入交易描述数据(其中可以包括每笔买入交易的买入物品类型、买入单价和买入总额等),并利用各笔买入交易各自的买入交易描述数据组成无序的买入交易序列数据。进而,服务器可以利用买入账号类型检测模型,根据上述买入交易统计数据、买入交易序列数据和买入交易关系,检测该游戏账号是否为买入交易异常账号。

示例性的,买入账号类型检测模型中可以包括统计特征建模模块、序列特征建模模块、特征融合模块、全局特征建模模块和分类模块。

其中,统计特征建模模块具体可以通过以下方式建模游戏账号的买入统计特征向量:对各种买入统计指标下的买入交易统计数据分别进行一阶特征映射处理,得到各种买入统计指标下的一阶子统计特征向量,进而融合各种买入统计指标下的一阶子统计特征向量得到一阶统计特征向量;并且,针对每种买入统计指标下的买入交易统计数据,计算该种买入交易统计指标的特征编号的映射向量和该买入交易统计数据的乘积,得到该种买入交易统计指标的基础统计特征向量,进而对各种买入交易统计指标的基础统计特征向量进行两两交叉组合,得到二阶统计特征向量;将上述一阶统计特征向量和二阶统计特征向量拼接融合,得到该游戏账号的买入统计特征向量。

其中,序列特征建模模块具体可以通过以下方式建模游戏账号的买入序列特征向量:通过多变量交易序列embedding表示层,针对买入交易序列数据中的每笔买入交易生成对应的浅层表示向量;即,针对买入交易描述数据中包括的每种交易基础特征,计算该种交易基础特征的特征编号的映射向量和该种交易基础特征的特征值的乘积,作为该种交易基础特征的表示向量,进而加权融合各种交易基础特征的表示向量,得到该笔买入交易的浅层表示向量。然后,通过包括多头注意力层和前馈神经网络层的transformer编码器,根据各笔买入交易各自的浅层表示向量,相应地生成各笔买入交易各自的深层表示向量。最终,通过基于注意力机制的向量融合层,融合各笔买入交易各自的深层表示向量,得到该游戏账号的买入序列特征向量。

其中,特征融合模块可以将游戏账号的买入统计特征向量和买入序列特征向量融合起来,得到该游戏账号的买入交易行为特征向量。

其中,全局特征建模模块具体可以通过以下方式建模游戏账号的买入交易全局特征向量:获取该游戏账号对应的关联游戏账号的买入交易行为特征向量,该游戏账号对应的关联游戏账号是mmo游戏平台上与该游戏平台具有买入交易关系的游戏账号;然后,通过基于多头注意力机制的图神经网络结构,根据该游戏账号的买入交易行为特征向量以及该游戏账号的各关联游戏账号各自的买入交易行为特征向量,确定该游戏账号的买入交易关系融合特征向量;进而,将该游戏账号的买入交易行为特征向量和买入交易关系融合特征向量拼接融合起来,得到该游戏账号的买入交易全局特征向量。

其中,分类模块可以根据该游戏账号的买入交易全局特征向量,确定该游戏账号分别属于买入交易正常账号和买入交易异常账号的概率。

本申请发明人基于mmo游戏交易网络中的数据对多种模型进行了训练和测试,证明了本申请中seqgat模型的优良性能,具体的测试结果参见表1。其中,seq_denseemb_attn是只使用资源转移序列特征建模的模型,并且该模型建模资源转移序列特征时,没有使用基于资源转移内容类型分配特征编号的特征向量映射方式;seq+groupemb+attn也是只使用资源转移序列特征建模的模型,但是该模型使用了基于资源转移内容类型分配特征编号的特征向量映射方式;seq+groupemb+attn+statis是使用了双塔结构对资源转移统计特征和资源转移序列特征建模的模型;seq+groupemb+attn+statis+gat是图2所示实施例中图5所示的seqgat模型。

表1

从表1可以看出,seq+groupemb+attn模型的效果明显优于seq_denseemb_attn模型,说明基于资源转移业务特点设计的基于资源转移内容类型分配特征编号的特征向量映射方式有效。同时,对比多个模型可以发现,随着特征信息的增加,资源转入异常账号、资源转出异常账号和中转账号的识别准确率均是逐渐提升的,使用双塔结构对资源转移统计特征和资源转移序列特征建模的模型seq+groupemb+attn+statis优于只使用资源转移序列特征建模的模型seq+groupemb+attn,同时融合资源转移行为特征和资源转移关系的seq+groupemb+attn+statis+gat模型的性能最优,且该模型对于中转账号的识别准确率符合实际业务要求。

针对上文描述的数据处理方法,本申请还提供了对应的数据处理装置,以使上述数据处理方法在实际中得以应用及实现。

参见图14,图14是与上文图2所示的数据处理方法对应的一种数据处理装置1400的结构示意图。如图14所示,该数据处理装置1400包括:

网络拆分单元1401,用于将目标平台的资源转移网络拆分为资源转入网络和资源转出网络;所述资源转入网络用于表征账号间的资源转入关系,所述资源转出网络用于表征账号间的资源转出关系;

异常账号识别单元1402,用于针对所述目标平台上待识别的目标账号,通过账号类型检测模型,根据所述目标账号在所述目标平台上的目标资源转移数据和目标资源转移关系,确定所述目标账号对应的检测结果;所述目标资源转移数据包括所述目标账号的资源转入数据和资源转出数据,所述目标资源转移关系包括所述资源转入网络中所述目标账号的资源转入关系和所述资源转出网络中所述目标账号的资源转出关系;所述目标账号对应的检测结果用于表征所述目标账号是否为资源转入异常账号、以及是否为资源转出异常账号;

中转账号识别单元1403,用于若所述目标账号对应的检测结果表征所述目标账号为资源转入异常账号、且为资源转出异常账号,则确定所述目标账号为中转账号。

可选的,在图14所示的数据处理装置的基础上,所述账号类型检测模型包括转入账号类型检测模型和转出账号类型检测模型;则所述异常账号识别单元1402具体用于:

通过所述转入账号类型检测模型,根据所述目标账号的资源转入数据和所述资源转入网络中所述目标账号的资源转入关系,确定所述目标账号对应的转入检测结果;所述转入检测结果用于表征所述目标账号是否为资源转入异常账号;

通过所述转出账号类型检测模型,根据所述目标账号的资源转出数据和所述资源转出网络中所述目标账号的资源转出关系,确定所述目标账号对应的转出检测结果;所述转出检测结果用于表征所述目标账号是否为资源转出异常账号。

可选的,在图14所示的数据处理装置的基础上,所述账号类型检测模型为四分类模型,用于检测所述目标平台上的账号属于资源转入正常账号、资源转入异常账号、资源转出正常账号和资源转出异常账号的概率;则所述异常账号识别单元1402具体用于:

通过所述账号类型检测模型,根据所述目标账号的资源转入数据和所述资源转入网络中所述目标账号的资源转入关系、以及所述目标账号的资源转出数据和所述资源转出网络中所述目标账号的资源转出关系,确定所述目标账号属于资源转入正常账号、资源转入异常账号、资源转出正常账号和资源转出异常账号的概率;

根据所述目标账号属于资源转入正常账号、资源转入异常账号、资源转出正常账号和资源转出异常账号的概率,确定所述目标账号对应的检测结果。

可选的,在图14所示的数据处理装置的基础上,参见图15,图15为本申请实施例提供的另一种数据处理装置1500的结构示意图。如图15所示,所述异常账号识别单元1402包括:

统计数据生成子单元1501,用于根据所述目标资源转移数据生成目标资源转移统计数据;所述目标资源转移统计数据包括多种统计指标下的资源转移统计数据;当所述目标交易数据为资源转入数据时,所述目标资源转移统计数据包括多种资源转入统计指标下的资源转入统计数据;当所述目标资源转移数据为资源转出数据时,所述目标资源转移统计数据包括多种资源转出统计指标下的资源转出统计数据;

序列数据生成子单元1502,用于根据所述目标资源转移数据生成目标资源转移序列数据;所述目标资源转移序列数据包括多笔资源转移各自的资源转移描述数据;当所述目标资源转移数据为资源转入数据时,所述目标资源转移序列数据包括多笔资源转入各自的资源转入描述数据;当所述目标资源转移数据为资源转出数据时,所述目标资源转移序列数据包括多笔资源转出交易各自的资源转出描述数据;

账号检测子单元1503,用于通过所述账号类型检测模型,根据所述目标资源转移统计数据、所述目标资源转移序列数据和所述目标资源转移关系,确定所述目标账号对应的检测结果。

可选的,在图15所示的数据处理装置的基础上,所述账号类型检测模型包括:统计特征建模模块、序列特征建模模块、特征融合模块、全局特征建模模块和分类模块;则所述账号检测子单元1503具体用于:

通过所述统计特征建模模块,根据所述目标资源转移统计数据确定所述目标账号的统计特征向量;

通过所述序列特征建模模块,根据所述目标资源转移序列数据确定所述目标账号的序列特征向量;

通过所述特征融合模块,融合所述目标账号的统计特征向量和序列特征向量,得到所述目标账号的资源转移行为特征向量;

通过所述全局特征建模模块,根据所述目标账号的资源转移行为特征向量、以及所述目标账号对应的关联账号的资源转移行为特征向量,确定所述目标账号的资源转移全局特征向量;当所述目标资源转移关系为所述资源转入网络中所述目标账号的资源转入关系时,所述目标账号对应的关联账号为所述资源转入网络中与所述目标账号具有资源转入关系的账号;当所述目标资源转移关系为资源转出网络中所述目标账号的资源转出关系时,所述目标账号对应的关联账号为所述资源转出网络中与所述目标账号具有资源转出关系的账号;

通过所述分类模块,根据所述目标账号的资源转出全局特征向量,确定所述目标账号对应的检测结果。

可选的,在图15所示的数据处理装置的基础上,所述账号检测子单元1503具体用于通过以下方式生成所述目标账号的统计特征向量:

对所述目标资源转移统计数据中各种统计指标下的资源转移统计数据,分别进行一阶特征映射处理,得到所述各种统计指标下的一阶子统计特征向量;融合所述各种统计指标下的一阶子统计特征向量,得到一阶统计特征向量;

针对所述目标资源转移统计数据中每种统计指标下的资源转移统计数据,根据所述统计指标的特征编号的映射向量和所述资源转移统计数据,确定所述统计指标的基础统计特征向量;对所述各种统计指标的基础统计特征向量进行两两交叉组合,得到二阶统计特征向量;

根据所述一阶统计特征向量和所述二阶统计特征向量,确定所述目标账号的统计特征向量。

可选的,在图15所示的数据处理装置的基础上,所述账号检测子单元1503具体用于通过以下方式生成所述目标账号的序列特征向量:

针对所述目标资源转移序列数据中每笔资源转移的资源转移描述数据,根据所述资源转移描述数据中包括的各种资源转移基础特征各自的特征编号以及所述各种资源转移基础特征的特征值,生成所述资源转移的浅层表示向量;

根据所述目标资源转移序列数据中各笔资源转移各自的浅层表示向量,生成所述各笔资源转移各自的深层表示向量;

基于注意力机制,对所述各笔资源转移各自的深层表示向量进行加权融合处理,得到所述目标账号的序列特征向量。

可选的,在图15所示的数据处理装置的基础上,所述账号检测子单元1503具体用于通过以下方式生成所述浅层表示向量:

针对每种资源转移基础特征,根据所述资源转移基础特征的特征编号的映射向量和所述资源转移基础特征的特征值,生成所述资源转移基础特征的表示向量;对应于不同资源转移内容的同种资源转移基础特征的特征编号不同;

通过残差门控单元,对各种资源转移基础特征各自的表示向量进行加权融合处理,得到所述资源转移的浅层表示向量。

可选的,在图15所示的数据处理装置的基础上,所述账号检测子单元1503具体用于通过以下方式生成所述深层表示向量:

通过transformer编码器,根据所述目标资源转移序列数据中各笔资源转移各自的浅层表示向量,生成所述各笔资源转移各自的深层表示向量;所述transformer编码器包括多头注意力层和前馈神经网络层。

可选的,在图15所示的数据处理装置的基础上,所述账号检测子单元1503具体用于通过以下方式生成所述目标账号的资源转移全局特征向量:

通过基于多头注意力机制的图神经网络结构,根据所述目标账号的资源转移行为特征向量、以及所述目标账号对应的关联账号的资源转移行为特征向量,确定所述目标账号的资源转移关系融合特征向量;

根据所述目标账号的资源转移行为特征向量和资源转移关系融合特征向量,生成所述目标账号的资源转移全局特征向量。

可选的,在图14所示的数据处理装置的基础上,参见图16,图16为本申请实施例提供的另一种数据处理装置1600的结构示意图。如图16所示,所述装置还包括模型训练单元1601,所述模型训练单元1601用于:

根据所述目标平台对应的黑名单,确定所述目标平台上的历史资源转入异常账号和历史资源转出异常账号,并利用所述历史资源转入异常账号的资源转入数据和所述历史资源转出异常账号的资源转出数据构建负训练样本;

从所述目标平台上抽取没有被列入所述黑名单的账号,作为历史资源转入正常账号和历史资源转出正常账号,并利用所述历史资源转入正常账号的资源转入数据和所述历史资源转出正常账号的资源转出数据构建正训练样本;

基于包括所述负训练样本和所述正训练样本的训练样本集,对待训练的账号类型检测模型进行训练。

可选的,在图14所示的数据处理装置的基础上,参见图17,图17为本申请实施例提供的另一种数据处理装置1700的结构示意图。如图17所示,所述装置还包括:

目标模型训练单元1701,用于获取所述目标平台的平台标识和训练时间范围;根据所述平台标识和所述训练时间范围,确定用于训练所述目标平台对应的所述账号类型检测模型的训练数据集,并基于所述训练数据集对所述账号类型检测模型进行训练;

目标模型调用单元1702,用于获取所述目标平台的平台标识和检测时间周期;根据所述平台标识调取所述目标平台对应的所述账号类型检测模型,并根据所述检测时间周期,通过所述账号类型检测模型对所述目标平台上的账号进行中转账号的检测。

上述数据处理装置考虑到中转账号的标注难度高且标注数据少,因此借助中转账号在资源转入和资源转出中均表现异常的特点,通过用于检测资源转入异常账号和资源转出异常账号的账号类型检测模型,检测账号是否为资源转入异常账号以及资源转出异常账号,并将被检测为既是资源转入异常账号、又是资源转出异常账号的账号确定为中转账号;由于资源转入异常账号和资源转出异常账号的标注难度较低且标注数据较多,因此可以容易地获取到大量的用于训练上述账号类型检测模型的训练样本数据,相应地,基于大量的训练样本数据训练得到的账号类型检测模型的模型性能较优,检测资源转入异常账号和资源转出异常账号的准确度较高,能够进一步保证基于该模型的检测结果确定的中转账号的准确度较高。此外,上述账号类型检测模型检测资源转入异常账号和资源转出异常账号时,综合考虑了账号间的资源转入关系和资源转出关系,由于资源转入关系和资源转出关系具有较高的参考价值,因此有助于进一步提高该账号类型检测模型的检测结果的准确性。如此,通过上述方式巧妙地实现了对于中转账号的检测,并且能够保证中转账号检测的准确性,从而有利于维护各种网络平台的正常交易秩序以及经济系统的稳定性。

本申请实施例还提供了一种用于检测异常账号的设备,该设备具体可以是终端设备或者服务器,下面将从硬件实体化的角度对本申请实施例提供的终端设备和服务器进行介绍。

参见图18,图18是本申请实施例提供的终端设备的结构示意图。如图18所示,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该终端可以为包括手机、平板电脑、个人数字助理(英文全称:personaldigitalassistant,英文缩写:pda)、销售终端(英文全称:pointofsales,英文缩写:pos)、车载电脑等任意终端设备,以终端为计算机为例:

图18示出的是与本申请实施例提供的终端相关的计算机的部分结构的框图。参考图18,计算机包括:射频(英文全称:radiofrequency,英文缩写:rf)电路1810、存储器1820、输入单元1830(其中包括触控面板1831和其他输入设备1832)、显示单元1840(其中包括显示面板1841)、传感器1850、音频电路1860(其可以连接扬声器1861和传声器1862)、无线保真(英文全称:wirelessfidelity,英文缩写:wifi)模块1870、处理器1880、以及电源1890等部件。本领域技术人员可以理解,图18中示出的计算机结构并不构成对计算机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

存储器1820可用于存储软件程序以及模块,处理器1880通过运行存储在存储器1820的软件程序以及模块,从而执行计算机的各种功能应用以及数据处理。存储器1820可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1820可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器1880是计算机的控制中心,利用各种接口和线路连接整个计算机的各个部分,通过运行或执行存储在存储器1820内的软件程序和/或模块,以及调用存储在存储器1820内的数据,执行计算机的各种功能和处理数据,从而对计算机进行整体监控。可选的,处理器1880可包括一个或多个处理单元;优选的,处理器1880可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1880中。

在本申请实施例中,该终端所包括的处理器1880还具有以下功能:

将目标平台的资源转移网络拆分为资源转入网络和资源转出网络;所述资源转入网络用于表征账号间的资源转入关系,所述资源转出网络用于表征账号间的资源转出关系;

针对所述目标平台上待识别的目标账号,通过账号类型检测模型,根据所述目标账号在所述目标平台上的目标资源转移数据和目标资源转移关系,确定所述目标账号对应的检测结果;所述目标资源转移数据包括所述目标账号的资源转入数据和资源转出数据,所述目标资源转移关系包括所述资源转入网络中所述目标账号的资源转入关系和所述资源转出网络中所述目标账号的资源转出关系;所述目标账号对应的检测结果用于表征所述目标账号是否为资源转入异常账号、以及是否为资源转出异常账号;

若所述目标账号对应的检测结果表征所述目标账号为资源转入异常账号、且为资源转出异常账号,则确定所述目标账号为中转账号。

可选的,所述处理器1880还用于执行本申请实施例提供的数据处理方法的任意一种实现方式的步骤。

参见图19,图19为本申请实施例提供的一种服务器1900的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessingunits,cpu)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。

服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,和/或,一个或一个以上操作系统,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm等等。

上述实施例中由服务器所执行的步骤可以基于该图19所示的服务器结构。

其中,cpu1922用于执行如下步骤:

将目标平台的资源转移网络拆分为资源转入网络和资源转出网络;所述资源转入网络用于表征账号间的资源转入关系,所述资源转出网络用于表征账号间的资源转出关系;

针对所述目标平台上待识别的目标账号,通过账号类型检测模型,根据所述目标账号在所述目标平台上的目标资源转移数据和目标资源转移关系,确定所述目标账号对应的检测结果;所述目标资源转移数据包括所述目标账号的资源转入数据和资源转出数据,所述目标资源转移关系包括所述资源转入网络中所述目标账号的资源转入关系和所述资源转出网络中所述目标账号的资源转出关系;所述目标账号对应的检测结果用于表征所述目标账号是否为资源转入异常账号、以及是否为资源转出异常账号;

若所述目标账号对应的检测结果表征所述目标账号为资源转入异常账号、且为资源转出异常账号,则确定所述目标账号为中转账号。

可选的,cpu1922还可以用于执行本申请实施例提供的数据处理方法的任意一种实现方式的步骤。

本申请实施例还提供一种计算机可读存储介质,用于存储计算机程序,该计算机程序用于执行前述各个实施例所述的一种数据处理方法中的任意一种实施方式。

本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前述各个实施例所述的一种数据处理方法中的任意一种实施方式。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(英文全称:read-onlymemory,英文缩写:rom)、随机存取存储器(英文全称:randomaccessmemory,英文缩写:ram)、磁碟或者光盘等各种可以存储计算机程序的介质。

应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。

以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1