异常数据的检测方法、装置和服务器与流程

文档序号:18271012发布日期:2019-07-27 09:40阅读:235来源:国知局
异常数据的检测方法、装置和服务器与流程

本说明书属于互联网技术领域,尤其涉及一种异常数据的检测方法、装置和服务器。



背景技术:

在互联网领域开展线下产品或服务的推广业务时,雇佣方通常会委托个人(例如“小二”)或者专业的服务公司(例如isv)作为被雇佣方向待推广的对象(例如商户或者消费者)推广雇佣方的产品或服务。雇佣方会根据被雇佣方每日完成的推广业绩,按照协议,支付相应的奖励报酬(例如返佣资金)。

但是,有时一些被雇佣方可能会采取一些不符合要求的方式,得到一些虚假的业绩数据作为每日的推广业绩,并借此获得不应得到的奖励报酬。实际上,由于被雇佣方并没有采取符合要求的方式进行推广,得到的推广业绩也不真实,不能达到雇佣方所要求的推广效果。这样会对雇佣方造成损失。

基于上述情况,需要对被雇佣方与该推广业务关联的资金数据进行监控,以便及时地检测发现存在异常的资金数据,进而可以进一步地识别确定、及时发现被雇佣方采取了不符合要求的方式来获取奖励报酬,并作相应处理,以减少雇佣方的损失。

目前,现有方法往往是直接基于被雇佣方一个时间段内的资金数据,笼统地通过求平均值等常规方式进行简单分析,在检测是否存在异常时容易产生误差,准确度也相对较差。因此,亟需一种能够准确、高效地识别出异常资金数据的检测方法。



技术实现要素:

本说明书目的在于提供一种异常数据的检测方法、装置和服务器,以达到准确、高效地识别出目标对象的异常资金数据。

本说明书提供的一种异常数据的检测方法、装置和服务器是这样实现的:

一种异常数据的检测方法,包括:获取目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据;根据所述目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据,建立数据节点图,其中,所述数据节点图包括多个数据节点,所述数据节点用于表征目标对象的对应时间点的资金数据;从所述数据节点图中,提取图形特征;根据所述图形特征,确定所述目标对象的待测时间点的资金数据是否符合预设要求。

一种异常数据的检测装置,包括:获取模块,用于获取目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据;建立模块,用于根据所述目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据,建立数据节点图,其中,所述数据节点图包括多个数据节点,所述数据节点用于表征目标对象的对应时间点的资金数据;提取模块,用于从所述数据节点图中,提取图形特征;确定模块,用于根据所述图形特征,确定所述目标对象的待测时间点的资金数据是否符合预设要求。

一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现获取目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据;根据所述目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据,建立数据节点图,其中,所述数据节点图包括多个数据节点,所述数据节点用于表征目标对象的对应时间点的资金数据;从所述数据节点图中,提取图形特征;根据所述图形特征,确定所述目标对象的待测时间点的资金数据是否符合预设要求。

一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现获取目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据;根据所述目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据,建立数据节点图,其中,所述数据节点图包括多个数据节点,所述数据节点用于表征目标对象的对应时间点的资金数据;从所述数据节点图中,提取图形特征;根据所述图形特征,确定所述目标对象的待测时间点的资金数据是否符合预设要求。

本说明书提供的一种异常数据的检测方法、装置和服务器,由于通过先获取并根据目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据,建立能反映目标对象的不同时间点的资金数据的相互关系的数据节点图,再在图像层面上,从中提取并利用能较为清晰地表征出目标对象的资金数据随时间波动变化情况的图形特征来判断目标对象的待测时间点的资金数据是否异常,从而解决了现有方法在判断目标对象的待测时间点的资金数据是否是异常数据时存在的容易出现误差、不准确的问题,达到能够避免噪声干扰,得到资金数据随时间波动变化的细节信息,进而可以准确、高效地识别出目标对象的异常资金数据。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本说明书实施例提供的异常数据的检测系统的结构组成的一种实施例的示意图;

图2是在一个场景示例中,应用本说明书实施例提供的异常数据的检测方法的一种实施例的示意图;

图3是在一个场景示例中,应用本说明书实施例提供的异常数据的检测方法的一种实施例的示意图;

图4是在一个场景示例中,应用本说明书实施例提供的异常数据的检测方法的一种实施例的示意图;

图5是在一个场景示例中,应用本说明书实施例提供的异常数据的检测方法的一种实施例的示意图;

图6是在一个场景示例中,应用本说明书实施例提供的异常数据的检测方法的一种实施例的示意图;

图7是在一个场景示例中,应用本说明书实施例提供的异常数据的检测方法的一种实施例的示意图;

图8是在一个场景示例中,应用本说明书实施例提供的异常数据的检测方法的一种实施例的示意图;

图9是在一个场景示例中,应用本说明书实施例提供的异常数据的检测方法的一种实施例的示意图;

图10是在一个场景示例中,应用本说明书实施例提供的异常数据的检测方法的一种实施例的示意图;

图11是本说明书实施例提供的异常数据的检测方法的流程的一种实施例的示意图;

图12是本说明书实施例提供的服务器的结构的一种实施例的示意图;

图13是本说明书实施例提供的异常数据的检测装置的结构的一种实施例的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。

考虑到现有方法大多是直接对所获取的目标对象一个时间段内与推广业务相关的资金数据进行分析处理,根据预先设置的检测维度(例如一个时间段内的资金数据的平均值)和对应的指标参数,对资金数据相应维度的数据特征进行检测判断,以确定是否存在异常资金数据。

上述方法由于是直接对资金数据本身进行分析处理,不能够准确、全面地反映出不同时间点之间(例如相邻两个时间点之间,或者相邻的包括多个连续的时间点的两个时间段之间)的资金数据随时间变化情况的相互关系。导致在检测异常数据时无法有效地获取到足够的细节,且容易受到数据噪声干扰。例如,可能会将某些正常的资金数据的波动错误地识别为资金数据的异常。还有可能忽略掉被不同时间点之间的资金数据的波动变化所掩盖的异常的资金数据。因此,导致存在容易受噪声影响出现误差、不准确的技术问题。

针对产生上述问题的根本原因,本说明书考虑可以先根据所获取的目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据建立数据节点图,从而可以将原先隐含在数值数据中的不同时间点之间的资金数据的相互关系等信息以外在的图形形态清晰、完整地表示出来。进而可以结合图形的处理方法,有针对性地提取出例如表征有目标对象的资金数据随时间变化情况等细节信息的图形特征来对目标对象待测点的资金数据是否存在异常进行判断。通过上述方式得到图形特征,可以清楚、全面地表征出相邻的时间点之间的资金数据的变化特点,某一段时间内资金数据的波动趋势,或者目标对象资金数据的整体规律,进而能够从更多的相互关系的维度对资金数据是否异常进行判断,减少了数据噪声的干扰,能够挖掘出更多隐含在数值数据中的细节规律。从而能准确、高效地识别出目标对象的异常资金数据。

参阅图1所示,本说明书实施方式提供一种用于检测异常资金数据的系统,其中,该系统中可以包括多个检测服务器和数据采集器,所述异常数据的检测方法可以具体应用于系统中的检测服务器和数据采集器中。

具体的,上述数据采集器具体用于每隔预设的时间间隔(例如一天)采集并向检测服务器发送目标对象当前时间点的与业务相关的资金数据。上述检测服务器具体用于接收目标对象当前时间点的资金数据,并调取之前接收存储的在当前时间点之前的多个时间点(例如当前时间点之前的第1天至当前时间点之前的第89天之间时间段内的每一天)的资金数据。再根据上述数据按照时间的先后顺序,建立数据节点图,其中,所述数据节点图包括多个数据节点,数据节点的横坐标表征时间参数,所述数据节点的纵坐标表征资金数据。进而可以根据上述数据节点图,有针对性地提取得到能够表征目标对象的资金数据随时间波动变化情况的图形特征来确定目标对象当前时间点的资金数据是否符合预设要求,如果不符合预设要求,则判断该时间点的资金数据存在异常,并进行标记和报警,以便进行后续相应的处理。

在本实施方式中,上述数据采集器可以是一种应用于目标对象一侧或者相应的业务系统一侧,能够实时或定时地统计目标对象每个时间点的资金数据的设备或者程序。具体的,所述数据采集器可以为一个具有数据采集、统计计数等功能的电子设备;也可以是运行于该电子设备中的用于执行数据采集、统计计数等的程序代码。需要说明的是,上述数据采集器可以是独立于检测服务器的一个装置单元,也可以是集成于检测服务器的一个功能模块。对此,本说明书不作限定。

在本实施方式中,所述检测服务器可以是一种应用于检测系统一侧,能够实现数据传输、数据处理等功能的服务器。具体的,所述服务器可以为一个具有数据运算、存储功能以及网络交互功能的电子设备;也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施方式中,并不具体限定所述服务器的数量。所述服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。

在一个场景示例中,可以参阅图2所示,被雇佣方会根据雇佣协议在线下为雇佣方xx公司,在商铺中推广xx公司的某支付app。被雇佣方每使得一个商铺使用该支付app,即完成了一个业务业绩,可以得到相应的资金数据作为报酬。被雇佣方每天的业绩数据会通过手机等移动设备上传到对应的业务系统,业务系统会每天统计各个被雇佣方每天具体的业绩量,并根据业绩量确定被雇佣方对应的资金数据,再将对应的资金数据发送至被雇佣方绑定在手机等移动设备上的账户中作为推广的报酬。

雇佣方xx公司为了确保雇佣方是根据协议采用符合预设要求的方式得到的真实的业绩,并基于真实的业绩得到对应的资金数据,可以引入上述应用异常数据的检测方法的检测系统对每一个被雇佣方每一天所获取的资金数据是否存在异常进行检测,以便及时地识别发现异常资金数据,并判断该异常资金数据所对应的被雇佣方可能是采用了不符合预设要求的方式得到了业绩数据,例如被雇佣方可能是通过伪造业绩数据来获取资金报酬。这种业绩数据往往是没有价值,不符合雇佣方要求的业绩数据,雇佣方为这类业绩数据向被雇佣方支付资金报酬显然是不合理的,不能够达到雇佣方预想的效果,会对雇佣方造成经济损失。因此,在确定出异常资金数据后,雇佣方可以针对该类异常资金数据所对应的被雇佣方进行相应的预设处理,以减少资金数据的损失,获得预想的推广效果。

具体的,可以参阅图3所示,检测系统中的检测服务器通过预先布设于业务系统的数据采集器,采集并存储每一个目标对象(即被雇佣方)每天基于当天的业务业绩通过返佣方式得到的资金数据。

检测服务器在对目标对象当前时间点(例如今天)的资金数据进行异常检测时,会调取存储于检测服务器中该目标对象当前时间点之前的多个时间点的资金数据(例如今天之前的89天中的每一天该目标对象的资金数据),进而可以结合该目标对象当前时间点之前的多个时间点的资金数据,对该目标对象当前时间点的资金数据是否存在异常进行检测判断。

具体实施时,检测服务器可以根据目标对象的当前时间点的资金数据,以及当前时间点之前的多个时间点的资金数据,建立数据节点图(一种可视图)。

参阅图4所示,检测服务器可以先以时间参数作为横轴,以资金数据的数据数值作为纵轴,建立坐标系。并在上述坐标系中确定出数据节点。其中,每一个数据节点用于表征目标对象对应的一个时间点的资金数据。具体的,每一个数据节点的横坐标表征与时间点对应的时间参数,纵坐标表征目标对象在该时间点获得的资金数据的具体数值。例如,1号数据节点的横坐标表征89天之前(可以记为t1),纵坐标表征该目标对象在该时间点获得了资金数据为0.87k(可以记为y1)。20号数据节点的横坐标表征60天之前(可以记为t20),纵坐标表征该目标对象在该时间点获得的资金数据为0.83k(可以记为y20)。当然,需要说明的是,上述所列举的建立数据节点图的方式只是为了更好地说明本说明书实施例。具体实施时,也可以以资金数据数值作为纵轴,以时间参数作为横轴,建立坐标系,并在该坐标系中确定出能够表征目标对象对应时间点的资金数据的数据节点,得到数据节点图。

在得到上述数据节点图后,检测服务器可以对上述数据节点图进行特征提取,以提取得到数据节点中表征有目标对象的资金数据随时间变化情况等信息的图形特征。进而可以根据上述图形特征确定目标对象当前时间点的资金数据是否存在异常。

在一个场景示例中,检测服务器可以先按照预设的时间长度(例如1天),建立一个对应的分割区域(例如,一个滑动时间窗口),通过按照预设步长(例如,间隔一个数据节点)移动上述分割区域,对数据节点图进行切割,得到多个切割后的子图作为第一子图。

其中,上述第一子图具体可以理解为一种数据节点图中包含有预设的时间长度的数据节点(即中心数据节点)与其关联数据节点,以及上述数据节点之间相应的连接关系的图结构。通过上述第一子图所包含的图形结构特征,可以较为清晰地反映出原先隐含于数值数据中的中心数据节点所表征的资金数据与其他数据节点所表征的资金数据之间的数值大小、变化速度等特征信息的相互关系和/或变化规律。

在本场景示例中,以预设的时间长度为1天,预设步长为1个数据节点为例,说明检测服务器如何从数据节点图中获取多个第一子图。

具体的,检测服务器可以先根据预设的时间长度1天,确定每个分割区域中的中心数据节点的数量为1。再根据数据节点对应的时间参数的先后排列顺序,间隔预设步长的数据节点,从数据节点图中分割出中心数据节点的分割区域,再对各个中心数据节点的分割区域进行处理,得到对应的第一子图。

参阅图5所示,检测服务器可以先处理排列顺序最靠前的1号数据节点,将1号数据节点这一个数据节点作为第一分割区域中的中心数据节点,再从该中心数据节点出发,从数据节点图中搜索与该中心数据节点存在预设连接关系的数据节点,作为与该中心数据节点相连的关联数据节点。再将数据节点图中包含有1号数据节点和对应的关联数据节点的范围区域作为第一分割区域。

其中,上述与中心数据节点存在预设连接关系的数据节点具体可以理解为在数据节点图中与中心数据节点之间的连接线段中,以及在与中心数据节点之间的连接线段的上方区域不存在其他的数据节点的数据节点。

参阅图6所示,例如,n号数据节点为中心数据节点,在n+1号数据节点与n号数据节点之间的连接线段中,以及该连接线段的上方区域都不存在其他的数据节点,则可以判断n号数据节点与n+1号数据节点具备预设连接关系,相当于n+1号数据节点对于n号数据节点是可视的。因此,n+1号数据节点为n号数据节点的关联数据节点。而在n+2号数据节点与n号数据节点之间的连线中还存在其他的数据节点,即n+1号数据节点,则可以判断n号数据节点与n+2号数据节点不具备预设连接关系。因此,n+2号数据节点不是n号数据节点的关联数据节点。对于n+3号数据节点,虽然在在n+3号数据节点与n号数据节点之间的连接线段中没有其他的数据节点,但在该连接线段的上方区域还存在n+1号数据节点,则可以判断n号数据节点与n+3号数据节点不具备预设连接关系。因此,n+3号数据节点不是n号数据节点的关联数据节点。

具体实施时,检测服务器可以按照以下方式搜索确定出与中心数据节点具备上述预设连接关系的关联数据节点:获取中心数据节点,以及待定数据节点(数据节点图中除中心数据节点以外的任意一个数据节点)的横坐标和纵坐标;再根据中心数据节点,以及待定数据节点的横坐标和纵坐标,先确定在是否存在横坐标数值在中心数据节点的横坐标与待定数据节点的横坐标之间的数据节点(记为中间节点)。如果在中心数据节点和待定数据节点之间不存在上述中间节点,则确定待定数据节点为该中心数据节点的一个关联数据节点。如果在中心数据节点和待定数据节点之间存在上述中间节点,则需要进一步根据中心数据节点、待定数据节点、中间节点的横坐标和纵坐标来判断中心数据节点、待定数据节点、中间节点的横坐标和纵坐标是否满足以下判断关系式:yc<yb+(ya-yb)(tb-tc)/(tb-ta)。如果满足上述判断关系式,则可以判断该中间节点没有构成中心数据节点和待定数据节点之间的光线遮挡点。因此,可以确定待定数据节点为中心数据节点的关联数据节点。相应的,如果中心数据节点、待定数据节点、中间节点的横坐标和纵坐标不满足以上判断关系式,则可以判断该中间节点构成中心数据节点和待定数据节点之间的光线遮挡点。因此,可以确定待定数据节点不是中心数据节点的关联数据节点。

其中,在上述判断关系式中,yc可以表示为中间节点的纵坐标,yb可以表示为中心数据节点的纵坐标,ya可以表示为待定数据节点的纵坐标,tb可以表示为中心数据节点的横坐标,ta可以表示为待定数据节点的横坐标。其中,中间节点的横坐标tc满足以下关系:ta<tc<tb,或者,tb<tc<ta。

按照上述方式,可以在数据节点图中确定出1号数据节点的关联数据节点分别为:2号数据节点、3号数据节点、4号数据节点、5号数据节点。进而可以将数据节点图中包含有上述1号数据节点、2号数据节点、3号数据节点、4号数据节点、5号数据节点的范围区域确定为1号数据节点分割区域,即第一分割区域。

进一步,检测服务器可以再对上述1号数据节点的第一分割区域中的各个数据节点分别进行检索确定,并按照与上述在数据节点图中确定关联数据节点的方式,在第一分割区域中的数据节点中确定出与第一分割区域中的各个数据节点具有预设连接关系的关联数据节点。

参阅图5所示,按照上述方式通过对第一分割区域中的数据节点分别进行检索确定,可以确定出1号数据节点在第一分割区域中的关联数据节点为:2号数据节点、3号数据节点、4号数据节点和5号数据节点。2号数据节点在第一分割区域中的关联数据节点为:1号数据节点、3号数据节点和4号数据节点。3号数据节点在第一分割区域中的关联数据节点为:1号数据节点、2号数据节点和4号数据节点。4号数据节点在第一分割区域中的关联数据节点为:1号数据节点、2号数据节点、3号数据节点和5号数据节点。5号数据节点在第一分割区域中的关联数据节点为:1号数据节点和5号数据节点。进而可以使用连接线段将数据节点与对应的关联数据节点连接起来,并将上述连线作为连边。从而得到了1号数据节点的第一子图(也可以称为1号数据节点的动态图)。

其中,上述1号数据节点的第一子图中具体可以包含有与1号数据节点这个中心数据节点具有预设连接关系的关联数据节点,也包含有第一分割区域中的各个数据节点与对应的关联数据节点之间的连边。

在确定完1号数据节点的第一子图后,可以按照预设步长,确定出与1号数据节点间隔一个数据节点的2号数据节点作为下一个分割区域(即第二分割区域)的中心数据节点。

按照类似的方式,可以先在数据节点图中先确定出2号数据节点的关联数据节点为:1号数据节点、3号数据节点和4号数据节点。进而,可以将数据节点图中包含有1号数据节点、2号数据节点、3号数据节点和4号数据节点的范围区域确定为第二分割区域。再在第二分割区域中分别确定与第二分割区域中的各个数据节点具有预设连接关系的关联数据节点,并将第二分割区域中的数据节点与对应的关联数据节点通过连边相连,从而得到第二数据节点的第一子图。

继续按照上述方式,根据预设的时间长度、预设步长,分别从数据节点图确定出多个第一子图。在本场景示例中,由于所使用的预设的时间长度为1天、预设步长为间隔1个数据节点,且所要处理的数据节点图包含有90个数据节点,因此可以分别得到90个第一子图。当然,如果所使用的预设的时间长度不同(例如2天)、预设步长不同(例如间隔5个数据节点),或者所要处理的数据节点图所包含的数据节点的数量不同,得到第一子图的数量也可以不同。

需要说明的是,具体实施时,可以按照上述方式获取得到多个第一子图。也可以在建立数据节点图的时候,同时检索确定出数据节点图中各个数据节点的关联数据节点,以及相应的连边;再根据上述携带有关联数据节点以及连边等信息的数据节点图,通过分割得到多个第一子图。对此,本说明书不作限定。

在建立得到上述多个第一子图后,检测服务器可以分别对多个第一子图中的各个第一子图进行数据处理。具体的,可以先根据各个第一子图中所包含的数据节点的参数数据,分别确定出各个第一子图中所包含的各个数据节点的度和聚类系数;再根据各个第一子图中所包含的数据节点的度和聚类系数,计算得到各个第一子图的平均度和平均聚类系数。

其中,上述数据节点的度具体可以理解为数据节点在对应的第一子图中的关联数据节点的数量,可以认为是一种描述数据节点相关的图形结构的图形特征。

上述数据节点的聚类系数具体可以理解为数据节点图中以数据节点为顶点的三角形与以该数据节点为顶点的所有可能的三角形的数量比值,可以认为是一种描述数据节点相关的图形结构的图形特征。

上述第一子图的平均度具体可以理解为同一个第一子图中所包含的数据节点的度的和与该第一子图中所包含的数据节点的数量相除后得到的商,可以视为一种描述第一子图整体的图形结构的图形特征。通过该图形特征能够有效地反映出原先隐含于数值数据中的中心数据节点所对应时间点的资金数据的数值与邻近时间点资金数据的整体趋势的差异情况。通常第一子图的平均度的数值越大,该第一子图的中心数据节点所对应的时间点处的资金数据的数值与邻近时间点资金数据的整体趋势的差异程度越高,越有可能存在异常。

上述第一子图的平均聚类系数具体可以理解为同一个第一子图中所包含的数据节点的平均聚类系数的和与该第一子图中所包含的数据节点的数量相除后得到的商,可以视为一种描述第一子图整体的图形结构的图形特征。通过该图形特征能够有效地反映出原先隐含于数值数据中的中心数据节点所对应的时间点的资金数据的数值变化速度与邻近时间点资金数据的数值变化速度的差异情况。通常第一子图的平均聚类系数的数值越大,该第一子图的中心数据点所对应的时间点处的资金数据的数值变化速度相对于邻近数据节点的资金数据的数值变化速度的差异程度越高,越有可能存在异常。

具体的,可以参阅图7所示,为本场景示例中所获取的一个第一子图。根据该第一子图中所包含的数据节点极其连边,可以确定出数据节点a的度为1,数据节点b的度为3,数据节点c的度为2,数据节点d的度为2。因此,确定该第一子图的平均度为:(1+3+2+2)/4=2。类似的,根据上述第一子图,可以确定出数据节点a的聚类系数为0,数据节点b的聚类系数为1/3,数据节点c和d的聚类系数分别为1。因此,可以确定出该第一子图的平均聚类系数为:(0+1/3+1+1)/4=7/12。

按照上述方式可以分别计算出多个第一子图中的各个第一子图的平均度和平均聚类系数作为图形特征,进而后续可以根据上述图形特征,确定出资金数据随时间点的变化规律,例如资金数据的数值大小随时间点的变化规律,以及资金数据的数值的变化速度随时间点的变化规律,再根据上述规律来判断当前时间点的资金数据是否存在异常。这样在检测异常的过程中,可以有效地减少例如资金数据随时间点正常增长或下降等基线或趋势变动所带来的噪声干扰,使得在判断资金数据是否异常时更加的准确、可靠。

当然,需要说明的是,上述所列举的是按照一个预设的时间长度从数据节点图中获取多个第一子图,得到多个图形特征,进而根据图形特征来判断当前时间点的资金数据是否异常。具体实施时,为了能够更加准确地判断当前时间点的资金数据是否异常,还可以设置多组不同的预设的时间长度,得到对应不同预设的时间长度的多个第一子图,即得到了对应不同组的预设的时间长度的多组第一子图集。其中上述多组第一子图集可以理解为包含有多个第一子图的集合,且每一个第一子图集对应于一个预设的时间长度。再对多组第一子图集中的多个第一子图分别进行处理,得到多个第一子图集中的各个第一子图集所分别包含的第一子图的平均度和平均聚类系数,即得到了对应于多组第一子图集的多组图形特征。这样后续可以通过比较不同组的图形特征,进一步获取得到不同预设的时间长度所对应的时间周期中资金数据随时间点的变化规律。

例如,可以选一个相对较短的时间长度(例如1天)作为一个预设的时间长度(即第一组预设的时间长度),进而可以获取得到较短周期内资金数据随时间点的变化规律(或者短周期内不同时间点之间的资金数据的相关性信息)。同时可以选一个相对较长的时间长度(例如15天)作为另一个预设的时间长度(即第二组预设的时间长度),进而可以获取得到较长周期内资金数据随时间点的变化规律(或者较长周期内不同时间点之间的资金数据的相关性信息)。这样后续在判断当前时间点的资金数据是否存在异常时,可以综合上述两种不同周期的变化规律,进一步减少噪声干扰,综合不同周期的资金数据的变化特点,更加精准地对是否存在异常进行判断。

进一步,又考虑到目标对象(即被雇佣方)的主体情况不同,在进行推广业务时,往往在工作时间、方式,以及返佣资金的结算等方面也会存在一定的周期性差异。

例如,如果目标对象的主体为个人(例如“小二”),往往是单人执行推广业务,且大多会按周进行返佣资金的结算。因此,针对这一类型主体的目标对象可以增加一个时间长度为7天的预设的时间长度。这样得到的对应组的图形特征能够有效地挖掘、反映出每一周为一周期的资金数据的变化规律,更加符合目标对象主体的执行规律,从而得到的图形特征也更具参考价值。

如果目标对象的主体为团体(例如服务公司),往往是多人有组织有规划地执行推广业务,且大多会按月进行返佣资金的结算,因此,针对这一类主体的目标对象可以增加一个时间长度为30天的预设的时间长度。这样得到的对应组的图形特征能够有效地挖掘、反映出每一个月为一周期的资金数据的变化规律,更加符合目标对象主体的执行规则,从而得到的图形特征也更具参考价值。

当然,需要说明的是,上述所列举的预设的时间长度的具体数值只是一种示意性说明。具体实施时,根据目标对象主体的具体情况,还可以采用其他的时间长度,例如15天作为一个预设的时间长度。

在另一场景示例中,又考虑到在真实的业务场景中,每一个目标对象每一天推广的业绩量通常是随机不确定的。因此,在正常的情况下,目标对象的每一个时间点的资金数据与其他时间点的资金数据在图形结构上应当也满足一定的随机性特征。

基于上述考虑,具体实施时,也可以选择不获取上述第一子图的平均度和平均聚类系数作为图形特征来检测异常资金数据。而是选择从上述数据节点图中获取第二子图,再根据第二子图得到能表征随机性特征的第二子图的同构图的比例参数来检测异常资金数据。

其中,上述第二子图具体可以理解为一种包含有能形成连通图的固定个数的多个数据节点,以及上述多个数据节点之间相应的连接关系的图。通过上述第二子图所反映的图形结构特征,也可以较为清晰地反映出原先隐含于数值数据中的数据节点的资金数据变化的随机性规律。

上述第二子图的同构图(也可以称为graphlet)具体可以理解为具有相似的图形结构关系的一个或多个第二子图所组成的一个连通图的类型组合。一个第二子图的同构图中,具体可以包含有一个或多个具有相似的图形结构关系的第二子图。

例如,可以参阅图8所示,虽然编号为1的第二子图与编号为2的第二子图所包含的数据节点完全不同,但所包含的数据节点的个数相同,且上述两个第二子图中数据节点的连接方式也是相同的。因此可以判断上述两个子图具有相似的图形结构关系,可以组成一个连通图的类型组合,即对应于同一个第二子图的同构图。

又考虑到第二子图的阶数不同,所包含的数据节点的个数不相同,图形结构的复杂程度也不相同。在本场景示例中,考虑到三阶的第二子图往往所能反映出的随机性信息较为简单,不适用于本场景;而阶数过高的第二子图的图形结构相对较复杂,后续在处理过程中所涉及到的数据量往往会相对较大。基于上述多种考虑,将第二子图的阶数设置为4,即每一个第二子图所包含的数据节点的个数固定为4个。当然,需要说明的是,上述所列举的阶数只是一种示意性说明。具体实施时,根据具体情况和精度要求,也可以建立其他阶数的第二子图进行后续图形特征的获取。对此,本说明书不作限定。

在本场景示例中,以4阶第二子图为例,具体实施时,检测服务器可以遍历所述数据节点图中的各个数据节点,并分别以各个数据节点作为起始节点,根据数据节点之间的连边,在数据节点图中搜索3个(即第二预设个数)能够构成连通图的数据节点,建立得到多个第二子图。

再将上述多个第二子图中数据节点和图形结构关系完全相同的第二子图(即相同的第二子图)进行合并,得到多个合并后的第二子图。进而可以从合并后的第二子图中找到图形结构关系相似的不同的第二子图组合得到一个第二子图的同构图。

在按照上述方式确定出多个第二子图的同构图后,进一步可以分别统计各个第二子图的同构图中所分别包含的第二子图的数量;再将各个第二子图中所分别包含的第二子图的数量分别除以多个第二子图的同构图所包含的第二子图的总数,得到商作为对应的第二子图的同构图的比例参数,从而得到了能够表征资金数据的随机性的图形特征。

在按照上述方式得到上述能够反映资金数据变化的随机性的图形特征后,进一步可以利用包含有当前时间点之前的时间点的资金数据的图形特征来对当前时间点的资金数据进行评分,得到当前时间点的资金数据的差异程度分值,进而可以根据该分值确定当前时间点的资金数据是否为异常数据。

具体的,可以将上述包含有当前时间点之前的时间点的资金数据的图形特征作为训练样本,通过孤立森林(isolationforest)等算法进行训练,得到能够对图形特征与远离群体图形特征的差异程度进行评分的评分模型,再通过该评分模型对包含有当前时间点的资金数据的图形特征进行评分,得到对应的差异程度分值。如果包含有当前时间点的资金数据的图形特征的差异程度分值越高,则表征该资金数据越远离群体图形特征,越特殊,越不符合随机性特征,越有可能存在异常。

具体的实施,可以先根据包含有当前时间点之前的时间点的资金数据的图形特征确定出一个预设的分数阈值,当包含有当前时间点的资金数据的图形特征的差异程度分值大于该预设的分数阈值时,可以判断当前时间点的资金数据存在异常。

当然,需要说明的是,上述所列举的通过能表征资金数据的随机性的图形特征来检测异常数据的方式只是一种示意性说明,具体实施时,根据具体情况和处理要求,还可以采用其他合适的方式来利用上述能表征资金数据的随机性的图形特征来检测异常的资金数据。对此,本说明书不作限定。

需要补充的是,在上述两个场景示例中,是分别单独使用数据节点图中第一子图的平均度和平均聚类系数、数据节点图中第二子图的同构图的比例参数作为图形特征来检测异常数据的。具体实施时,为了进一步提高检测的准确度,也可以将上述两种不同类型的图形特征综合起来使用,以便更加准确地检测出异常的资金数据。

在另一个场景示例中,参阅图9所示,在获取得到上述任意一种或两种类型的图形特征后,为了能进一步提高检测异常资金数据的准确度,还可以获取目标对象的业务信息特征,进而可以综合图形特征和业务信息特征,更加准确地得到当前时间点的资金数据的差异程度分值,以便更加精准地确定当前时间点的资金数据是否为异常数据。

其中,上述业务信息特征具体可以理解为一种区别于图形特征的,通过对与目标对象相关的数值数据进行处理得到的能够反映目标对象不同时间点的资金数据的相互变化关系的特征信息。

具体的,上述业务信息特征可以包括以下至少之一:目标对象关联商户数的均值、目标对象关联商户数的方差、目标对象关联商户数的资金数据的均值、目标对象关联商户数的资金数据的方差等。当然,需要说明的是,上述所列举的业务信息特征只是一种示意性说明。具体实施时,根据具体情况,上述业务信息特征还可以包括商户返目标对象的资金数据的均值、商户返目标对象的资金数据的方差等等。对此,本说明书不作限定。

在本场景示例中,具体实施时,可以先对上述图形特征和业务信息特征不同类型的特征数据分别进行归一化处理,得到对应的归一化后的多种不同类型的特征数据。例如,可以对上述用于表征资金数据随机性的第二子图的同构图的比例参数进行one-hot编码,得到对应的编码数据,从而将数值差异较大的第二子图的同构图的比例参数统一到同一个比较维度上,在利用对应的编码数据进行训练,以便更加准确地对当前时间点的资金数据进行评分。当然,需要说明的是,上述所列举的归一化处理方式只是一种示意性说明。具体实施时,根据具体情况,也可以采用其他合适的归一化处理方式对上述图形特征或业务信息特征进行归一化处理。对此,本说明书不作限定。

在得到归一化后的多种不同类型的特征数据后,可以利用上述归一化后的多种不同类型的特征数据通过孤立森林等算法进行模型训练,得到相应的评分模型。再利用上述评分模型对当前时间点的资金数据进行评分,得到当前时间点的资金数据的差异程度分值。进而可以根据当前时间点的差异程度分值来判断当前时间点的资金数据是否为异常数据。

需要补充的是,如果在确定第一子图的平均度和平均聚类系数这类的图形特征时,使用了多组不同的预设的时间长度,得到了多组图形特征,在训练上述评分模型时,可以针对每一组图形特征分别训练对应的评分模型。

参阅图9所示,由于使用了三组不同的预设的时间长度,即1天、7天和30天。因此可以得到对应上述3种不同预设的时间长度的3组第一子图集中的第一子图的平均度和平均聚类系数,即得到了3组对应的图形特征(即第一组图形特征、第二组图形特征和第三组图形特征)。进而可以根据上述3组对应的图形特征,结合其他相同的特征数据,例如第二子图的同构图的比例参数,和/或,业务信息特征等分别训练得到3个不同的评分模型(即第一评分模型、第二评分模型和第三评分模型)。再利用上述3个评分模型分别对对应预设的时间长度的包含有目标对象的当前时间点的资金数据的图形特征的差异程度分值进行评分,得到上述3个分数值(即第一分数值、第二分数值和第三分数值);对上述3个分数值进行加权求平均,得到一个平均值作为该目标对象当前时间点的资金数据的差异程度分值。进而后续可以根据该差异程度分值最终确定当前时间点的资金数据是否存在异常。这样可以综合多种周期长度内资金数据的相互变化规律,以及其他类型的特征数据,更加准确地检测出异常资金数据。

在另一个场景示例中,还可以参阅图10所示,将同一主体类型的不同目标对象的资金数据结合起来进行分析处理,以得到同一主体类型中的资金数据随时间点的变化规律,进而可以引入另一个维度的资金数据之间的相互关系,更加精准地判断该主体类型的目标对象的当前时间点的资金数据是否存在异常。

具体的,例如,检测服务器在某检测服务公司(记为isv-1),除了采集获取isv-1当前时间点的资金数据,以及当前时间点之前的89天的资金数据外,还可以采集获取与isv-1的主体类型相同的其他服务公司(例如isv-2、isv-3、isv-n等)的当前时间点的资金数据,以及当前时间点之前的89天的资金数据。进而可以综合并根据上述n个isv的当前时间点的资金数据,以及当前时间点之前的89天的资金数据,建立n个isv的数据节点图。再按照上述图形特征的提取方式,根据多组预设的时间长度(包括:1天、7天、15天和30天)进行图形特征的提取处理,得到多组图形特征(即多组基于多个isv的图形特征)。其中,上述多组图形特征中的各组图形特征分别对应一个预设的时间长度,上述多组图形特征中的各组图形特征又分别包含有n个针对对应isv的图形特征。进而可以对上述多组图形特征分别进行归一化处理,得到对应的多组处理后的图形特征。再分别利用多组处理后的图形特征,通过孤立森林算法进行训练,建立评分模型,并对包含有isv-1当前时间点的资金数据的图形特征分别进行评分,得到对应的多个分数值。再综合上述多个分数值,求平均得到最终能够精确的指示当前时间点的资金数据是否存在差异的分值,进而可以根据该分值来判断当前时间点的资金数据是否异常。这样通过参考同一主体类型的不同个体的资金数据随时间点的变化规律,达到能够更加准确、全面地对目标对象的资金数据是否异常进行判断。

由上述场景示例可见,本说明书提供的异常数据的检测方法,由于通过先获取并根据目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据,建立能反映目标对象的不同时间点的资金数据的相互关系的数据节点图,在图像层面上,从中提取并利用数据节点图中能较为清晰地表征目标对象的资金数据随时间波动变化情况的图形特征来判断待测时间点的资金数据是否异常,从而解决了现有方法在判断目标对象的待测时间点的资金数据是否是异常数据时存在的容易出现误差、不准确的问题,达到能够避免噪声干扰,得到资金数据随时间波动变化的细节信息,进而准确、高效地识别出目标对象的异常资金数据;还通过根据不同组预设的时间长度,从数据节点图中获取多组第一子图集,进而得到对应不同预设的时间长度的,能表征目标对象的资金数据的短周期性变化情况以及长周期性变化情况的多组第一子图集中的第一子图的平均度和平均聚类系数作为图形特征来检测目标对象的待测时间点的资金数据是否异常,提高了识别异常资金数据的准确度;还通过从所述数据节点图中确定出多个连通图作为第二子图,再通过获取并利用能够表征目标对象的资金数据分布变化的随机性的第二子图的同构图的比例参数来识别异常资金数据,进一步提高了识别异常资金数据的准确度。

参阅图11所示,本说明书实施例提供了一种异常数据的检测方法,其中,该方法具体应用于检测服务器一侧。具体实施时,该方法可以包括以下内容:

s1101:获取目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据。

在本实施例中,需要说明的是,上述异常数据的检测方法具体可以应用于对雇佣方每个时间点支付给被雇佣方的返佣金额进行检测,以便及时地检测、发现被雇佣方每个时间点的返佣金额是否异常,进而后续可以以此为依据判断被雇佣方每个时间点是否是根据协议采用符合预设要求的方式获取真实的业绩来得到返佣金额的,并对检测出数据异常的,即可能是通过采用不符合预设要求的方式获取不真实的业绩数据来套取返佣金额的目标对象进行相应的预设处理。当然,需要说明的是,上述所列举的异常数据的检测方法的应用场景只是一种示意性说明。具体实施时,根据具体情况和处理要求,也可以将上述异常数据的检测方法应用于其他的应用场景,例如,还可以用于对下一级经销商的营业数据是否存在异常进行检测,或者用于对网站每日的好评数据是否存在异常进行检测等等。对此,本说明书不作限定。

在本实施例中,上述目标对象具体可以理解为被雇佣方。被雇佣方受雇于雇佣方,根据协议应当采用符合预设要求的方式,为雇佣进行某产品或服务的推广。雇佣方可以根据被雇佣方每个时间点(例如每天)的推广业绩(例如受被雇佣方的推广影响使用某产品或服务的人数)确定相应的返佣金额作为报酬奖励提供给被雇佣方。其中,上述目标对象根据主体类型的不同,进一步可以分为个人(例如“小二”),和,公司或团体(例如yy服务公司)等。对于目标对象的具体类型、形式,本说明书不作限定。

在本实施例中,上述目标对象的待测时间点的资金数据具体可以为目标对象当前时间点(例如今天)所获取的返佣金额的金额数据,也可以是目标对象其他时间点(例如昨天,或者10天前等)所获取的返佣金额的金额数据等。对此,本说明书不作限定。

需要补充的是,在本实施例中,由于应用场景为检测雇佣方每个时间点支付给被雇佣方的返佣金额是否异常,所以涉及到的要获取的数据是资金数据。如果上述异常数据的检测方法所应用的场景不是上述场景,相应的,上述资金数据也可以利用对应场景中的其他类型的数据进行替换。例如,当所应用的场景为检测网站每日得到的好评数据是否异常时,相应的,可以获取目标对象(即网站)待测时间点得到的好评数据作为后续要处理的数据。对此,本说明书不作限定。

在本实施例中,上述目标对象的待测时间点之前的多个时间点的资金数据,具体可以理解为在待测时间点之前的多个连续的时间点的目标对象的资金数据。例如,可以是目标对象从昨天至之前的第89天之间时间段内的每一天得到的资金数据。这样后续检测处理时,可以根据待测时间点之前的多个连续的时间点的资金数据分析出目标对象的资金数据随时间点的变化规律,进而可以用于判断待测时间点的资金数据是否异常。当然,需要说明的是,上述所列举的待测时间点之前的多个时间点的资金数据只是一种示意性说明。具体实施时,根据具体情况,也可以选择使用昨天到20天前这段时间内每天得到资金数据作为上述待测时间点之间的多个时间点的资金数据。对此,本说明书不作限定。

当然,需要说明的是,如果待测时间点不是当前时间点,例如待测时间点为10天前。则除了可以按照上述方式获取待测时间点之前的多个时间点的资金数据用于后续的检测处理外,也可以获取待测时间点与当前时间点之间的多个时间点的资金数据用于后续的检测处理。对此,本说明书不作限定。

在本实施例中,具体实施时,检测服务器可以通过预设于业务系统一侧或者目标对象的客户端一侧的数据采集器来采集获取上述目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据。

s1103:根据所述目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据,建立数据节点图,其中,所述数据节点图包括多个数据节点,数据节点的横坐标表征时间参数,所述数据节点的纵坐标表征资金数据。

在本实施例中,上述数据节点图具体可以理解为一种根据目标对象不同时间点的资金数据,建立的可视化的数据点图。其中,上述数据节点图中具体可以包括有多个数据节点,每一个数据节点分别对应与目标对象一个时间点的资金数据。具体的,每一个数据节点的横坐标可以用于表征对应的时间参数,例如1天前。每一个数据节点的纵坐标可以用于表征对应的资金数据,例如0.54k等。

需要说明的是,上述数据节点图包含有目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据等数据信息。不同于现有方法直接使用的数值数据,上述数据节点图是一种图形数据,相对于数值数据,能够更加直观、有效地反映出隐含于数据中的数据特点和变化规律。

在本实施例中,上述根据所述目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据,建立数据节点图,具体实施时,可以包括以下内容:先建立以时间参数为横轴、以资金数据为纵轴的坐标系;再根据上述目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据,确定出目标对象各个时间点的资金数据在坐标系中对应点的横坐标和纵坐标,并根据上述横坐标和纵坐标在坐标系中标识出对应的数据节点,从而得到了上述数据节点图。

s1105:从所述数据节点图中,提取图形特征。

在本实施例中,上述图形特征具体可以理解为一种基于上述数据节点图得到的,能够表征出目标对象的资金数据随时间变化情况(或规律)等信息的特征数据。

在本实施例中,上述图形特征具体可以包括能够表征出目标对象的资金数据随时间点变化的变化幅度和变化速度的图形特征(例如数据节点图中第一子图的平均度和平均聚类系数等),也可以包括能够表征出目标对象的资金数据随时间点变化的随机性的图形特征(例如数据节点图中第二子图的同构图的比例参数等),还可以是上述两种不同类型的图形特征的组合。

即,本说明书实施例所提供的异常数据的检测方法,可以单独利用数据节点图中第一子图的平均度和平均聚类系数作为图形特征,进行异常数据的检测,也可以单独利用数据节点图中第二子图的同构图的比例参数作为图形特征,进行异常数据的检测,还可以综合利用数据节点图中第一子图的平均度和平均聚类系数、数据节点图中第二子图的同构图的比例参数共同作为图形特征,进行异常数据的检测。具体实施时,可以根据具体情况和处理要求,选择使用合适的图形特征进行异常数据的检测。对此,本说明书不作限定。

在本实施例中,上述第一子图(也可称为动态图)具体可以理解为一种数据节点图中包含有预设的时间长度的数据节点(即中心数据节点)与其关联数据节点,以及上述数据节点之间相应的连接关系的图结构。通过上述第一子图所包含的图形结构特征,可以较为清晰地反映出原先隐含于数值数据中的中心数据节点所表征的资金数据与其他数据节点所表征的资金数据之间的数值大小、变化速度等特征信息的相互关系和/或变化规律。

在本实施例中,上述关联数据节点具体可以理解为数据节点图中与数据节点存在预设连接关系的数据节点。其中,与数据节点存在预设连接关系的数据节点具体可以理解为在数据节点图中与数据节点之间的连接线段中,以及在与数据节点之间的连接线段的上方区域不存在其他的数据节点的数据节点。

在本实施例中,上述第一子图的平均度具体可以理解为第一子图中所包含的数据节点的度的和与该第一子图中所包含的数据节点的数量相除后得到的商,可以视为一种描述第一子图整体的图形结构特点的图形特征。通过该图形特征能够有效地反映出原先隐含于数值数据中的中心数据节点所对应时间点的资金数据的数值与邻近时间点资金数据的整体趋势的差异情况。其中,上述数据节点的度具体可以理解为数据节点在所对应的第一子图中的关联数据节点的数量。

在本实施例中,上述第一子图的平均聚类系数具体可以理解为第一子图中所包含的数据节点的平均聚类系数的和与该第一子图中所包含的数据节点的数量相除后得到的商,可以视为一种描述第一子图整体的图形结构特点的图形特征。通过该图形特征能够有效地反映出原先隐含于数值数据中的中心数据节点所对应的时间点的资金数据的数值变化速度与邻近时间点资金数据的数值变化速度的差异情况。其中,上述数据节点的聚类系数具体可以理解为数据节点图中以数据节点为顶点的三角形与以该数据节点为顶点的所有可能的三角形的数量比值。

在本实施例中,上述第二子图具体可以理解为一种包含有能形成连通图的固定个数的多个数据节点,以及上述多个数据节点之间相应的连接关系的图。通过上述第二子图所反映的图形结构特征,也可以较为清晰地反映出原先隐含于数值数据中的数据节点的资金数据变化的随机性规律。

在本实施例中,上述第二子图的同构图(也可以称为graphlet)具体可以理解为具有相似的图形结构的一个或多个第二子图所组成的一个连通图的类型组合。一个第二子图的同构图中,具体可以包含有一个或多个具有相似的图形结构关系的第二子图。

在本实施例中,上述第二子图的同构图的比例参数具体可以理解为各个第二子图的同构图中所包含的第二子图的数量与总的第二子图数量的比值。可以视为一种描述不同类型的第二子图的同构图的分布特点的图形特征。通过该图形特征能够有效地反映出原先隐含于数值数据中的资金数据随时间变化的随机性差异情况。

s1107:根据所述图形特征,确定所述目标对象的待测时间点的资金数据是否符合预设要求。

在本实施例中,上述根据所述图形特征,确定所述目标对象的待测时间点的资金数据是否符合预设要求,具体实施时,可以包括以下内容:根据所述图形特征,确定目标对象的待测时间点的资金数据的差异程度分值;检测目标对象的待测时间点的资金数据的差异度分值是否大于预设的差异程度分值的阈值;在所述目标对象的待测时间点的资金数据的差异程度分值大于预设的差异程度分值的阈值的情况下,确定所述目标对象的待测时间点的资金数据不符合预设要求,进而可以判断目标对象的待测时间点的资金数据为异常资金数据;在所述目标对象的待测时间的资金数据的差异程度分值小于等于预设的差异程度分值的阈值的情况下,确定所述目标对象的待测时间点的资金数据符合预设要求,进而可以判断目标对象的待测时间点的资金数据为正常资金数据。

在本实施例中,上述预设的差异程度分值的阈值具体可以根据基于目标对象待侧时间点之前的多个时间点的资金数据(即不包含有待测时间点的资金数据)所得到的图形特征确定。对于上述预设的差异程度分值的阈值,本说明书不作限定。

在本实施例中,可以先根据基于不包含有目标对象的待测时间点的资金数据得到的图形特征,确定出资金数据随时间点的变化规律;再根据上述资金数据随时间点的变化规律,确定基于包含有目标对象的待测时间点的资金数据得到的图形特征与正常图形特征的差异程度分值;进而后续可以根据上述差异程度分值,判断目标对象的待测时间点的资金数据是否为异常资金数据。

在本实施例中,具体实施时,可以先将基于不包含有目标对象的待测时间点的资金数据得到的图形特征作为训练样本,通过孤立森林(isolationforest)算法进行训练,得到一个用于确定图形特征的评分模型;再将基于包含有目标对象的待测时间点的资金数据得到的图形特征作为输入数据,输入至上述评分模型中,得到该图形特征的评分值,作为待测时间点的资金数据的差异程度分值。当然,需要说明的是,上述确定待测时间点的资金数据的差异程度分值的方式只是一种示意性说明。具体实施时,根据具体情况和精度要求,也可以采用其他合适的方式根据上述图形特征来确定待测时间点的资金数据的差异程度分值。对此,本说明书不作限定。

在本实施例中,由于通过先获取并根据目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据,建立能反映目标对象的不同时间点的资金数据的相互关系的数据节点图,在图像层面上,从中提取并利用数据节点图中能较为清晰地表征目标对象的资金数据随时间波动变化情况的图形特征来判断待测时间点的资金数据是否异常,从而解决了现有方法在判断目标对象的待测时间点的资金数据是否是异常数据时存在的容易出现误差、不准确的问题,达到能够避免噪声干扰,得到资金数据随时间波动变化的细节信息,进而准确、高效地识别出目标对象的异常资金数据。

在一个实施例中,所述图形特征具体可以包括:数据节点图中第一子图的平均度和平均聚类系数,和/或,数据节点图中第二子图的同构图的比例参数等。具体实施时,可以单独根据上述所列举的图形特征中任意一种,或者同时根据上述所列举的两种图形特征来检测异常数据。当然,根据具体情况,还可以引入其他类型的图形特征来检测异常数据。对此,本说明书不作限定。

在一个实施例中,在所述图形特征包括:数据节点图中第一子图的平均速度和平均聚类系数的情况下,从所述数据节点图中,提取图形特征,具体实施时,可以包括以下内容:按照预设的时间长度,从所述数据节点图中获取多个第一子图,其中,第一子图包括多个与中心数据节点相连的关联数据节点;根据所述第一子图中的数据节点,计算第一子图中数据节点的度和聚类系数;根据第一子图中数据点的度和聚类系数,确定所述第一子图的平均度和平均聚类系数;将所述多个第一子图的平均度和平均聚类系数,作为所述图形特征。

在本实施例中,上述预设的时间长度具体可以根据应用场景中目标对象的数据的变化周期来确定。具体的,在本应用场景中,考虑到通常对主体类型为个人的被雇佣方(即目标对象),所适用的业务周期大多是1天或者1周,因此对这类主体类型的目标对象的预设的时间长度可以设置为1天或7天。而对主体类型为公司或团体的被雇佣方,所适用的业务周期大多是半个月或1个月,因此对这类主体类型的目标对象的预设的时间长度可以设置为15天或30天等。这样分割得到的第一子图更加贴近于目标对象的业务周期性习惯,进而得到图形特征能够反映出资金数据随时间点的周期性变化规律。

在本实施例中,上述按照预设的时间长度,从所述数据节点图中获取多个第一子图,具体实施时,可以包括以下内容:根据预设的时间长度确定中心数据节点的个数,即第一预设个数;按照预设步长间隔的数据节点数分别获取多组中心数据节点;对于所述多组中心数据节点中的各组中心数据节点,分别在数据节点图中搜索与中心数据节点具有预设连接关系的数据节点作为关联数据节点,并将所述中心数据节点与对应的关联数据节点作为第一子图所包含的数据节点;根据所述数据节点图,获取所述第一子图中的数据节点之间具有预设连接关系的连线作为所述第一子图中的连边;根据所述第一子图中的数据节点、所述第一子图中的连边,建立对应的第一子图。

在本实施例中,具体实施时,可以按照以下方式搜索确定出与中心数据节点具备上述预设连接关系的关联数据节点:获取中心数据节点,以及待定数据节点(数据节点图中除中心数据节点以外的任意一个数据节点)的横坐标和纵坐标;再根据中心数据节点,以及待定数据节点的横坐标和纵坐标,先确定在是否存在横坐标数值在中心数据节点的横坐标与待定数据节点的横坐标之间的数据节点(记为中间节点)。如果在中心数据节点和待定数据节点之间不存在上述中间节点,则确定待定数据节点为该中心数据节点的一个关联数据节点。如果在中心数据节点和待定数据节点之间存在上述中间节点,则需要进一步根据中心数据节点、待定数据节点、中间节点的横坐标和纵坐标来判断中心数据节点、待定数据节点、中间节点的横坐标和纵坐标是否满足以下判断关系式:yc<yb+(ya-yb)(tb-tc)/(tb-ta)。如果满足上述判断关系式,则可以判断该中间节点没有构成中心数据节点和待定数据节点之间的光线遮挡点。因此,可以确定待定数据节点为中心数据节点的关联数据节点。相应的,如果中心数据节点、待定数据节点、中间节点的横坐标和纵坐标不满足以上判断关系式,则可以判断该中间节点构成中心数据节点和待定数据节点之间的光线遮挡点。因此,可以确定待定数据节点不是中心数据节点的关联数据节点。

其中,在上述判断关系式中,yc可以表示为中间节点的纵坐标,yb可以表示为中心数据节点的纵坐标,ya可以表示为待定数据节点的纵坐标,tb可以表示为中心数据节点的横坐标,ta可以表示为待定数据节点的横坐标。其中,中间节点的横坐标tc满足以下关系:ta<tc<tb,或者,tb<tc<ta。

在本实施例中,上述根据所述第一子图中的数据节点,计算第一子图中数据节点的度和聚类系数;根据第一子图中数据点的度和聚类系数,确定所述第一子图的平均度和平均聚类系数,具体实施时,可以包括以下内容:对于多个第一子图中的各个第一子图,分别按照以下方式确定当前第一子图的平均度和平均聚类系数:获取当前第一子图中所包含的多个数据节点;根据所述当前第一子图中所包含的多个数据节点,分别统计多个数据节点中的度和聚类系数;计算当前第一子图中多个数据节点的度的和,以及多个数据节点的聚类系数的和;将上述当前第一子图中多个数据节点的度的和,以及多个数据节点的聚类系数的和分别除以当前第一子图中所包含的数据节点的总数,得到的商作为所述当前第一子图的平均度,和平均聚类系数。

在一个实施例中,上述按照预设的时间长度,从所述数据节点图中获取多个第一子图,具体实施时,可以包括以下内容:根据数据节点的时间参数,间隔预设步长的数据节点,从所述数据节点图中获取第一预设个数个数据节点作为第一子图中的中心数据节点,其中,所述第一预设个数的数值根据所述预设的时间长度确定;在所述数据节点图中搜索与所述中心数据节点具有预设连接关系的数据节点作为与所述中心数据节点相连的关联数据节点,并将所述中心数据节点和所述关联数据节点作为第一子图中的数据节点;根据所述数据节点图,获取所述第一子图中的数据节点之间具有预设连接关系的连线作为所述第一子图中的连边;根据所述第一子图中的数据节点、所述第一子图中的连边,建立所述第一子图。

在本实施例中,上述预设步长具体可以是1个数据节点。具体的,可以每隔一个数据节点获取中心数据节点。例如,预设的时间长度为2,则第一个第一子图的中心数据节点为1号数据节点和2号数据节点。间隔预设步长的数据节点,可以确定出第二个第一子图的中心数据节点为2号数据节点和3号数据节点。相应的,第三个第一子图的中心数据节点为3号数据节点和4号数据节点等等。当然,需要说明的是,上述所列举的预设步长只是一种示意性说明。具体实施时,根据具体情况和精度要求,也可以选择使用其他的数据节点数作为预设步长。对此,本说明书不作限定。

在一个实施例中,所述预设的时间长度具体可以包括以下至少之一:1天、7天、15天、30天等等。当然,需要说明的是,上述所列举的预设的时间长度只是为了更好地说明本说明书实施方式。具体实施时,根据具体的应用场景和精度要求,还可以设置其他时间长度作为上述预设的时间长度。对此,本说明书不作限定。

在一个实施例中,为了能够得到多种不同时间长度中资金数据随时间点的变化情况,例如资金数随时间点变化的长周期和短周期相关性,以便能够更加准确地检测异常资金数据。具体实施时,上述从所述数据节点图中,提取图形特征,具体还可以包括以下内容:按照多组预设的时间长度,从所述数据节点图中获取多组第一子图集,其中,所述多组第一子图集分别对应一个预设的时间长度,所述第一子图集包括多个第一子图;分别确定出所述多组第一子图集中的第一子图的平均度和平均聚类系数,得到多组图形特征。其中,所述多组图形特征分别对应一个预设的时间长度。

进而后续可以根据上述多组图形特征,从多组不同预设的时间长度中资金数据随时间点的变化情况来判断待测时间点的资金数据是否存在异常。进一步可以提高检测异常资金数据的准确度。

具体实施时,可以将上述多组图形特征分别作为多组训练样本,通过孤立森林(isolationforest)算法进行训练,得到用于确定图形特征的多个评分模型,其中,上述多个评分模型分别对应于多个预设的时间长度;再将基于多组包含有目标对象的待测时间点的资金数据得到的多个图形特征作为输入数据,分别输入至上述多个评分模型的对应模型中,得到各个模型给出的评分值;再对上述多个模型给出的评分值求平均,得到平均分值作为待测时间点的资金数据的差异程度分值。

在一个实施例中,在所述图形特征包括:数据节点图中第二子图的同构图的比例参数的情况下,从所述数据节点图中,提取图形特征,具体实施时,可以包括以下内容:分别以数据节点图中的多个数据节点为起始节点,搜索第二预设个数个数据节点,以建立连通子图作为第二子图,其中,所述第二预设个数根据第二子图的阶数确定;根据所述第二子图,确定出第二子图的同构图;统计所述第二子图的同构图的比例参数,作为所述图形特征。

在本实施例中,具体实施时,可以根据第二子图的阶数确定第二预设个数。具体的,如果第二子图的阶数为4,一个第二子图中所包含的数据节点的总数为4,则对应的第二预设个数则为3。如果第二子图的阶数为5,一个第二子图中所包含的数据节点的总数为5,则对应的第二预设个数则为4等。当然上述所列举的阶数只是一种示意性说明。具体实施时,可以根据具体情况和处理要求,选择合适阶数。对此,本说明书不作限定。

在本实施例中,具体实施时,可以根据预设的第二子图的阶数确定出第二子图中所包含的数据节点的总数;再分别以数据节点图中的多个数据节点中各个数据节点作为起始节点,搜索能够形成连通图的第二预设个数个数据节点,建立对应的多个第二子图。

在本实施例中,上述根据所述第二子图,确定出第二子图的同构图,具体实施时,可以包括以下内容:根据第二子图的图形结构,检索并将图形结构关系相似的不同的第二子图划分为一组,得到对应的一个第二子图的同构图(即graphlet)。其中,上述第二子图的同构图中可以包含有具有相似的图形结构关系的一个或多个第二子图

在本实施例中,上述统计所述第二子图的同构图的比例参数,具体实施时,可以包括以下内容:分别统计多个第二子图的同构图中各个第二子图的同构图所包含的第二子图的数量;将上述多个第二子图的同构图中各个第二子图的同构图所包含的第二子图的数量分别除以第二子图的总数,得到对应的多个第二子图的同构图的比例参数。后续可以根据上述多个第二子图的同构图的比例参数来分析资金数据随时间点的变化规律的随机性特征。

在一个实施例中,上述根据所述图形特征,确定所述目标对象的待测时间点的资金数据是否符合预设要求,具体实施时,可以包括以下内容:根据所述图形特征,确定目标对象的待测时间点的资金数据的差异程度分值;在所述目标对象的待测时间点的资金数据的差异程度分值大于预设的差异程度分值的阈值的情况下,确定所述目标对象的待测时间点的资金数据不符合预设要求。

在本实施例中,上述预设的差异程度分值的阈值具体可以根据基于不包含有待测时间点的资金数据所得到的图形特征所确定的。

在本实施例中,如果确定出所述目标对象的待测时间点的资金数据不符合预设要求,可以判断目标对象的待测时间点的资金数据异常,进而可以判断目标对象获得的待测时间的资金数据可能不是根据协议通过符合预设要求的方式获取正常的业绩数据得到的。例如,上述待测时间点的资金数据可能是被雇佣方通过伪造的推广记录套取资金报酬获得的,实际上被雇佣方并没有根据协议按照雇佣方的要求进行有效的推广,雇佣方也没有得到与自己所支付的资金数据匹配的推广效果。

在这种情况下,如果目标对象获得了上述异常资金数据显然是不合理的,也会对雇佣方造成损失。因此,在确定所述目标对象的待测时间点的资金数据不符合预设要求的情况下,所述方法具体实施时,还可以包括以下内容:确定所述目标对象的待测时间点的资金数据异常,并生成针对所述目标对象的警示信息;响应所述警示信息,对所述目标对象进行预设处理。其中,上述警示信息可以用于提示该目标对象的资金数据不符合预设要求,存在异常,需要对该目标对象进行相应处理。

进一步,可以根据上述警示信息,对目标对象进行相应的预设处理。例如,可以收回支付给目标对象的存在异常的资金数据。或者,也可以先对目标对象是否根据协议通过正常方式获取业绩数据得到资金数据进行调查,再根据调查结果确定是否收回支付给目标对象的存在异常的资金数据。或者,还可以对资金数据存在异常的目标对象进行警告或加入黑名单等等。从而可以及时减少雇佣方的经济损失,并对存在资金数据异常的目标对象作出对应的惩戒。当然,上述所列举的预设处理只是一种示意性说明。具体实施时,根据具体的应用场景,还可以采用其他合适的处理方式对上述资金数据存在异常的目标对象进行相应处理。对此,本说明书不作限定。

在一个实施例中,上述根据所述图形特征,确定目标对象的待测时间点的资金数据的差异程度分值,具体实施时,可以包括以下内容:获取目标对象的待测时间点的业务信息特征;根据所述图形特征,和所述目标对象的待测时间点的业务信息特征,确定所述目标对象的待测时间点的资金数据的差异程度分值。

在本实施例中,上述业务信息特征具体可以理解为一种区别于图形特征的,通过对与目标对象相关的数值数据进行处理得到的能够反映目标对象不同时间点的资金数据的相互变化关系的特征信息。

在本实施例中,为了进一步提高检测异常数据的准确度,具体实施时,在获取并利用图形特征的基础上,还可以获取并综合利用业务信息特征,以便从多个维度来检测待测点的资金数据是否异常。从而可以进一步提高检测异常数据的准确度。

在一个实施例中,所述业务信息特征具体可以包括以下至少之一:目标对象关联商户数的均值、目标对象关联商户数的方差、目标对象关联商户数的资金数据的均值、目标对象关联商户数的资金数据的方差等。当然,需要说明的是,上述所列举的业务信息特征只是一种示意性说明。具体实施时,根据具体情况,上述业务信息特征还可以包括商户返目标对象的资金数据的均值、商户返目标对象的资金数据的方差等等。对此,本说明书不作限定。

在一个实施例中,在按照上述实施例得到对应的图形特征后,所述方法具体实施时,还可以包括以下内容:对所述图形特征进行归一化处理,得到归一化后的图形特征。其中,所述归一化处理包括对所述图形特征进行one-hot编码。

在本实施例中,考虑到不同的图形特征可能差异较大,或者不同类型的图形特征是基于不同维度的数据处理得到的,为了能将上述差异较大,或者基于不同维度的数据处理得到的图形特征统一到同一个数据层面上来使用,可以先对图形特征进行归一化处理。这样后续可以将不同的图形特征统一到同一个数据层面中,从而可以更有效地结合不同的图形特征,更加精确地检测异常数据。

在一个实施例中,又考虑到对于目标对象而言,同一主体类型的其他对象的资金数据随时间点的变化情况,也可以作为一种判断目标对象待测时间点的资金数据是否存在异常的依据。例如,对于某个个体类型的被雇佣方小二1而言,其他小二,例如小二2、小二3和小二4都是个体类型的主体,在为雇佣方进行产品或服务的推广时,所采集用的推广方式、业务时间等具有较高的相似性。因此,在正常情况下,其他小二的资金数据随时间点的变化情况与小二1的资金数据随时间点的变化情况也会存在一定的相似性。

基于上述考虑,为了能够更加准确地对目标对象的待测时间点的资金数据是否异常进行判断,还可以获取与目标对象同一类型主体的对象多个时间点的资金数据,按照上述针对目标对象的时间点资金数据的处理方式,得到针对多个其他对象的图形特征。进而可以根据目标对象的图形特征和其他对象的图形特征共同对包含有目标对象的待测时间点的资金数据的图形特征进行检测,更加精准地检测出异常资金数据。

在本实施例中,具体的,可以根据多个其他对象的图形特征,以及目标对象的图形特征作为训练样本,通过孤立森林等算法进行训练,建立对应的评分模型;再通过上述评分模型对包含有目标对象的待测时间点的资金数据的图形特征进行评分,得到对应差异程度分值;根据上述差异程度分值确定目标对象的待测时间点的资金数据是否为异常资金数据。

在一个实施例中,上述异常数据的检测方法,具体实施时,可以包括以下内容:获取目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据;根据所述目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据,建立数据节点图,其中,所述数据节点图包括多个数据节点,数据节点的横坐标表征时间参数,所述数据节点的纵坐标表征资金数据;从所述数据节点图中,提取数据节点图中第一子图的平均度和平均聚类系数;根据所述数据节点图中第一子图的平均度和平均聚类系数,确定所述目标对象的待测时间点的资金数据是否符合预设要求。

在一个实施例中,上述异常数据的检测方法,具体实施时,还可以包括以下内容:获取目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据;根据所述目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据,建立数据节点图,其中,所述数据节点图包括多个数据节点,数据节点的横坐标表征时间参数,所述数据节点的纵坐标表征资金数据;从所述数据节点图中,提取数据节点图中第二子图的同构图的比例参数;根据所述数据节点图中第二子图的同构图的比例参数,确定所述目标对象的待测时间点的资金数据是否符合预设要求。

在一个实施例中,上述异常数据的检测方法,具体实施时,还可以包括以下内容:获取目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据;根据所述目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据,建立数据节点图,其中,所述数据节点图包括多个数据节点,数据节点的横坐标表征时间参数,所述数据节点的纵坐标表征资金数据;从所述数据节点图中,提取数据节点图中第一子图的平均度和平均聚类系数,和数据节点图中第二子图的同构图的比例参数;根据数据节点图中第一子图的平均度和平均聚类系数,和数据节点图中第二子图的同构图的比例参数,确定所述目标对象的待测时间点的资金数据是否符合预设要求。

由上可见,本说明书实施例提供的异常数据的检测方法,由于通过先获取并根据目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据,建立能反映目标对象的不同时间点的资金数据的相互关系的数据节点图,在图像层面上,从中提取并利用数据节点图中能较为清晰地表征目标对象的资金数据随时间波动变化情况的图形特征来判断待测时间点的资金数据是否异常,从而解决了现有方法在判断目标对象的待测时间点的资金数据是否是异常数据时存在的容易出现误差、不准确的问题,达到能够避免噪声干扰,得到资金数据随时间波动变化的细节信息,进而准确、高效地识别出目标对象的异常资金数据;还通过根据不同组预设的时间长度,从数据节点图中获取多组第一子图集,进而得到对应不同预设的时间长度的,能表征目标对象的资金数据的短周期性变化情况以及长周期性变化情况的多组第一子图集中的第一子图的平均度和平均聚类系数作为图形特征来检测目标对象的待测时间点的资金数据是否异常,提高了识别异常资金数据的准确度;还通过从所述数据节点图中确定出多个连通图作为第二子图,再通过获取并利用能够表征目标对象的资金数据分布变化的随机性的第二子图的同构图的比例参数来识别异常资金数据,进一步提高了识别异常资金数据的准确度。

本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:获取目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据;根据所述目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据,建立数据节点图,其中,所述数据节点图包括多个数据节点,所述数据节点用于表征目标对象的对应时间点的资金数据;从所述数据节点图中,提取图形特征;根据所述图形特征,确定所述目标对象的待测时间点的资金数据是否符合预设要求。

为了能够更加准确地完成上述指令,参阅图12所示,本说明书还提供了另一种具体的服务器,其中,所述服务器包括网络通信端口1201、处理器1202以及存储器1203,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。

其中,所述网络通信端口1201,具体可以用于获取目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据。

所述处理器1202,具体可以用于根据所述目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据,建立数据节点图,其中,所述数据节点图包括多个数据节点,所述数据节点用于表征目标对象的对应时间点的资金数据;从所述数据节点图中,提取图形特征;根据所述图形特征,确定所述目标对象的待测时间点的资金数据是否符合预设要求。

所述存储器1203,具体可以用于存储处理器1202所基于的相应的指令程序。

在本实施方式中,所述网络通信端口1201可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的80号端口,也可以是负责进行ftp数据通信的21号端口,还可以是负责进行邮件数据通信的25号端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如gsm、cdma等;其还可以为wifi芯片;其还可以为蓝牙芯片。

在本实施方式中,所述处理器1202可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(applicationspecificintegratedcircuit,asic)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。

在本实施方式中,所述存储器1203可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如ram、fifo等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、tf卡等。

本说明书实施例还提供了一种基于上述异常数据的检测方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:获取目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据;根据所述目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据,建立数据节点图,其中,所述数据节点图包括多个数据节点,所述数据节点用于表征目标对象的对应时间点的资金数据;从所述数据节点图中,提取图形特征;根据所述图形特征,确定所述目标对象的待测时间点的资金数据是否符合预设要求。

在本实施方式中,上述存储介质包括但不限于随机存取存储器(randomaccessmemory,ram)、只读存储器(read-onlymemory,rom)、缓存(cache)、硬盘(harddiskdrive,hdd)或者存储卡(memorycard)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。

在本实施方式中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。

参阅图13所示,在软件层面上,本说明书实施例还提供了一种异常数据的检测装置,该装置具体可以包括以下的结构模块:

获取模块1301,具体可以用于获取目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据;

建立模块1302,具体可以用于根据所述目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据,建立数据节点图,其中,所述数据节点图包括多个数据节点,所述数据节点用于表征目标对象的对应时间点的资金数据;

提取模块1303,具体可以用于从所述数据节点图中,提取图形特征;

确定模块1304,具体可以用于根据所述图形特征,确定所述目标对象的待测时间点的资金数据是否符合预设要求。

在一个实施例中,所述图形特征具体可以包括:数据节点图中第一子图的平均度和平均聚类系数,和/或,数据节点图中第二子图的同构图的比例参数等。需要说明的是,具体实施时,可以单独根据上述所列举的图形特征中任意一种,或者同时根据上述所列举的两种图形特征来检测异常数据。当然,根据具体情况,还可以引入其他类型的图形特征来检测异常数据。对此,本说明书不作限定。

在一个实施例中,在所述图形特征包括:数据节点图中第一子图的平均速度和平均聚类系数的情况下,所述提取模块1303具体可以包括以下结构单元:

第一获取单元,具体可以用于按照预设的时间长度,从所述数据节点图中获取多个第一子图,其中,第一子图包括多个与中心数据节点相连的关联数据节点;

第一计算单元,具体可以用于根据所述第一子图中的数据节点,计算第一子图中数据节点的度和聚类系数;

第一确定单元,具体可以用于根据第一子图中数据点的度和聚类系数,确定所述第一子图的平均度和平均聚类系数;并将所述多个第一子图的平均度和平均聚类系数,作为所述图形特征。

在一个实施例中,所述第一获取单元具体可以包括以下结构子单元:

第一获取子单元,具体可以用于根据数据节点的时间参数,间隔预设步长的数据节点,从所述数据节点图中获取第一预设个数个数据节点作为第一子图中的中心数据节点,其中,所述第一预设个数的数值根据所述预设的时间长度确定;

搜索子单元,具体可以用于在所述数据节点图中搜索与所述中心数据节点具有预设连接关系的数据节点作为与所述中心数据节点相连的关联数据节点,并将所述中心数据节点和所述关联数据节点作为第一子图中的数据节点;

第二获取子单元,具体可以用于根据所述数据节点图,获取所述第一子图中的数据节点之间具有预设连接关系的连线作为所述第一子图中的连边;

建立子单元,具体可以用于根据所述第一子图中的数据节点、所述第一子图中的连边,建立所述第一子图。

在一个实施例中,所述预设的时间长度具体可以包括以下至少之一:1天、7天、15天、30天等。当然,需要说明的是,上述所列举的预设的时间长度只是为了更好地说明本说明书实施方式。具体实施时,根据具体的应用场景和精度要求,还可以设置其他时间长度作为上述预设的时间长度。对此,本说明书不作限定。

在一个实施例中,所述提取模块具体还可以用于按照多组预设的时间长度,从所述数据节点图中获取多组第一子图集,其中,所述多组第一子图集分别对应一个预设的时间长度,所述第一子图集包括多个第一子图;分别确定出所述多组第一子图集中的第一子图的平均度和平均聚类系数,得到多组图形特征。

在一个实施例中,在所述图形特征包括:数据节点图中第二子图的同构图的比例参数的情况下,所述提取模块1303具体可以包括以下结构单元:

搜索单元,具体可以用于分别以数据节点图中的多个数据节点为起始节点,搜索第二预设个数个数据节点,以建立连通子图作为第二子图,其中,所述第二预设个数根据第二子图的阶数确定;

第二确定单元,具体可以用于根据所述第二子图,确定出第二子图的同构图;

统计单元,具体可以用于统计所述第二子图的同构图的比例参数,作为所述图形特征。

在一个实施例中,所述确定模块1304具体可以包括以下结构单元:

第三确定单元,具体可以用于根据所述图形特征,确定目标对象的待测时间点的资金数据的差异程度分值;

第四确定单元,具体可以用于在所述目标对象的待测时间点的资金数据的差异程度分值大于预设的差异程度分值的阈值的情况下,确定所述目标对象的待测时间点的资金数据不符合预设要求。

在一个实施例中,所述第三确定单元具体可以包括以下结构子单元:

第三获取子单元,用于获取目标对象的待测时间点的业务信息特征;

确定子单元,用于根据所述图形特征,和所述目标对象的待测时间点的业务信息特征,确定所述目标对象的待测时间点的资金数据的差异程度分值。

在一个实施例中,所述业务信息特征具体可以包括以下至少之一:目标对象关联商户数的均值、目标对象关联商户数的方差、目标对象关联商户数的资金数据的均值、目标对象关联商户数的资金数据的方差等。当然,需要说明的是,上述所列举的业务信息特征只是一种示意性说明。具体实施时,根据具体情况,上述业务信息特征还可以包括商户返目标对象的资金数据的均值、商户返目标对象的资金数据的方差等等。对此,本说明书不作限定。

在一个实施例中,所述装置还可以包括处理模块,具体可以用于在确定所述目标对象的待测时间点的资金数据不符合预设要求的情况下,确定所述目标对象的待测时间点的资金数据异常,并生成针对所述目标对象的警示信息;响应所述警示信息,对所述目标对象进行预设处理。

在本实施例中,上述预设处理具体可以包括以下至少之一:收回目标对象的异常资金数据;对目标对象进行警告处理;将目标对象列入信用黑名单等等。

需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

由上可见,本说明书实施例提供的异常数据的检测装置,由于通过获取模块和建立模块先获取并根据目标对象的待测时间点的资金数据,以及目标对象的待测时间点之前的多个时间点的资金数据,建立能反映目标对象的不同时间点的资金数据的相互关系的数据节点图,通过提取模块在图像层面上,从中提取并利用数据节点图中能较为清晰地表征目标对象的资金数据随时间波动变化情况的图形特征,再通过确定模块根据上述图形特征来判断待测时间点的资金数据是否异常,从而解决了现有方法在判断目标对象的待测时间点的资金数据是否是异常数据时存在的容易出现误差、不准确的问题,达到能够避免噪声干扰,得到资金数据随时间波动变化的细节信息,进而准确、高效地识别出目标对象的异常资金数据;还通过建立模块根据不同组预设的时间长度,从数据节点图中获取多组第一子图集,进而通过提取模块得到对应不同预设的时间长度的,能表征目标对象的资金数据的短周期性变化情况以及长周期性变化情况的多组第一子图集中的第一子图的平均度和平均聚类系数作为图形特征来检测目标对象的待测时间点的资金数据是否异常,提高了识别异常资金数据的准确度;还通过提取模块从所述数据节点图中确定出多个连通图作为第二子图,再通过获取并利用能够表征目标对象的资金数据的分布变化的随机性的第二子图的同构图的比例参数来识别异常资金数据,进一步提高了识别异常资金数据的准确度。

虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1