异常交易识别方法、装置及服务器与流程

文档序号:14195532阅读:205来源:国知局
异常交易识别方法、装置及服务器与流程

本说明书实施例涉及互联网技术领域,尤其涉及一种异常交易识别方法、装置及服务器。



背景技术:

在电商平台上,一些卖家为了获取更多的流量等平台资源,进行刷单、刷好评等作弊行为。刷单团伙会出于自身的利益,例如套取营销资源、刷虚假好评、刷竞价排名顺序、向投资人展示平台销量,在口碑门店进行大额刷单以营造出门店有大量交易的假象。这些虚假交易给平台带来了各种各样的危害,例如:虚假评论导致平台公信力下降,营销活动中的刷单导致营销资金的滥用。



技术实现要素:

本说明书实施例提供及一种异常交易识别方法、装置及服务器。

第一方面,本说明书实施例提供一种异常交易识别方法,包括:获取预定时间段内的历史交易数据;根据历史交易数据中的交易主体和交易行为,确定出至少一个具有连通关系的交易团体;提取出交易团体特征数据,并基于交易团体特征数据,确定出所述交易团体中每笔交易的交易特征数据;对交易特征数据进行异常检测,确定出异常交易。

第二方面,本说明书实施例提供一种异常交易识别装置,包括:历史数据获取单元,用于获取预定时间段内的历史交易数据;交易团体确定单元,用于根据历史交易数据中的交易主体和交易行为,确定出至少一个具有连通关系的交易团体;交易特征数据确定单元,用于提取出交易团体特征数据,并基于交易团体特征数据,确定出所述交易团体中每笔交易的交易特征数据;异常检测单元,用于对交易特征数据进行异常检测,确定出异常交易。

第三方面,本说明书实施例提供一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述异常交易识别方法的步骤。

第四方面,本说明书实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述异常交易识别方法的步骤。

本说明书实施例有益效果如下:

本说明书实施例中,通过确定一个个交易团体,缩小了风险交易的范围,在交易团体范围内通过交易特征数据进行异常检测,可以达到高效、快速检测出异常交易的目的。在一个可选方式中,通过kcore算法将较大规模的无向图中分割出一个个小的连通子图,从而确定一个个交易团体,并针对线下口碑交易地理位置聚集性的特点,引入无监督学习的孤立森林算法,可以准确的区分出正常交易和异常交易。并且,可根据交易团体中异常交易占比,确定异常交易团体,并对异常交易或异常交易团体进行管控提高电商平台可信度。

附图说明

图1为本说明书实施例异常交易识别应用场景示意图;

图2为本说明书实施例第一方面异常交易识别方法流程图;

图3为本说明书实施例异常交易识别方法实例中交易连通子图示意图;

图4为本说明书实施例第二方面异常交易识别装置结构示意图;

图5为本说明书实施例第三方面异常交易识别服务器结构示意图。

具体实施方式

为了更好的理解上述技术方案,下面通过附图以及具体实施例对本说明书实施例的技术方案做详细的说明,应当理解本说明书实施例以及实施例中的具体特征是对本说明书实施例技术方案的详细的说明,而不是对本说明书技术方案的限定,在不冲突的情况下,本说明书实施例以及实施例中的技术特征可以相互组合。

请参见图1,为本说明书实施例的异常交易识别应用场景示意图。终端100位于用户侧,与网络侧的服务器200通信。终端100中的交易处理客户端101可以是基于互联网实现业务的app或网站,为用户提供交易的界面并将交易数据提供给网络侧进行处理;服务器200中的异常交易识别系统201用于对交易处理客户端101中涉及的异常交易进行识别。

本说明书实施例针对基于电商平台中刷单、刷好评的作弊行为。特别在口碑场景,大多数是以线下交易为主。其中的交易通常会呈现某种程度的聚集性。如果单以图算法将一个个非法团伙提取出来,这些团伙通常还包括一些正常交易(例如固定买早餐、固定买菜、线下批发市场等)有聚集性,但又是正常交易的团体。本本说明书实施例首先聚类出交易团体,再对交易团体中的交易进行异常识别,可以达到针对性的对非法团伙进行特别关注的目的。

第一方面,本说明书实施例提供一种异常交易识别方法,请参考图2,包括步骤s201-s204。

s201:获取预定时间段内的历史交易数据。

预定时间段可以按照如下方式划分:由于时间属性为连续值,可以将时间离散化,即将时间进行分段,如按照自然天分段,预定时间段为某一天或某几天,如按照自然月分段,预定时间段为某一个月。时间的分段可以根据具体情况而定,对此不作限定。例如,在一个应用场景下,获取近三天的历史交易数据。

历史交易数据是指电商平台的交易数据。交易数据可以包括订单id、金额、买家id、卖家id、订单生成时间、交付信息、物流信息等。

s202:根据历史交易数据中的交易主体和交易行为,确定出至少一个具有连通关系的交易团体。

如前所述的,历史交易数据中的买家id和卖家id可以表明交易主体,金额、交付信息、物流信息等可以表明交易行为。通过对交易主体和交易行为的分析(例如利用聚类算法)可以确定出多个具有连通关系的交易团体。其中,具有连通关系,是指该交易团体中的交易主体存在交易行为。例如,一个交易团体中包括五个交易主体a、b、c、d、e,则这五个交易主体之间存在买卖关系的交易,从而构成一个交易连通图或连通网络。

在一种可选实现方式中,可以首先构建一个较大规模的交易无向图,然后再对该交易无向图进行划分为多个连通子图,由每个连通子图确定一个交易团体。

因此上述步骤s202可进一步包括:

s2021:分析历史交易数据,以买家节点或卖家节点为点、以每笔交易为边,构建具有交易关系的交易无向图。

直观而言,若一个图中每条边都是无方向的,则称为无向图。可以理解,如果采集的历史交易数据较庞大,则该无向图规模也相应的很大。为了提高处理效率,可以对无向图进行缩小范围。在一种可选方式中,通过下述s2022使无向图缩小。

s2022:从交易无向图中,去除热门卖家、标记为信誉高的卖家、属于卖家白名单中的卖家。

该s2022是可选的。

通过将热门卖家、标记为信誉高的卖家、属于卖家白名单中的卖家等信誉良好的卖家从无向图中去除,可有效缩减无向图的体积,便于后续对无向图进行进一步划分为连通子图。例如:去除超过有100个买家的卖家的节点。一般此类的热门卖家多为连锁店、自动贩卖机和信誉较好的ka商家。去掉此类节点能降低图的连通度。

s2023:将交易无向图划分为至少一个预定规模的团体交易连通子图,其中每个团体交易连通子图确定一个上述交易团体。

在一种可选方式中:通过下述步骤将交易无向图划分为至少一个预定规模的团体交易连通子图:基于k中心(kcore)算法,根据预置的k值,从交易无向图中反复去除度小于或等于k的节点后,得到至少一个团体交易连通子图。kcore算法目的在于对图进行分割,通过删除图中的一些节点或者一些边后使图逐渐变得不连通。

在本说明书实施例中,通过利用kcore算法将无向图反复去除度小于或等于k的节点后,得到团体交易连通子图。其中预先设定k的值,通过反复去除度小于或等于k的节点。可见k值大小决定了团体交易连通子图的规模。

图3中示出了一个简单的对无向图进行缩减的例子。图3最左侧图(1)中示出了节点a、b、c、d、e、f、g的连通关系;其中每个节点与几个节点相连则其即几度,例如节点a与三个节点b、c、d相连,因此节点a为三度节点;再如节点f与两个节点e、g相连,因此节点f为二度节点。

例如参考图3的例子:假设k=2(即需要反复删除节点度数小于等于2的节点),即需要删除二度及以下的节点。

在图3的中间图(2)中即为删除了节点f、g所剩余的图。此时发现在删除节点f、g之后节点e变为了一度节点,也需要删除。因此在图3右侧图(3)中,将节点e删除。最终得到的连通子图为图3最右侧图(3)所示。

s203:提取出交易团体特征数据,并基于交易团体特征数据,确定出交易团体中每笔交易的交易特征数据。

经过kcore算法分割过的连通子图可以确定众多的联通团体。这些团体中有些是刷单团体,有些是正常交易,因为经常固定在几家地点买菜/吃饭/购物而形成的正常社区。因此,需要提取团体中的一些特征进一步为异常交易检测所使用。团体特征数据是指团体中交易主体之间发生的交易行为描述信息。例如,团体特征数据包括:团体中买家交易金额标准差、团体中所有交易金额总和、团体中交易频率、团体中交易方向,等等。

在确定出交易团体特征数据之后,可根据预先设置的团体特征数据阈值或团体特征数据黑/白名单的方式,过滤掉正常交易的团体特征数据,而仅保留风险较高的交易团体的交易团体特征数据。并仅对这些风险较高的交易团体基于交易团体特征数据确定出交易团体中每笔交易的交易特征数据。

例如,假设对近3天历史交易数据进行分析处理之后得到风险较高的80个交易团体,其中,有的团体规模较大,例如包括100个交易主体(买家和卖家总数),有的团体规模较小,例如包括5个交易主体。那么,通过对每个交易团体的团体特征数据进行分析,即可确定该交易团体中每笔交易的交易特征数据。

例如,为了简便,假设对规模较小的5个交易主体团体分析发现,该团体共进行了50笔交易,可提取出每笔交易的交易特征数据,例如包括每笔交易的交易id、交易时间、买家id、卖家id、交易金额等特征数据。

本说明书实施例中首先确定交易团体,从而提取出交易团体特征数据,再基于交易团体特征数据确定出交易团体中每笔交易的交易特征数据。这样处理的好处在于,通过确定交易团体将范围缩小,锁定可疑的交易团体,特别是通过kcore算法以及去除热门卖家的方式,可以确定出联通度较低的多个交易团体。进一步,通过去除正常交易团体特征数据的方式保留风险较高的交易团体,并根据这些风险较高的交易团体的交易团体特征数据对这些交易团体的每笔交易特征数据进行提取,为后续进行交易异常检测做准备。可见,本说明书实施例从风险性较高的交易团体入手,并结合上述各种处理方式,不断缩小风险交易的范围,可实现高效处理。

s204:对交易特征数据进行异常检测,确定出异常交易。

数据集中会包含一个或多个数值异常大、异常小、异常分布的值,这样的极端值称为异常值。对交易特征数据进行异常检测目的在于找出分布异常的交易特征数据,从而确定出异常交易。具体可使用各种异常检测算法进行异常检测。例如:基于经典统计的方法、基于正态分布的一元离群点检测方法、基于多元离群点的检测方法、基于一元正态分布的离群点检测方法、基于多元高斯分布的异常点检测方法、使用马氏(mahalanobis)距离检测多元离群点、一分类支持向量机(one-classsvm)、自编码网络(autoencoder)、孤立森林(isolationforest)算法,等等。

下面以采用孤立森林算法进行异常检测为例进行说明。

孤立森林是一种无监督的快速异常检测算法,无需定义数学模型也不需要有标记的训练,对于如何查找哪些点是否容易被孤立,孤立森林使用了一套非常高效的策略,简言之,那些密度很高的簇(聚集在一起的数据点)是可以被切很多次才会停止切割,但是那些密度很低的点很容易很早的就停到一个子空间了。简言之,根据数据点在整体中分布的不同,会给出不同的分数。算法会将与正常分布较远的点打高分,与正常分布接近的点打低分。

在一个可选实现方式中,对交易特征数据进行异常检测确定出异常交易的具体方式包括:基于孤立森林算法,对交易特征数据进行分析,确定出分布稀疏且距离密度高的群体较远的数据为异常交易。

例如,在本说明书实施例中,根据交易特征数据的分布对交易进行打分。打分越低的交易表示交易与其他正常交易类似,例如买菜、吃饭、理发等。打分越高表示与其他交易越异常,例如团伙人数众多、交易金额固定为某个数字、高频信用卡交易、批量大额交易等。

在一种可选实现方式中,当确定出异常交易之后,还可以进一步统计各个交易团体中异常交易占比,如果异常交易占比较高,则可确定该交易团体为异常交易团体。假设一个交易团体中包括50笔交易,其中30笔交易为异常交易,也即异常交易占比达到了60%,假设团体异常阈值为40%,那么可确定该交易团体为异常交易团体。

在一种可选实现方式中,可对异常交易或异常交易团体进行管控。例如,对异常交易进行标记、对异常交易的交易主体(买家或卖家)进行管控,从而可以对虚假评论进行过滤、不予展示;对异常交易团体的交易主体或交易行为进行管控,如禁止交易团体的交易主体之间的交易行为、将买家和卖家加入黑名单等。通过对异常交易或异常交易团体的管控,可以降低虚假交易对电商平台造成的危害,提高电商平台信息可信度。

本说明书实施例中,通过确定一个个交易团体,缩小了风险交易的范围,在交易团体范围内通过交易特征数据进行异常检测,可以达到高效、快速检测出异常交易的目的。在一个可选方式中,通过kcore算法将较大规模的无向图中分割出一个个小的连通子图,从而确定一个个交易团体,并针对线下口碑交易地理位置聚集性的特点,引入无监督学习的孤立森林算法,可以准确的区分出正常交易和异常交易。并且,可根据交易团体中异常交易占比,确定异常交易团体,并对异常交易或异常交易团体进行管控提高电商平台可信度。

第二方面,基于同一发明构思,本说明书实施例提供一种异常交易识别装置,请参考图4,包括:

历史数据获取单元401,用于获取预定时间段内的历史交易数据;

交易团体确定单元402,用于根据历史交易数据中的交易主体和交易行为,确定出至少一个具有连通关系的交易团体;

交易特征数据确定单元403,用于提取出交易团体特征数据,并基于交易团体特征数据,确定出所述交易团体中每笔交易的交易特征数据;

异常检测单元404,用于对交易特征数据进行异常检测,确定出异常交易。

在一种可选实现方式中,所述交易团体确定单元402包括:

无向图构建子单元4021,用于分析所述历史交易数据,以买家节点或卖家节点为点、以每笔交易为边,构建具有交易关系的交易无向图;

连通子图划分子单元4022,用于将所述交易无向图划分为至少一个预定规模的团体交易连通子图,其中每个团体交易连通子图确定一个所述交易团体。

在一种可选实现方式中,所述交易团体确定单元402还包括:

卖家过滤子单元4023,用于从所述交易无向图中,去除热门卖家、标记为信誉高的卖家、属于卖家白名单中的卖家。

在一种可选实现方式中,所述连通子图划分子单元4022具体用于:基于k中心算法,根据预置的k值,从所述交易无向图中反复去除度小于或等于k的节点后,得到至少一个团体交易连通子图。

在一种可选实现方式中,所述异常检测单元404具体用于:基于孤立森林算法,对交易特征数据进行分析,确定出分布稀疏且距离密度高的群体较远的数据为异常交易。异常检测单元404单元中可以采用其他异常检测算法,包括但不限于一分类支持向量机(one-classsvm)、自编码网络(autoencoder)等。

在一种可选实现方式中,所述装置还包括:

异常交易团体确定单元405,用于确定交易团体中异常交易占交易团体中所有交易的占比;判断异常交易占比是否高于团体异常阈值,若是,将交易团体确定为异常交易团体。

在一种可选实现方式中,所述装置还包括:

异常管控单元406,用于对所述异常交易进行标记,和/或,对异常交易的交易主体进行管控;以及,对所述异常交易团体的交易主体或交易行为进行管控。

第三方面,基于与前述实施例中异常交易识别方法同样的发明构思,本发明还提供一种服务器,如图5所示,包括存储器504、处理器502及存储在存储器504上并可在处理器502上运行的计算机程序,所述处理器502执行所述程序时实现前文所述异常交易识别方法的任一方法的步骤。

其中,在图5中,总线架构(用总线500来代表),总线500可以包括任意数量的互联的总线和桥,总线500将包括由处理器502代表的一个或多个处理器和存储器504代表的存储器的各种电路链接在一起。总线500还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口506在总线500和接收器501和发送器503之间提供接口。接收器501和发送器503可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器502负责管理总线500和通常的处理,而存储器504可以被用于存储处理器502在执行操作时所使用的数据。

第四方面,基于与前述实施例中异常交易识别的发明构思,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前文所述异常交易识别的方法的任一方法的步骤。

本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本说明书的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本说明书范围的所有变更和修改。

显然,本领域的技术人员可以对本说明书进行各种改动和变型而不脱离本说明书的精神和范围。这样,倘若本说明书的这些修改和变型属于本说明书权利要求及其等同技术的范围之内,则本说明书也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1