异常账户识别方法、装置、设备及介质与流程

文档序号:22740964发布日期:2020-10-31 09:24阅读:113来源:国知局
异常账户识别方法、装置、设备及介质与流程
本发明属于计算机
技术领域
,尤其涉及一种异常账户识别方法、装置、设备及介质。
背景技术
:信用贷记产品包括信用卡和消费信贷产品,其具有先消费、后支付的消费支付属性,可以有效地缓解用户的短时资金压力、帮助用户积累良好的信用记录,使得用户越来越依赖于使用信用贷记产品进行交易。随着信用贷记产品的普及,利用信用贷记产品进行套现交易的风险日益凸显,有些用户甚至专门开通账户来进行循环套现,对社会造成众多不良影响。由于套现方法越来越隐蔽、套现技术越来越强、套现手法越来越专业且套现交易的样本数据极度缺失,导致相关技术中无法准确地识别出循环套现账户。技术实现要素:本发明实施例提供一种异常账户识别方法、装置、设备及介质,能够解决相关技术中无法准确地识别出循环套现账户的问题。第一方面,本发明实施例提供了一种异常账户识别方法,包括:获取目标账户对应的多个目标交易的交易信息;其中,交易信息包括每个目标交易的交易日期和交易金额;对交易信息进行预设循环周期内的集中度分析,确定目标账户的交易集中度;其中,交易集中度用于表征目标账户在预设循环周期内的同一个时间范围内进行集中交易的疑似程度;根据交易集中度,识别目标账户是否为异常账户。第二方面,本发明实施例提供了一种异常账户识别装置,包括:第一获取模块,用于获取目标账户对应的多个目标交易的交易信息;其中,交易信息包括每个目标交易的交易日期和交易金额;第一处理模块,用于对交易信息进行预设循环周期内的集中度分析,确定目标账户的交易集中度;其中,交易集中度用于表征目标账户在预设循环周期内的同一个时间范围内进行集中交易的疑似程度;第一识别模块,用于根据交易集中度,识别目标账户是否为异常账户。第三方面,本发明实施例提供了一种异常账户识别设备,该设备包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现如第一方面所述的异常账户识别方法。第四方面,本发明实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面所述的异常账户识别方法。本发明实施例的异常账户识别方法、装置、设备及介质,能够在获取目标账户对应的多个目标交易的交易日期和交易金额之后,结合交易日期和交易金额进行预设循环周期内的集中度分析,确定用于表征目标账户在预设循环周期内的同一个时间范围内进行集中交易的疑似程度的交易集中度,该疑似程度与目标账户存在循环套现的可能性相关,因此,可以利用交易集中度,准确地对目标账户是否为异常账户进行识别。附图说明为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本发明一个实施例提供的异常账户识别方法的流程示意图;图2是本发明一个实施例提供的集中度分析方法的流程示意图;图3是本发明一个实施例提供的日期环距离的示意图;图4是本发明一个实施例提供的集中度分析过程的示意图;图5是本发明一个实施例提供的异常账户识别装置的结构示意图;图6是本发明实施例提供的异常账户识别设备的硬件结构示意图。具体实施方式下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。随着信用卡和消费信贷产品等信用贷记产品的普及,利用信用贷记产品进行套现交易的风险日益凸显,有些用户甚至专门开通账户来进行循环套现,对社会造成众多不良影响。现有循环套现账户的检测方法主要包括两种:一种是基于信用贷记产品侧或商户侧简单汇总统计量的交易特征,构建专家规则,利用专家规则识别账户是否为循环套现账户,但是由于套现方法越来越隐蔽、套现技术越来越强、套现手法越来越专业,由简单的汇总构建的专家规则已经无法准确地识别出循环套现账户;二是基于业务前端所积累的少量确认为循环套现账户的样本数据,构建机器学习模型,利用机器学习模型识别账户是否为循环套现账户,但是由于套现交易的样本数据极度缺失,而机器学习模型的准确性对于样本数据有很强的依赖性,导致也无法准确地识别出循环套现账户。为了解决上述的问题,申请人对循环套现账户进行了分析,发现循环套现账户至少存在如下特点:循环套现账户总中的交易总是在每个月的同一个日期附近产生,尤其是循环套现账户总中的出账交易。基于上述发现,本发明实施例提供了一种异常账户识别方法、装置、设备及介质,以基于历史交易数据准确地识别信用贷记产品的账户是否为循环套现账户。下面首先对本发明实施例所提供的异常账户识别方法进行介绍。图1示出了本发明一个实施例提供的异常账户识别方法的流程示意图。在本发明一些实施例中,图1所示的方法可以由服务器或电子设备执行。其中,服务器可以是一种高性能的电子计算器,用于存储和处理数据。电子设备可以包括但不限于手机、台式电脑、平板电脑、笔记本电脑、掌上电脑等。下面,以图1所示的方法由服务器执行为例进行说明。如图1所示,该异常账户识别方法可以包括如下步骤。s110、获取目标账户对应的多个目标交易的交易信息。其中,交易信息包括每个目标交易的交易日期和交易金额。在本发明实施例中,目标账户可以为待识别的任意信用贷记产品的任意账户。其中,信用贷记产品可以包括信用卡和消费信贷产品,也可以包括其他具有先消费、后支付的消费支付属性的金融产品。在一些实施例中,多个目标交易可以为目标账户下的历史交易流水中的全部交易。在另一些实施例中,多个目标交易可以为目标账户下的历史交易流水中位于目标日期范围内的交易。在又一些实施例中,多个目标交易可以为目标账户下的历史交易流水中位于目标日期范围内的满足第一预设条件的交易。在本发明实施例中,在多个目标交易为目标账户下的交易流水中位于目标日期范围内的满足第一预设条件的交易的情况下,s110可以包括如下步骤。获取目标账户对应的多个历史交易;其中,历史交易为交易日期处于目标日期范围内的交易;在多个历史交易中,筛选满足第一预设条件的多个目标交易。具体地,服务器可以在目标账户下的历史交易流水中,获取目标账户对应的交易日期处于目标日期范围内的多个历史交易,然后对这些历史交易进行筛选,得到满足第一预设条件的多个目标交易。由此,可以对历史交易流水进行筛选,筛选出有可能是套现交易的目标交易,以降低服务器的数据处理量。在本发明实施例中,目标日期范围可以根据用户需要进行设定,在此不做限制。可选地,若预设循环周期为月度周期,目标日期范围可以为获取目标交易的日期之前的大于或等于1年的时间范围内,以保证在该观察时间窗口长度下,可以更好地观察卡片的月度周期性交易行为特征。例如,目标日期范围可以设置为获取目标交易的日期之前的12个月内。在例如,目标日期范围可以设置为获取目标交易的日期之前的18个月内。在本发明一些实施例中,第一预设条件可以包括下列中的至少一项:历史交易的收支类型为支出类型;历史交易的交易类型为消费类型或预授权类型。其中,支出类型的历史交易指的是由目标账户向外转移资源的交易。其中,资源可以为目标账户内的资金。消费类型可以包括普通消费类型、自助消费类型、信用卡远程收款系统(mailorder/telephoneorder,moto)消费类型等,预授权类型可以包括普通预授权类型、自助预授权类型、moto预授权类型等。具体地,在第一预设条件包括历史交易的收支类型为支出类型和历史交易的交易类型为消费类型或预授权类型的情况下,服务器可以首先筛选出收支类型为支出类型的历史交易,然后进一步在筛选得到的历史交易中,筛选消费类型或预授权类型的历史交易,并且将最终筛选得到的历史交易作为目标交易。在本发明另一些实施例中,第一预设条件还可以包括:历史交易的交易地点为目标地点。其中,目标地点可以包括境内地点。由于大部分的循环套现均发生在境内,因此,可以筛选出交易地点为境内的目标交易,以降低数据处理量。具体地,在第一预设条件包括历史交易的交易地点为目标地点、历史交易的收支类型为支出类型和历史交易的交易类型为消费类型或预授权类型的情况下,服务器可以首先筛选出交易地点为目标地点的历史交易,然后进一步在筛选得到的历史交易中,筛选收支类型为支出类型的历史交易,接着进一步在筛选得到的历史交易中,筛选消费类型或预授权类型的历史交易,并且将最终筛选得到的历史交易作为目标交易。在本发明一些实施例中,交易信息还可以包括多个历史交易的交易总数,历史交易为交易日期处于目标日期范围内的交易。在本发明另一些实施例中,多个目标交易还可以按照交易日期排序形成目标交易序列,以使服务器在对目标交易的交易信息进行集中度分析时,可以根据交易日期进行遍历,提高数据处理效率。s120、对交易信息进行预设循环周期内的集中度分析,确定目标账户的交易集中度。其中,交易集中度用于表征目标账户在预设循环周期内的同一个时间范围内进行集中交易的疑似程度。在本发明一些实施例中,根据循环套现的特性,预设循环周期可以包括月度周期和季度周期中的至少一种。在一些实施例中,若预设循环周期为季度周期,交易集中度可以为月度周期对应的日期环集中度。交易集中度可以用于表征目标账户在季度周期内的同一个时间范围内进行集中交易的疑似程度。其中,同一个时间范围可以指季度周期中的某一日对应的指定时长下的时间范围,其中,指定时长可根据需要设置,例如,3天、4天或者1星期等。在另一些实施例中,若预设循环周期为月度周期,交易集中度可以为月度周期对应的日期环集中度。交易集中度可以用于表征目标账户在月度周期内的同一个时间范围内进行集中交易的疑似程度。其中,同一个时间范围可以指月度周期中的某一日对应的指定时长下的时间范围,其中,指定时长可根据需要设置,例如,2天、3天或4天等。其中,确定目标账户的交易集中度的具体方法将在后文详细描述。s130、根据交易集中度,识别目标账户是否为异常账户。在本发明实施例中,由于交易集中度可以表征目标账户在预设循环周期内的同一个时间范围内进行集中交易的疑似程度,该疑似程度可以用于度量目标账户为循环套现的异常账户的可能性,因此,服务器可以根据交易集中度,识别目标账户是否为异常账户,交易集中度越大,说明目标账户在预设循环周期内的同一个时间范围内进行集中交易的疑似程度越大,目标账户为异常账户的可能性越大。在本发明一些实施例中,可以仅基于交易集中度识别目标账户是否为异常账户,具体的识别方法将在后文详细描述。在本发明另一些实施例中,还可以基于交易集中度和多个目标交易的交易日期识别目标账户是否为异常账户,具体的识别方法将在后文详细描述。在本发明又一些实施例中,还可以基于交易总数、交易集中度和多个目标交易的交易日期识别目标账户是否为异常账户,具体的识别方法将在后文详细描述。在本发明实施例中,能够在获取目标账户对应的多个目标交易的交易日期和交易金额之后,结合交易日期和交易金额进行预设循环周期内的集中度分析,确定用于表征目标账户在预设循环周期内的同一个时间范围内进行集中交易的疑似程度的交易集中度,该疑似程度与目标账户存在循环套现的可能性相关,因此,可以利用交易集中度,准确地对目标账户是否为异常账户进行识别。图2示出了本发明一个实施例提供的集中度分析方法的流程示意图。在本发明另一个实施方式中,如图2所示,在预设循环周期为月度周期、交易集中度为月度周期对应的日期环集中度的情况下,服务器对交易信息进行预设循环周期内的集中度分析以确定目标账户的交易集中度的方法可以包括如下步骤。s210、针对多个预设日份中的每一个,根据交易信息,计算预设日份对应的日期环集中度。在本发明一些实施例中,如果预设循环周期为月度周期,天数最多的月份可以包括第1日至第31日,因此,月度周期中的多个预设日份可以包括第1日至第31日等31个日份。在本发明另一些实施例中,如果预设循环周期为季度周期,每个季度可以包括第1月至第三月,天数最多的月份中的日份包括1日至31日,因此,多个预设日份可以包括第1月中的第1日至第3月中的第31日等93个日份。服务器可以根据多个目标交易的交易日期和交易金额,分别计算每个预设日份对应的日期环集中度。在本发明一些实施例中,在交易信息还包括多个历史交易的交易总数的情况下,针对多个预设日份中的每一个,s210的具体方法可以包括如下步骤。针对每个目标交易,根据目标交易的交易日期,确定交易日期中的日份与预设日份之间的日份距离;根据交易总数、每个目标交易的交易金额、每个目标交易对应的日份距离,计算预设日份对应的日期环集中度。以预设日期为第1日为例,服务器可以首先确定每个目标交易的交易日期中的日份与预设日份之间的日份距离,然后利用交易总数、每个目标交易的交易金额、每个目标交易对应的日份距离计算预设日份对应的日期环集中度。可选地,根据交易总数、每个目标交易的交易金额和每个目标交易对应的日份距离,计算预设日份对应的日期环集中度的具体方法可以包括:将交易总数、每个目标交易的交易金额和每个目标交易对应的日份距离输入预设的集中度计算公式,得到预设日份对应的日期环集中度。具体地,集中度计算公式可以为:其中,sx为预设日份对应的日期环集中度。x为预设日份,x的取值范围可以为1到31,1代表月度周期中的第1日,以此类推。i为多个目标交易中的第i个交易,n为交易日期处于目标日期范围内的交易总数,mi代表第i个目标交易的交易金额,ti,x代表第i个目标交易与预设日份之间的日份距离。在本发明实施例中,集中度计算公式类似于统计学中的标准差计算公式,如果交易日期中的日份与预设日份越接近,则日期环集中度应越大,同时,由于交易金额越大的交易,越能反映出目标账户的真实资源动向,因此,在集中度计算公式中可以将交易金额作为日份的权重项加入到计算中,以基于交易日期和交易金额两个维度更准确地计算出预设日份对应的日期环集中度。s220、将多个预设日份对应的日期环集中度中的最小日期环集中度,作为月度周期对应的日期环集中度。在本发明实施例中,若某一预设日份为目标账户在月度周期内集中交易的日份,则集中交易的日份应为与各个交易日期中的日份之间的日分距离最小的预设日份,集中交易的日份对应的日期环集中度应为多个预设日份对应的日期环集中度中的最小日期环集中度,因此,服务器可以将多个预设日份对应的日期环集中度中的最小日期环集中度,作为月度周期对应的日期环集中度。具体地,月度周期对应的日期环集中度的计算公式可以为:s=min(sx)其中,s代表月度周期对应的日期环集中度。在本发明一些实施例中,根据目标交易的交易日期,确定交易日期中的日份与预设日份之间的日份距离的具体方法可以包括:将交易日期中的日份和预设日份输入预设的日份距离计算公式,得到交易日期中的日份与预设日份之间的日份距离。其中,日份距离计算公式可以为:t′i,x=min(|di-x|,min(31.5-di,di-0.5)+min(31.5-x,x-0.5))其中,di为第i个目标交易的交易日期中的日份,x为预设日份,x的取值范围可以为1到31,1代表月度周期中的第1日,以此类推。t′i,x为第i个目标交易的交易日期中的日份与预设日份之间的日份距离。在本发明另一些实施例中,根据目标交易的交易日期,确定交易日期中的日份与预设日份之间的日份距离的具体方法可以包括:将交易日期中的日份和预设日份输入预设的日份距离计算公式,得到日期环距离。将日期环距离的平方数,作为交易日期中的日份与预设日份之间的日份距离。其中,日份距离计算公式以在上文中介绍,在此不做赘述。其中,根据上述的日份距离计算公式计算得到的日期环距离可以为交易日期中的日份和预设日份之间的差值绝对值,也可以为交易日期中的日份和预设日份跨过月末日份的差值绝对值,即跨过第31日的差值绝对值。具体地,根据上述的日份距离计算公式计算得到的日期环距离为上述两个差值绝对值中的最小值。例如,3日与29日的最短距离为4,相当于上月29日距离下月3日之间的日份差。图3示出了本发明一个实施例提供的日期环距离的示意图。如图3所示,被“□”301框选的数字代表预设日份,即预设日份为第7日,被“○”302圈选的数字代表交易日期中的日份,即交易日期中的日份为第6日、第9日、第10日和第11日。“□”301与“○”302之间的连接线“—”303代表日期环距离,其中,日期环距离越近,连接线“—”303越短,第6日对应的“□”301与第7日对应的“○”302之间有两条连接线“—”303,说明第6日有两个目标交易。可见,日期环距离可以表示交易日期中的日份与预设日份之间的最短日期距离。在本发明实施例中,日期环距离的平方数为度量目标交易的交易日期中的日份是否与预设日份相近的指标,日期环距离的平方数的构造充分考虑到以月为循环周期的月度周期的循环特点,避免了对两个日份直接做差可能导致月初的日份和月末的日份之间的差值过大的谬误。具体地,日期环距离的平方数即日份距离的计算公式可以为:ti,x=(t′i,x)2下面,以一个具体示例对本发明实施例提供的一种集中度分析过程进行说明。图4示出了本发明一个实施例提供的集中度分析过程的示意图。如图4所示,在预设循环周期为月度周期、交易集中度为月度周期对应的日期环集中度的情况下,该集中度分析过程可以具体包括:设定第1日至第31日中的预设日份x。针对预设日份x,对多个目标交易的交易日期和交易金额进行遍历,首先获取第1个目标交易的交易日期中的日份d1和交易金额m1,并利用日份d1与预设日份x计算第1个目标交易的日期环距离的平方数t1,x,然后获取第2个目标交易的交易日期中的日份d2和交易金额m2,并利用日份d2与预设日份x计算第2个目标交易的日期环距离的平方数t2,x,……,最后获取第n个目标交易的交易日期中的日份dn和交易金额mn,并利用日份dn与预设日份x计算第n个目标交易的日期环距离的平方数tn,x。针对每个预设日份x,在得到全部目标交易对应的日期环距离的平方数之后,可以根据各个目标交易对应的交易金额mi和日期环距离的平方数ti,x,计算该预设日份x对应的日期环集中度sx。在计算得到全部预设日份对应的日期环集中度s1~s31之后,可以选取全部预设日份对应的日期环集中度s1~s31中的最小值,作为月度周期对应的日期环集中度。在本发明另一个实施方式中,为了提高识别效率、减少服务器的数据处理量,服务器可以仅基于交易集中度识别目标账户是否为异常账户。可选地,在交易信息还包括多个历史交易的交易总数的情况下,图1所示的s130的具体方法可以包括:根据交易总数和交易集中度,识别目标账户是否为异常账户;具体地,在交易集中度处于交易总数对应的目标集中度范围内的情况下,确定目标账户为异常账户;在交易集中度未处于目标集中度范围内的情况下,确定目标账户不是异常账户。由于账户的总体交易频率,即账户中的历史交易的交易总数可以影响交易集中度的分布,并且历史交易的交易总数增加,由于集中度计算公式中的分子可以随交易日期中日份与预设日份的差值之和线性增加,而集中度计算公式中的分母可以随着历史交易的交易总数的开方线性增加,分母增长速度比分子慢,使得交易集中度的整体分布(均值、分位数)会增高。因此,历史交易的交易总数越多,则交易集中度越大。为了更准确地识别目标账户是否为异常账户,可以为不同的交易总数设置对应的目标集中度范围,以使服务器通过判断交易集中度是否处于交易总数对应的目标集中度范围内,来识别目标账户是否为异常账户。在本发明实施例中,可选地,不同的交易总数对应的目标集中度范围的设置方法可以为:首先,确定多个交易数量区间,各个交易数量区间的上限值和下限值可以根据需要设置。然后,统计每个历史交易的交易总数处于交易数量区间内的账户在预设循环周期下的交易集中度,得到该交易数量区间内的所有账户对应的交易集中度分布,最后根据该交易数量区间内的前第一预设分位点对应的交易集中度,确定该交易数量区对应的集中度范围。其中,第一预设分位点可以根据需要设定,如第一预设分位点可以位于[5%,10%]的范围内若第一预设分位点较小,例如5%,则识别的准确性较高,若第一预设分位点较大,例如10%,则识别的准确性较低。在一些实施例中,可以将0作为交易数量区间对应的集中度范围的下限值,将交易数量区间内的前第一预设分位点对应的交易集中度作为该交易数量区间对应的集中度范围的上限值,得到集中度范围。在另一些实施例中,可以将交易数量区间的前相邻交易数量区间内的前第一预设分位点对应的交易集中度作为该交易数量区间对应的集中度范围的下限值,将交易数量区间对应的交易集中度分布中的前第一预设分位点对应的交易集中度作为该交易数量区间对应的集中度范围的上限值,得到集中度范围。其中,前相邻交易数量区间指的是区间上限值小于或等于该交易数量区间的下限值且区间上限值与该交易数量区间的下限值最接近的交易数量区间。由此,服务器在确定目标账户的历史交易的交易总数后,可以确定交易总数所属的目标交易数量区间,进而将该目标交易数量区间对应的目标集中度范围,作为交易总数对应的目标集中度范围。在本发明另一个实施方式中,为了提高识别准确性,服务器还可以基于交易集中度和多个目标交易的交易日期识别目标账户是否为异常账户。可选地,在s130之前,该异常账户识别方法还可以包括:根据目标交易的交易日期和预设循环周期,确定目标账户的活跃周期数量。具体地,在预设循环周期为月度周期、活跃周期数量为活跃月份数量的情况下,服务器可以根据目标交易的交易日期中的月份,确定目标账户存在目标交易的月份数量,进而得到目标账户的活跃月份数量。可选地,s130的具体方法可以包括:根据活跃周期数量和交易集中度,识别目标账户是否为异常账户。由于在目标账户在目标日期范围中的多个月份中都有目标交易时,根据交易集中度识别目标账户是否为异常账户的可靠性更高。例如,目标账户a在目标日期范围中的历史交易的交易总数较少,但在某一天内连续产生多个目标交易,会导致交易集中度较高,如果单独基于交易集中度识别目标账户是否为异常账户,则会导致识别结果的可靠性较低,因此,可以引入活跃周期数量即活跃月份数量,使交易集中度更加符合循环套现的周期性特征。其中,活跃周期数量为存在目标交易的周期数量。在预设循环周期为月度周期的情况下,活跃月份数量可以为存在目标交易的月份数量。在预设循环周期为季度周期的情况下,活跃周期数量还可以为活跃季度数量,活跃季度数量可以为存在目标交易的季度数量。可选地,在交易信息还包括多个历史交易的交易总数的情况下,根据活跃周期数量和交易集中度识别目标账户是否为异常交易账的具体方法可以为:根据交易总数、活跃周期数量和交易集中度。识别目标账户是否为异常交易账户。具体地,在交易集中度处于交易总数对应的目标集中度范围内且活跃周期数量大于或等于交易总数对应的目标数量阈值的情况下,确定目标账户为异常账户;在交易集中度未处于目标集中度范围内或活跃周期数量小于目标数量阈值的情况下,确定目标账户不是异常账户。其中,确定交易总数对应的目标集中度范围的方法与上文相同,在此不做赘述。活跃周期数量也可能影响目标集中度范围,即活跃周期数量越少,则目标集中度范围可以较小,以严格地设定目标集中度范围,增加目标集中度范围对循环套现账户的交易集中度的限制,进而提高对目标账户是否为异常交易账的识别结果的准确性;活跃周期数量越多,则目标集中度范围可以较大,以放宽设定目标集中度范围,降低目标集中度范围对循环套现账户的交易集中度的限制,进而保证对目标账户是否为异常账户的识别结果的准确性。因此,可以根据不同的目标日期范围和不同的交易总数设置相应的月份数量阈值。以目标日期范围为18个月、预设循环周期为月度周期、交易集中度为月度周期对应的日期环集中度为例,如果交易总数对应的目标集中度范围的上限小于第一预设限制值,则可以将目标数量阈值设置为6,如果交易总数对应的目标集中度范围的上限小于第二预设限制值,则可以将目标数量阈值设置为12。其中,第一预设限制值和第二预设限制值可以根据需要设定,且第一预设限制值小于第二预设限制值。例如,第二预设限制值可以为指定交易数量区间对应的目标集中度范围的上限值,第二预设限制值可以为小于第二预设限制值的任意值。其中,指定交易数量区间可以根据用户的需要确定。在本发明另一个实施方式中,为了进一步提高识别准确性,服务器还可以基于交易总数、交易集中度和多个目标交易的交易日期识别目标账户是否为异常账户。由上文可知,历史交易的交易总数也会对交易集中度产生影响,可选地,可以利用历史交易的交易总数更准确地识别目标账户是否为异常账户。可选地,在交易信息还包括多个历史交易的交易总数的情况下,根据活跃周期数量和交易集中度,识别目标账户是否为异常账户的具体方法可以包括:根据交易总数、活跃周期数量和交易集中度,识别目标账户是否为异常账户。具体地,可以利用机器学习的方法,根据交易总数、活跃周期数量和交易集中度,识别目标账户是否为异常账户,下面将对此进行说明。在本发明一些实施例中,根据交易总数、活跃周期数量和交易集中度,识别所目标账户是否为异常账户的具体方法可以包括:将交易总数、活跃周期数量和交易集中度输入预先训练得到的异常账户识别模型,得到目标账户对应的异常账户预测值。在异常账户预测值大于或等于预设概率阈值的情况下,确定目标账户为异常账户。在异常账户预测值小于预设概率阈值的情况下,确定目标账户不是异常账户。在这些实施例中,服务器在识别异常交易用户之前,可以先训练异常账户识别模型。具体地,可以首先随机选取一些账户,并对其进行是否为异常账户进行人工标注,然后利用每个账户对应的交易总数、活跃周期数量和交易集中度训练二分类决策树模型,得到预先训练得到的异常账户识别模型。在本发明一些实施例中,在异常账户为正样本(标记值为1),正常账户为负样本(标记值为0)的情况下,预设概率阈值可以设置为0.5,即在异常账户预测值大于或等于0.5的情况下,确定目标账户为异常账户,在异常账户预测值小于0.5的情况下,确定目标账户不是异常账户。在本发明另一些实施例中,根据交易总数、活跃周期数量和交易集中度,识别目标账户是否为异常账户的具体方法可以包括:根据交易总数、活跃周期数量和交易集中度,生成目标账户对应的目标交易特征向量。计算目标交易特征向量与预先训练得到的第一交易特征向量之间的第一向量距离以及与预先训练得到的第二交易特征向量之间的第二向量距离;其中,第一交易特征向量为正常账户对应的交易特征中心向量,第二交易特征向量为异常账户对应的交易特征中心向量。根据第一向量距离和第二向量距离,确定目标账户是否为异常账户。具体地,根据第一向量距离和第二向量距离,确定目标账户是否为异常账户的具体方法可以包括:若第一向量距离小于第二向量距离,确定目标账户为异常账户;若第一向量距离大于第二向量距离,确定目标账户不是异常账户。在这些实施例中,服务器在识别异常交易用户之前,可以先训练得到第一交易特征向量和第二交易特征向量。具体地,可以首先在多个账户中选定少量典型的异常账户和正常账户,并对异常账户和正常账户分别进行标记,再利用交易总数、活跃周期数量和交易集中度,生成每个账户对应的交易特征向量,接着使用k-means方法基于交易特征向量对剩余账户进行无监督学习,最终得到两组交易特征向量组,一组为异常账户对应的交易特征向量组,一组为正常账户对应的交易特征向量组,然后分别确定每组交易特征向量组的交易特征中心向量,从而将正常账户对应的交易特征向量组的交易特征中心向量作为正常账户对应的第一交易特征向量,将异常账户对应的交易特征向量组的交易特征中心向量作为异常账户对应的第二交易特征向量。在本发明一些实施例中,可以利用欧氏距离、夹角余弦距离等方式计算计算目标交易特征向量与第一交易特征向量之间的第一向量距离以及与第二交易特征向量之间的第二向量距离,然后对第一向量距离和第二向量距离进行比较,若第一向量距离小于第二向量距离,则说明目标交易特征向量与异常账户对应的第二交易特征向量较近,目标交易特征向量属于异常账户对应的交易特征向量组,进而确定目标账户为异常账户;若第一向量距离大于第二向量距离,则说明目标交易特征向量与造成账户对应的第一交易特征向量较近,目标交易特征向量属于正常账户对应的交易特征向量组,进而确定目标账户不是异常账户。下面以一个具体示例对本发明实施例提供的异常账户识别过程进行说明。第一步骤、获取信用卡账户a在18个月内的全量历史交易流水中,然后只保留全量历史交易流水中各个历史交易的交易参数,交易参数包括交易类型、交易金额和交易日期。最后,从历史交易中筛选出交易类型为支出类型的目标交易及目标交易对应的交易参数,并统计历史交易的交易总数以及活跃月份数量,如表1所示。表1目标交易及目标交易对应的交易参数表信用卡账户交易类型交易金额交易日期a支出类型10020180906a支出类型1020181006a支出类型500020190711a支出类型100020191109a支出类型300020191210第二步骤、计算信用卡账户a在月度周期下的日期环集中度。若预设日份为第7日,则x=7,若信用卡账户a的第3个目标交易对应的日份为11,则d3=11,若信用卡账户a的第3个目标交易对应的交易金额为5000,则m3=5000。以x=7为例,分别将各个交易日期的日份代入日期环距离的平方数的计算公式,可以得到每个日份与预设日份之间的日份距离,如图3以及表2所示。表2日份与预设日份之间的日份距离表然后,利用集中度计算公式计算得到每个预设日份对应的日期环集中度,如表3所示。表3日份对应的日期环集中度表最后,找到sx的最小值,即为月度周期对应的日期环集中度,即信用卡账户a的日期环集中度。例如对于信用卡账户a,当x=10时,sx有最小值,即s=s10=0.41。第三步骤、根据信用卡账户a的交易总数、活跃月份数量和日期环集中度,与预设的判断规则进行对比,判断信用卡账户a是否满足任意一个判断规则。其中,判断规则如表4所示。表4判断规则表规则序号交易数量区间集中度范围月份数量阈值1[0~20]<=2.79>=62[21~40]<=3.63>=63[41~70]<=4.49>=64[71~100]<=5.18>=65[>100]<=5.63>=66[>100](5.63,6.29]>=12可见,信用卡账户a不满足任何的判断规则,因此,信用卡账户a不是循环套现信用卡账户。综上所述,本发明实施例提供的异常账户识别方法,能够从时间序列的角度对账户的循环套现特征进行深度挖掘,提取月度周期下的日期环集中度,从而精准定位循环套现账户。同时,本发明实施例提供的异常账户识别方法,通过活跃月份数量和交易总数,可以充分昭示循环套现账户的行为轨迹,使识别结果具有可解释性。另外,本发明实施例提供的异常账户识别方法,对交易数据的要求较少,仅通过交易流水汇总的交易日期、交易金额和交易类型,既可以实现对异常账户的识别,对于很多不掌握账户信息但掌握交易流水的机构(如卡组织等),提供了异常账户的识别的可能,对于本身掌握账户信息的机构(如银行、信用卡中心等),补充了异常账户的识别维度。并且,本发明实施例提供的异常账户识别方法,由于对对交易数据的依赖数目少也可以大大减少对计算能力的需求负担和对计算节点性能的要求。图5示出了本发明一个实施例提供的异常账户识别装置的结构示意图。在本发明一些实施例中,图5所示的异常账户识别装置500可以由服务器或电子设备执行。其中,服务器可以是一种高性能的电子计算器,用于存储和处理数据。电子设备可以包括但不限于手机、台式电脑、平板电脑、笔记本电脑、掌上电脑等。如图5所示,该异常账户识别装置500可以包括第一获取模块510、第一处理模块520和第一识别模块530。第一获取模块510可以用于获取目标账户对应的多个目标交易的交易信息;其中,交易信息包括每个目标交易的交易日期和交易金额。第一处理模块520可以用于对交易信息进行预设循环周期内的集中度分析,确定目标账户的交易集中度;其中,交易集中度用于表征目标账户在预设循环周期内的同一个时间范围内进行集中交易的疑似程度。第一识别模块530可以用于根据交易集中度,识别目标账户是否为异常账户。在本发明实施例中,能够在获取目标账户对应的多个目标交易的交易日期和交易金额之后,结合交易日期和交易金额进行预设循环周期内的集中度分析,确定用于表征目标账户在预设循环周期内的同一个时间范围内进行集中交易的疑似程度的交易集中度,该疑似程度与目标账户存在循环套现的可能性相关,因此,可以利用交易集中度,准确地对目标账户是否为异常账户进行识别。在本发明一些实施例中,第一获取模块510可以包括:第一获取单元,用于获取目标账户对应的多个历史交易;其中,历史交易为交易日期处于目标日期范围内的交易;第一筛选单元,用于在多个历史交易中,筛选满足第一预设条件的多个目标交易。在本发明一些实施例中,第一预设条件可以包括下列中的至少一项:历史交易的收支类型为支出类型;历史交易的交易类型为消费类型或预授权类型。在本发明一些实施例中,预设循环周期可以为月度周期,交易集中度可以为月度周期对应的日期环集中度。在本发明一些实施例中,第一处理模块520可以包括:第一计算单元,用于针对多个预设日份中的每一个,根据交易信息,计算预设日份对应的日期环集中度;第一确定单元,用于将多个预设日份对应的日期环集中度中的最小日期环集中度,作为月度周期对应的日期环集中度。在本发明一些实施例中,交易信息还可以包括多个历史交易的交易总数,历史交易为交易日期处于目标日期范围内的交易;相应地,第一计算单元可以包括:第一确定子单元,用于针对每个目标交易,根据目标交易的交易日期,确定交易日期中的日份与预设日份之间的日份距离;第一计算子单元,用于根据交易总数、每个目标交易的交易金额、每个目标交易对应的日份距离,计算预设日份对应的日期环集中度。在本发明一些实施例中,第一计算子单元可以具体用于:将交易总数、每个目标交易的交易金额和每个目标交易对应的日份距离输入预设的集中度计算公式,得到预设日份对应的日期环集中度。在本发明一些实施例中,第一确定子单元可以具体用于:将交易日期中的日份和预设日份输入预设的日份距离计算公式,得到日期环距离;将日期环距离的平方数,作为交易日期中的日份与预设日份之间的日份距离。在本发明一些实施例中,交易信息还可以包括多个历史交易的交易总数,历史交易为交易日期处于目标日期范围内的交易;相应地,第一识别模块530可以包括:第二确定单元,用于在交易集中度处于交易总数对应的目标集中度范围内的情况下,确定目标账户为异常账户;第三确定单元,用于在交易集中度未处于目标集中度范围内的情况下,确定目标账户不是异常账户。在本发明一些实施例中,该异常账户识别装置500还可以包括:第一确定模块,用于根据目标交易的交易日期和预设循环周期,确定目标账户的活跃周期数量;相应地,第一识别模块530还可以用于:根据活跃周期数量和交易集中度,识别目标账户是否为异常账户。在本发明一些实施例中,交易信息还可以包括多个历史交易的交易总数,历史交易为交易日期处于目标日期范围内的交易;相应地,第一识别模块530还可以包括:第四确定单元,用于在交易集中度处于交易总数对应的目标集中度范围内且活跃周期数量大于或等于交易总数对应的目标数量阈值的情况下,确定目标账户为异常账户;第五确定单元,用于在交易集中度未处于目标集中度范围内或活跃周期数量小于目标数量阈值的情况下,确定目标账户不是异常账户。在本发明一些实施例中,交易信息还可以包括多个历史交易的交易总数,历史交易为交易日期处于目标日期范围内的交易;相应地,第一识别模块530还可以用于:根据交易总数、活跃周期数量和交易集中度,识别目标账户是否为异常账户。在本发明一些实施例中,第一识别模块530还可以包括:第一处理单元,用于将交易总数、活跃周期数量和交易集中度输入预先训练得到的异常账户识别模型,得到目标账户对应的异常账户预测值;第六确定单元,用于在异常账户预测值大于或等于预设概率阈值的情况下,确定目标账户为异常账户;第七确定单元,用于在异常账户预测值小于预设概率阈值的情况下,确定目标账户不是异常账户。在本发明一些实施例中,第一识别模块530还可以包括:第二处理单元,用于根据交易总数、活跃周期数量和交易集中度,生成目标账户对应的目标交易特征向量;第二计算单元,用于计算目标交易特征向量与预先训练得到的第一交易特征向量之间的第一向量距离以及与预先训练得到的第二交易特征向量之间的第二向量距离;其中,第一交易特征向量为正常账户对应的交易特征中心向量,第二交易特征向量为异常账户对应的交易特征中心向量;第八确定单元,用于根据第一向量距离和第二向量距离,确定目标账户是否为异常账户。在本发明一些实施例中,第八确定单元可以包括:第二确定子单元,用于在第一向量距离小于第二向量距离的情况下,确定目标账户为异常账户;第二确定子单元,用于在第一向量距离大于第二向量距离的情况下,确定目标账户不是异常账户。需要说明的是,图5所示的异常账户识别装置500可以实现图1至图4所示方法实施例中的各个过程和各个效果,在此不做赘述。图6示出了本发明实施例提供的异常账户识别设备的硬件结构示意图。异常账户识别设备可以包括处理器601以及存储有计算机程序指令的存储器602。具体地,上述处理器601可以包括中央处理器(cpu),或者特定集成电路(applicationspecificintegratedcircuit,asic),或者可以被配置成实施本发明实施例的一个或多个集成电路。存储器602可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器602可包括硬盘驱动器(harddiskdrive,hdd)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(universalserialbus,usb)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器602可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器602可在综合网关容灾设备的内部或外部。在特定实施例中,存储器602是非易失性固态存储器。在特定实施例中,存储器602包括只读存储器(rom)。在合适的情况下,该rom可以是掩模编程的rom、可编程rom(prom)、可擦除prom(eprom)、电可擦除prom(eeprom)、电可改写rom(earom)或闪存或者两个或更多个以上这些的组合。处理器601通过读取并执行存储器602中存储的计算机程序指令,以实现上述实施例中的任意一种异常账户识别方法。在一个示例中,异常账户识别设备还可包括通信接口603和总线610。其中,如图6所示,处理器601、存储器602、通信接口603通过总线610连接并完成相互间的通信。通信接口603,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。总线610包括硬件、软件或两者,将异常账户识别设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(agp)或其他图形总线、增强工业标准架构(eisa)总线、前端总线(fsb)、超传输(ht)互连、工业标准架构(isa)总线、无限带宽互连、低引脚数(lpc)总线、存储器总线、微信道架构(mca)总线、外围组件互连(pci)总线、pci-express(pci-x)总线、串行高级技术附件(sata)总线、视频电子标准协会局部(vlb)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线610可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。该异常账户识别设备可以执行本发明实施例中的异常账户识别方法,从而实现结合图1至图5描述的异常账户识别方法和装置。另外,结合上述实施例中的异常账户识别方法,本发明实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种异常账户识别方法。需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(asic)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、rom、闪存、可擦除rom(erom)、软盘、cd-rom、光盘、硬盘、光纤介质、射频(rf)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1