本发明涉及电子交易技术领域,更具体地说,涉及一种欺诈交易检测方法及系统。
背景技术:
随着移动互联网的发展,移动终端交易、云闪付业务逐步普及,在给人们生活带来极大便利的同时,也给了不法分子有趁之机。
当前各类电子交易中,或多或少都存在这信息泄露、被盗取的风险。一些违法犯罪分子可以通过骗取持卡人交易密码、短信验证码等信息,将持卡人卡号绑定在犯罪分子手机上,然手再进行手机刷卡支付,这会给持卡人、金融机构带来严重损失,为此,相关机构通过设置风险规则对疑似欺诈绑卡交易进行拦截,这种方式对遏制违法犯罪分子的欺诈绑卡起到了一定效果,但是也存在一些不完善之处,主要包括:
一、依靠专家经验进行欺诈规则的提取,费时费力;
二、专家经验不可能穷尽所有的欺诈规则;
三、违法犯罪分子总是在测试、避开规则,经过一段时间后,规则很容易失效;
四、无法有效利用欺诈卡片及欺诈设备的关联关系。
技术实现要素:
本发明的目的在于提供一种电子交易中的欺诈交易检测方法,其能够可靠地、自适应地检测欺诈交易,克服规则模型检测及专家经验检测的不足之处。
为实现上述目的,本发明提供一种技术方案如下:
一种电子交易中的欺诈交易检测方法,包括如下步骤:a)、建立评分模型;b)、将评分模型与规则模型相结合,对电子交易进行检测;其中,步骤a)包括:a1)、根据欺诈卡片与欺诈设备之间的关联关系确定N组样本数据,其中,N为欺诈卡片或欺诈设备的分级数,每组样本数据包括用于区分电子交易是否为欺诈交易的负样本与正样本;a2)、对每组样本数据进行特征值计算,以生成N组特征数据,其中特征值至少包括IV值;a3)、对各组特征数据进行划分以获得训练数据和测试数据,基于各组训练数据生成多个评分模型,利用各组测试数据来测试多个评分模型;步骤b)包括:b1)、利用多个评分模型分别对当前电子交易进行评分,基于各评分结果对当前电子交易是否为欺诈交易进行投票;b2)、基于投票的结果与规则模型计算的结果判定当前电子交易是否为欺诈交易。
优选地,步骤a1)具体包括:将电子交易欺诈检测系统检测出的欺诈卡片确定为第1级欺诈卡片;将与第N级欺诈卡片关联的欺诈设备确定第N级欺诈设备,将与第N级欺诈设备关联的欺诈卡片确定为第N+1级欺诈卡片;其中N≥1。
优选地,步骤a2)具体包括,针对每组样本数据:计算该组内负样本数量与各组内负样本数量之和的比例p1,以及该组内正样本数量与各组内正样本数量之和的比例p2;计算该组样本数据的WOE值,WOE值表示为以及计算该组样本数据的IV值,IV值表示为IV=(p1-p2)*WOE。
优选地,步骤a3)具体包括:利用逻辑回归算法对训练数据进行训练,以生成N个评分模型。
优选地,步骤a3)还包括:利用测试数据分别测试N个评分模型,统计各评分模型的准确率;舍弃准确率低于准确率阈值的评分模型。
本发明还公开一种欺诈交易检测系统,包括:评分模型单元,其包括:样本数据确定模块,用于根据欺诈卡片与欺诈设备之间的关联关系确定N组样本数据,其中,N为欺诈卡片或欺诈设备的分级数;特征计算模块,与样本数据确定模块相耦合,用于对每组样本数据进行特征值计算,以生成N组特征数据;评分模型训练及测试模块,与特征计算模块相耦合,用于对各组特征数据进行划分以获得训练数据和测试数据,基于各组训练数据生成多个评分模型,以及利用各组测试数据来测试多个评分模型;以及投票模块,用于利用多个评分模型对当前电子交易是否为欺诈交易进行投票,以生成第一输出;规则模型单元,基于欺诈判定规则对当前电子交易的特征进行判定,以生成第二输出;以及决策单元,基于第一、第二输出识别当前电子交易是否为欺诈交易。
本发明所提供的欺诈交易检测方法及检测系统,能够克服规则模型检测及专家经验检测的不足之处,基于数据之间的关联性以及前期的检测结果来补充、完善后期的检测,从而可靠地、自适应地检测欺诈交易。上述检测方法及检测系统实现简单,便于在业内推广应用。
附图说明
图1示出本发明第一实施例的欺诈交易检测方法的流程示意图。
图2示出本发明第二实施例的欺诈交易检测系统的模块结构示意图。
具体实施方式
如图1所示,本发明第一实施例提供一种欺诈交易检测方法,其包括如下步骤:
步骤S10、根据欺诈卡片与欺诈设备之间的关联关系确定N组样本数据,其中,N为欺诈卡片或欺诈设备的分级数,每组样本数据包括用于区分电子交易是否为欺诈交易的负样本与正样本。
作为一个示例,该步骤可以按如下方式实现:将电子交易欺诈检测系统(或根据专家经验)检测出的欺诈卡片确定为第1级欺诈卡片;将与第1级欺诈卡片关联的欺诈设备确定第1级欺诈设备,并将与第1级欺诈设备关联的欺诈卡片确定为第2级欺诈卡片;依次类推,最终可以确定总共N级欺诈卡片以及N级欺诈设备,N为大于等于1的正整数。
作为另一个示例,可以按照欺诈卡片或欺诈设备出现的频率或地点等来对欺诈卡片或欺诈设备进行分级,例如,出现频次属于第一范围的欺诈设备归类于第1级欺诈设备,出现频次属于第二范围的欺诈设备归类于第2级欺诈设备,依次类推,其中第一范围的数值高于第二范围的数值。又例如,出现地点属于第一地域的欺诈设备归类于第1级欺诈设备,出现地点属于第二地域的欺诈设备归类于第2级欺诈设备,等等。
步骤S11、对每组样本数据进行特征值计算,以生成N组特征数据,其中特征值至少包括IV值。
具体地,在该步骤中,针对每组样本数据分别进行如下操作:计算该组内负样本数量与各组内负样本数量之和的比例p1,以及该组内正样本数量与各组内正样本数量之和的比例p2;计算该组样本数据的WOE(Weight ofEvidence)值,WOE值表示为以及计算该组样本数据的IV(Information Value)值,IV值表示为IV=(p1-p2)*WOE。
可见,每组样本数据的特征值可以表示为其中i为组编号。可见,每组样本数据的特征值可以取决于正样本、负样本的数量与分布。
进一步,可以将IV值小于给定阈值的若干组样本数据剔除。
步骤S12、对各组特征数据进行划分以获得训练数据和测试数据,基于各组训练数据生成多个评分模型,利用各组测试数据来测试多个评分模型。
作为一种具体实现,可以对样本数据组中的每一组样本数据,按时间进行抽样,T时间节点之前的数据形成为训练数据,T时间节点之后的数据形成为测试数据。
可以利用逻辑回归算法对训练数据进行训练,以生成N个评分模型。随后,利用测试数据分别测试N个评分模型。
作为进一步改进,在测试之后,可以统计各评分模型的准确率;并舍弃准确率低于准确率阈值的评分模型。从而,最终评分模型的数量一般会低于欺诈卡片或欺诈设备的分级数N。
可以理解,由于评分模型的数量为多个,并可以分别对应于多个不同级别的欺诈卡片或欺诈设备,从而本发明提供的方法可以充分利用欺诈卡片或欺诈设备之间的关联性,从而实现更准确的欺诈交易检测。
步骤S20、利用多个评分模型分别对当前电子交易进行评分,基于各评分结果对当前电子交易是否为欺诈交易进行投票。
具体地,该步骤可以包括:可以利用上述多个评分模型分别对当前电子交易进行评分;确定每个评分模型的投票权重;其中,投票权重表示为其中,l为评分模型的数量,ri为对应评分模型的准确率。
可见,每个评分模型的投票权重取决于该评分模型的准确率。可以理解,当一个评分模型的准确率较高时,意味这该评分模型能够对样本数据进行更好地表征,也通常表示其能够更准确地检测欺诈交易。
步骤S21、基于投票的结果与规则模型计算的结果判定当前电子交易是否为欺诈交易。
为了克服自动检测欺诈交易的弊端,该步骤中,结合规则模型计算的结果(和/或结合专家经验)来综合判定当前电子交易是否为欺诈交易。
作为对上述实施例的进一步改进,可以每隔一时间周期,重新执行上述步骤S10、S11及S12,以便更新评分模型,从而可以根据前期的检测结果来补充、完善后期的检测,也有利于使不法分子意图避开检测规则的企图无法实现。
本发明第二实施例提供一种欺诈交易检测系统,其包括评分模型单元10、规则模型单元20及决策单元30,如图2所示。
其中,评分模型单元10包括样本数据确定模块101、特征计算模块102、评分模型训练及测试模块103以及投票模块104。其中,样本数据确定模块101用于根据欺诈卡片与欺诈设备之间的关联关系确定N组样本数据,其中,N为欺诈卡片或欺诈设备的分级数;特征计算模块102与样本数据确定模块101相耦合,用于对每组样本数据进行特征值计算,以生成N组特征数据;评分模型训练及测试模块103与特征计算模块102相耦合,用于对各组特征数据进行划分以获得训练数据和测试数据,基于各组训练数据生成多个评分模型,以及利用各组测试数据来测试多个评分模型;投票模块104用于利用多个评分模型对当前电子交易是否为欺诈交易进行投票,以生成第一输出;
规则模型单元20则基于欺诈判定规则(或专家经验)对当前电子交易的特征进行判定,以生成第二输出。
决策单元30基于上述第一、第二输出最终识别当前电子交易是否为欺诈交易。
上述各实施例所提供的欺诈交易检测方法及检测系统,能够克服规则模型检测及专家经验检测的不足之处,基于数据之间的关联性以及前期的检测结果来补充、完善后期的检测,从而更可靠地、并自适应地检测欺诈交易。此外,上述检测方法及检测系统实现简单,便于在业内推广应用。
上述说明仅针对于本发明的优选实施例,并不在于限制本发明的保护范围。本领域技术人员可作出各种变形设计,而不脱离本发明的思想及附随的权利要求。