异常交易识别方法、装置、设备及介质与流程

文档序号:30270767发布日期:2022-06-02 08:57阅读:197来源:国知局
异常交易识别方法、装置、设备及介质与流程

1.本技术属于数据处理领域,尤其涉及一种异常交易识别方法、装置、设备及介质。


背景技术:

2.随着银行卡如借记卡及信用卡的普及,一些不法分子通过银行卡的资金交易来达到不法目的,用于达到不法目的的交易即为异常交易。例如,将信用卡透支资金或借记卡合法目的贷款资金用于房地产、投资等违规领域。又例如,不法分子利用银行卡转移赌博、诈骗等非法获取的资金。
3.现阶段缺乏一种能够识别不法目的的异常交易的方法。


技术实现要素:

4.本技术实施例提供一种异常交易识别方法、装置、设备及介质,能够实现对不法目的的异常交易的识别。
5.第一方面,本技术实施例提供一种异常交易识别方法,包括:获取预设时间段内的支出卡交易数据和收入卡交易数据,支出卡交易数据用于表征支出详情,收入卡交易数据用于表征收入详情;根据支出卡交易数据表征的支出详情和收入卡交易数据表征的收入详情,对支出卡交易数据和收入卡交易数据进行匹配,得到匹配数据组,匹配数据组中的支出卡交易数据表征的支出详情和收入卡交易数据的收入详情相同或近似相同;基于匹配数据组,识别至少部分匹配数据组指示的交易为异常交易。
6.第二方面,本技术实施例提供一种异常交易识别装置,包括:数据获取模块,用于获取预设时间段内的支出卡交易数据和收入卡交易数据,支出卡交易数据用于表征支出详情,收入卡交易数据用于表征收入详情;
7.匹配模块,用于根据支出卡交易数据表征的支出详情和收入卡交易数据表征的收入详情,对支出卡交易数据和收入卡交易数据进行匹配,得到匹配数据组,匹配数据组中的支出卡交易数据表征的支出详情和收入卡交易数据的收入详情相同或近似相同;识别模块,用于基于匹配数据组,识别至少部分匹配数据组指示的交易为异常交易。
8.第三方面,本技术实施例提供一种异常交易识别设备,包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现第一方面的异常交易识别方法。
9.第四方面,本技术实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面的异常交易识别方法。
10.本技术实施例提供一种异常交易识别方法、装置、设备及介质,可根据获取的支出卡交易数据表征的支出详情和收入卡交易数据表征的收入详情,对支出卡交易数据和收入卡交易数据进行匹配,得到匹配数据组。在异常交易中,资金的流动的速度非常快,不管交易资金是在两张卡中进行流转,还是在更多张卡中进行流转,支出详情和收入详情是非常
相近的。通过支出卡交易数据和收入卡交易数据匹配得到的匹配数据组包括支出详情和收入详情相同或近似相同的一组支出卡交易数据和一组收入卡交易数据。因此,匹配数据组指示的交易为异常交易的可能性非常大,可基于匹配数据组,将匹配数据组指示的识别出异常交易,以实现对不法目的的异常交易的识别。
附图说明
11.为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
12.图1为本技术提供的异常交易识别方法的一实施例的流程图;
13.图2为本技术提供的异常交易识别方法的另一实施例的流程图;
14.图3为本技术提供的异常交易识别方法的又一实施例的流程图;
15.图4为本技术提供的异常交易识别装置的一实施例的结构示意图;
16.图5为本技术提供的异常交易识别装置的另一实施例的结构示意图;
17.图6为本技术提供的异常交易识别装置的又一实施例的结构示意图;
18.图7为本技术提供的异常交易识别装置的再一实施例的结构示意图;
19.图8为本技术提供的异常交易识别设备的一实施例的结构示意图。
具体实施方式
20.下面将详细描述本技术的各个方面的特征和示例性实施例,为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本技术进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本技术,而不是限定本技术。对于本领域技术人员来说,本技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本技术的示例来提供对本技术更好的理解。
21.随着银行卡如借记卡及信用卡的普及,一些不法分子通过银行卡的资金交易来达到不法目的,用于达到不法目的的交易即为异常交易。例如,将信用卡透支资金或借记卡合法目的贷款资金用于房地产、投资等违规领域。又例如,不法分子利用银行卡转移赌博、诈骗等非法获取的资金。异常交易对收单机构、清算机构以及合法用户都会带来非常大的安全风险。现阶段缺乏一种能够识别不法目的的异常交易的方法。
22.本技术提供一种异常交易识别方法、装置、设备及介质,能够根据获取的交易中的支出卡交易数据和收入卡交易数据,对支出卡交易数据和收入卡交易数据进行匹配,得到支出卡交易数据表征的支出详情和收入卡交易数据表征的收入详情相同或近似相同的匹配数据组。由于异常交易中,不管交易资金是在两张卡中进行流转,还是在更多张卡中进行流转,支出详情和收入详情是非常相近的,匹配数据组指示的交易为异常交易的可能性非常大,可基于匹配数据组,识别出异常交易。
23.本技术提供一种异常交易识别方法,可应用于异常交易识别装置或设备,即该异常交易识别方法可由异常交易识别装置或设备执行,在此并不限定。图1为本技术提供的异常交易识别方法的一实施例的流程图。如图1所示,该异常交易识别方法可包括步骤s101至步骤s103。
24.在步骤s101中,获取预设时间段内的支出卡交易数据和收入卡交易数据。
25.预设时间段内的支出卡交易数据和收入卡交易数据为发生在预设时间段内的交易所对应的支出卡交易数据和收入卡交易数据。预设时间段可根据场景、需求等设定,在此并不限定。例如,预设时间段可为一个月。又例如,预设时间段可为三个月。
26.支出卡交易数据可包括多项能够表征支出详情的数据,可用于表征支出详情。一组支出卡交易数据可表征一张银行卡作为支出方的一次交易的支出详情。
27.在一些示例中,支出卡交易数据可包括支出卡卡号、支出卡性质、支出卡发卡机构标识、交易收单机构标识、交易商户标识、支出时间、支出金额、交易手续费和交易应答标识等中的一项或两项以上,在此并不限定。例如,支出卡交易数据包括支出卡卡号、交易收单机构标识、支出时间和支出金额,则一组支出卡交易数据可包括某张银行卡作为支出卡的某次交易中的支出卡卡号、交易收单机构标识、支出时间和支出金额。
28.支出卡卡号用于标识作为支出卡的银行卡。支出卡性质可表征支出卡的性质,例如,支出卡性质可表征支出卡为借记卡或信用卡。支出卡发卡机构标识可用于标识支出卡的发卡机构。交易收单机构标识用于标识支出卡的这次交易的收单机构。交易商户标识可用于标识支出卡的这次交易的商户。支出时间为支出卡在这次交易中支出的时间,即支出资金从支出卡转出的时间,具体可为时间戳,在此并不限定支出时间的形式。支出金额为支出卡在这次交易中支出的金额。交易手续费为支出卡在这次交易中支出对应的手续费。交易应答标识用于表征支出卡的这次交易是否成功。
29.收入卡交易数据可包括多项能够表征收入详情的数据,可用于表征收入详情。一组收入卡交易数据可表征一张银行卡作为收入方的一次交易的收入详情。
30.在一些示例中,收入卡交易数据可包括收入卡卡号、收入卡性质、收入卡发卡机构标识、交易收单机构标识、收入时间、收入金额和交易应答标识等中的一项或两项以上,在此并不限定。例如,收入卡交易数据包括收入卡卡号、交易收单机构标识、收入时间和收入金额,则一组收入卡交易数据可包括某张银行卡作为收入卡的某次交易中的收入卡卡号、交易收单机构标识、收入时间和收入金额。
31.收入卡卡号用于标识作为收入卡的银行卡。收入卡性质可表征收入卡的性质,例如,收入卡性质可表征收入卡为借记卡或信用卡。收入卡发卡机构标识可用于标识收入卡的发卡机构。交易收单机构标识用于标识收入卡的这次交易的收单机构。收入时间为收入卡在这次交易中收入的时间,即收入资金入账的时间,具体可为时间戳,在此并不限定收入时间的形式。收入金额为收入卡在这次交易中收入的金额。交易应答标识用于表征收入卡的这次交易是否成功。
32.支出卡交易数据和收入卡交易数据可用字段表示,标示同一属性的支出卡交易数据和收入卡交易数据可采用相同的字段名,以便于后续进行匹配。例如,支出卡卡号与收入卡卡号均为卡号,在支出卡交易数据中和在收入卡交易数据中可采用相同的字段名记录。
33.在一些示例中,在支出卡交易数据包括支出金额,收入卡交易数据包括收入金额的情况下,在获取预设时间段内的支出卡交易数据和收入卡交易数据之后,还可清洗获取的支出卡交易数据和收入卡交易数据。例如,可判定支出卡交易数据中的支出金额是否小于小额支付阈值,以及,判定收入卡交易数据中的收入金额是否小于小额支付阈值;若支出卡交易数据中的支出金额小于小额支付阈值,则剔除支出卡交易数据;若收入卡交易数据
中的收入金额小于小额支付阈值,则剔除收入卡交易数据。小额支付阈值为判定小额支付的门限值,小额支付阈值可根据场景、需求、经验等设定,在此并不限定,例如,小额支付阈值可为100元。支出金额小于小额支付阈值,可将支付金额所在的这组支出卡交易数据对应的交易确定为小额支付交易;收入金额小于小额支付阈值,可将收入金额所在的这组收入卡交易数据对应的交易确定为小额支付交易。通常情况下,异常交易的金额大于小额支付阈值,可利用小额支付阈值剔除正常交易对应的额支出卡交易数据和收入卡交易数据,以减少后续数据匹配的工作量,进一步提高匹配效率,从而进一步提高异常交易的识别效率。
34.在一些示例中,在所述支出卡交易数据包括交易应答标识,所述收入卡交易数据包括交易应答标识的情况下,在所述获取预设时间段内的支出卡交易数据和收入卡交易数据之后,还可清洗支出卡交易数据和收入卡交易数据。例如,可判定支出卡交易数据中的交易应答标识是否指示交易失败,以及,判定收入卡交易数据中的交易应答标识是否指示交易失败;若支出卡交易数据中的交易应答标识指示交易失败,则剔除支出卡交易数据;若收入卡交易数据中的交易应答标识指示交易失败,则剔除收入卡交易数据。失败的交易所对应的支出卡交易数据和收入卡交易数据不能成为异常交易,可利用交易应答标识剔除失败交易所对应的支出卡交易数据和收入卡交易数据,以减少后续数据匹配的工作量,进一步提高匹配效率,从而进一步提高异常交易的识别效率。
35.在步骤s102中,根据支出卡交易数据表征的支出详情和收入卡交易数据表征的收入详情,对支出卡交易数据和收入卡交易数据进行匹配,得到匹配数据组。
36.一个匹配数据组包括匹配成功的一组支出卡交易数据和一组收入卡交易数据。同一匹配数据组中的支出卡交易数据表征的支出详情和收入卡交易数据的收入详情相同或近似相同。例如,匹配成功的支出卡交易数据中的支出时间与收入卡交易数据中的收入时间近似相同。又例如,匹配成功的支出卡交易数据中的支出金额与收入卡交易数据中的收入金额相同或近似相同。其中,上述的支出卡交易数据表征的支出详情和收入卡交易数据的收入详情的“近似相同”,表示支出卡交易数据表征的支出详情与收入卡交易数据的收入详情具有差距,但该差距在可接受范围内。
37.在一些示例中,可对多组支出卡交易数据和多组收入卡交易数据分别依次匹配,直至得到各匹配数据组。该示例适用于支出卡交易数据和收入卡交易数据的量较小的场景。
38.在另一些示例中,可按照支出卡交易数据和收入卡交易数据,先行进行区域划分,对取值范围相同或相近的支出卡交易数据和收入卡交易数据进行匹配,从而减少匹配占用的资源和时间,提高匹配的效率。该示例尤其适用于支出卡交易数据和收入卡交易数据的量较大的场景,能够大幅度提高匹配效率,从而进一步提高异常交易的识别效率。
39.在步骤s103中,基于匹配数据组,识别至少部分匹配数据组指示的交易为异常交易。
40.在一些示例中,可将匹配数据组指示的交易全部确定为异常交易。在另一些示例中,可根据进一步的筛选条件,对匹配数据组进行筛选,将筛选后得到的匹配数据组指示的交易确定为异常交易。
41.在一些实施例中,在执行步骤s103之前,还可根据一些筛选条件,从得到的匹配数据组中剔除匹配错误或表征正常交易的匹配数据组。
42.在一些示例中,支出卡交易数据包括支出时间,收入卡交易数据包括收入时间,在执行步骤s103之前,若匹配数据组中的支出时间晚于或等于收入时间,则剔除匹配数据组,和/或,若匹配数据组中的支出时间与收入时间之间的时长大于异常时长阈值,则剔除匹配数据组。
43.在同一交易中,支出时间应早于收入时间,因此,若匹配数据组中的支出时间晚于或等于收入时间,表示该匹配数据组中的支出卡交易数据和收入卡交易数据对应的并不是同一交易,需要剔除该匹配数据组,以提高异常交易识别的精准度。异常时长阈值为用于协助判定异常交易的支出时间与收入时间之间的时长的阈值,可根据场景、需求、经验等设定,在此并不限定。正常交易的支出时间与收入时间之间的时长一般大于异常时长阈值;异常交易的支出时间与收入时间之间的时长一般小于或等于异常时长阈值,因此,匹配数据组中的支出时间与收入时间之间的时长大于异常时长阈值,表示匹配数据组指示的交易很有可能为正常交易,需要剔除该匹配数据组,以提高异常交易识别的精准度。
44.在一些示例中,支出卡交易数据包括支出金额和交易手续费,收入卡交易数据包括收入金额,在执行步骤s103之前,若匹配数据组中的支出金额与收入金额的差值小于或等于交易手续费,则剔除匹配数据组。
45.支出卡交易数据中的交易手续费为合法的交易手续费。正常交易中,支出金额与交易手续费的差值应小于或等于收入金额,因此,匹配数据组中的支出金额与收入金额的差值小于或等于交易手续费,即支出金额与交易手续费的差值应小于或等于收入金额,表示匹配数据组指示的交易很有可能为正常交易,需要剔除该匹配数据组,以提高异常交易识别的精准度。
46.在本技术实施例中,根据获取的支出卡交易数据表征的支出详情和收入卡交易数据表征的收入详情,对支出卡交易数据和收入卡交易数据进行匹配,得到匹配数据组。在异常交易中,资金的流动的速度非常快,不管交易资金是在两张卡中进行流转,还是在更多张卡中进行流转,支出详情和收入详情是非常相近的。通过支出卡交易数据和收入卡交易数据匹配得到的匹配数据组包括支出详情和收入详情相同或近似相同的一组支出卡交易数据和一组收入卡交易数据。因此,匹配数据组指示的交易为异常交易的可能性非常大,可基于匹配数据组,将匹配数据组指示的识别出异常交易,以实现对不法目的的异常交易的识别。
47.而且,在本技术实施例中,不仅能够识别未经其他中介卡的两张卡之间的异常交易,还能够识别经过一张或更多张中介卡的两张卡之间的异常交易,从而实现了异常交易的穿透式深度识别,进一步提高了银行卡资金的安全性。
48.在一些实施例中,支出卡交易数据包括支出时间、支出金额和交易收单机构标识,收入卡交易数据包括收入时间、收入金额和交易收单机构标识,可通过支出时间、收入时间、支出金额、收入金额和交易收单机构标识确定匹配数据组。图2为本技术提供的异常交易识别方法的另一实施例的流程图。图2与图1的不同之处在于,图1中的步骤s102可具体细化为图2中的步骤s1021至步骤s1025。
49.在步骤s1021中,确定支出卡交易数据的支出时间和收入卡交易数据的收入时间是否属于同一时段。
50.两张卡之间直接交易的异常交易和两张卡之间通过中介卡交易的异常交易所用
的时间都非常短,可通过支出时间和收入时间来协助判断支出卡交易数据指示的交易和收入卡交易数据指示的交易是否为同一笔交易且该笔交易是否为异常交易。
51.为了提高匹配效率,从而提高异常交易识别效率,可从时间维度上进行分区,利用支出时间、收入时间落入的区域来进行匹配。可按照预设的时间步长,划分得到多个支出时间区间、多个结算时间区间和多个收入时间区间;根据支出时间、收入时间和业务处理上限时长,确定第一支出时间区间、第一结算时间区间和第一收入时间区间;若第一支出时间区间与第一收入时间区间关联对应,或第二支出时间区间与第一收入时间区间关联对应,则确定支出卡收入时间和收入时间属于同一时段。
52.一个支出时间区间、一个结算时间区间和一个收入时间区间各自所占用的时长相等,且占用的时长可与时间步长一致。多个支出时间区间、多个结算时间区间和多个收入时间区间具有一一关联对应的关系,关联对应的支出时间区间、结算时间区间与收入时间区间的区间范围相同。时间步长可根据场景、需求、经验等设定,在此并不限定。支出时间区间、结算时间区间和收入时间区间可根据时长步长设定。例如,时间步长可设为10秒,设时间起始点为0秒,则第一个支出时间区间、第一个结算时间区间和第一个收入时间区间均为[0,10),第二个支出时间区间、第二个结算时间区间和第二个收入时间区间均为[10,20),以此类推。
[0053]
第一支出时间区间为支出时间所属的支出时间区间,即第一支出时间区间为支出卡交易数据中支出时间所在的支出时间区间。例如,时间步长为10秒,若支出时间采用时间戳表示,可将支出时间的时间戳除以10,再向下取整,计算得到的数值可作为第一支出时间区间的标识。
[0054]
第一结算时间区间为支出时间与业务处理上限时长之和所属的结算时间区间。业务处理上限时长为处理交易业务所需的时长的上限值,可根据场景、需求、经验等设定,在此并不限定。例如,业务处理上限时长可为10秒,若时间步长为10秒且支出时间采用时间戳表示,则可将支出时间的时间戳加10秒后除以10,再向下取整,计算得到的数值可作为第一结算时间区间的标识。
[0055]
第一收入时间区间为收入时间所属的收入时间区间,即第一收入时间区间为收入卡交易数据中收入时间所在的收入时间区间。例如,时间步长为10秒,若收入时间采用时间戳表示,可将收入时间的时间戳除以10,再向下取整,计算得到的数值可作为第一收入时间区间的标识。
[0056]
第一支出时间区间与第一收入时间区间关联对应,即第一支出时间区间与第一收入时间区间的区间范围相同,表示支出时间与收入时间相同或近似相同。第一结算时间区间与第一收入时间区间关联对应,即第一结算时间区间与第一收入时间区间范围相同,也就是说,在考虑处理交易业务所需的时长的基础上,支出时间与收入时间相同或近似相同。
[0057]
例如,下面的表一示出了一些支付时间和收入时间所属的第一支出时间区间、第一结算时间区间和第一收入时间区间。
[0058]
表一
[0059]
支付时间的时间戳16340229421634775329
……
第一支出时间区间的标识163402294163477532
……
第一结算时间区间的标识163402295163477533
……
收入时间的时间戳1634022945634775331
……
第一收入时间区间的标识16340229463477533
……
[0060]
如表一所示,将支付时间的时间戳除以10向下取整,可得到第一支出时间区间的标识。将支付时间加10(这个10是业务处理上限时长)后的时间戳再除以10向下取整,可得到第一结算时间区间的标识。将收入时间的时间戳除以10向下取整,可得到第一收入时间区间的标识。在表一中,支付时间“1634022942”与收入时间“1634022945”属于同一时段,支付时间“1634775329”与收入时间“634775331”属于同一时段。
[0061]
支出时间与收入时间相同或近似相同,即支出卡交易数据的支出时间与收入卡交易数据的收入时间属于同一时段。若第一支出时间区间与第一收入时间区间不关联对应且第一结算时间区间与所第一收入时间区间不关联对应,则可确定支出卡交易数据的支出时间和收入卡交易数据的收入时间不属于同一时段。
[0062]
在一些示例中,支出卡交易数据的支出时间和收入卡交易数据的收入时间是否属于同一时段的判定可利用数据仓库工具hive实现,在此并不限定。
[0063]
通过时间分区,可实现支出时间与支付时间属于同一时段的支出卡交易数据和收入卡交易数据的匹配,减小了数据匹配过程中的数据量,减小了数据匹配所占用的资源,提高了匹配效率,也提高了异常交易的识别效率。
[0064]
在步骤s1022中,确定支出卡交易数据的支出金额和收入卡交易数据的收入金额是否属于同一额度范围。
[0065]
两张卡之间直接交易的异常交易和两张卡之间通过中介卡交易的异常交易中涉及的金额都非常相近,可通过支出金额和收入金额来协助判断支出卡交易数据指示的交易和收入卡交易数据指示的交易是否为同一笔交易且该笔交易是否为异常交易。
[0066]
为了提高匹配效率,从而提高异常交易识别效率,可从金额维度上进行分区,利用支出金额、收入金额落入的区域来进行匹配。可按照预设的金额步长,划分得到多个支出金额区间和多个收入金额区间;根据支出金额区间和预设的合法手续费上限信息,划分得到多个收入下调金额区间;根据支出金额、收入金额和交易手续费,确定第一支出金额区间、第一收入金额区间和第一收入下调金额区间;若第一支出金额区间与第一收入金额区间关联对应,或第一支出金额区间与第一收入下调金额区间关联对应,则确定支出金额和收入金额属于同一额度范围。
[0067]
一个支出金额区间和一个收入金额区间各自范围的金额相等,且金额一致。多个支出金额区间和多个收入金额区间具有一一关联对应的关系,关联对应的支出金额区间与收入金额区间的区间范围相同。金额步长可根据场景、需求、经验等设定,在此并不限定。支出金额区间和收入金额区间可根据金额步长设定。支出金额区间关联对应的收入下调金额区间的上限与支出金额区间的下限相同,支出金额区间关联对应的收入下调金额区间的长度为支出金额区间的下限和合法手续费上限信息指示的合法手续费率的乘积。合法手续费上限信息用于表征合法交易的手续费的上限,例如,合法手续费上限信息可包括合法手续费率。合法手续费上限信息可根据场景、需求、经验等设定,在此并不限定。例如,金额步长可设为100元,合法手续费上限信息指示的合法手续费率为0.7%,设金额起始点为100元,则第一个支出金额区间和第一个收入金额区间均为[100,200),第一个收入下调金额区间为[99.3,100),第二个支出金额区间和第二个收入金额区间均为[200,300),第二个收入下
调金额区间为[198.6,200),以此类推。
[0068]
第一支出金额区间为支出金额所属的支出金额区间,即第一支出金额区间为支出卡交易数据中支出金额所在的支出金额区间。例如,金额步长为100元,可将支出金额除以100,再向下取整,计算得到的数值可作为第一支出金额区间的标识。
[0069]
第一收入金额区间为收入金额所属的收入金额区间,即第一收入金额区间为收入卡交易数据中收入金额所在的收入金额区间。例如,金额步长为100元,可将收入金额除以100,再向下取整,计算得到的数值可作为第一收入金额区间的标识。
[0070]
第一收入下调金额区间为收入金额所属的收入下调金额区间,即第一收入下调金额区间为收入卡交易数据中收入金额所在的收入下调金额区间。
[0071]
第一支出金额区间与所述第一收入金额区间,即第一支出金额区间与第一收入金额区间的区间范围相同,表示支出金额与收入金额相同或近似相同。第一支出金额区间与第一收入下调金额区间关联对应,即第一支出金额区间包括第一收入时间区间,也就是说,在考虑交易业务中合法手续费的基础上,支出金额与收入金额相同或近似相同。
[0072]
在一些示例中,可将超出一定金额值的金额全部划归到一个金额区间。例如,将超出10000元的支出金额划分为一个支出金额区间,将超出10000元的收入金额划分为一个收入金额区间。
[0073]
支出金额与收入金额相同或近似相同,即支出卡交易数据的支出金额与收入卡交易数据的收入金额属于同一额度范围。若第一支出金额区间与第一收入金额区间不关联对应且第一支出金额区间与第一收入下调金额区间不关联对应,则可确定支出卡交易数据的支出金额和收入卡交易数据的收入金额不属于同一额度范围。
[0074]
在一些示例中,支出卡交易数据的支出金额和收入卡交易数据的收入金额是否属于同一额度范围的判定可利用数据仓库工具hive实现,在此并不限定。
[0075]
通过金额分区,可实现支出金额与支付金额属于同一额度范围内的支出卡交易数据和收入卡交易数据的匹配,减小了数据匹配过程中的数据量,减小了数据匹配所占用的资源,提高了匹配效率,也提高了异常交易的识别效率。
[0076]
在步骤s1023中,确定支出卡交易数据的交易收单机构标识和收入卡交易数据的交易收单机构标识是否一致。
[0077]
两张卡之间直接交易的异常交易和两张卡之间通过中介卡交易的异常交易中涉及的收单机构基本相同,可通过交易收单机构标识来协助判断支出卡交易数据指示的交易和收入卡交易数据指示的交易是否为同一笔交易且该笔交易是否为异常交易。
[0078]
在步骤s1024中,在支出卡交易数据的支出时间和收入卡交易数据的收入时间属于同一时段、支出卡交易数据的支出金额和收入卡交易数据的收入金额属于同一额度范围且支出卡交易数据的交易收单机构标识和收入卡交易数据的交易收单机构标识一致的情况下,将支出卡交易数据和收入卡交易数据划分至同一候选数据组。
[0079]
一个候选数据组包括一组支出卡交易数据和一组收入卡交易数据。一组支出卡交易数据包括一张银行卡作为支出卡进行一次交易的相关数据。一组收入卡交易数据包括一张银行卡作为收入卡进行一次交易的相关数据。
[0080]
在步骤s1025中,从候选数据组中选取至少部分作为匹配数据组。
[0081]
候选数据组中有可能存在误匹配的支出卡交易数据和收入卡交易数据,可进行一
定条件的筛选,将误匹配的候选数据组剔除,将剔除后剩余的候选数据组确定为匹配数据组。误匹配的候选数据组可包括具有重复匹配的支出卡交易数据和/或重复匹配的收入卡交易数据的候选数据组。
[0082]
在一些实施例中,支出卡交易数据还包括支出卡卡号,收入卡交易数据还包括收入卡卡号。可获取每个候选数据组的特征信息;根据候选数据组的特征信息,计算候选数据组中支出卡交易数据和收入卡交易数据的相似度;去除相似度低于预设相似度阈值的候选数据组;若包括同一支出卡交易数据的候选数据组的数量为两个以上,从两个以上的候选数据组中选取相似度最高的一个作为匹配数据组;若包括同一收入卡交易数据的候选数据组的数量为两个以上,从两个以上的候选数据组中选取相似度最高的一个作为匹配数据组。
[0083]
特征信息可包括第一特征信息、第二特征信息和第三特征信息中的一项或两项以上。
[0084]
第一特征信息用于表征支出卡卡号指示的支出卡的用户与收入卡卡号指示的收入卡的用户是否为同一用户。例如,第一特征信息可根据下面的算式(1)得到:
[0085][0086]
其中,x为支出卡的某笔交易,y为收入卡的某笔交易,t1(x,y)为第一特征信息。
[0087]
第二特征信息用于表征支出卡卡号指示的支出卡的历史支出卡交易数据和收入卡卡号指示的收入卡的历史收入卡交易数据的匹配成功次数的多少。支出卡的历史支出卡交易数据为该支出卡的交易的历史数据,收入卡的历史收入卡交易数据为该收入卡的交易的历史数据。例如,可获取预设时间段之前的一段时间内的支出卡交易数据和收入卡交易数据来作为历史支出卡交易数据和历史收入卡交易数据。例如,第二特征信息可根据下面的算式(2)得到:
[0088]
t2(x,y)=m
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0089]
其中,x为支出卡的某笔交易,y为收入卡的某笔交易,m为x表征的交易的支出卡在近三个月内的历史支出卡交易数据与y表征的交易的收入卡在近三个月内的历史收入卡交易数据配对成功的次数,t2(x,y)为第二特征信息。
[0090]
第三特征信息用于表征支出金额和收入金额之间的手续费与预设的异常手续费的差距的大小。异常手续费可根据场景、需求、经验等设定,在此并不限定。例如,第三特征信息可根据下面的算式(3)得到:
[0091][0092]
其中,x为支出卡的某笔交易,y为收入卡的某笔交易,a(x)为支出卡的支出金额,a(y)为收入卡的收入金额,为异常手续费的费率,t3(x,y)为第三特征信息。异常手续费的费率可根据场景、需求、经验等设定,在此并不限定。为了异常交易的识别较全面,可将异常手续费设置为采集到的真实的异常交易数据中异常手续费的均值,也可将异常手续费的费率设置为采集到的真实的异常交易数据中异常手续费的费率的均值。不同性质的卡的异常
手续费的费率可不同,例如,信用卡的异常手续费的费率可为0.0057,借记卡的异常手续费的费率可为0.0048。
[0093]
支出卡交易数据与收入卡交易数据的相似度根据候选数据组的特征信息得到。支出卡交易数据与收入卡交易数据的相似度表示支出卡交易数据表征的支出详情与收入卡交易数据表征的收入详情的相似度。
[0094]
支出卡卡号指示的支出卡的用户与收入卡卡号指示的收入卡的用户为同一用户,表示支出卡交易数据表征的支出详情与收入卡交易数据表征的收入详情相对来说较为相似,这种情况相当于提高了支出卡交易数据与收入卡交易数据的相似度。支出卡卡号指示的支出卡的用户与收入卡卡号指示的收入卡的用户为不同用户,表示支出卡交易数据表征的支出详情与收入卡交易数据表征的收入详情相对来说较为不相似,这种情况相当于降低了支出卡交易数据与收入卡交易数据的相似度。
[0095]
支出卡卡号指示的支出卡的历史支出卡交易数据和所述收入卡卡号指示的收入卡的历史收入卡交易数据的匹配成功次数越多,表示支出卡交易数据表征的支出详情与收入卡交易数据表征的收入详情越相似,支出卡交易数据与收入卡交易数据的相似度越高。支出卡卡号指示的支出卡的历史支出卡交易数据和所述收入卡卡号指示的收入卡的历史收入卡交易数据的匹配成功次数越少,表示支出卡交易数据表征的支出详情与收入卡交易数据表征的收入详情越不相似,支出卡交易数据与收入卡交易数据的相似度越低。
[0096]
支出金额和收入金额之间的手续费与异常手续费的差距越小,表示支出卡交易数据表征的支出详情与收入卡交易数据表征的收入详情越相似,支出卡交易数据与收入卡交易数据的相似度越高。支出金额和收入金额之间的手续费与异常手续费的差距越大,表示支出卡交易数据表征的支出详情与收入卡交易数据表征的收入详情越相似,支出卡交易数据与收入卡交易数据的相似度越高。
[0097]
在一些实施例中,特征信息包括第一特征信息、第二特征信息和第三特征信息。可根据第一特征信息,得到第一特征函数值;根据第二特征信息,得到第二特征函数值;根据第三特征信息,得到第三特征函数值;根据第一特征函数值、第一特征函数值对应的第一权重、第二特征函数值、第二特征函数值对应的第二权重、第三特征函数值和第三特征函数值对应的第三权重,计算得到候选数据组中支出卡交易数据和收入卡交易数据的相似度。相似度越高,表示候选数据组为匹配数据组的可能性越高,即候选数据组中的支出卡交易数据和收入卡交易数据匹配成功的可能性越高。
[0098]
在一些示例中,若第一特征信息表征支出卡卡号指示的支出卡的用户与收入卡卡号指示的收入卡的用户为同一用户,第一特征函数值为1,若第一特征信息表征支出卡卡号指示的支出卡的用户与收入卡卡号指示的收入卡的用户不是同一用户,第一特征函数值为0。即第一特征函数值可根据下面的算式(4)得到:
[0099]
p(x,y)=t1(x,y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0100]
其中,x为支出卡的某笔交易,y为收入卡的某笔交易,p(x,y)为第一特征函数值,t1(x,y)为第一特征信息,第一特征信息的计算可参见上述算式(1)。
[0101]
在一些示例中,第二特征函数值与匹配成功次数呈正相关。若匹配成功次数为0,第二特征函数值为0。例如,第二特征函数值可根据下面的算式(5)得到:
[0102][0103]
其中,x为支出卡的某笔交易,y为收入卡的某笔交易,q(x,y)为第二特征函数值,t2(x,y)为第二特征信息,第二特征信息的计算可参见上述算式(2)。通过算式(5)可对第二特征信息取logistic函数,为了减小第二特征信息为0和第二特征信息为1以上的值时差距过大,设置当t2(x,y)=0时,第二特征函数值为0。
[0104]
第三特征函数值与差距呈负相关。这里的差距指的是支出金额和收入金额之间的手续费与预设的异常手续费的差距。例如,第二特征函数值可根据下面的算式(6)得到:
[0105][0106]
其中,max(t3(x,y))为第三特征信息中的最大值,min(t3(x,y))为第三特征信息中的最小值,r(x,y)为第三特征函数值,t3(x,y)为第三特征信息,第三特征信息的计算可参见上述算式(3)。通过算式(6)可对第三特征信息进行标准化,使其更易于相似度的计算。
[0107]
第一权重、第二权重、第三权重可根据场景、需求、经验等设定,在此并不确定。第一权重、第二权重和第三权重之和为1,例如,第一权重为1/2,第二权重为1/3,第三权重为1/6。候选数据组中支出卡交易数据和收入卡交易数据的相似度可根据下面的算式(7)得到。
[0108]
f(x,y)=α
·
p(x,y)+β
·
q(x,y)+γ
·
r(x,y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0109]
其中,f(x,y)为相似度,α为第一权重,p(x,y)为第一特征函数值,β为第二权重,q(x,y)为第二特征函数值,γ为第三权重,r(x,y)为第三特征函数值。第一特征函数值、第二特征函数值和第三特征函数值的计算可参见上述算式(4)至(6)。在一些示例中,相似度的取值范围可为[0,1]。
[0110]
预设相似度阈值为用于判定匹配数据组的相似度的门限值,可根据采集的正样本和负样本通过最优解测定得到,还可结合交易历史数据的经验进行调节,在此并不限定得到预设相似度阈值的具体方法。例如,预设相似度阈值可设为0.4。候选数据组的相似度高于或等于预设相似度阈值,可保留该候选数据组。候选数据组的相似度低于预设相似度阈值,可去除该候选数据组。
[0111]
在得到的两个以上的候选数据组中,可能会出现同一支出卡交易数据存在于不同的候选数据组中,同理,在得到的两个以上的候选数据组中,可能会出现同一收入卡交易数据存在于不同的候选数据组中。
[0112]
包括同一支出卡交易数据的候选数据组的数量为两个以上,表示出现了同一支出卡交易数据存在于不同的候选数据组中的现象,即出现了重复匹配,重复匹配的候选数据组中具有误匹配的候选数据组,需要保留唯一一个候选数据组作为匹配数据组,可将其中相似度最高的一个确定为匹配数据组。
[0113]
包括同一收入卡交易数据的候选数据组的数量为两个以上,表示出现了同一收入卡交易数据存在于不同的候选数据组中的现象,即出现了重复匹配,重复匹配的候选数据组中具有误匹配的候选数据组,需要保留唯一一个候选数据组作为匹配数据组,可将其中
相似度最高的一个确定为匹配数据组。
[0114]
通过对重复匹配的候选数据组的去重处理,能够进一步提高匹配的精准度,从而提高异常交易识别的精确度。
[0115]
在一些实施例中,对于发生异常交易的支出卡,还可确定该支出卡的异常等级,从而对发生异常交易的支出卡进行对应的处理。具体地,针对一张支出卡,可获取支出卡在预设时间段内对应的匹配数据组的相似度和匹配数据组中的支出金额;利用匹配数据组的相似度和匹配数据组中的支出金额,计算得到第一异常强度参数;根据第一异常强度参数,确定支出卡的第一异常等级;根据第一异常等级对应的第一异常处理策略对支出卡进行处理。
[0116]
在一些实施例中,针对一张收入卡,获取收入卡在预设时间段内对应的匹配数据组的相似度和匹配数据组中的收入金额;利用匹配数据组的相似度和匹配数据组中的收入金额,计算得到第二异常强度参数;根据第二异常强度参数,确定匹配数据组指示的异常交易的第二异常等级;根据第二异常等级对应的异常处理策略对收入卡进行处理。
[0117]
匹配数据组的相似度越高,表示匹配数据组指示的交易为异常交易的可能性越大,危害性越大。在交易为异常交易的情况下,匹配数据组中的支出金额越高,资金安全的风险越大,危害性也越大。可用异常强度参数来确定银行卡异常的强度,即异常强度参数用于表征银行卡异常的强度。异常强度参数越大,表示银行卡异常的强度越大,银行卡的危害性越大。异常强度参数与异常等级具有对应关系,可根据该对应关系,查找到异常强度参数对应的异常等级。异常等级用于表征异常的严重程度。异常强度参数越大,异常等级表征的异常的严重程度越大。异常等级与异常处理策略具有对应关系,可根据异常等级,确定对银行卡对应的异常处理策略,从而按照异常处理策略对银行卡进行处理。异常等级表征的异常的严重程度越大,异常处理策略越严格。处理可为锁定银行卡、冻结银行卡、向相关执法部门发送告警信息等,在此并不限定。
[0118]
例如,异常强度参数可根据下面的算式(8)得到。
[0119]
g(x)=f(x1,y1)
·
a(z1)+f(x2,y2)
·
a(z2)+

+f(xn,yn)
·
a(zn)
ꢀꢀ
(8)
[0120][0121]
其中,x为银行卡,g(x)为银行卡x的异常强度参数,f(xi,yi)为银行卡x在预设时间段内的第i次配对成功的匹配数据组的相似度,n为银行卡x在预设时间段内匹配成功的次数,即银行卡x在预设时间段内匹配成功的匹配数据组的数量。
[0122]
第一异常强度参数为与支出卡对应的异常强度参数。第一异常等级为与支出卡对应的异常等级。第一异常处理策略为与支出卡对应的异常处理策略。具体地,第一异常强度参数为各匹配数据组的相似度和匹配数据组中的支出金额的乘积的加和,具体可参见上述算式(8)。
[0123]
第二异常强度参数为与收入卡对应的异常强度参数。第二异常等级为与收入卡对应的异常等级。第二异常处理策略为与收入卡对应的异常处理策略。具体地,第二异常强度参数为各匹配数据组的相似度和匹配数据组中的收入金额的乘积的加和,具体可参见上述算式(8)。
[0124]
在一些实施例中,所述支出卡交易数据还包括支出卡卡号,所述收入卡交易数据还包括收入卡卡号。可利用预先配置的异常交易卡数据库,在匹配数据组指示的交易中进
一步确定异常交易。图3为本技术提供的异常交易识别方法的又一实施例的流程图。图3与图1的不同之处在于,图1中的步骤s103可具体细化为步骤s1031至步骤s1033。
[0125]
在步骤s1031中,调用异常交易卡数据库。
[0126]
异常交易卡数据库包括发生过异常交易的交易卡的交易卡信息,交易卡信息可包括交易卡卡号。异常交易卡数据可根据历史数据分析得到,也可根据实际异常交易案例的信息得到,还可根据其他合理的方式得到,在此并不限定。在本技术实施例中,在确定异常交易后,也可将并未存储在异常交易卡数据库中与该异常交易对应的支出卡和/或收入卡的卡号存储入异常交易卡数据库。
[0127]
在一些示例中,异常交易卡数据库还可根据异常交易的类型,分为多个异常交易卡数据子库,每个异常交易卡数据子库可包括一种类型的异常交易的交易卡的交易卡信息。例如,异常交易卡数据库可包括套现异常交易卡数据子库和涉诈涉赌异常交易卡数据子库。
[0128]
在得到匹配数据组后,可调用异常交易卡数据库,在匹配数据组指示的交易中进一步确定异常交易。
[0129]
在步骤s1032中,在异常交易卡数据库中查找与匹配数据组中的支出卡卡号和/或收入卡卡号匹配的交易卡信息。
[0130]
异常交易卡数据库中的交易卡信息与匹配数据组中的支出卡卡号和/或收入卡卡号匹配,表示异常交易卡数据库中的交易卡信息指示的卡号与匹配数据组中的支出卡卡号和/或收入卡卡号相同。
[0131]
在步骤s1033中,若异常交易卡数据库中存在与匹配数据组中的支出卡卡号和/或收入卡卡号匹配的交易卡信息,将匹配数据组指示的交易识别为异常交易。
[0132]
异常交易卡数据库中存在与匹配数据组中的支出卡卡号和/或收入卡卡号匹配的交易卡信息,表示匹配数据组指示的交易为异常交易,可将匹配数据组指示的交易识别为异常交易。
[0133]
在一些示例中,异常交易卡数据库可包括至少一个异常交易卡数据子库,每个异常交易卡数据子库对应一种类型的异常交易。还可根据匹配数据组中的支出卡卡号和/或收入卡卡号与异常交易卡数据子库中交易卡信息的匹配结果,确定匹配数据组指示的异常交易的类型。若与匹配数据组中的支出卡卡号和/或收入卡卡号匹配的交易卡信息存储于某一异常交易卡数据子库,则可确定该匹配数据组指示的异常交易的类型与该异常交易卡数据子库对应的异常交易的类型一致。例如,若匹配数据组中的支出卡卡号和/或收入卡卡号与套现异常交易卡数据子库中的交易卡信息匹配,可确定匹配数据组指示的异常交易为套现异常交易。又例如,若匹配数据组中的支出卡卡号和/或收入卡卡号与涉诈涉赌异常交易卡数据子库中的交易卡信息匹配,可确定匹配数据组指示的异常交易为涉诈涉赌异常交易。
[0134]
在一些实施例中,为了能够全面地获取与异常交易相关的信息,还可根据已确定的异常交易的转账记录中对方的信息继续追踪与该异常交易关联的信息,以提高异常交易识别的全面性,进一步提高银行卡资金的安全性。具体地,可将与目标支出卡具有交易关系的交易卡标记为交易异常风险卡。目标支出卡为异常交易对应的匹配数据组指示的支出卡,例如,将异常交易对应的匹配数据组中支出卡卡号指示的支出卡确定为目标支出卡,将
与目标支出卡有交易往来的交易卡标记为交易异常风险卡,可再对交易异常风险卡继续进行排查或相关处理。可将与目标收入卡具有交易关系的交易卡标记为交易异常风险卡。目标收入卡为异常交易对应的匹配数据组指示的收入卡,例如,将异常交易对应的匹配数据组中收入卡卡号指示的收入卡确定为目标收入卡,将与目标收入卡有交易往来的交易卡标记为交易异常风险卡,可再对交易异常风险卡继续进行排查或相关处理。
[0135]
本技术还提供一种异常交易识别装置,该异常交易识别装置可执行上述实施例中的异常交易识别方法。图4为本技术提供的异常交易识别装置的一实施例的结构示意图。如图4所示,异常交易识别装置200可包括数据获取模块201、匹配模块202和识别模块203。
[0136]
数据获取模块201可用于获取预设时间段内的支出卡交易数据和收入卡交易数据。
[0137]
支出卡交易数据用于表征支出详情,收入卡交易数据用于表征收入详情。
[0138]
匹配模块202可用于根据支出卡交易数据表征的支出详情和收入卡交易数据表征的收入详情,对支出卡交易数据和收入卡交易数据进行匹配,得到匹配数据组。
[0139]
匹配数据组中的支出卡交易数据表征的支出详情和收入卡交易数据的收入详情相同或近似相同。
[0140]
识别模块203可用于基于匹配数据组,识别至少部分匹配数据组指示的交易为异常交易。
[0141]
在本技术实施例中,根据获取的支出卡交易数据表征的支出详情和收入卡交易数据表征的收入详情,对支出卡交易数据和收入卡交易数据进行匹配,得到匹配数据组。在异常交易中,资金的流动的速度非常快,不管交易资金是在两张卡中进行流转,还是在更多张卡中进行流转,支出详情和收入详情是非常相近的。通过支出卡交易数据和收入卡交易数据匹配得到的匹配数据组包括支出详情和收入详情相同或近似相同的一组支出卡交易数据和一组收入卡交易数据。因此,匹配数据组指示的交易为异常交易的可能性非常大,可基于匹配数据组,将匹配数据组指示的识别出异常交易,以实现对不法目的的异常交易的识别。
[0142]
而且,在本技术实施例中,不仅能够识别未经其他中介卡的两张卡之间的异常交易,还能够识别经过一张或更多张中介卡的两张卡之间的异常交易,从而实现了异常交易的穿透式深度识别,进一步提高了银行卡资金的安全性。
[0143]
在一些实施例中,支出卡交易数据包括支出时间、支出金额和交易收单机构标识,收入卡交易数据包括收入时间、收入金额和交易收单机构标识。图5为本技术提供的异常交易识别装置的另一实施例的结构示意图。
[0144]
图5与图4的不同之处在于,图4中的匹配模块202可包括第一匹配单元2021、第二匹配单元2022、第三匹配单元2023、分组单元2024和选取单元2025。
[0145]
第一匹配单元2021可用于:确定支出卡交易数据的支出时间和收入卡交易数据的收入时间是否属于同一时段。
[0146]
第二匹配单元2022可用于:确定支出卡交易数据的支出金额和收入卡交易数据的收入金额是否属于同一额度范围。
[0147]
第三匹配单元2023可用于:确定支出卡交易数据的交易收单机构标识和收入卡交易数据的交易收单机构标识是否一致。
[0148]
分组单元2024可用于:在支出卡交易数据的支出时间和收入卡交易数据的收入时间属于同一时段、支出卡交易数据的支出金额和收入卡交易数据的收入金额属于同一额度范围且支出卡交易数据的交易收单机构标识和收入卡交易数据的交易收单机构标识一致的情况下,将支出卡交易数据和收入卡交易数据划分至同一候选数据组。
[0149]
选取单元2025可用于:从候选数据组中选取至少部分作为匹配数据组。
[0150]
在一些示例中,第一匹配单元2021可用于:按照预设的时间步长,划分得到多个支出时间区间、多个结算时间区间和多个收入时间区间,其中,关联对应的支出时间区间、结算时间区间与收入时间区间的区间范围相同;根据支出时间、收入时间和业务处理上限时长,确定第一支出时间区间、第一结算时间区间和第一收入时间区间,第一支出时间区间为支出时间所属的支出时间区间,第一结算时间区间为支出时间与业务处理上限时长之和所属的结算时间区间,第一收入时间区间为收入时间所属的收入时间区间;若第一支出时间区间与第一收入时间区间关联对应,或第一结算时间区间与第一收入时间区间关联对应,则确定支出卡收入时间和收入时间属于同一时段。
[0151]
在一些示例中,第二匹配单元2022可用于:按照预设的金额步长,划分得到多个支出金额区间和多个收入金额区间,关联对应的支出金额区间与收入金额区间的区间范围相同;根据支出金额区间和预设的合法手续费上限信息,划分得到多个收入下调金额区间,支出金额区间关联对应的收入下调金额区间的上限与支出金额区间的下限相同,支出金额区间关联对应的收入下调金额区间的长度为支出金额区间的下限和合法手续费上限信息指示的合法手续费率的乘积;根据支出金额、收入金额和交易手续费,确定第一支出金额区间、第一收入金额区间和第一收入下调金额区间,第一支出金额区间为支出金额所属的支出金额区间,第一收入金额区间为收入金额所属的收入金额区间,第一收入下调金额区间为收入金额所属的收入下调金额区间;若第一支出金额区间与第一收入金额区间关联对应,或第一支出金额区间与第一收入下调金额区间关联对应,则确定支出金额和收入金额属于同一额度范围。
[0152]
在一些示例中,支出卡交易数据还包括支出卡卡号,收入卡交易数据还包括收入卡卡号。
[0153]
选取单元2025可用于:获取每个候选数据组的特征信息,特征信息包括第一特征信息、第二特征信息和第三特征信息中的一项或两项以上,第一特征信息用于表征支出卡卡号指示的支出卡的用户与收入卡卡号指示的收入卡的用户是否为同一用户,第二特征信息用于表征支出卡卡号指示的支出卡的历史支出卡交易数据和收入卡卡号指示的收入卡的历史收入卡交易数据的匹配成功次数的多少,第三特征信息用于表征支出金额和收入金额之间的手续费与预设的异常手续费的差距的大小;根据候选数据组的特征信息,计算候选数据组中支出卡交易数据和收入卡交易数据的相似度;去除相似度低于预设相似度阈值的候选数据组;若包括同一支出卡交易数据的候选数据组的数量为两个以上,从两个以上的候选数据组中选取相似度最高的一个作为匹配数据组;若包括同一收入卡交易数据的候选数据组的数量为两个以上,从两个以上的候选数据组中选取相似度最高的一个作为匹配数据组。
[0154]
在一些示例中,特征信息包括第一特征信息、第二特征信息和第三特征信息。
[0155]
选取单元2025可用于:根据第一特征信息,得到第一特征函数值,其中,若第一特
征信息表征支出卡卡号指示的支出卡的用户与收入卡卡号指示的收入卡的用户为同一用户,第一特征函数值为1,若第一特征信息表征支出卡卡号指示的支出卡的用户与收入卡卡号指示的收入卡的用户不是同一用户,第一特征函数值为0;根据第二特征信息,得到第二特征函数值,第二特征函数值与匹配成功次数呈正相关,其中,若匹配成功次数为0,第二特征函数值为0;根据第三特征信息,得到第三特征函数值,第三特征函数值与差距呈负相关;根据第一特征函数值、第一特征函数值对应的第一权重、第二特征函数值、第二特征函数值对应的第二权重、第三特征函数值和第三特征函数值对应的第三权重,计算得到候选数据组中支出卡交易数据和收入卡交易数据的相似度。
[0156]
图6为本技术提供的异常交易识别装置的又一实施例的结构示意图。图6与图5的不同之处在于,图6所示的异常交易识别装置200还可包括处理模块204。
[0157]
在一些示例中,处理模块204可用于:针对一张支出卡,获取支出卡在预设时间段内对应的匹配数据组的相似度和匹配数据组中的支出金额;利用匹配数据组的相似度和匹配数据组中的支出金额,计算得到第一异常强度参数;根据第一异常强度参数,确定支出卡的第一异常等级;根据第一异常等级对应的第一异常处理策略对支出卡进行处理。
[0158]
具体地,第一异常强度参数为各匹配数据组的相似度和匹配数据组中的支出金额的乘积的加和。
[0159]
在一些示例中,处理模块204可用于:针对一张收入卡,获取收入卡在预设时间段内对应的匹配数据组的相似度和匹配数据组中的收入金额;利用匹配数据组的相似度和匹配数据组中的收入金额,计算得到第二异常强度参数;根据第二异常强度参数,确定收入卡的第二异常等级;根据第二异常等级对应的异常处理策略对收入卡进行处理。
[0160]
具体地,第二异常强度参数为各匹配数据组的相似度和匹配数据组中的收入金额的乘积的加和。
[0161]
在一些实施例中,支出卡交易数据还包括支出卡卡号,收入卡交易数据还包括收入卡卡号。
[0162]
识别模块203可用于:调用异常交易卡数据库;在异常交易卡数据库中查找与匹配数据组中的支出卡卡号和/或收入卡卡号匹配的交易卡信息;若异常交易卡数据库中存在与匹配数据组中的支出卡卡号和/或收入卡卡号匹配的交易卡信息,将匹配数据组指示的交易识别为异常交易。
[0163]
图7为本技术提供的异常交易识别装置的再一实施例的结构示意图。图7与图4的不同之处在于,图7所示的异常交易识别装置200还可包括数据过滤模块205。
[0164]
在一些示例中,数据过滤模块205可用于:在支出卡交易数据包括支出时间,收入卡交易数据包括收入时间的情况下,在基于匹配数据组,识别匹配数据组指示的交易中的至少部分为异常交易之前,若匹配数据组中的支出时间晚于或等于收入时间,则剔除匹配数据组;和/或,若匹配数据组中的支出时间与收入时间之间的时长大于异常时长阈值,则剔除匹配数据组。
[0165]
在一些示例中,数据过滤模块205可用于:在支出卡交易数据包括支出金额和交易手续费,收入卡交易数据包括收入金额的情况下,在基于匹配数据组,识别匹配数据组指示的交易中的至少部分为异常交易之前,若匹配数据组中的支出金额与收入金额的差值小于或等于交易手续费,则剔除匹配数据组。
[0166]
在一些示例中,数据过滤模块205可用于:在支出卡交易数据包括支出金额,收入卡交易数据包括收入金额的情况下,在获取预设时间段内的支出卡交易数据和收入卡交易数据之后,若支出卡交易数据中的支出金额小于小额支付阈值,则剔除支出卡交易数据;若收入卡交易数据中的收入金额小于小额支付阈值,则剔除收入卡交易数据。
[0167]
在一些示例中,数据过滤模块205可用于:在支出卡交易数据包括交易应答标识,收入卡交易数据包括交易应答标识的情况下,在获取预设时间段内的支出卡交易数据和收入卡交易数据之后,若支出卡交易数据中的交易应答标识指示交易失败,则剔除支出卡交易数据;若收入卡交易数据中的交易应答标识指示交易失败,则剔除收入卡交易数据。
[0168]
在一些实施例中上述识别模块203还可用于:将与目标支出卡具有交易关系的交易卡标记为交易异常风险卡,目标支出卡为异常交易对应的匹配数据组指示的支出卡;将与目标收入卡具有交易关系的交易卡标记为交易异常风险卡,目标收入卡为异常交易对应的匹配数据组指示的收入卡。
[0169]
本技术还提供了一种异常交易识别设备。图8为本技术提供的异常交易识别设备的一实施例的结构示意图。如图8所示,异常交易识别设备300包括存储器301、处理器302及存储在存储器301上并可在处理器302上运行的计算机程序。
[0170]
在一个示例中,上述处理器302可以包括中央处理器(cpu),或者特定集成电路(application specific integrated circuit,asic),或者可以被配置成实施本技术实施例的一个或多个集成电路。
[0171]
存储器301可包括只读存储器(read-only memory,rom),随机存取存储器(random access memory,ram),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本技术实施例中异常交易识别方法所描述的操作。
[0172]
处理器302通过读取存储器301中存储的可执行程序代码来运行与可执行程序代码对应的计算机程序,以用于实现上述实施例中的异常交易识别方法。
[0173]
在一个示例中,异常交易识别设备300还可包括通信接口303和总线304。其中,如图8所示,存储器301、处理器302、通信接口303通过总线304连接并完成相互间的通信。
[0174]
通信接口303,主要用于实现本技术实施例中各模块、装置、单元和/或设备之间的通信。也可通过通信接口303接入输入设备和/或输出设备。
[0175]
总线304包括硬件、软件或两者,将异常交易识别设备300的部件彼此耦接在一起。举例来说而非限制,总线304可包括加速图形端口(accelerated graphics port,agp)或其他图形总线、增强工业标准架构(enhanced industry standard architecture,eisa)总线、前端总线(front side bus,fsb)、超传输(hyper transport,ht)互连、工业标准架构(industry standard architecture,isa)总线、无限带宽互连、低引脚数(low pin count,lpc)总线、存储器总线、微信道架构(micro channel architecture,mca)总线、外围组件互连(peripheral component interconnect,pci)总线、pci-express(pci-e)总线、串行高级技术附件(serial advanced technology attachment,sata)总线、视频电子标准协会局部(video electronics standards association local bus,vlb)总线或其他合适的总线或
者两个或更多个以上这些的组合。在合适的情况下,总线304可包括一个或多个总线。尽管本技术实施例描述和示出了特定的总线,但本技术考虑任何合适的总线或互连。
[0176]
本技术第四方面还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序指令,该计算机程序指令被处理器执行时可实现上述实施例中的异常交易识别方法,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,上述计算机可读存储介质可包括非暂态计算机可读存储介质,如只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等,在此并不限定。
[0177]
需要明确的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。对于装置实施例、设备实施例、计算机可读存储介质实施例而言,相关之处可以参见方法实施例的说明部分。本技术并不局限于上文所描述并在图中示出的特定步骤和结构。本领域的技术人员可以在领会本技术的精神之后,作出各种改变、修改和添加,或者改变步骤之间的顺序。并且,为了简明起见,这里省略对已知方法技术的详细描述。
[0178]
上面参考根据本技术的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本技术的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
[0179]
本领域技术人员应能理解,上述实施例均是示例性而非限制性的。在不同实施例中出现的不同技术特征可以进行组合,以取得有益效果。本领域技术人员在研究附图、说明书及权利要求书的基础上,应能理解并实现所揭示的实施例的其他变化的实施例。在权利要求书中,术语“包括”并不排除其他装置或步骤;数量词“一个”不排除多个;术语“第一”、“第二”用于标示名称而非用于表示任何特定的顺序。权利要求中的任何附图标记均不应被理解为对保护范围的限制。权利要求中出现的多个部分的功能可以由一个单独的硬件或软件模块来实现。某些技术特征出现在不同的从属权利要求中并不意味着不能将这些技术特征进行组合以取得有益效果。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1