一种预测模型构建和银行卡所属国预测方法及装置与流程

文档序号:18744840发布日期:2019-09-21 02:12阅读:238来源:国知局
一种预测模型构建和银行卡所属国预测方法及装置与流程

本说明书实施例涉及互联网应用技术领域,尤其涉及一种预测模型构建和银行卡所属国预测方法及装置。



背景技术:

在对银行卡进行风险管控时,通常基于银行卡的所属国,采取不同力度的管控措施。例如,一般会对所属国为外国的银行卡,采取比所属国为本国的卡片更严格的风险管控。

而如果银行卡数据中的所属国错误,将影响对银行卡的风险管控效果。现有技术的方案一般是在客户申诉后,基于申诉中提交的材料发现所属国错误并更正。这一方案可能无法及时发现错误,实时性较低。



技术实现要素:

针对上述技术问题,本说明书实施例提供一种预测模型构建和银行卡所属国预测方法及装置,技术方案如下:

一种银行卡所属国预测模型构建方法,该方法包括:

获取若干银行卡样本;所述银行卡样本为已确定所属国正确的银行卡;每个银行卡样本包括该银行卡的账户信息与历史交易信息,所述账户信息包括所属国信息;

提取每个银行卡样本的特征向量;其中,提取特征向量的方法包括:

根据该银行卡的历史交易信息,提取预设的本卡交易国特征;

根据所述账户信息,确定该银行卡样本所对应的用户;确定所述用户的其他银行卡,并获得其他银行卡的历史交易信息;根据所述其他银行卡的历史交易信息,提取预设的其他卡交易国特征;

获得所述用户在预设时间段内的位置数据,并根据所述位置数据提取预设的用户位置特征;

根据所获取的若干银行卡样本的所属国信息、及所提取的特征向量,通过机器学习算法训练银行卡所属国预测模型。

一种银行卡所属国预测模型构建装置,该装置包括:

样本获取模块,用于获取若干银行卡样本;所述银行卡样本为已确定所属国正确的银行卡;每个银行卡样本包括该银行卡的账户信息与历史交易信息,所述账户信息包括所属国信息;

特征提取模块,用于提取每个银行卡样本的特征向量;其中,特征提取模块具体包括:

本卡交易国特征提取单元,用于根据该银行卡的历史交易信息,提取预设的本卡交易国特征;

其他卡交易国特征提取单元,用于根据所述账户信息,确定该银行卡样本所对应的用户;确定所述用户的其他银行卡,并获得其他银行卡的历史交易信息;根据所述其他银行卡的历史交易信息,提取预设的其他卡交易国特征;

用户位置特征提取单元,用于获得所述用户在预设时间段内的位置数据,并根据所述位置数据提取预设的用户位置特征;

模型训练模块,用于根据所获取的若干银行卡样本的所属国信息、及所提取的特征向量,通过机器学习算法训练银行卡所属国预测模型。

本说明书实施例所提供的技术方案,根据已知所属国正确的银行卡的历史交易信息、对应用户的位置数据及用户其他卡的历史交易信息,训练银行卡所属国预测模型,并使用所训练的模型预测未知银行卡的所属国,从而更实时、高效且准确地确定银行卡所属国,提高银行卡风控效果。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书实施例。

此外,本说明书实施例中的任一实施例并不需要达到上述的全部效果。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。

图1是本说明书实施例的银行卡所属国预测模型构建方法的流程示意图;

图2是本说明书实施例的特征向量提取方法的流程示意图;

图3是本说明书实施例的银行卡所属国预测方法的流程示意图;

图4是本说明书实施例的银行卡所属国预测模型构建装置的结构示意图;

图5是本说明书实施例的特征提取模块的结构示意图;

图6是本说明书实施例的银行卡所属国预测装置的结构示意图;

图7是本说明书实施例的所属国预测模块的结构示意图;

图8是用于配置本说明书实施例装置的一种设备的结构示意图。

具体实施方式

为了使本领域技术人员更好地理解本说明书实施例中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行详细地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于保护的范围。

针对现有技术的问题,本说明书实施例提供一种银行卡所属国预测方案,该方案包括两个阶段:银行卡所属国预测模型的构建阶段、及运用该模型进行银行卡所属国预测的阶段。

首先介绍银行卡所属国预测模型的构建阶段,参见图1所示,该方法可以包括以下步骤:

S101,获取若干银行卡样本;所述银行卡样本为已确定所属国正确的银行卡;每个银行卡样本包括该银行卡的账户信息与历史交易信息,所述账户信息包括所属国信息;

本说明书实施例提供的方案,在构建银行卡所属国预测模型阶段,是以已知正确所属国的若干银行卡作为训练样本,来训练银行卡所属国预测模型。

本说明书实施例提供的方案中,针对每个银行卡样本,结合该银行卡的历史交易中涉及的国家与银行卡所属用户常住的国家,综合分析确定该银行卡的正确所属国,因此,每个银行卡样本包括该银行卡的账户信息与历史交易信息。当然,作为模型训练中样本的标签,每个银行卡样本的账户信息中包括所属国信息。

S102,提取每个银行卡样本的特征向量;

其中,参见图2所示,提取特征向量的方法包括:

S102a,根据该银行卡的历史交易信息,提取预设的本卡交易国特征;

本说明书实施例中,具体可以通过多种方式,根据该银行卡的历史交易信息,提取预设的本卡交易国特征,本领域技术人员可以根据实际需求灵活地设置,本说明书实施例对此不做限定。

在一种具体实施方式中,可以首先从该银行卡的历史交易信息中,确定所述用户使用该银行卡进行交易时的以下一项或多项信息:所使用的物流地址国、IP地址所在国、所使用设备的语言国、所使用应用程序的语言国、交易账单地址国,然后将所确定的一项或多项信息,作为所提取的本卡交易国特征。

在另一种具体实施方式中,也可以从该银行卡的历史交易信息中,确定所涉及的各个国家,如物流中卖方地址国与买方地址国、交易中所使用货币对应的国家、交易账单地址国、等等,然后根据所对应的交易量,对所涉及的各个国家进行优先级排序,从而将优先级最高(即交易中最常涉及)的若干国家,确定为所提取的本卡交易国特征。

S102b,根据所述账户信息,确定该银行卡样本所对应的用户;确定所述用户的其他银行卡,并获得其他银行卡的历史交易信息;根据所述其他银行卡的历史交易信息,提取预设的其他卡交易国特征;

本说明书实施例中,具体可以通过多种方式,根据所述其他银行卡的历史交易信息,提取预设的其他卡交易国特征,本领域技术人员可以根据实际需求灵活地设置,本说明书实施例对此不做限定。

在一种具体实施方式中,可以采用与S102a相同或相似的方式,针对每张其他银行卡提取交易国特征,并将各张其他银行卡的交易国特征均作为其他卡交易国特征。

在另一种具体实施方式中,也可以针对每张其他银行卡,根据该银行卡的历史交易信息,确定用户使用该银行卡进行交易的频率与次数,从该银行卡的历史交易信息中,确定所述用户使用该银行卡进行交易时的以下一项或多项信息:该银行卡的所述国、所使用的物流地址国、IP地址所在国、所使用设备的语言国、所使用应用程序的语言国、交易账单地址国,根据用户使用各其他银行卡进行交易的频率与次数,为各其他银行卡赋予计算权重;所述权重与所述频率、或与所述次数成正相关,根据从各其他银行卡中提取的信息、以及为各其他银行卡赋予的权重,计算得到其他卡交易国特征。

当然,在针对每张其他银行卡提取其他卡交易国特征前,还可以首先确定用户使用该银行卡进行交易的频率和/或次数,并对频率过低、或次数过少的银行卡进行过滤,避免噪音数据对最终预测结果的干扰。

S102c,获得所述用户在预设时间段内的位置数据,并根据所述位置数据提取预设的用户位置特征;

本说明书实施例中,并不限定预设时间段的设定方式,本领域技术人员可以根据实际情况灵活地设置。例如,可以设置为一段固定的时间,如一年之内;又如,可以根据银行卡的注册时长设置,如设置为银行卡的已注册时间;当然,也可以结合多种情况设置,如设置为固定时间与银行卡已注册时间中的较短者、平均值、等等;本说明书实施例对此不做限定。

对应地,在本说明书实施例的一种具体实施方式中,在获得所述用户在预设时间段内的位置数据时,可以首先确定该银行卡的已注册时长;以及,确定预设的时长;然后根据所确定的预设时长与已注册时长,通过预设计算规则,得到数据获取时长,例如计算二者中较小的数值、取二者的加权平均值、等等;从而获得所述用户在所述数据获取时长内的位置数据。

此外,本说明书实施例中并不限定用户位置数据的具体形式,例如,可以是LBS(Location Based Service,基于移动位置服务)数据、IP地址数据、等等的一种或多种数据。

S103,根据所获取的若干银行卡样本的所属国信息、及所提取的特征向量,通过机器学习算法训练银行卡所属国预测模型。

本说明书实施例不限定根据银行卡样本训练模型的具体方式,例如,可以训练神经网络模型,并且本领域技术人员可以根据实际需求设置一层或多层隐藏层。

参照图3所示,基于以上构建的银行卡所属国预测模型的银行卡所属国预测方法,可以包括以下步骤:

S301,获得待预测银行卡的账户信息与历史交易信息;

S302,根据所述提取特征向量的方法,提取所述待预测银行卡的特征向量;

S303,将所提取的待预测银行卡的特征向量,输入所述银行卡所属国预测模型;

S304,得到模型输出的至少一个所属国、及各所属国对应的概率,根据所得到的概率确定所述待预测银行卡的所属国。

本说明书实施例所提供的方案中,对待预测银行卡进行所属国预测的触发机制,可以由本领域技术人员根据实际需求灵活地设置。

例如,可以设置周期性预测各银行卡的所属国,从而更正错误的所属国信息,如可以设置每一周或一个月提取一次银行卡数据,预测各银行卡的所属国。

又如,可以设置触发条件,如出现大量客户申诉银行卡所属国错误时,可以统一提取所有银行卡数据,预测各银行卡的所属国,提高未申诉客户的平台使用体验。

当然,也可以采用其他触发机制,或者同时采用多种触发机制。

此外,本说明书实施例并不限定根据所得到的概率确定所述待预测银行卡的所属国的具体方式。

在本说明书实施例的一种具体实施方式中,在根据模型输出的至少一个所属国、及各所属国对应的概率,确定所述待预测银行卡的所属国时,可以根据模型输出的各所属国的概率,对所属国进行优先级排序,并将优先级最高的所属国,确定为待预测银行卡的所属国。

在本说明书实施例的另一种具体实施方式中,在根据模型输出的至少一个所属国、及各所属国对应的概率,确定所述待预测银行卡的所属国时,也可以首先根据所述待预测银行卡的账户信息,确定所述待预测银行卡当前的所属国信息,然后使用所述所属国信息对模型输出的各所属国及对应概率进行修正,从而根据修正后的概率,将概率最高的所属国确定为所述待预测银行卡的所属国。

在对银行卡的所属国进行预测后,如果银行卡原账户信息中的所属国信息与预测结果相符,则可以认为原所属国信息正确;如果不相符,则可以认为原所属国信息错误,可以直接更正所属国信息、或进一步地进行人工核实等。

下面结合一个更为具体的实例,对本说明书提供的银行卡所属国预测模型构建和银行卡所属国预测方法进行说明。

1)构建银行卡所属国预测模型

预先准备若干已知所属国正确的银行卡样本,然后针对每个银行卡样本,获取该银行卡的账户信息与历史交易信息。

根据账户信息,得到其中包括的所属国信息。并且,确定该银行卡样本所对应的用户。

从而确定所述用户的其他银行卡,并获得其他银行卡的历史交易信息。

根据该银行卡的历史交易信息、其他银行卡的历史交易信息、及对应用户的位置数据,提取预设的本卡交易国特征、其他卡交易国特征、及用户位置特征。

例如,客户360天内的所使用的物流地址国、IP地址所在国、所使用设备的语言国、所使用应用程序的语言国、交易账单地址国、其他银行卡所属国、等等。

将各银行卡样本的所属国信息与特征向量输入初始化的神经网络模型,迭代训练得到银行卡所属国预测模型。

2)基于所构建的银行卡所属国预测模型预测银行卡所属国

假设预先设置批量银行卡所属国预测的触发阈值为10,即当发生10名或以上客户进行银行卡所属国错误申诉时,便触发批量银行卡所属国预测,对本端所存储的所有银行卡数据进行所属国预测。

具体地,获得银行卡的账户信息与历史交易信息,并基于上述特征向量提取方式,提取预设的本卡交易国特征、其他卡交易国特征、及用户位置特征,输入上述训练的银行卡所属国预测模型中。

假设对于某张待预测银行卡,模型输出了所属国A国、B国、C国,且概率分别为49%、49%及2%。则可以进一步地获取该银行卡的原始所属国信息,假设为B国,则可以修正A国、B国、C国的概率,提高B国的概率并降低A国与C国的概率。由于修正后的概率中,B国概率最高,则将B国确定为该待预测银行卡的所属国。即该银行卡的所属国信息正确,不需要进行修改。

可见,应用上述方案,根据已知所属国正确的银行卡的历史交易信息、对应用户的位置数据及用户其他卡的历史交易信息,训练银行卡所属国预测模型,并使用所训练的模型预测未知银行卡的所属国,从而更实时、高效且准确地确定银行卡所属国,提高银行卡风控效果。

相应于上述方法实施例,本说明书实施例还提供一种银行卡所属国预测模型构建装置,参见图4所示,该装置可以包括:

样本获取模块410,用于获取若干银行卡样本;所述银行卡样本为已确定所属国正确的银行卡;每个银行卡样本包括该银行卡的账户信息与历史交易信息,所述账户信息包括所属国信息;

特征提取模块420,用于提取每个银行卡样本的特征向量;其中,参见图5所示,特征提取模块具体可以包括:

本卡交易国特征提取单元421,用于根据该银行卡的历史交易信息,提取预设的本卡交易国特征;

其他卡交易国特征提取单元422,用于根据所述账户信息,确定该银行卡样本所对应的用户;确定所述用户的其他银行卡,并获得其他银行卡的历史交易信息;根据所述其他银行卡的历史交易信息,提取预设的其他卡交易国特征;

用户位置特征提取单元423,用于获得所述用户在预设时间段内的位置数据,并根据所述位置数据提取预设的用户位置特征;

模型训练模块430,用于根据所获取的若干银行卡样本的所属国信息、及所提取的特征向量,通过机器学习算法训练银行卡所属国预测模型。

在本说明书提供的一种具体实施方式中,所述本卡交易国特征提取单元421,具体可以用于:

从该银行卡的历史交易信息中,确定所述用户使用该银行卡进行交易时的以下一项或多项信息:所使用的物流地址国、IP地址所在国、所使用设备的语言国、所使用应用程序的语言国、交易账单地址国;

将所确定的一项或多项信息,作为所提取的本卡交易国特征。

在本说明书提供的一种具体实施方式中,所述其他卡交易国特征提取单元,具体可以用于:

针对任一其他银行卡:

根据该银行卡的历史交易信息,确定用户使用该银行卡进行交易的频率与次数;

从该银行卡的历史交易信息中,确定所述用户使用该银行卡进行交易时的以下一项或多项信息:该银行卡的所述国、所使用的物流地址国、IP地址所在国、所使用设备的语言国、所使用应用程序的语言国、交易账单地址国;

根据用户使用各其他银行卡进行交易的频率与次数,为各其他银行卡赋予计算权重;所述权重与所述频率、或与所述次数成正相关;

根据从各其他银行卡中提取的信息、以及为各其他银行卡赋予的权重,计算得到其他卡交易国特征。

在本说明书提供的一种具体实施方式中,所述用户位置特征提取单元423,具体可以用于通过以下方式获得所述用户在预设时间段内的位置数据:

确定该银行卡的已注册时长;以及,确定预设的时长;

根据所确定的预设时长与已注册时长,通过预设计算规则,得到数据获取时长;

获得所述用户在所述数据获取时长内的位置数据。

本说明书实施例还提供一种基于所述预测模型的银行卡所属国预测装置,参见图6所示,该装置可以包括:

信息获取模块610,用于获得待预测银行卡的账户信息与历史交易信息;

特征提取模块620,用于根据所述提取特征向量的装置,提取所述待预测银行卡的特征向量;

所属国预测模块630,用于将所提取的待预测银行卡的特征向量,输入所述银行卡所属国预测模型;以及,得到模型输出的至少一个所属国、及各所属国对应的概率,根据所得到的概率确定所述待预测银行卡的所属国。

在本说明书提供的一种具体实施方式中,参见图7所示,所述所属国预测模块630可以包括:

原所属国获取单元631,用于根据所述待预测银行卡的账户信息,确定所述待预测银行卡当前的所属国信息;

概率修正单元632,用于使用所述所属国信息对模型输出的各所属国及对应概率进行修正;

所属国确定单元633,用于根据修正后的概率,将概率最高的所属国确定为所述待预测银行卡的所属国。

上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。

本说明书实施例还提供一种计算机设备,其至少包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行所述程序时实现前述的银行卡所属国预测模型构建方法。该方法至少包括:

一种银行卡所属国预测模型构建方法,该方法包括:

获取若干银行卡样本;所述银行卡样本为已确定所属国正确的银行卡;每个银行卡样本包括该银行卡的账户信息与历史交易信息,所述账户信息包括所属国信息;

提取每个银行卡样本的特征向量;其中,提取特征向量的方法包括:

根据该银行卡的历史交易信息,提取预设的本卡交易国特征;

根据所述账户信息,确定该银行卡样本所对应的用户;确定所述用户的其他银行卡,并获得其他银行卡的历史交易信息;根据所述其他银行卡的历史交易信息,提取预设的其他卡交易国特征;

获得所述用户在预设时间段内的位置数据,并根据所述位置数据提取预设的用户位置特征;

根据所获取的若干银行卡样本的所属国信息、及所提取的特征向量,通过机器学习算法训练银行卡所属国预测模型。

图8示出了本说明书实施例所提供的一种更为具体的计算设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。

处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。

存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random Access Memory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。

输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。

通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。

总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。

需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。

本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述的银行卡所属国预测模型构建方法。该方法至少包括:

一种银行卡所属国预测模型构建方法,该方法包括:

获取若干银行卡样本;所述银行卡样本为已确定所属国正确的银行卡;每个银行卡样本包括该银行卡的账户信息与历史交易信息,所述账户信息包括所属国信息;

提取每个银行卡样本的特征向量;其中,提取特征向量的方法包括:

根据该银行卡的历史交易信息,提取预设的本卡交易国特征;

根据所述账户信息,确定该银行卡样本所对应的用户;确定所述用户的其他银行卡,并获得其他银行卡的历史交易信息;根据所述其他银行卡的历史交易信息,提取预设的其他卡交易国特征;

获得所述用户在预设时间段内的位置数据,并根据所述位置数据提取预设的用户位置特征;

根据所获取的若干银行卡样本的所属国信息、及所提取的特征向量,通过机器学习算法训练银行卡所属国预测模型。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书实施例可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书实施例各个实施例或者实施例的某些部分所述的方法。

上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,在实施本说明书实施例方案时可以把各模块的功能在同一个或多个软件和/或硬件中实现。也可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

以上所述仅是本说明书实施例的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本说明书实施例原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本说明书实施例的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1