一种消费行为的风险控制系统及方法

文档序号:10489609阅读:353来源:国知局
一种消费行为的风险控制系统及方法
【专利摘要】本发明公开了一种消费行为的风险控制系统及方法,该系统包括依次相连的数据预处理模块、模型训练模块、风险预测模块和风险控制模块,通过导入消费记录数据和风险回访反馈数据,从导入的消费记录数据中采样一定的消费记录,和风险反馈数据一起作为消费记录训练集,并根据消费者的历史消费记录,生成消费记录序列训练集,并使用消费记录序列训练集训练分类器,通过训练得到的分类器对目标消费记录对应的目标消费记录序列进行预测,预测出目标消费记录对应的风险值,根据预测的风险值,对目标消费记录的消费者进行风险控制。本发明的系统及方法通过模型来捕捉历史消费行为对当前消费的影响,风险控制效果更好。
【专利说明】
一种消费行为的风险控制系统及方法
技术领域
[0001]本发明属于网络监控技术领域,尤其涉及一种消费行为的风险控制系统及方法。
【背景技术】
[0002]互联网在给生活提供便利的同时,也为网络犯罪提供方便。近年来,网上欺诈事件不断出现,成为人们关注的话题。因此对在线业务进行有效的风险控制,为消费者提供安全的网络消费环境,对现在互联网企业尤为重要。
[0003]现有技术的风险控制通常基于规则的判断,或使用机器学习对当前行为的特征数据,使用分类或者聚类模型对特征进行分类。
[0004]基于规则的方法的表现取决于规则的好坏,通常需要领域专家凭经验编辑充分而合适的规则,需要大量的人力,并且规则带有主观性,表现可能不稳定。
[0005]使用机器学习的方法来进行异常行为检测,可以根据历史的交易数据,通过监督或者无监督的方法,对用户每次的行为数据做出风险概率预测,具有更大的灵活性。但是现有的方法通常只考虑用户的当前消费行为,结合特征工程导出的一些特征数据进行预测,没法自动的学习历史数据对当前行为的影响。然而通常消费行为是否异常,和它之前的连续一系列消费行为有关。但是这类方法处理的目标是单个独立的数据点,所以通常需要通过时间窗等方法来提取历史行为相关的特征,对特征工程的工作有一定的要求,需要一定的经验来选择有效的特征。
[0006]例如申请号为CN201010001479.2的发明专利提出了一种风险控制系统及方法,该方法将数据表示为独立的点,训练一个逻辑回归模型来预测数据点的风险概率。然而消费行为是否异常和目标用户的历史消费行为紧密关联,在不同的消费历史上下文中,会有不同的异常判定。这种方法在处理带上下文的异常点检测问题时,需要先通过特征工程生成上下文特征,编码成一个点数据。该特征工程的过程需要人工生成有效的特征,模型的效果很大程度上取决于特征是否合理。

【发明内容】

[0007]本发明的目的是提供一种消费行为的风险控制系统及方法,通过使用分类器建模,将历史消费记录数据的序列作为模型的输入,通过模型来捕捉历史消费行为对当前消费的影响,不需要凭经验来提取历史行为特征,提高了模型的风险控制效果。
[0008]为了实现上述目的,本发明技术方案如下:
[0009]一种消费行为的风险控制系统,用于对消费者的消费记录进行检测,并进行风险控制,所述风险控制系统包括依次相连的数据预处理模块、模型训练模块、风险预测模块和风险控制模块,其中:
[0010]所述数据预处理模块,用于导入消费记录数据和风险回访反馈数据,从导入的消费记录数据中采样一定的消费记录,和风险反馈数据一起作为消费记录训练集,并根据消费者的历史消费记录,生成消费记录序列训练集;
[0011]所述模型训练模块,用于使用消费记录序列训练集训练分类器;
[0012]所述风险预测模块,用于通过训练得到的分类器对目标消费记录对应的目标消费记录序列进行预测,预测出目标消费记录对应的风险值;
[0013]所述风险控制模块,用于根据预测的风险值,对目标消费记录的消费者进行风险控制。
[0014]其中,所述数据预处理模块根据消费者的历史消费记录,生成消费记录序列训练集,执行如下操作:
[0015]对于消费记录训练集中的任一消费记录,根据设定的窗口大小,选取窗口范围内该消费记录对应的消费时间前该消费者的历史消费记录,与该消费记录一起生成对应的消费记录序列;
[0016]消费记录训练集中所有消费记录对应的消费记录序列形成消费记录序列训练集。
[0017]进一步地,所述风险预测模块还包括序列扩展子模块,所述序列扩展子模块,用于根据目标消费记录的消费者的历史消费记录,将目标消费记录扩展为目标消费记录序列。
[0018]进一步地,所述序列扩展子模块目标消费记录的消费者的历史消费记录,将目标消费记录扩展为目标消费记录序列,包括:
[0019]根据设定的窗口大小,选取窗口范围内该目标消费记录对应的消费时间前该消费者的历史消费记录,与该目标消费记录一起生成对应的目标消费记录序列。
[0020]进一步地,所述风险控制模块还包括反馈收集子模块,用于根据对风险值低于设定阈值的目标消费记录的消费者进行回访的结果,将对应的消费记录放入风险反馈数据中。
[0021]本发明还提出了一种消费行为的风险控制方法,用于对消费行为进行检测,并进行风险控制,所述风险控制方法包括:
[0022]导入消费记录数据和风险回访反馈数据,从导入的消费记录数据中采样一定的消费记录,和风险反馈数据一起作为消费记录训练集,并根据消费者的历史消费记录,生成消费记录序列训练集;
[0023]使用消费记录序列训练集训练分类器;
[0024]通过训练得到的分类器对目标消费记录对应的目标消费记录序列进行预测,预测出目标消费记录对应的风险值;
[0025]根据预测的风险值,对目标消费记录的消费者进行风险控制。
[0026]其中,所述根据消费者的历史消费记录,生成消费记录序列训练集,包括:
[0027]对于消费记录训练集中的任一消费记录,根据设定的窗口大小,选取窗口范围内该消费记录对应的消费时间前该消费者的历史消费记录,与该消费记录一起生成对应的消费记录序列;
[0028]消费记录训练集中所有消费记录对应的消费记录序列形成消费记录序列训练集。
[0029]进一步地,所述通过训练得到的分类器对目标消费记录对应的目标消费记录序列进行预测,预测出目标消费记录对应的风险值,还包括:
[0030]根据目标消费记录的消费者的历史消费记录,将目标消费记录扩展为目标消费记录序列。
[0031]进一步地,所述根据目标消费记录的消费者的历史消费记录,将目标消费记录扩展为目标消费记录序列,包括:
[0032]根据设定的窗口大小,选取窗口范围内该目标消费记录对应的消费时间前该消费者的历史消费记录,与该目标消费记录一起生成对应的目标消费记录序列。
[0033]进一步地,所述根据预测的风险值,对目标消费记录的消费者进行风险控制,还包括:
[0034]根据对风险值低于设定阈值的目标消费记录的消费者进行回访的结果,将对应的消费记录放入风险反馈数据中。
[0035]本发明提出了一种消费行为的风险控制系统及方法,通过使用RNN(递归神经网络)分类器,将历史消费记录数据的序列作为模型的输入,通过模型来捕捉历史消费行为对当前消费的影响,不需要凭经验来提取历史行为特征,风险控制效果更好。此外,该方法可以通过多层神经网络捕捉特征和风险值之间的非线性关系,不需要在特征工程中寻找合理的非线性函数来转换特征。
【附图说明】
[0036]图1为本发明风险控制系统的结构示意图;
[0037]图2为本发明实施例风险控制原理示意图;
[0038]图3为本发明风险控制方法流程图。
【具体实施方式】
[0039]下面结合附图和实施例对本发明技术方案做进一步详细说明,以下实施例不构成对本发明的限定。
[0040]本发明的总体思想是结合上下文来进行风险控制,含有上下文的风险控制与一般的作为独立点的行为检测不同的是,处理目标行为自身的特征,还要考虑该行为所处上下文。同样一个行为在不同的上下文下,可能有着不同的风险含义。具体的,本发明关心的是历史消费行为这个上下文。现有的技术一般通过特征工程,生成一些历史消费相关的特征,将问题转化成不包含上下文的独立数据点,再使用相关模型进行检测。这种方法的效果好坏很大程度上取决于如何选择和生成特征。本发明通过使用分类器模型来捕捉历史消费记录作为目标数据的上下文,可以自动的学习出上下文和目标数据点的依赖,避免了人工的特征提取。
[0041]如图1所示,本实施例一种消费行为的风险控制系统,包括数据预处理模块、模型训练模块、风险预测模块和风险控制模块。其中:
[0042]数据预处理模块,用于导入消费记录数据和风险回访反馈数据,从导入的消费记录数据中采样一定的消费记录,和风险反馈数据一起作为消费记录训练集,并根据消费者的历史消费记录,生成消费记录序列训练集。
[0043]具体地,数据预处理模块包括数据导入子模块和特征提取子模块。其中数据导入子模块主要用于周期性从业务数据库导入消费记录数据和风险回访反馈数据,从导入的消费记录数据中采样一定的消费记录,和风险反馈数据一起作为消费记录训练集。而特征提取子模块用于根据消费者的历史消费记录,生成消费记录序列训练集。
[0044]数据预处理模块根据消费记录数据和风险回访反馈数据生成消费记录序列训练集,用于进行分类器的训练。对于机器学习,当训练数据足够时,训练得到的分类器模型参数越准确,分类的效果越好。实际上业务数据库中的消费记录是不断增加的,增量消费记录可以用来训练分类器,对模型参数进行更新。因此本实施例采用周期性地从业务数据库导入消费记录数据和风险回访反馈数据,以便后续进行机器学习更新模型参数,使得分类器的效果更好。相比一次性地完成分类器的训练,模型参数得到了更新,效果更好。
[0045]本实施例优选地采用RNN(递归神经网络)分类器,但不限于分类器的具体种类,例如可采用隐马尔可夫模型(HMM),但是RNN效果优于HMM。在RUN分类器中,还可以采用LSTMRNN分类器,或采用GRU RNN分类器。
[0046]容易理解的是,对于周期性导入数据,在首次导入时,是导入全部的消费记录数据和风险回访反馈数据,而在后续的导入时,仅导入增量消费记录数据即可。导入的数据存储到离线库,以便用来训练RNN分类器。其中,消费记录数据为没有进行识别的消费记录,而风险回访反馈数据为进行过回访,已经确定是否为异常的消费记录。
[0047]本实施例一条消费记录,包括用户名U、消费金额f和消费时间t,所述特征提取子模块根据消费者的历史消费记录,生成消费记录序列训练集,具体方法如下:
[0048]对于消费记录训练集中的任一消费记录,根据设定的窗口大小,选取窗口范围内该消费记录对应的消费时间前该消费者的历史消费记录,与该消费记录一起生成对应的消费记录序列;
[0049]消费记录训练集中所有消费记录对应的消费记录序列形成消费记录序列训练集。
[0050]例如消费记录训练集包括:
[0051 ] (ul,fl,tl);
[0052](u2,f2,t2);
[0053](ul,f3,t3);
[0054](u2,f4,t4);
[0055](u3,f5,t5);
[0056](ul,f6,t6);
[0057](u2,f7,t7);
[0058]…。
[0059]假设设定的窗口大小为当前消费记录及其前2条历史消费记录,则生成如下消费记录序列:
[0060][(ul,fl,tl),(ul,f3,t3),(ul,f6,t6)]
[0061 ] [(U2,f2,t2),(u2,f4,t4),(u2,f7,t7)]
[0062][(ul,f3,t3),(ul,f6,t6),...]
[0063]…。
[0064]本实施例中窗口大小可以是消费记录序列中包含的记录的条数,也可以是消费记录对应的时间范围,例如从当前时间开始前两天内的历史消费记录。
[0065]需要说明的是,消费记录序列的获得可以是记录每个消费者的消费记录,从消费者对应的消费记录中提取消费记录来生成消费记录序列。也可以是取出所有消费记录,按照设定的窗口大小,来选取出窗口范围内的消费记录生成消费记录序列。
[0066]模型训练模块,用于使用消费记录序列训练集训练分类器。
[0067]本实施例采用RNN(递归神经网络)来建模,每次获取的消费记录序列训练集都可以对RNN分类器进行训练,训练得到模型参数保存,并根据更新的模型参数对实时消费记录进行识别预测。
[0068]风险预测模块,用于通过训练得到的分类器对目标消费记录对应的目标消费记录序列进行预测,预测出目标消费记录对应的风险值。
[0069]本实施例目标消费记录序列,是消费者的实时消费记录对应的包含历史消费记录的目标消费记录序列。目标消费记录序列可以预先生成后输入到风险预测模块,例如直接由数据预处理模块读入消费者的目标消费记录,经过处理生成目标消费记录序列,然后输入到风险预测模块来预测得到对应的风险值。也可以将消费者的目标消费记录输入到风险预测模块,由风险预测模块包括的序列扩展子模块,根据目标消费记录的消费者的历史消费记录,将目标消费记录扩展为目标消费记录序列。序列扩展子模块将目标消费记录扩展为目标消费记录序列的方法与数据预处理模块生成目标消费记录序列的方法相同。
[0070]该目标消费记录序列的获得方法同样根据设定的窗口大小,选取窗口范围内该目标消费记录对应的消费时间前该消费者的历史消费记录,与该目标消费记录一起生成对应的目标消费记录序列。
[0071]如图2所示,目标消费记录与其对应的历史消费记录组成对应的消费记录序列,窗口范围内包括的消费记录条数就是窗口的大小,将该消费记录序列输入到RNN分类器进行预测,预测出目标消费记录对应的风险值。
[0072]风险控制模块,用于根据预测的风险值,对目标消费记录的消费者进行风险控制。
[0073]本实施例对目标消费记录的消费者进行风险控制,是根据预测的风险值对消费者进行风险控制,包括但不限于:
[0074]不予干预(风险值小于0.5)、放入待回访列表(风险值在0.5?0.8之间)、冻结消费(风险值在0.8以上)。
[0075]上述风险值仅为一具体实施例,根据业务规则不同,其取值可以进行调整。
[0076]本实施例风险控制模块还包括反馈收集子模块,该反馈收集子模块用于根据对风险值低于设定阈值的目标消费记录的消费者进行回访的结果将对应的消费记录放入风险反馈数据中。
[0077]例如对放入待回访列表(风险值在0.5??0.8之间)和冻结消费(风险值在0.8以上)的消费记录对应的消费者进行回访,阈值为0.5,根据回访结果,如该消费者电话多次未接,不愿意核实身份,或反馈的信息不正确,判定该消费者为异常或正常,对于异常的冻结账户,对于正常的解冻账户。并标识对应的消费记录,放入风险反馈数据中,以便后续对RNN分类器进行训练。
[0078]通过不断更新风险反馈数据,可以持续对RNN分类器进行训练,更新RNN分类器模型参数,以得到更加准确的预测结果。如果不这样进行更新,仅依据原始的RNN分类器,则不能根据新的情况进行模型参数的更新,导致RNN分类器适应不了新的情况。
[0079]本实施例一种消费行为的风险控制方法,如图3所示,用于对消费行为进行检测,并进行风险控制,该风险控制方法包括:
[0080]导入消费记录数据和风险回访反馈数据,从导入的消费记录数据中采样一定的消费记录,和风险反馈数据一起作为消费记录训练集,并根据消费者的历史消费记录,生成消费记录序列训练集;
[0081 ]使用消费记录序列训练集训练分类器;
[0082]通过训练得到的分类器对目标消费记录对应的目标消费记录序列进行预测,预测出目标消费记录对应的风险值;
[0083]根据预测的风险值,对目标消费记录的消费者进行风险控制。
[0084]其中,根据消费者的历史消费记录,生成消费记录序列训练集,与数据预处理模块对应地,优选方法为:
[0085]对于消费记录训练集中的任一消费记录,根据设定的窗口大小,选取窗口范围内该消费记录对应的消费时间前该消费者的历史消费记录,与该消费记录一起生成对应的消费记录序列;
[0086]消费记录训练集中所有消费记录对应的消费记录序列形成消费记录序列训练集。
[0087]同样地,与风险预测模块对应地,通过训练得到的分类器对目标消费记录对应的目标消费记录序列进行预测,预测出目标消费记录对应的风险值,还包括:
[0088]根据目标消费记录的消费者的历史消费记录,将目标消费记录扩展为目标消费记录序列。
[0089]优选地,根据目标消费记录的消费者的历史消费记录,将目标消费记录扩展为目标消费记录序列,包括:
[0090]根据设定的窗口大小,选取窗口范围内该目标消费记录对应的消费时间前该消费者的历史消费记录,与该目标消费记录一起生成对应的目标消费记录序列。
[0091]同样地,与风险控制模块对应地,根据预测的风险值,对目标消费记录的消费者进行风险控制,还包括:
[0092]根据对风险值低于设定阈值的目标消费记录的消费者进行回访的结果,将对应的消费记录放入风险反馈数据中。
[0093]以上实施例仅用以说明本发明的技术方案而非对其进行限制,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
【主权项】
1.一种消费行为的风险控制系统,用于对消费者的消费记录进行检测,并进行风险控制,其特征在于,所述风险控制系统包括依次相连的数据预处理模块、模型训练模块、风险预测模块和风险控制模块,其中: 所述数据预处理模块,用于导入消费记录数据和风险回访反馈数据,从导入的消费记录数据中采样一定的消费记录,和风险反馈数据一起作为消费记录训练集,并根据消费者的历史消费记录,生成消费记录序列训练集; 所述模型训练模块,用于使用消费记录序列训练集训练分类器; 所述风险预测模块,用于通过训练得到的分类器对目标消费记录对应的目标消费记录序列进行预测,预测出目标消费记录对应的风险值; 所述风险控制模块,用于根据预测的风险值,对目标消费记录的消费者进行风险控制。2.根据权利要求1所述的消费行为的风险控制系统,其特征在于,所述数据预处理模块根据消费者的历史消费记录,生成消费记录序列训练集,执行如下操作: 对于消费记录训练集中的任一消费记录,根据设定的窗口大小,选取窗口范围内该消费记录对应的消费时间前该消费者的历史消费记录,与该消费记录一起生成对应的消费记录序列; 消费记录训练集中所有消费记录对应的消费记录序列形成消费记录序列训练集。3.根据权利要求1所述的消费行为的风险控制系统,其特征在于,所述风险预测模块还包括序列扩展子模块,所述序列扩展子模块,用于根据目标消费记录的消费者的历史消费记录,将目标消费记录扩展为目标消费记录序列。4.根据权利要求3所述的消费行为的风险控制系统,其特征在于,所述序列扩展子模块目标消费记录的消费者的历史消费记录,将目标消费记录扩展为目标消费记录序列,包括: 根据设定的窗口大小,选取窗口范围内该目标消费记录对应的消费时间前该消费者的历史消费记录,与该目标消费记录一起生成对应的目标消费记录序列。5.根据权利要求1所述的消费行为的风险控制系统,其特征在于,所述风险控制模块还包括反馈收集子模块,用于根据对风险值低于设定阈值的目标消费记录的消费者进行回访的结果,将对应的消费记录放入风险反馈数据中。6.—种消费行为的风险控制方法,用于对消费行为进行检测,并进行风险控制,其特征在于,所述风险控制方法包括: 导入消费记录数据和风险回访反馈数据,从导入的消费记录数据中采样一定的消费记录,和风险反馈数据一起作为消费记录训练集,并根据消费者的历史消费记录,生成消费记录序列训练集; 使用消费记录序列训练集训练分类器; 通过训练得到的分类器对目标消费记录对应的目标消费记录序列进行预测,预测出目标消费记录对应的风险值; 根据预测的风险值,对目标消费记录的消费者进行风险控制。7.根据权利要求6所述的消费行为的风险控制方法,其特征在于,所述根据消费者的历史消费记录,生成消费记录序列训练集,包括: 对于消费记录训练集中的任一消费记录,根据设定的窗口大小,选取窗口范围内该消费记录对应的消费时间前该消费者的历史消费记录,与该消费记录一起生成对应的消费记录序列; 消费记录训练集中所有消费记录对应的消费记录序列形成消费记录序列训练集。8.根据权利要求6所述的消费行为的风险控制方法,其特征在于,所述通过训练得到的分类器对目标消费记录对应的目标消费记录序列进行预测,预测出目标消费记录对应的风险值,还包括: 根据目标消费记录的消费者的历史消费记录,将目标消费记录扩展为目标消费记录序列。9.根据权利要求8所述的消费行为的风险控制方法,其特征在于,所述根据目标消费记录的消费者的历史消费记录,将目标消费记录扩展为目标消费记录序列,包括: 根据设定的窗口大小,选取窗口范围内该目标消费记录对应的消费时间前该消费者的历史消费记录,与该目标消费记录一起生成对应的目标消费记录序列。10.根据权利要求6所述的消费行为的风险控制方法,其特征在于,所述根据预测的风险值,对目标消费记录的消费者进行风险控制,还包括: 根据对风险值低于设定阈值的目标消费记录的消费者进行回访的结果,将对应的消费记录放入风险反馈数据中。
【文档编号】G06Q30/02GK105844501SQ201610329807
【公开日】2016年8月10日
【申请日】2016年5月18日
【发明人】丁伟峰
【申请人】上海亿保健康管理有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1