策略生成及风险控制方法和装置与流程

文档序号：16360163发布日期：2018-12-22 08:07阅读：174来源：国知局

本说明书涉及风险控制技术领域，尤其涉及策略生成及风险控制方法和装置。

背景技术

在互联网快速发展的今天，安全作为保障业务健康、稳定发展的守护者，其作用正在逐渐凸显，其中风险策略的布控是其重要一环。随着业务的多样性和对抗的不断升级，有必要对传统的风险策略生成方式进行改进。

技术实现要素：

基于此，本发明提供了策略生成及风险控制方法和装置。

根据本发明实施例的第一方面，提供一种策略生成方法，所述方法包括：从预先生成的多条风控规则中选择至少一条目标风控规则，并根据所述目标风控规则生成风控策略；若目标变量不满足预设的约束条件，对所述风控策略中的目标风控规则进行调整，其中，所述目标变量是将训练样本输入所述风控策略后获得的输出变量。

可选地，所述多条风控规则由多个决策树生成，且每个决策树生成其中至少一条风控规则。

可选地，在根据所述目标风控规则生成风控策略之前，所述方法还包括：对各个决策树中相同的目标风控规则进行合并。

可选地，在对各个决策树中相同的目标风控规则进行合并之后，所述方法还包括：若所述目标风控规则在各个决策树中具有不同的决策条件，根据所述约束条件选取其中一个决策条件作为合并之后的目标风控规则的决策条件。

可选地，对所述风控策略中的目标风控规则进行调整的步骤包括：剔除所述风控策略中的至少一条目标风控规则；和/或调整所述风控策略中的至少一条目标风控规则的决策条件；和/或采用所述风控规则对所述风控策略中的至少一条目标风控规则进行替换。

可选地，所述方法还包括：根据测试样本验证调整后的风控策略是否满足所述约束条件。

可选地，所述方法还包括：从数据库中提取训练样本；根据所述训练样本生成所述风控规则。

可选地，所述方法还包括：对所述训练样本进行更新。

可选地，在根据所述训练样本生成所述风控规则之前，所述方法还包括：对所述训练样本进行数据清洗和特征衍生。

可选地，所述方法还包括：获取满足预设约束条件的多个风控策略；从所述多个风控策略中选择最优的风控策略。

可选地，所述约束条件为精确度约束条件。

根据本发明实施例的第二方面，提供一种风险控制方法，所述方法包括：根据风控策略判断业务数据是否存在风险；其中，所述风控策略由任一实施例的风控策略生成方法生成。

根据本发明实施例的第三方面，提供一种风控策略生成装置，所述装置包括：策略生成模块，用于从预先生成的多条风控规则中选择至少一条目标风控规则，并根据所述目标风控规则生成风控策略；策略调整模块，用于若目标变量不满足预设的约束条件，对所述风控策略中的目标风控规则进行调整，其中，所述目标变量是将训练样本输入所述风控策略后获得的输出变量。

可选地，所述多条风控规则由多个决策树生成，且每个决策树生成其中至少一条风控规则。

可选地，所述装置还包括：合并模块，用于对各个决策树中相同的目标风控规则进行合并。

可选地，所述装置还包括：阈值选择模块，用于若所述目标风控规则在各个决策树中具有不同的决策条件，根据所述约束条件选择其中一个决策条件作为合并之后的目标风控规则的决策条件。

可选地，策略调整模块包括：剔除单元，用于剔除所述风控策略中的至少一条目标风控规则；和/或调整单元，用于调整所述风控策略中的至少一条目标风控规则的决策条件；和/或替换单元，用于采用所述风控规则对所述风控策略中的至少一条目标风控规则进行替换。

可选地，所述装置还包括：验证模块，用于根据测试样本验证调整后的风控策略是否满足所述约束条件。

可选地，所述装置还包括：提取模块，用于从数据库中提取训练样本；风控规则生成模块，用于根据所述训练样本生成所述风控规则。

可选地，所述装置还包括：更新模块，用于对所述训练样本进行更新。

可选地，所述装置还包括：预处理模块，用于对所述训练样本进行数据清洗和特征衍生。

可选地，所述装置还包括：获取模块，用于获取满足预设约束条件的多个风控策略；策略选择模块，用于从所述多个风控策略中选择最优的风控策略。

可选地，所述约束条件为精确度约束条件。

根据本发明实施例的第四方面，提供一种风险控制装置，所述装置包括：判断模块，用于根据风控策略判断业务数据是否存在风险；其中，所述风控策略由任一实施例的风控策略生成方法生成。

根据本发明实施例的第五方面，提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现任一实施例的方法。

根据本发明实施例的第六方面，提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现任一实施例的方法。

应用本发明实施例方案，通过设置约束条件来对风控策略中的目标风控规则进行调整，实现规则的自动化挑选和组合，从而能够自动对风控策略进行优化，提高了风控策略的可靠性；同时，上述风控策略生成方法无需人工干涉，提高了生成风控策略的时效性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是本说明书一个实施例中风险对抗过程的示意图。

图2是本说明书一个实施例中风控策略生成方法的流程图。

图3是本说明书一个实施例中的决策树示意图。

图4是本说明书一个实施例中风险控制方法示意图。

图5是本说明书一个实施例中风控策略生成及风险控制的总体流程图。

图6是本说明书一个实施例中风控策略生成装置的框图。

图7是本说明书一个实施例中风险控制装置的框图。

图8是本说明书一个实施例中装置所在计算机设备的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

在本发明使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本发明可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本发明范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

如图1所示，是本说明书一个实施例中风险对抗过程的示意图。日常生活中会存在各种各样的风险，这些风险可能带来一定的隐患。例如，当用户在电脑、手机、平板电脑等电子设备102上执行支付操作时，可能存在系统漏洞等风险，给用户的资产安全带来隐患。为了进行风险控制，保障用户的资产安全，可以通过网络对用户的底层数据进行提取，并将提取到的底层数据存储至数据库104中。服务器106可以从数据库104中采集训练样本，并按照一定的算法生成风控策略，生成的风控策略可以用于进行风险对抗。当然，由于风控策略的存在，产生的风险也会随着时间的推移和技术的进步做出相应的升级，因此，在风险对抗的过程中，往往也需要随着风险的升级而更新风控策略。从而，形成一套闭环的风险对抗方案。

如图2所示，是本说明书一个实施例中风控策略生成方法的流程图。所述风控策略生成方法可包括以下步骤：

步骤202：从预先生成的多条风控规则中选择至少一条目标风控规则，并根据所述目标风控规则生成风控策略；

步骤204：若目标变量不满足预设的约束条件，对所述风控策略中的目标风控规则进行调整，其中，所述目标变量是将训练样本输入所述风控策略后获得的输出变量。

在步骤202中，可以预先按照某种或某些算法来生成多条风控规则，其中，不同的风控规则可以由相同的算法生成，也可以由不同的算法生成。例如，可以通过决策树算法来生成多条风控规则。所述多条风控规则可以是由同一棵决策树生成的风控规则。所述多条风控规则也可以由多个决策树生成，且每个决策树生成其中至少一条风控规则。例如，假设共有3棵决策树，则决策树1可以生成风控规则a、b、c，决策树2可以生成风控规则d和e，决策树3可以生成风控规则f和g，则步骤202中获取到的风控规则包括风控规则a～g。

如图3所示，示出了生成2棵决策树的实施例。其中，每一条规则由一个父节点、一个子节点和一条分支(即决策条件)所构成，最终生成的每个叶子节点分别对应一个标签。可以看出，在图3所示的实施例中，决策树1和决策树2中存在部分相同的规则。当然，这只是一种可能存在的情况，实际情况中，生成的每棵决策树中的规则可能都不同。

在获取风控规则之后，可以先从预先生成的多条风控规则中选择至少一条目标风控规则，然后通过迭代的方式生成风控策略。

在步骤204中，目标变量是将业务数据导入风控策略后得到的变量，可以用于表征业务数据所属的类别。可以从数据库中获取若干组训练样本，将训练样本导入风控策略，得到目标变量，然后判断各个训练样本对应的目标变量与训练样本实际的类别是否一致，以验证该约束条件。

本说明书实施例通过设置约束条件来对风控策略中的目标风控规则进行调整，实现规则的自动化挑选和组合，从而能够自动对风控策略进行优化，提高了风控策略的可靠性；同时，上述风控策略生成方法无需人工干涉，提高了生成风控策略的时效性。

在一个实施例中，可以提取数据库中的训练样本，并根据所述训练样本生成所述风控规则。训练样本可以从客户端获取。例如，对于支付宝业务，可以获取用户注册时通过客户端上传的用户信息，以及用户使用支付宝进行支付时通过客户端发送的业务数据等等。可以先将生成的各条规则添加到一个规则集合中，然后再从规则集合中选择至少一条目标风控规则，用于生成风控策略。

在生成风控规则之前，还可以对训练样本进行数据清洗和特征衍生。其中，数据清洗是对数据进行重新审查和校验的过程，目的在于删除重复信息、纠正存在的错误，并提供数据一致性。特征衍生是对指现有的特征进行某种组合，生成新的具有含义的特征。

对于存在相同风控规则的情形，为了减少规则的冗余度，在根据所述目标风控规则生成风控策略之前，可以对相同的目标风控规则进行合并。进一步地，如果相同的目标风控规则在各个决策树中具有不同的决策条件，可以根据所述约束条件选取其中一个决策条件作为合并之后的目标风控规则的决策条件。

在一个实施例中，对所述风控策略中的目标风控规则进行调整的步骤包括以下至少任一：剔除所述风控策略中的至少一条目标风控规则；和/或调整所述风控策略中的至少一条目标风控规则的决策条件；和/或采用所述风控规则对所述风控策略中的至少一条目标风控规则进行替换。

例如，预先生成的风控规则包括{a、b、c、d、e、f、g}，选取的目标风控规则为a、b、c。则可判断a、b、c构成的风控策略是否满足约束条件，若不满足，可以从风控策略中删除某一条或某几条目标风控规则，例如，删除a，则调整后的风控策略中仅包括b和c。也可以调整某一条或某几条目标风控规则的决策条件，例如，将b的决策条件从“大于等于90”调整为“大于等于95”。还可以采用、d、e、f、g中的任意一条风控规则来替代其中一条目标风控规则(例如，c)。当然，也可以同时执行删除、调整决策条件和替换。

在一个实施例中，获取风控策略时，可以获取满足预设约束条件的多个风控策略，再从所述多个风控策略中选择最优的风控策略。例如，假设对目标风控规则进行调整后，获取到的满足约束条件的风控策略包括策略x1、策略x2和策略x3，则可以从x1、x2、x3中选择最优的风控策略，作为最终的风控策略。其中，最优可以是最符合约束条件。例如，当约束条件是准确率约束条件时，可以从x1、x2、x3中选择准确率最高的风控策略作为最终的风控策略。这样，通过二次筛选，能够进一步获得较优的风控策略。

在获取风控策略之后，可以根据测试样本验证调整后的风控策略是否满足所述约束条件。测试样本可以从最新的业务数据中提取。例如，可以获取业务数据中20％的业务数据作为测试样本，验证最终得到的风控策略是否满足约束条件。如果满足，则可以直接采用该风控策略对整个业务系统的数据进行风险控制；如果不满足，则可以重新生成风控策略。通过这种方式，减小了对整个业务系统的影响。

在一个实施例中，还可以对所述训练样本进行更新。在采用风控策略进行风险对抗的过程中，风险会根据风控策略的改进而升级，在升级后的风险作用下会产生新的业务数据，因此，可以根据新的业务数据对训练样本进行更新。更新的方式可以是定期更新，例如，每隔一周或者一个月等时间进行一次底层数据提取，根据提取到的底层数据对训练样本进行更新。也可以通过条件触发的方式进行数据更新。

上述任一实施例中的约束条件可以是准确率约束条件，即，通过风控策略得到的目标变量与实际类别一致的训练样本的数量占训练样本总数的比例。假设总共有n条训练样本，通过风控策略得到的目标变量中，有m个目标变量与对应训练样本实际的类别一致，则准确率可记为m/n。若准确率大于预设的准确率阈值，则可认为满足准确率约束条件；否则，认为不满足准确率约束条件。

上述任一实施例中的约束条件也可以是风险覆盖率约束条件，即，通过风控策略识别出的风险占实际存在的风险总数的比例。假设共有n条训练样本存在风险，通过风控策略识别出的存在风险的训练样本的数量为m，则风险覆盖率可记为m/n。若风险覆盖率大于预设的风险覆盖率阈值，则可认为满足风险覆盖率约束条件；否则，认为不满足风险覆盖率约束条件。

本说明书实施例具有以下优点：

(1)无需人工选择规则，提高了策略生成的时效性。

(2)通过设置约束条件对规则进行合理的评估，提高了规则和策略的可靠性。

(3)基于多棵决策树中的规则生成策略，提高了生成策略的鲁棒性。

(4)对不同的规则进行合并、筛选、整理，减小了规则的冗余度。

如图4所示，本说明书实施例还提供了一种风险控制方法，所述方法可包括：

根据风控策略判断业务数据是否存在风险；其中，所述风控策略由上述任一实施例的风控策略生成方法生成。

在本实施例中，将业务数据导入风控策略，可以获取业务数据的类别，例如：不存在风险的类别、存在风险的类别、存在高危风险的类别等。通过这种方式，可以进行风险控制，保障业务数据的安全。

如图5所示，是本说明书一个实施例中风控策略生成及风险控制的总体流程图，可包括以下步骤：

步骤502：底层数据提取。其中，底层数据可来自用户使用的手机、电脑、平板电脑等电子设备。

步骤504：数据清洗和特征衍生。

步骤506：将步骤504中得到的数据存入数据库备用。

步骤508：定义目标变量，例如：存在风险。

步骤510：从数据库中获取训练样本，执行树桩算法，得到风控规则。

步骤512：根据风控规则生成风控策略，生成方式可采用上述任一实施例中的风控策略生成方法。

步骤514：采用测试样本对步骤512生成的风控规则进行测试，测试完成后根据风控规则对风险进行对抗。

与前述方法的实施例相对应，本发明还提供了装置、计算存储介质以及计算机设备的实施例。

如图6所示，是本说明书一个实施例中风控策略生成装置的框图。所述装置包括：

策略生成模块602，用于从预先生成的多条风控规则中选择至少一条目标风控规则，并根据所述目标风控规则生成风控策略；

策略调整模块604，用于若目标变量不满足预设的约束条件，对所述风控策略中的目标风控规则进行调整，其中，所述目标变量是将训练样本输入所述风控策略后获得的输出变量。

上述装置中各个模块的功能和作用的实现过程具体详情见上述风控策略生成方法中对应步骤的实现过程，在此不再赘述。

如图7所示，是本说明书一个实施例中风险控制装置的框图。所述装置包括：

判断模块702，用于根据风控策略判断业务数据是否存在风险；其中，所述风控策略由任一实施例的风控策略生成方法生成。

上述装置中各个模块的功能和作用的实现过程具体详情见上述风险控制方法中对应步骤的实现过程，在此不再赘述。

本说明书在线支付过程中的数据处理装置的实施例可以应用在计算机设备上，例如服务器或终端设备。装置实施例可以通过软件实现，也可以通过硬件或者软硬件结合的方式实现。以软件实现为例，作为一个逻辑意义上的装置，是通过其所在文件处理的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言，如图8所示，为本说明书在线支付过程中的数据处理装置所在计算机设备的一种硬件结构图，除了图8所示的处理器802、内存804、网络接口806、以及非易失性存储器808之外，实施例中装置所在的服务器或电子设备，通常根据该计算机设备的实际功能，还可以包括其他硬件，对此不再赘述。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

相应地，本说明书实施例还提供一种计算机存储介质，所述存储介质中存储有程序，所述程序被处理器执行时实现上述任一实施例中的方法。

相应地，本说明书实施例还提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述任一实施例中的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

以上所述仅为本公开的较佳实施例而已，并不用以限制本公开，凡在本公开的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本公开保护的范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王川
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。