风控模型培训及策略执行系统的制作方法

文档序号:15446492发布日期:2018-09-14 23:25阅读:362来源:国知局

本发明涉及机器学习模型技术领域,具体来说,涉及一种风控模型培训及策略执行系统。



背景技术:

在传统方法里,模型培训和控策略定义是独立进行的。模型的开发由建模人员使用专业的软件如sas、r等来对数据进行分析和建模。模型开发完后,将模型报告交予开发人员进行代码翻译。策略的开发则是由策略人员根据市场、人群等对产品有影响的因数,将多个模型聚合,并设置条件和阈值,而后提交给开发人员进行代码翻译,最终将代码部署到生产上。整个流程耗时长,而且模型、策略的开发和代码的开发发布混合在一起,不利于模型、策略的保密。

针对相关技术中的上述问题,目前尚未提出有效的解决方案。



技术实现要素:

针对相关技术中的上述问题,本发明提出一种风控模型培训及策略执行系统,提供了一种模型培训、策略定义、策略部署执行一站式的系统。

本发明的技术方案是这样实现的:

根据本发明的一个方面,提供了一种风控模型培训及策略执行系统,包括顺序连接的以下模块:

模型训练模块,用于根据数据建立模型;

策略定义模块,用于选择模型并通过选择的模型进行策略定义;

策略执行模块,用于在执行策略时,为模型计算提供所需要的数据。

在一个实施例中,策略定义模块还用于添加节点,并进一步通过节点进行策略定义;其中,节点包括规则节点。

在一个实施例中,策略定义模块通过模型的输入和输出定义策略的输入和输出。

在一个实施例中,模型训练模块还用于将模型训练所使用数据的元数据存储在模型中;策略执行模块根据元数据,从策略上下文中选择所需的字段以用于模型计算。

在一个实施例中,数据存储模块,与模型训练模块连接,用于获取并存储用户上传的数据。

在一个实施例中,数据存储模块以数据集存储数据。

本发明提供了一种模型培训、策略定义、策略部署执行一站式的系统,可以避免中间需要的代码翻译及代码部署的工作,提高整个模型,策略开发的效率。可以灵活的定义策略,适用于对策略进行快速更新。中间无代码开发,加强了模型,策略的安全。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的风控模型培训及策略执行系统的框图;

图2是根据本发明实施例的风控模型培训及策略执行系统的工作流程图;

图3是根据本发明实施例的风控模型培训及策略执行系统的数据存储模块的数据存储形式的示意图;

图4是根据本发明实施例的风控模型培训及策略执行系统的模型训练模块的模型信息的示意图;

图5是根据本发明实施例的风控模型培训及策略执行系统的策略定义模块进行策略定义的示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,根据本发明的实施例,提供了一种风控模型培训及策略执行系统,包括顺序连接的以下模块:模型训练模块12,用于根据数据建立模型;策略定义模块14,用于选择模型并通过选择的模型进行策略定义;策略执行模块16,用于在执行策略时,为模型计算提供所需要的数据。

本发明的上述技术内容,提供了一种模型培训、策略定义、策略部署执行一站式的系统,可以避免中间需要的代码翻译及代码部署的工作,提高整个模型,策略开发的效率。可以灵活的定义策略,适用于对策略进行快速更新。中间无代码开发,加强了模型,策略的安全。

其中,本发明的风控模型培训及策略执行系统可使用全程可视化的ui界面,以使建模人员、策略人员能够完全控制风控流程。

在一个实施例中,本发明的风控模型培训及策略执行系统还可包括与模型训练模块连接的数据存储模块,数据存储模块用于获取并存储用户上传的数据。在一个实施例中,数据存储模块以数据集存储数据。结合图2和图3所示,系统以数据集的概念存储用户上传的数据。数据集会保存文件的基本信息,如各列的类型,描述,文件的存储位置等。以便于之后进行数据分析和清洗。数据集还可保存部分常用统计量,供用户快速确认数据的质量。

在一个实施例中,模型训练模块还用于将模型训练所使用数据的元数据存储在模型中;策略执行模块根据元数据,从策略上下文中选择所需的字段以用于模型计算。结合图2和图4所示,用户可以基于数据集做模型训练,在可视化的ui做参数配置、查看模型信息。用户可以建立多种模型,如基于各种机器学习分类算法lr、gbdt、randomforest的模型。模型会保留基本的元数据,如模型的输入输出字段,字段类型。

结合图2和图5所示,在一个实施例中,策略定义模块还用于添加节点,并进一步通过节点进行策略定义;其中,节点包括规则节点。在一个实施例中,策略定义模块通过模型的输入和输出定义策略的输入和输出。模型开发完后,用户将模型注册,提交给策略人员使用。策略人员定义策略时,可以将已注册模型拖拉进策略定义里。一个策略中可以使用多个模型,按照客户属性,使用条件分支来决定适配的模型。

在策略执行时,系统会根据模型的元数据,将模型执行所需要的字段从策略上下文中挑选出并提供给模型计算。

在本发明的风控模型培训及策略执行系统中,最重要的部分为模型、策略。模型训练模块,可以通过在开源的spark(一种计算引擎)框架基础上添加了一部分算法来适应金融领域的一些特定需求,比如woe自动分箱,使用pipeline保存模型培训结果及中间所需要的操作,如标准化、填充缺失值、以及操作相对应的数据。在pipeline之外,也需同时保留模型训练所使用数据的字段名及字段类型,以元数据的形式存储在模型中。将模型的输入输出暴露给策略,一方面是为了策略人员能够理解模型的输入输出,另一方面是系统能够通过这些元数据决定应该传入入给模型的数据。

策略定义与执行可使用开源的activiti(一种工作流引擎),并在activiti上添加了模型,规则节点。输入、输出节点描述了策略的输入、输出,并以api(applicationprogramminginterface,应用程序编程接口)的形式告诉api调用者策略执行时所需要的输入。

策略定义后,即可由ui发布,以activiti工作流的方式执行。在策略执行时,每个单独的调用维护一个上下文,上下文以键-值对的形式保存了策略的输入、模型节点、脚本节点、规则节点的输出。在使用模型节点时,会从这个上下文中将模型所需要的输入,组织成为一个dataframe,传递给模型供模型计算。在规则节点、脚本节点中,用户可以输入drools规则,做灵活的自定义配置。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1