一种基于数据、模型及策略的风险控制平台建设方法与流程

文档序号:20017974发布日期:2020-02-25 10:58阅读:269来源:国知局
一种基于数据、模型及策略的风险控制平台建设方法与流程

本发明公开一种基于数据、模型及策略的风险控制平台建设方法,涉及数据控制技术领域。



背景技术:

风险控制是指风险管理者采取各种措施和方法,消灭或减少风险事件发生的各种可能性,或风险控制者减少风险事件发生时造成的损失。做为管理者会采取各种措施减小风险事件发生的可能性,或者把可能的损失控制在一定的范围内,以避免在风险事件发生时带来的难以承担的损失。

现有的银行风险控制模式因具备时效性滞后、无法全线上流程化、用户画像精准度低、管控覆盖面小等不利因素,不能有效满足日益复杂的征信市场需要。

本发明提供一种基于数据、模型及策略的风险控制平台建设方法,主要建设流程步骤为:通过对接公共数据、自有数据、三方接入数据、风险数据等,将各类数据源聚集在数据管理平台上,并进行数据的传输、存储、管理、维护及可视化。在实时数据及历史存储数据完备的情况下,采用大数据、机器学习等技术,赋予风险控制平台智能化、实时化、高效化数据处理及建模能力。模型建设流程从数据抽取、数据处理、数据分析、特征训练、模型评估、模型训练直到模型的部署及迭代优化,流程化、一站式、线上化完成。风险控制策略是基于原始数据或模型结果数据的可配置业务流程。风险控制策略包括反欺诈策略、评分策略、授信策略等,每种策略都有相应的业务逻辑。通过调用已配置的数据源,获取相应申贷人的信息数据,对数据进行规则校验或逻辑判断,生成当前策略的最终结果。不同策略的组合构成了可对外输出的不同信贷产品,在满足平台访问权限的情况下,统一对外提供信贷决策服务。风险控制平台还包括贷后监控平台,定期扫描客户贷后逾期记录,为不同客户制定不同级别的风险控制标准,做到贷前、贷中、贷后全方位防控。



技术实现要素:

本发明针对现有技术的问题,提供一种基于数据、模型及策略的风险控制平台建设方法,提出了风险控制平台的输出流程,提供了解决信贷产品通过金融风险控制平台纯线上输出风险控制结果的方法,并可进行基于信贷产品的泛化推广。

本发明提出的具体方案是:

一种基于数据、模型及策略的风险控制平台建设方法,

搭建风险控制平台:

建立数据管理模块,负责通过数据源采集数据并对数据进行处理,同时利用数据仓库根据不同数据的类型建立不同的数据集,进行数据存储及维护;

建立模型计算模块,针对用户的数据及不同业务选取不同的模型进行分析预测,获得分析预测的结果数据,

建立策略管理模块,依据业务要求,对已有的原始数据和经过分析预测的结果数据进行策略配置,并利用规则引擎对策略配置的结果数据进行逐个检验,对策略配置的结果数据反馈形成不同的策略执行结果,区分用户信誉度,

建立金融产品监管模块,根据用户信誉度配置相应的金融产品,并对用户进行监管。

所述的方法中建立的数据管理模块中,当数据源多样化时,采取根据数据源采用不同的方式对数据源进行采集。

所述的方法中采用从数据库中采集、日志采集或页面埋点的方式对不同的数据源的数据进行采集。

所述的方法中模型计算模块中的模型通过数据管理模块中采集的数据集进行训练和测试,获得成熟的模型。

所述的方法中建立的模型计算模块中包含基于黑名单库及关系图谱的企业反欺诈模型、基于法人基本信息数据及企业经营数据的个体工商户评分卡模型及基于个人社保、公积金数据的额度测算模型。

所述的方法中策略管理模块中依据反欺诈策略、评分策略及授信策略,对已有的原始数据和经过分析预测的结果数据进行相关配置。

所述的方法中相关配置包括数据源的配置、准入规则的配置、验真条件的配置、反欺诈规则的配置。

所述的方法中规则引擎使用jsonarray的格式进行对策略配置的结果数据进行逐个检验,基本语法形式为:["操作符","参数1","参数2",...],较复杂的判断的条件可以扩充表达式实现。

一种基于数据、模型及策略的风险控制平台,包括数据管理模块、模型计算模块、策略管理模块及金融产品监管模块,

数据管理模块,负责通过数据源采集数据并对数据进行处理,同时利用数据仓库根据不同数据的类型建立不同的数据集,进行数据存储及维护;

模型计算模块,针对用户的数据及不同业务选取不同的模型进行分析预测,获得分析预测的结果数据,

策略管理模块,依据业务要求,对已有的原始数据和经过分析预测的结果数据进行策略配置,并利用规则引擎对策略配置的结果数据进行逐个检验,对策略配置的结果数据反馈形成不同的策略执行结果,区分用户信誉度,

金融产品监管模块,根据用户信誉度配置相应的金融产品,并对用户进行监管。

本发明的有益之处是:

本发明提供一种基于数据、模型及策略的风险控制平台建设方法,建立风险控制平台,具有如下的有益结果:

通过大数据驱动,以其数据多样、兼容各个平台、全线上化结果输出的优点,克服了现有金融产品流程数据来源局限、原理简单、风险较大的弊端;

预设了大量的风险控制模型及产品策略,可快速匹配多种业务场景,满足不同用户需求,相较现有风险控制技术,提高了风险控制效率,降低了信贷不良率;

更适用于不断变化的业务场景,不断对用户数据进行迭代和动态调整,产品策略指标及验证标准根据样本不断调优,能够不断改进风险控制产品的评测结果;

后期可引进基于人工智能的“智能风险控制平台”及多种平台架构技术,本平台以其可扩展性强的特点,可迅速实现版本更新,更新后将更能准确识别风险高的金融产品用户,应用前景将更加广阔。

附图说明

图1是本发明方法数据流示意图;

图2是本发明平台架构示意图;

图3本发明方法具体应用流程示意图。

具体实施方式

本发明提供一种基于数据、模型及策略的风险控制平台建设方法,

搭建风险控制平台:

建立数据管理模块,负责通过数据源采集数据并对数据进行处理,同时利用数据仓库根据不同数据的类型建立不同的数据集,进行数据存储及维护;

建立模型计算模块,针对用户的数据及不同业务选取不同的模型进行分析预测,获得分析预测的结果数据,

建立策略管理模块,依据业务要求,对已有的原始数据和经过分析预测的结果数据进行策略配置,并利用规则引擎对策略配置的结果数据进行逐个检验,对策略配置的结果数据反馈形成不同的策略执行结果,区分用户信誉度,

建立金融产品监管模块,根据用户信誉度配置相应的金融产品,并对用户进行监管。

同时提供与上述方法相应的一种基于数据、模型及策略的风险控制平台,包括数据管理模块、模型计算模块、策略管理模块及金融产品监管模块,

数据管理模块,负责通过数据源采集数据并对数据进行处理,同时利用数据仓库根据不同数据的类型建立不同的数据集,进行数据存储及维护;

模型计算模块,针对用户的数据及不同业务选取不同的模型进行分析预测,获得分析预测的结果数据,

策略管理模块,依据业务要求,对已有的原始数据和经过分析预测的结果数据进行策略配置,并利用规则引擎对策略配置的结果数据进行逐个检验,对策略配置的结果数据反馈形成不同的策略执行结果,区分用户信誉度,

金融产品监管模块,根据用户信誉度配置相应的金融产品,并对用户进行监管。

下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。

利用本发明方法进行基于数据、模型及策略的风险控制平台建设,具体过程为:

建立数据管理模块,从来源上可以分为内部数据和外部数据,根据数据的特点,又可分为结构化与非结构化数据、原始数据与推算数据、离散数据与联系数据、黑红名单数据、画像数据、知识图谱数据等,根据数据源不同,可以分为从数据库中采集、日志采集、页面埋点的方式进行数据采集,并存入数据仓库中,比如外部数据可通过数据产品接口的形式进行调取后,直接存储在oracle数据库中,日志形式的数据,可以通过flume进行采集,输出到kafka,并聚合到elastic进行存储,黑红名单数据使用内存数据库redis进行存储。由于知识图谱数据是基于图数据结构的数据,主要使用neo4j或集成sparkgraph进行存储及处理,随着业务量的增加,还可以使用hadoop+spark进行数据管理及维护;

建立模型计算模块,模型计算模块中包括风险控制业务中常见的算法模型,如基于黑名单库及关系图谱的企业反欺诈模型,基于法人基本信息数据及企业经营数据的个体工商户评分卡模型,基于个人社保、公积金数据的额度测算模型等,根据模型特点及业务能力的不同,各个模型可以内嵌算法模型,如决策树、逻辑回归、随机森林、svm等,并通过数据管理模块中采集的数据集进行训练和测试,获得成熟的模型,比如评分卡模型,可提取数据仓库已经存储的数据资源,对数据进行清洗及特征预处理,应重点关注数据的特征划分、异常值、连续变量分段,进行特征变量选择,在tensorflow、gdbt等框架环境中把样本分为训练集和测试集,经过参数调优后,进入到模型预测阶段,使用gini系数表示模型区分度能力,使用roc曲线表示模型泛化能力等;

利用成熟的模型,针对用户的数据及不同业务进行分析预测,获得分析预测的结果数据,

建立策略管理模块,依据业务要求,对已有的原始数据和经过分析预测的结果数据进行策略配置,策略包括反欺诈策略,评分策略、授信策略等,配置包括数据源的配置、准入规则的配置、验真条件的配置、反欺诈规则的配置等,

并利用规则引擎对策略配置的结果数据进行逐个检验,对策略配置的结果数据反馈形成不同的策略执行结果,区分用户信誉度,

规则引擎的规则语法使用jsonarray的格式实现,基本语法形式为:["操作符","参数1","参数2",...],较复杂的判断的条件可以扩充表达式实现:

["操作符",

["操作符1","参数1","参数2",...],["操作符2","参数1","参数2",...]

]

以上述表达式执行产生当前策略的校验结果,true表示通过,false表示不通过,也存在其他数值型结果,可支持的运算操作符见表1,

表1

校验全部完成后,即生成不同的策略执行结果。当然,不同的策略具备不同特点,评分策略会根据不同模型计算多个评分卡权重累加,授额策略会根据评分结果的信用等级配置信用等级系数等,

建立金融产品监管模块,可对金融机构等用户和信贷产品进行管理,基于已有的策略集和模型结果数据和数据源数据,先配置不同的规则项,生成不同的策略后,最终生成可对外发布的信贷产品,并且可给出当前申贷人所选申贷产品的反馈结果,包括是否拒绝申贷、信用等级、评分结果、额度建议等。还可基于用户的特征画像给出整体风控报告,

同时对用户进行监管,通过持续对申贷主体的逾期情况、资金流转、经营状况等进行探查,生成阶段性风控结果,当各项指标出现较大波动发出逾期警报时,采取一定的手段对授信额度进行降级,仍不能挽回损失时,启用贷后催收机制,该申贷人相关信息即会进入到黑名单库,用于后期模型的数据分析,进入黑名单库的申贷人再次申贷时,其信贷水平会大大降低。

利用本发明平台进行风险控制,具体过程为:

利用数据管理模块,采集数据,其中数据从来源上可以分为内部数据和外部数据,根据数据的特点,又可分为结构化与非结构化数据、原始数据与推算数据、离散数据与联系数据、黑红名单数据、画像数据、知识图谱数据等,根据数据源不同,可以分为从数据库中采集、日志采集、页面埋点的方式进行数据采集,并存入数据仓库中,比如外部数据可通过数据产品接口的形式进行调取后,直接存储在oracle数据库中,日志形式的数据,可以通过flume进行采集,输出到kafka,并聚合到elastic进行存储,黑红名单数据使用内存数据库redis进行存储。由于知识图谱数据是基于图数据结构的数据,主要使用neo4j或集成sparkgraph进行存储及处理,随着业务量的增加,还可以使用hadoop+spark进行数据管理及维护;

模型计算模块中包括风险控制业务中常见的算法模型,如基于黑名单库及关系图谱的企业反欺诈模型,基于法人基本信息数据及企业经营数据的个体工商户评分卡模型,基于个人社保、公积金数据的额度测算模型等,根据模型特点及业务能力的不同,各个模型可以内嵌算法模型,如决策树、逻辑回归、随机森林、svm等,并通过数据管理模块中采集的数据集进行训练和测试,获得成熟的模型,比如评分卡模型,可提取数据仓库已经存储的数据资源,对数据进行清洗及特征预处理,应重点关注数据的特征划分、异常值、连续变量分段,进行特征变量选择,在tensorflow、gdbt等框架环境中把样本分为训练集和测试集,经过参数调优后,进入到模型预测阶段,使用gini系数表示模型区分度能力,使用roc曲线表示模型泛化能力等;

利用成熟的模型,针对用户的数据及不同业务进行分析预测,获得分析预测的结果数据,

策略管理模块依据业务要求,对已有的原始数据和经过分析预测的结果数据进行策略配置,策略包括反欺诈策略,评分策略、授信策略等,配置包括数据源的配置、准入规则的配置、验真条件的配置、反欺诈规则的配置等,

并利用规则引擎对策略配置的结果数据进行逐个检验,对策略配置的结果数据反馈形成不同的策略执行结果,区分用户信誉度,

规则引擎的规则语法使用jsonarray的格式实现,基本语法形式为:["操作符","参数1","参数2",...],较复杂的判断的条件可以扩充表达式实现:

["操作符",

["操作符1","参数1","参数2",...],["操作符2","参数1","参数2",...]

]

以上述表达式执行产生当前策略的校验结果,true表示通过,false表示不通过,也存在其他数值型结果,可支持的运算操作符见表1,

表1

校验全部完成后,即生成不同的策略执行结果。当然,不同的策略具备不同特点,评分策略会根据不同模型计算多个评分卡权重累加,授额策略会根据评分结果的信用等级配置信用等级系数等,

金融产品监管模块可对金融机构等用户和信贷产品进行管理,基于已有的策略集和模型结果数据和数据源数据,先配置不同的规则项,生成不同的策略后,最终生成可对外发布的信贷产品,并且可给出当前申贷人所选申贷产品的反馈结果,包括是否拒绝申贷、信用等级、评分结果、额度建议等。还可基于用户的特征画像给出整体风控报告,

同时对用户进行监管,通过持续对申贷主体的逾期情况、资金流转、经营状况等进行探查,生成阶段性风控结果,当各项指标出现较大波动发出逾期警报时,采取一定的手段对授信额度进行降级,仍不能挽回损失时,启用贷后催收机制,该申贷人相关信息即会进入到黑名单库,用于后期模型的数据分析,进入黑名单库的申贷人再次申贷时,其信贷水平会大大降低。

利用本发明方法或平台可以对各个数据来源的数据进行传输、存储、管理、分析及数据可视化。通过大数据流式处理技术对各个数据源数据进行数据清洗、处理,构建数据仓库。基于大数据及机器学习领域知识,建设模型并计算。模型结果数据和数据源数据均可作为策略集合的规则配置数据来源。不同的策略组合将构成不同的信贷产品,统一对外提供信贷决策服务。信贷产品服务的客户增长后,将会根据贷后监控平台,生成不同级别的用户群体,各类用户群体的不同特征划分又将分别存储到数据仓库并应用到模型体系的建设中,以达到全流程、全方位防控的目的。

以上所述实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1