一种基于大数据智能风控的小额贷款系统及方法与流程

文档序号:12887988阅读:1133来源:国知局
一种基于大数据智能风控的小额贷款系统及方法与流程

本发明涉及一种基于大数据智能风控的小额贷款系统及方法,属于互联网金融技术领域。



背景技术:

互联网金融是传统金融机构与互联网企业利用互联网技术和信息通信技术实现资金融通、支付、投资和信息中介服务的新型金融业务模式。互联网与金融深度融合是大势所趋,将对金融产品、业务、组织和服务等方面产生更加深刻的影响。互联网金融对促进小微企业发展和扩大就业发挥了现有金融机构难以替代的积极作用,为大众创业、万众创新打开了大门。

小额贷款是以个人或企业为核心的综合消费贷款,贷款的金额一般为1000元以上,20万元以下。目前我国的小额贷款存在以下问题:

第一、小额贷款缺少最终偿还的保障机制,小额贷款的借款者一般是创业者,且多为资金匮乏者,如果创业成功,他愿意归还贷款,可是如果创业失败,资金损失,贷款者的利益就难以保障;

第二、小额贷款运作成本过高。小额贷款属于零售贷款,一个贷款员最多营销一二百笔贷款,但是金额却仅仅是几百万,这和批发贷款的规模效应是无法比的,相对的成本也高。同样是一个亿的贷款,如果贷款给大企业,只需要一个客户经理就可以办理,而办理小额贷款可能要几千笔业务量,光客户经理就需要十几个,人力物力成本过高;

第三、整个社会的诚信体制缺失,小额贷款绝大部分依靠的是信用担保,骗取贷款的恶意行为时有发生。

可以看出目前小额贷款还是存在较大的风险,现有的风险控制方法一般是采用线下人工审核,不仅速度慢,而且人为审核容易出现错误,审核不够全面,数据审核范围窄,不能做出合理准确的风险预判,因此需要对小额贷款地风险控制问题进行解决。



技术实现要素:

本发明的目的在于提供一种基于大数据智能风控的小额贷款系统及方法,审核速度快,数据审核全面,风险预判准确性高,有效的降低小额贷款风险。

为实现上述目的,本发明提供一种基于大数据智能风控的小额贷款系统,所述小额贷款系统包括后台管理服务器,所述后台管理服务器包括前端接入系统、大数据风控系统、贷款业务系统;

所述前端接入系统包括后台管理系统接入模块、官网接入模块、终端接入模块、第三方推件接入模块;所述后台管理系统接入模块用于实现对所述小额贷款系统的业务管理;所述官网接入模块用于实现所述小额贷款系统与官方网站之间的数据对接;所述终端接入模块用于实现所述小额贷款系统与智能终端之间的数据对接;所述第三方推件接入模块用于实现所述小额贷款系统与第三方推荐平台之间的数据对接;

所述大数据风控系统包括数据采集模块、风控引擎模块、模型训练模块、信用评估模块;所述数据采集模块用于收集用户数据信息并进行数据预处理;所述风控引擎模块利用基于随机森林算法的反欺诈模型进行反欺诈决策;所述模型训练模块用于通过至少2个样本集的运行对反欺诈模型进行模型优化;所述信用评估模块利用逻辑回归算法对用户信用进行得分评估;

所述贷款业务系统包括风控管理模块;所述风控管理模块通过大数据风控系统对所述小额贷款系统进行风控管理。

如上所述的一种基于大数据智能风控的小额贷款系统,所述前端接入系统还包括微信接入模块,所述微信接入模块用于实现所述小额贷款系统与微信平台的数据对接,用户通过微信客户端实现小额贷款系统的数据访问。

如上所述的一种基于大数据智能风控的小额贷款系统,所述数据采集模块收集的用户信息包括常规数据、实时数据,数据采集模块通过spark通用并行计算框架实现分布式计算。spark是专为大规模数据处理而设计的快速通用的计算引擎,通过在spark上构建处理stream数据的框架,将stream数据分成小的时间片断,以类似batch批量处理的方式来处理这小部分数据。

进一步,所述常规数据包括身份信息、历史征信报告、个人教育、居住信息,数据采集模块利用map-reduce原理实现常规数据etl处理。map-reduce是由google在2004年提出的大数据并行编程架构,分为map(映射)和reduce(化简)两个步骤,因此得名,它隐藏并行化、容错、数据分布、负载均衡等细节,可以搭建在普通pc上,程序员可以很方便完成大数据并行编程。etl是英文extract-transform-load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。etl是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。

进一步,所述实时数据包括人脸识别、定位,数据采集模块采用消息队列kafka和流计算框架storm处理实时数据。kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据,这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素,这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决,对于像hadoop的一样的日志数据和离线分析系统,但又要求实时处理的限制,这是一个可行的解决方案。kafka的目的是通过hadoop的并行加载机制来统一线上和离线的消息处理,也是为了通过集群来提供实时的消费。storm是个实时的、分布式以及具备高容错的计算系统,同hadoop一样storm也可以处理大批量的数据,然而storm在保证高可靠性的前提下还可以让处理进行的更加实时。storm同样还具备容错和分布计算特性,从而使storm可以扩展到不同的机器上进行大批量的数据处理。

如上所述的一种基于大数据智能风控的小额贷款系统,所述随机森林算法包括至少一个决策树,每个决策树随机采样一组用户的特征,在每个节点判断某一个用户特征和欺诈的关联度并对对每个用户做出欺诈结果决策。

如上所述的一种基于大数据智能风控的小额贷款系统,所述逻辑回归算法通过后台管理服务器积累的用户历史数据得出用户还款能力概率和还款意愿概率,所述还款能力概率通过用户的收入资产情况得出,所述还款意愿概率通过用户逾期还款、违约违法情况得出。

本发明还提供一种基于大数据智能风控的小额贷款方法,所述小额贷款方法采用上述的小额贷款系统,所述小额贷款方法包括以下步骤:

贷款用户提出贷款业务申请,对贷款用户的用户信息进行采集;

生成订单利用基于随机森林算法的反欺诈模型进行反欺诈决策;

对于通过反欺诈模型验证的用户,利用逻辑回归算法对用户信用进行得分评估;

根据用户信用评估得分进行线性拟合,得出用户最终贷款额度。

本发明具有如下优点:以海量数据为基础,结合人脸识别技术,实现多维度识别用户信息的真实性,发现与规避潜在的欺诈风险,采用了随机森林的算法实现了反欺诈决策,采用了逻辑回归的方法得出还款意愿和还款能力评分。大规模数据可实现快速建模,应用广义线性模型和深度学习,找出数据中隐含复杂非线性关系,根据实际应用场景,通过机器学习等技术训练多个模型,多维度描绘用户画像。本发明整体审核速度快,数据审核全面,风险预判准确性高,有效的降低小额贷款风险。

附图说明

图1为基于大数据智能风控的小额贷款系统架构示意图;

图2为基于大数据智能风控的小额贷款方法流程图;

图3为基于大数据智能风控的小额贷款系统处理流程。

具体实施方式

以下实施例用于说明本发明,但不用来限制本发明的范围。

如图1所示,一种基于大数据智能风控的小额贷款系统,小额贷款系统包括后台管理服务器,后台管理服务器包括前端接入系统1、大数据风控系统2、贷款业务系统3;

前端接入系统1包括后台管理系统接入模块101、官网接入模块102、终端接入模块103、第三方推件接入模块104;后台管理系统接入模块101用于实现对小额贷款系统的业务管理;官网接入模块102用于实现小额贷款系统与官方网站之间的数据对接;终端接入模块103用于实现小额贷款系统与智能终端之间的数据对接;第三方推件接入模块104用于实现小额贷款系统与第三方推荐平台之间的数据对接;

大数据风控系统2包括数据采集模块201、风控引擎模块202、模型训练模块203、信用评估模块204;数据采集模块201用于收集用户数据信息并进行数据预处理;风控引擎模块202利用基于随机森林算法的反欺诈模型进行反欺诈决策;模型训练模块203用于通过至少2个样本集的运行对反欺诈模型进行模型优化;信用评估模块204利用逻辑回归算法对用户信用进行得分评估;

贷款业务系统3包括风控管理模块301;风控管理模块301通过大数据风控系统2对小额贷款系统进行风控管理。

基于大数据智能风控的小额贷款系统的一个实施例中,前端接入系统1还包括微信接入模块105,微信接入模块105用于实现小额贷款系统与微信平台的数据对接,用户通过微信客户端实现小额贷款系统的数据访问。

数据采集模块201收集的用户信息包括常规数据、实时数据,数据采集模块201通过spark通用并行计算框架实现分布式计算。spark是专为大规模数据处理而设计的快速通用的计算引擎,通过在spark上构建处理stream数据的框架,将stream数据分成小的时间片断,以类似batch批量处理的方式来处理这小部分数据。

进一步,常规数据包括身份信息、历史征信报告、个人教育、居住信息,数据采集模块201利用map-reduce原理实现常规数据etl处理。map-reduce是由google在2004年提出的大数据并行编程架构,分为map(映射)和reduce(化简)两个步骤,因此得名,它隐藏并行化、容错、数据分布、负载均衡等细节,可以搭建在普通pc上,程序员可以很方便完成大数据并行编程。etl是英文extract-transform-load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。etl是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。

进一步,实时数据包括人脸识别、定位,数据采集模块201采用消息队列kafka和流计算框架storm处理实时数据。kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据,这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素,这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决,对于像hadoop的一样的日志数据和离线分析系统,但又要求实时处理的限制,这是一个可行的解决方案。kafka的目的是通过hadoop的并行加载机制来统一线上和离线的消息处理,也是为了通过集群来提供实时的消费。storm是个实时的、分布式以及具备高容错的计算系统,同hadoop一样storm也可以处理大批量的数据,然而storm在保证高可靠性的前提下还可以让处理进行的更加实时。storm同样还具备容错和分布计算特性,从而使storm可以扩展到不同的机器上进行大批量的数据处理。

随机森林算法包括至少一个决策树,每个决策树随机采样一组用户的特征,在每个节点判断某一个用户特征和欺诈的关联度并对对每个用户做出欺诈结果决策。逻辑回归算法通过后台管理服务器积累的用户历史数据得出用户还款能力概率和还款意愿概率,还款能力概率通过用户的收入资产情况得出,还款意愿概率通过用户逾期还款、违约违法情况得出。

如图2所示,本发明还提供一种基于大数据智能风控的小额贷款方法,小额贷款方法采用上述的小额贷款系统,小额贷款方法包括以下步骤:

s1:贷款用户提出贷款业务申请,对贷款用户的用户信息进行采集;

s2:生成订单利用基于随机森林算法的反欺诈模型进行反欺诈决策;

s3:对于通过反欺诈模型验证的用户,利用逻辑回归算法对用户信用进行得分评估;

s4:根据用户信用评估得分进行线性拟合,得出用户最终贷款额度。

如图3所示,结合本发明用于消费品的小额贷款的完整处理流程:

消费场景:用户浏览虚拟消费场景进行个人消费;

客源获取:通过客户端、第三方推件进行客源获取;

数据采集评估:利用本发明进行用户数据采集评估;

贷款申请:对用户贷款订单进行录入;

审批:利用本发明进行审批;

签约:生成合同,进行签约;

放款:发出支付指令,自动过账;

贷后跟踪:定期跟踪,进行还款提醒;

还款:通过手机客户端进行还款;

逾期催收:对逾期还款用户进行内部催收、委外催收或司法追偿。

本发明以海量数据为基础,结合人脸识别技术,实现多维度识别用户信息的真实性,发现与规避潜在的欺诈风险,采用了随机森林的算法实现了反欺诈决策,采用了逻辑回归的方法得出还款意愿和还款能力评分。大规模数据可实现快速建模,应用广义线性模型和深度学习,找出数据中隐含复杂非线性关系,根据实际应用场景,通过机器学习等技术训练多个模型,多维度描绘用户画像。本发明整体审核速度快,数据审核全面,风险预判准确性高,有效的降低小额贷款风险。

虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1