本发明涉及风险控制技术领域,更具体的,涉及一种基于连接函数的还款意愿预测方法及系统。
背景技术:
在风险控制系统中,信贷申请人的基本信息:年龄、婚姻情况、家庭情况、教育背景和工作情况属于重要考察因素,对评估信贷申请人的基本品质和还款意愿具有重要作用。
然而,目前风险控制技术中对申请人还款意愿的评估方法主要依赖主观判断,或根据某个维度对申请人进行还款意愿的评估,如根据收入情况或工作情况等某一个维度进行还款意愿评估。
显然,主观判断往往依靠经验,缺乏数据支持,还款意愿预测的准确度较低。根据某个维度对申请人进行还款意愿的评估,由于只考虑某个维度还款意愿预测的准确度也较低。例如:一个35岁,结婚10年,有两个孩子的人,与25岁,结婚4年,有一个孩子的人,很难准确判断在还款意愿上有什么不同。
技术实现要素:
有鉴于此,本发明提供了一种基于连接函数的还款意愿预测方法及系统,对信贷申请人的基本信息进行连续性、客观的评估,提高了对信贷申请人还款意愿的预测准确度。
为了实现上述发明目的,本发明提供的具体技术方案如下:
一种基于连接函数的还款意愿预测方法,包括:
获取目标申请人的基本信息;
对所述目标申请人的基本信息进行向量化处理,得到所述目标申请人的多个向量,以及每个所述向量的映射值;
按预设规则,对多个所述向量进行分组,得到多个向量组合;
分别以每个所述向量组合中所述向量的映射值为输入数据,调用每个所述向量组合对应的多元联合概率密度函数及连接函数,计算每个所述向量组合的积分值;
分别判断每个所述向量组合的积分值是否在对应的阈值范围内;
当所有所述向量组合的积分值都在对应的阈值范围内时,判定所述目标申请人具有还款意愿。
优选的,所述目标申请人的基本信息包括年龄、婚姻情况、家庭情况、教育背景、工作情况和收入情况。
优选的,对所述目标申请人的基本信息进行向量化处理,得到所述目标申请人的多个向量,以及每个所述向量的映射值,包括:
按预设分类规则对所述目标申请人的基本信息进行分类,并将每类基本信息表示为向量,得到所述目标申请人的多个向量;
分别将每个所述向量输入到相应的映射函数中,计算每个所述向量的映射值。
优选的,所述按预设规则,对多个所述向量进行分组,得到多个向量组合,包括:
根据每个所述向量所表示的所述目标申请人的基本信息,将多个所述向量分为第一向量集合和第二向量集合,所述第一向量集合表示所述目标申请人的年龄、婚姻情况和家庭情况,所述第二向量集合表示所述目标申请人的教育背景、工作情况和收入情况;
将所述第一向量集合中任意两个向量或任意三个向量确定为一个向量组合,并将所述第二向量集合中任意两个向量或任意三个向量确定为一个向量组合。
优选的,所述方法还包括:
当任意一个所述向量组合的积分值不在对应的阈值范围内时,判定所述目标申请人不具有还款意愿。
一种基于连接函数的还款意愿预测系统,包括:
获取单元,用于获取目标申请人的基本信息;
向量化处理单元,用于对所述目标申请人的基本信息进行向量化处理,得到所述目标申请人的多个向量,以及每个所述向量的映射值;
分组单元,用于按预设规则,对多个所述向量进行分组,得到多个向量组合;
计算单元,用于分别以每个所述向量组合中所述向量的映射值为输入数据,调用每个所述向量组合对应的多元联合概率密度函数及连接函数,计算每个所述向量组合的积分值;
判断单元,用于分别判断每个所述向量组合的积分值是否在对应的阈值范围内;
第一判定单元,用于当所有所述向量组合的积分值都在对应的阈值范围内时,判定所述目标申请人具有还款意愿。
优选的,所述目标申请人的基本信息包括年龄、婚姻情况、家庭情况、教育背景、工作情况和收入情况。
优选的,所述向量化处理单元包括:
向量化表示子单元,用于按预设分类规则对所述目标申请人的基本信息进行分类,并将每类基本信息表示为向量,得到所述目标申请人的多个向量;
计算子单元,用于分别将每个所述向量输入到相应的映射函数中,计算每个所述向量的映射值。
优选的,所述分组单元包括:
第一分组子单元,用于根据每个所述向量所表示的所述目标申请人的基本信息,将多个所述向量分为第一向量集合和第二向量集合,所述第一向量集合表示所述目标申请人的年龄、婚姻情况和家庭情况,所述第二向量集合表示所述目标申请人的教育背景、工作情况和收入情况;
第二分组子单元,用于将所述第一向量集合中任意两个向量或任意三个向量确定为一个向量组合,并将所述第二向量集合中任意两个向量或任意三个向量确定为一个向量组合。
优选的,所述系统还包括:
第二判定单元,用于当任意一个所述向量组合的积分值不在对应的阈值范围内时,判定所述目标申请人不具有还款意愿。
相对于现有技术,本发明的有益效果如下:
本发明提供的一种基于连接函数的还款意愿预测方法及系统,根据目标申请人的基本信息对目标申请人的还款意愿进行多维度预测,并提供了一种连续性量化机制,将目标申请人的基本信息进行向量化处理,得到所述目标申请人的多个向量,以及每个所述向量的映射值;按预设规则,对多个所述向量进行分组,得到多个向量组合;分别以每个所述向量组合中所述向量的映射值为输入数据,调用每个所述向量组合对应的多元联合概率密度函数及连接函数,计算每个所述向量组合的积分值;分别判断每个所述向量组合的积分值是否在对应的阈值范围内;当所有所述向量组合的积分值都在对应的阈值范围内时,判定所述目标申请人具有还款意愿。提高了还款意愿预测的准确性。同时,目标申请人的基本信息不包括敏感数据,仅根据脱敏数据就可以实现对目标申请人的还款意愿的预测,保护了用户隐私。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种基于连接函数的还款意愿预测方法流程图;
图2为本发明实施例公开的一种基于连接函数的还款意愿预测系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本实施例公开了一种基于连接函数的还款意愿预测方法,具体包括以下步骤:
s101:获取目标申请人的基本信息;
优选的,所述目标申请人的基本信息包括年龄、婚姻情况、家庭情况、教育背景、工作情况和收入情况等维度。具体的,每个维度还可以包括多个维度的信息,例如,婚姻情况维度可以包括结婚次数和婚龄,家庭情况维度可以包括孩子数量和孩子年龄。
当然,目标申请人的基本信息涉及的维度越多,越能准确反映目标申请人的还款意愿。
例如,当目标申请人25岁,结婚5年,2个孩子时,目标申请人年纪不大,婚龄步长,但生育了2个孩子,可能是有父母家庭支持,目标用户的还款能力还包括了父母家庭的还款能力。此时,考虑目标申请人父母工作情况能更准确的反应目标申请人的还款意愿。所述目标申请人的基本信息还可以包括父母工作情况等等。
s102:对所述目标申请人的基本信息进行向量化处理,得到所述目标申请人的多个向量,以及每个所述向量的映射值;
目标申请人的基本信息,例如,教育背景中的学历、毕业院校、专业等都是文本形式,为了便于后续计算,需要将目标申请人的基本信息转化为向量,并将每种基本信息最后处理得到一个数值。
一种优选的实施方式为:
按预设分类规则对所述目标申请人的基本信息进行分类,并将每类基本信息表示为向量,得到所述目标申请人的多个向量;
分别将每个所述向量输入到相应的映射函数中,计算每个所述向量的映射值。
需要说明的是,每类基本信息表示目标申请人某一维度的基本信息,当每类基本信息又包括多种维度信息时,对目标申请人的基本信息进行向量化处理后得到多个向量,每个向量表示某一维度的基本信息中的多种维度信息,例如,向量b=(b1,b2)表示婚姻情况,其中,b1表示结婚次数,b2表示婚龄。
每个向量对应的映射函数不相同,系统经过训练数据,对每个向量都会产生其特定的映射函数。
s103:按预设规则,对多个所述向量进行分组,得到多个向量组合;
根据每个所述向量所表示的所述目标申请人的基本信息,将多个所述向量分为第一向量集合和第二向量集合,所述第一向量集合表示所述目标申请人的年龄、婚姻情况和家庭情况,所述第二向量集合表示所述目标申请人的教育背景、工作情况和收入情况;
将所述第一向量集合中任意两个向量或任意三个向量确定为一个向量组合,并将所述第二向量集合中任意两个向量或任意三个向量确定为一个向量组合。
当然,上述仅为本实施例中的一种分组方式,还可以在多个所述向量中将任意两个或三个向量分成一组,在此不做具体限定。
s104:分别以每个所述向量组合中所述向量的映射值为输入数据,调用每个所述向量组合对应的多元联合概率密度函数及连接函数,计算每个所述向量组合的积分值;
需要说明的是,所述连接函数为copula,每个向量组合对应的多元联合概率密度函数及连接函数不同,每个向量组合对应的阈值范围也不同。
对于每一个向量组合,向量组合中向量的映射值为输入数据,调用向量组合对应的多元联合概率密度函数及连接函数,计算所述向量组合的积分值,具体为:
调用所述向量组合对应的多元联合概率密度函数和其连接函数,先根据所述向量组合中向量的映射值进行连接函数的积分计算得到多元联合概率密度函数的参数值,再进行多元联合概率密度函数的积分计算,最终得到所述向量组合的积分值。
s105:分别判断每个所述向量组合的积分值是否在对应的阈值范围内;若是,执行s106,若否,执行s107;
s106:判定所述目标申请人具有还款意愿;
s107:判定所述目标申请人不具有还款意愿。
需要说明的是,当所有所述向量组合的积分值都在对应的阈值范围内时,判定所述目标申请人满足还款意愿指标,即,所述目标申请人具有还款意愿,当任意一个所述向量组合的积分值不在对应的阈值范围内时,判定所述目标申请人不具有还款意愿。
本实施例公开的一种基于连接函数的还款意愿预测方法,根据目标申请人的基本信息对目标申请人的还款意愿进行多维度预测,并提供了一种连续性量化机制,将目标申请人的基本信息进行向量化处理,得到所述目标申请人的多个向量,以及每个所述向量的映射值;按预设规则,对多个所述向量进行分组,得到多个向量组合;分别以每个所述向量组合中所述向量的映射值为输入数据,调用每个所述向量组合对应的多元联合概率密度函数及连接函数,计算每个所述向量组合的积分值;分别判断每个所述向量组合的积分值是否在对应的阈值范围内;当所有所述向量组合的积分值都在对应的阈值范围内时,判定所述目标申请人具有还款意愿。提高了还款意愿预测的准确性。同时,目标申请人的基本信息不包括敏感数据,仅根据脱敏数据就可以实现对目标申请人的还款意愿的预测,保护了用户隐私。
为了进一步阐述本实施例公开的还款意愿的预测方法,下面通过一个场景实施例进行详细说明。
以目标申请人的基本信息包括年龄、婚姻情况、家庭情况、教育背景、工作情况和收入情况为例。
年龄包括年龄值;婚姻情况包括:结婚次数、婚龄;家庭情况包括:孩子数量、孩子年龄;教育背景包括:学历、毕业院校、专业;工作情况包括:职业、工作城市、参加工作时间;收入情况包括:年化总收入、年均收入。
根据上述分类将每类基本信息表示为向量,即:向量a表示年龄、向量b表示婚姻情况、向量c表示家庭情况、向量d表示教育背景、向量e表示工作情况、向量f表示收入情况。
根据预先设定好的学历、毕业院校、专业、职业、工作城市对应的数据,得到目标申请人的多个向量:
a=(a1);
b=(b1,b2);
c=(c1,c2);
d=(d1,d2,d3);
e=(e1,e2,e3);
f=(f1,f2)。
分别将每个所述向量输入到相应的映射函数中,计算每个所述向量的映射值:
f(a)=xa;
f(b)=xb;
f(c)=xc;
f(d)=xd;
f(e)=xe;
f(f)=xf。
将多个所述向量分为第一向量集合和第二向量集合,第一向量集合包括向量a、向量b和向量c,第二向量集合包括向量d、向量e和向量f。
将所述第一向量集合中任意两个向量或任意三个向量确定为一个向量组合,并将所述第二向量集合中任意两个向量或任意三个向量确定为一个向量组合,得到如下组合:
(xa,xb)、(xa,xc)、(xb,xc)、(xa,xb,xc)、(xd,xe)、(xd,xf)(xe,xf)和(xd,xe,xf)。
以组合(xa,xb)为例,连接函数为f1,联合概率密度函数为f2,输入数据为(xa,xb),阈值范围为(0,y1),参数值为∫f1(xa,xb)=g1,根据所述参数值计算积分值,积分值为∫f2(xa,xb)=g2,判断g2是否在(0,y1)内。例如,联合概率密度函数为f2为正态分布概率密度函数,经过连接函数f1计算得到的参数值为平均值和方差。
依次类推,分别计算其他组合的积分值,并分别判断每个组合的积分值是否在对应的阈值范围内,当所有所述向量组合的积分值都在对应的阈值范围内时,判定所述目标申请人具有还款意愿。
基于上述实施例公开的一种基于连接函数的还款意愿预测方法,请参阅图2,本实施例公开了一种基于连接函数的还款意愿预测系统,具体包括:
获取单元201,用于获取目标申请人的基本信息;
优选的,所述目标申请人的基本信息包括年龄、婚姻情况、家庭情况、教育背景、工作情况和收入情况。
向量化处理单元202,用于对所述目标申请人的基本信息进行向量化处理,得到所述目标申请人的多个向量,以及每个所述向量的映射值;
分组单元203,用于按预设规则,对多个所述向量进行分组,得到多个向量组合;
计算单元204,用于分别以每个所述向量组合中所述向量的映射值为输入数据,调用每个所述向量组合对应的多元联合概率密度函数及连接函数,计算每个所述向量组合的积分值;
判断单元205,用于分别判断每个所述向量组合的积分值是否在对应的阈值范围内;
第一判定单元206,用于当所有所述向量组合的积分值都在对应的阈值范围内时,判定所述目标申请人具有还款意愿。
第二判定单元207,用于当任意一个所述向量组合的积分值不在对应的阈值范围内时,判定所述目标申请人不具有还款意愿。
优选的,所述向量化处理单元202包括:
向量化表示子单元,用于按预设分类规则对所述目标申请人的基本信息进行分类,并将每类基本信息表示为向量,得到所述目标申请人的多个向量;
计算子单元,用于分别将每个所述向量输入到相应的映射函数中,计算每个所述向量的映射值。
优选的,所述分组单元203包括:
第一分组子单元,用于根据每个所述向量所表示的所述目标申请人的基本信息,将多个所述向量分为第一向量集合和第二向量集合,所述第一向量集合表示所述目标申请人的年龄、婚姻情况和家庭情况,所述第二向量集合表示所述目标申请人的教育背景、工作情况和收入情况;
第二分组子单元,用于将所述第一向量集合中任意两个向量或任意三个向量确定为一个向量组合,并将所述第二向量集合中任意两个向量或任意三个向量确定为一个向量组合。
本实施例公开的一种基于连接函数的还款意愿预测系统,根据目标申请人的基本信息对目标申请人的还款意愿进行多维度预测,并提供了一种连续性量化机制,将目标申请人的基本信息进行向量化处理,得到所述目标申请人的多个向量,以及每个所述向量的映射值;按预设规则,对多个所述向量进行分组,得到多个向量组合;分别以每个所述向量组合中所述向量的映射值为输入数据,调用每个所述向量组合对应的多元联合概率密度函数及连接函数,计算每个所述向量组合的积分值;分别判断每个所述向量组合的积分值是否在对应的阈值范围内;当所有所述向量组合的积分值都在对应的阈值范围内时,判定所述目标申请人具有还款意愿。提高了还款意愿预测的准确性。同时,目标申请人的基本信息不包括敏感数据,仅根据脱敏数据就可以实现对目标申请人的还款意愿的预测,保护了用户隐私。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。