一种针对用户画像的信用评估方法与流程

文档序号:25218353发布日期:2021-05-28 14:17阅读:92来源:国知局
一种针对用户画像的信用评估方法与流程

本发明涉及信用评估技术领域,特别涉及一种针对用户画像的信用评估方法。



背景技术:

互联网金融是传统金融单位与互联网部门利用it技术和信通技术实现资金融通、支付、投资和中介服务的新金融业务模式。互联网与金融的融合是大趋势,将对金融产品、业务、组织和服务等方面产生十分深刻的影响。互金对促小微企业发展和扩大就业发挥了远大于现有金融机构的作用,为大众创业、万众创新打开了大门。促进互金顺利发展,有助于提升金融服务质量和效率,加深金融改革,促进金融发展,扩大金融业对内外各地的开放,构建多层次金融架构。作为新生事物,互联网金融既要求市场驱动,鼓励创新,也需要政策扶持,促进发展。现有技术中,金融机构对用户的贷款审批时,会综合考虑用户的信用,对其信用及资产情况进行评估,进而确定是否放贷。在用户存在多头借贷时,不能准确对其信用及资产情况进行评估。多头借贷就是一个借款者向2或2家以上的金融单位提出借贷需求。由于用户的偿还能力是有限的,向多方借款必存在着较高的风险。当超出偿还能力时,只能逾期。由于互金平台的逾期并不计入央行征信,不会对用户借款产生直接影响,也导致一部分用户在逾期时肆无忌惮,同时多头借贷也为各平台审查风控带来巨大挑战。



技术实现要素:

本发明旨在至少一定程度上解决上述技术中的技术问题之一。为此,本发明的目的在于提出一种针对用户画像的信用评估方法,可以对用户的信用进行准确评估,降低金融机构的审查风险。

为达到上述目的,本发明实施例提出了一种针对用户画像的信用评估方法,包括:

s1、金融机构发送用户的手机号码信息及身份证匹配信息至用户画像生成平台;

s2、用户画像生成平台将用户的手机号码信息及身份证匹配信息发送至大数据供应平台;

s3、大数据供应平台根据用户的手机号码信息及身份证匹配信息获取用户的行为信息,并根据用户的行为信息输入预先训练好的用户标签生成模型,输出用户标签反馈至用户画像生成平台;

s4、用户画像生成平台根据用户标签生成用户画像并将所述用户画像发送至金融机构;

s5、金融机构获取用户画像,并对用户画像进行特征提取获取用户的信用数据,根据所述用户的信用数据评定信用等级。

根据本发明实施例提出的一种针对用户画像的信用评估方法,当金融机构在获得了用户充分授权的情况下,将md5加密的手机号码、md5加密的身份证匹配信息,通过专线或vpn连接,发送至用户画像生成平台。可以保证用户的手机号码信息及身份证信息在传输过程中的安全性,避免出现数据被窃取,保护用户的隐私,提高用户体验。用户画像生成平台将用户的手机号码信息及身份证匹配信息发送至大数据供应平台;大数据供应平台根据用户的手机号码信息及身份证匹配信息获取用户的行为信息,并根据用户的行为信息输入预先训练好的用户标签生成模型,输出用户标签反馈至用户画像生成平台;用户的行为信息包括消费情况、旅游情况、资产情况等。用户标签是通过对用户的行为信息进行高度精炼的特征标识,是生成用户画像的核心信息。用户画像生成平台根据用户标签生成用户画像并将所述用户画像发送至金融机构;用户画像是根据用户社会属性、生活行为和消费习惯等信息而抽象出的一个标签化的用户模型。用户画像生成平台只接收生成的用户标签,节省数据传输的成本,保护了用户的隐私信息,不进行多平台的共享信息,保证了大数据供应平台的数据核心竞争力,也确保了数据安全合规性。用户画像可以综合反映用户的相关信息,金融机构根据用户画像进行特征并提取获取用户的信用数据,根据所述用户的信用数据评定信用等级。可以清楚的了解用户是否存在多头借贷的情况,同时可以更全面的获取用户的信用数据,并基于全面的用户数据提高对用户信用评估的准确性,降低了金融机构的审查风险。

根据本发明的一些实施例,所述用户标签生成模型的建立,包括:

大数据供应平台获取样本用户的行为信息并进行预处理;

对预处理后的样本用户的行为信息进行第一次筛选,确定建立用户标签生成模型的变量;

根据pca算法对用户标签生成模型的变量进行处理以建立用户标签生成模型。

根据本发明的一些实施例,所述pca算法包括:

导入确定的用户标签生成模型的变量得到数据样本矩阵;

根据所述样本矩阵计算均值及散布矩阵;

根据所述散布矩阵计算散布矩阵的特征值,并对特征值进行排序,选取p个最大的特征值,计算p个最大的特征值分别对应的特征向量;

将p个最大的特征值分别对应的特征向量进行数据投影,形成投影矩阵以实现降维。

根据本发明的一些实施例,所述预处理包括去重处理、缺失值处理、异常值处理、特征编码处理、标准化处理、正则化处理中的至少一种。

根据本发明的一些实施例,所述大数据供应平台包括:

数据采集器,用于获取从智能终端采集的用户行为信息;

券商业务平台,用于获取用户的证券投资信息;

合作方平台,用于获取用户的行为偏好、消费状况信息;

第三方数据平台,用于获取对用户的特殊信息。

根据本发明的一些实施例,所述金融机构获取用户画像,并对用户画像进行特征提取获取用户的信用数据,根据所述用户的信用数据评定信用等级,包括:

获取用户的信用数据并判断是否预设信用评估条件;

在确定用户的信用数据满足预设信用评估条件时,将用户的信用数据按照不同场景进行分类,获得用户在多个场景下分别对应的信用数据;

将用户在多个场景下分别对应的信用数据输入预先训练好的多场景信用评估模型中,得到多个场景下的信用评分;

根据预设算法将多个场景下的信用评分进行计算,得到用户的综合信用评分,根据综合信用评分确定用户的信用等级。

根据本发明的一些实施例,所述金融机构获取用户画像,并对用户画像进行特征提取获取用户的信用数据,根据所述用户的信用数据评定信用等级,包括:

s11、对用户画像进行特征提取获取用户在多个周期的信用数据;

s12、将用户在多个周期的信用数据输入信用度网络模型中,输出用户在各个周期的信用评分;

s13、根据用户在各个周期的信用评分计算得到用户当前周期的总体的信用评估结果,设置信用等级的取值范围,进而评定用户的信用等级。

根据本发明的一些实施例,所述计算用户当前周期的总体的信用评估结果的算法包括:

s131、获取信用度网络模型的计算函数:

其中,f(i)为样本用户在第i周期的信用评分;n为选取的用于训练信用度网络模型的样本用户计算信用评分的周期总数;ki为信用度网络模型中输入层到输出层的连接权值;β为信用度网络模型的拟合系数;xi为样本用户在第i周期的信用数据;ci为根据n确定的聚类中心;cmax为所选取的聚类中心之间的最大值;z为信用度网络模型的灵敏度阈值;

s132、将用户在m个周期的信用数据输入信用度网络模型中,输出用户在各个周期的信用评分,得到当前周期的f(t)以及前m期的f(t-1)、f(t-2),…,f(t-m);

s133、计算用户第t周期的总体的信用评估结果f(t):

其中,为修正系数;f(t)为用户在第t周期的信用评分,即当前周期的信用评分;f(t-1)为用户在第t-1周期的信用评分;f(t-2)为用户在第t-2周期的信用评分;f(t-m)为用户在第t-m周期的信用评分。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:

图1是根据本发明一个实施例的一种针对用户画像的信用评估方法的流程图;

图2是根据本发明一个实施例的大数据供应平台生成用户标签的示意图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。

下面参考图1至图2来描述本发明实施例提出的一种针对用户画像的信用评估方法。

图1是根据本发明一个实施例的一种针对用户画像的信用评估方法的流程图;如图1所示,包括:

s1、金融机构发送用户的手机号码信息及身份证匹配信息至用户画像生成平台;

s2、用户画像生成平台将用户的手机号码信息及身份证匹配信息发送至大数据供应平台;

s3、大数据供应平台根据用户的手机号码信息及身份证匹配信息获取用户的行为信息,并根据用户的行为信息输入预先训练好的用户标签生成模型,输出用户标签反馈至用户画像生成平台;

s4、用户画像生成平台根据用户标签生成用户画像并将所述用户画像发送至金融机构;

s5、金融机构获取用户画像,并对用户画像进行特征提取获取用户的信用数据,根据所述用户的信用数据评定信用等级。

上述技术方案的工作原理及有益效果:当金融机构在获得了用户充分授权的情况下,将md5加密的手机号码、md5加密的身份证匹配信息,通过专线或vpn连接,发送至用户画像生成平台。可以保证用户的手机号码信息及身份证信息在传输过程中的安全性,避免出现数据被窃取,保护用户的隐私,提高用户体验。用户画像生成平台将用户的手机号码信息及身份证匹配信息发送至大数据供应平台;大数据供应平台根据用户的手机号码信息及身份证匹配信息获取用户的行为信息,并根据用户的行为信息输入预先训练好的用户标签生成模型,输出用户标签反馈至用户画像生成平台;用户的行为信息包括消费情况、旅游情况、资产情况等。用户标签是通过对用户的行为信息进行高度精炼的特征标识,是生成用户画像的核心信息。用户画像生成平台根据用户标签生成用户画像并将所述用户画像发送至金融机构;用户画像是根据用户社会属性、生活行为和消费习惯等信息而抽象出的一个标签化的用户模型。用户画像生成平台只接收生成的用户标签,节省数据传输的成本,保护了用户的隐私信息,不进行多平台的共享信息,保证了大数据供应平台的数据核心竞争力,也确保了数据安全合规性。用户画像可以综合反映用户的相关信息,金融机构根据用户画像进行特征并提取获取用户的信用数据,根据所述用户的信用数据评定信用等级。可以清楚的了解用户是否存在多头借贷的情况,同时可以更全面的获取用户的信用数据,并基于全面的用户数据提高对用户信用评估的准确性,降低了金融机构的审查风险。

根据本发明的一些实施例,所述用户标签生成模型的建立,包括:

大数据供应平台获取样本用户的行为信息并进行预处理;

对预处理后的样本用户的行为信息进行第一次筛选,确定建立用户标签生成模型的变量;

根据pca算法对用户标签生成模型的变量进行处理以建立用户标签生成模型。

上述技术方案的工作原理及有益效果:pca(principalcomponentanalysis)主成分分析,是一种统计方法。对预处理后的样本用户的行为信息进行第一次筛选,确定建立用户标签生成模型的变量,可以反映模型的数据稳定性、数据质量等。通过pca算法在对用户标签生成模型的变量进行处理时,使得数据更易使用,并且可以去除数据中的噪声,使得其他机器学习任务更加精确,同时可以进行数据降维,降低计算量及计算复杂度。

根据本发明的一些实施例,所述pca算法包括:

导入确定的用户标签生成模型的变量得到数据样本矩阵;

根据所述样本矩阵计算均值及散布矩阵;

根据所述散布矩阵计算散布矩阵的特征值,并对特征值进行排序,选取p个最大的特征值,计算p个最大的特征值分别对应的特征向量;

将p个最大的特征值分别对应的特征向量进行数据投影,形成投影矩阵以实现降维。

上述技术方案的工作原理及有益效果:导入已经处理好的数据集并生成样本矩阵,并导入相关算法的开源库。根据所述样本矩阵计算均值及散布矩阵;根据所述散布矩阵计算散布矩阵的特征值,根据所述散布矩阵计算散布矩阵的特征值,并对特征值进行排序,选取p个最大的特征值,计算p个最大的特征值分别对应的特征向量;保留了特征值序列中的前p个作为主成分,并根据对应的特征向量生成了新的映射空间,将数据导入到新的映射空间中完成降维。

根据本发明的一些实施例,所述预处理包括去重处理、缺失值处理、异常值处理、特征编码处理、标准化处理、正则化处理中的至少一种。

上述技术方案的工作原理及有益效果:去重处理:去掉数据集中重复出现的数据。缺失值处理:缺失值是指原始数据中由于缺失信息而导致的数据的聚类、分组、删失或截断。它指的是现有数据集中某个或某些属性的值是不完全的,通常对其进行删除或者填补操作。异常值处理:即在数据集中存在不正常的值,通常需要判别是否异常并进行相应的修正。特征编码处理:通常原始数据中的有些特征是无法直接被模型识别的,需要将这些特征转换为数学模型能够识别的模式,使用特征二元化或独热编码对分类变量进行处理。标准化处理:数据的标准化是将数据进行缩放,使之落入一个小的特定区间,便于不同单位或量级的指标能够进行比较和加权。正则化处理用于防止数据过拟合。

根据本发明的一些实施例,所述大数据供应平台包括:

数据采集器,用于获取从智能终端采集的用户行为信息;

券商业务平台,用于获取用户的证券投资信息;

合作方平台,用于获取用户的行为偏好、消费状况信息;

第三方数据平台,用于获取对用户的特殊信息。

上述技术方案的工作原理及有益效果:数据采集器指在pc端或者移动端,通过api,sdk,js等软件方式采集到的客户行为信息。券商业务平台采集的数据主要有证券交易所以公开、集中的方式进行的集中竞价交易,大宗交易,协议转让,盘后交易等买卖的集中交易数据信息。投资者向具有融资融券业务资格的证券公司提供担保物,借入资金买入证券或借入证券并卖出等交易行为的融资融券数据。用户在券商的线上投资平台,投资分析决策系统等投资系统上进行买卖的投资系统数据。合作方平台采集的数据主要是与用户画像生成平台存在合作关系的机构所提供的反应客户行为偏好,消费状况等相关情况的数据信息,包括公共号数据,电商站数据,媒体数据等;第三方数据平台是大流量平台利用其数据能力推出的满足特定的部门或者用户对于数据的需求的开放性数据产品市场。大数据供应平台可以采集更加全面的用户数据,生成更准确的用户标签,进而生成更准确的用户图像,提高对用户信息评估的准确性。

根据本发明的一些实施例,所述金融机构获取用户画像,并对用户画像进行特征提取获取用户的信用数据,根据所述用户的信用数据评定信用等级,包括:

获取用户的信用数据并判断是否预设信用评估条件;

在确定用户的信用数据满足预设信用评估条件时,将用户的信用数据按照不同场景进行分类,获得用户在多个场景下分别对应的信用数据;

将用户在多个场景下分别对应的信用数据输入预先训练好的多场景信用评估模型中,得到多个场景下的信用评分;

根据预设算法将多个场景下的信用评分进行计算,得到用户的综合信用评分,根据综合信用评分确定用户的信用等级。

上述技术方案的工作原理及有益效果:用户在使用花呗、共享单车、共享充电宝时产生的行为信息也是作为评估用户信用的一部分,将用户在多个场景下分别对应的信用数据输入预先训练好的多场景信用评估模型中,得到多个场景下的信用评分;根据预设算法将多个场景下的信用评分进行计算,得到用户的综合信用评分,根据综合信用评分确定用户的信用等级。提高对用户的信用评分的准确性。

根据本发明的一些实施例,所述金融机构获取用户画像,并对用户画像进行特征提取获取用户的信用数据,根据所述用户的信用数据评定信用等级,包括:

s11、对用户画像进行特征提取获取用户在多个周期的信用数据;

s12、将用户在多个周期的信用数据输入信用度网络模型中,输出用户在各个周期的信用评分;

s13、根据用户在各个周期的信用评分计算得到用户当前周期的总体的信用评估结果,设置信用等级的取值范围,进而评定用户的信用等级。

上述技术方案的工作原理及有益效果:将从用户画像里面进行特征提取的用户的信用数据按照预设周期间隔,设置为多个周期,将用户的多个周期的信用数据输入信用度网络模型,输出用户在各个周期的信用评分,根据用户的在各个周期的信用评分进行综合计算,得到对用户当前的信用的评估结果,综合考虑用户的历史信用评分,使的计算出的用户当前的信用评估结果更加准确,由此,根据设置的信用等级的取值范围,计算出准确的用户的信用等级。预设周期间隔可以是1年,预设周期间隔越短,计算出的用户当前的信用的评估结果越准确。

根据本发明的一些实施例,所述计算用户当前周期的总体的信用评估结果的算法包括:

s131、获取信用度网络模型的计算函数:

其中,f(i)为样本用户在第i周期的信用评分;n为选取的用于训练信用度网络模型的样本用户计算信用评分的周期总数;ki为信用度网络模型中输入层到输出层的连接权值;β为信用度网络模型的拟合系数;xi为样本用户在第i周期的信用数据;ci为根据n确定的聚类中心;cmax为所选取的聚类中心之间的最大值;z为信用度网络模型的灵敏度阈值;

s132、将用户在m个周期的信用数据输入信用度网络模型中,输出用户在各个周期的信用评分,得到当前周期的f(t)以及前m期的f(t-1)、f(t-2),…,f(t-m);

s133、计算用户第t周期的总体的信用评估结果f(t):

其中,为修正系数;f(t)为用户在第t周期的信用评分,即当前周期的信用评分;f(t-1)为用户在第t-1周期的信用评分;f(t-2)为用户在第t-2周期的信用评分;f(t-m)为用户在第t-m周期的信用评分。

上述技术方案的工作原理及有益效果:首先通过得到样本用户在多个周期的信用数据、信用评分等信息,根据样本用户的相关信息训练信用度网络模型,使信用度网络模型的模型参数不断优化更新,确定出准确的计算函数。示例的,设定用户a,将用户a在m个周期的信用数据输入信用度网络模型中,输出用户a在各个周期的信用评分,根据公式(2)及用户a在各个周期的信用评分,对用户a在当前周期的总体的信用评估结果进行计算,计算出的用户a在当前周期的总体的信用评估结果更加准确,有利于确定用户a在当前周期准确的信用等级,为金融机构提供有效的数据参考。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1