一种基于深度学习模型的借贷意愿预估方法及系统与流程

文档序号:28500169发布日期:2022-01-15 04:46阅读:158来源:国知局
一种基于深度学习模型的借贷意愿预估方法及系统与流程

1.本发明涉及新一代信息技术相关技术领域,具体涉及一种基于深度学习模型的借贷意愿预估方法及系统。


背景技术:

2.在金融行业中,传统的金融机构依靠客户的借贷案例结合专业经验对客户进行大体的需求评估,进而可以为客户提供更精准的金融服务。随着人工智能的蓬勃发展,通过采集大数据对客户的需求进行评估的方法逐渐被提出。
3.目前的技术主要通过采集近期的客户数据,依赖专家经验人工标识客户的特征信息,进而训练模型对近期的数据处理评估客户需求,提高服务精准度。
4.但本技术发明人在实现本技术实施例中发明技术方案的过程中,发现上述技术至少存在如下技术问题:
5.现有技术中需要依赖专家经验对数据特征进行标注且由于缺乏包含时间序列的要素,使得无法对未来时间窗口内的行为趋势做预估,进而导致存在特征标注工作量较大且对客户需求预测准确度不足的技术问题。


技术实现要素:

6.本技术实施例通过提供了一种基于深度学习模型的借贷意愿预估方法及系统,解决了现有技术中需要依赖专家经验对数据特征进行标注且由于缺乏包含时间序列的要素,使得无法对未来时间窗口内的行为趋势做预估,进而导致存在特征标注工作量较大且对客户需求预测准确度不足的技术问题。通过采集借贷数据,并对借贷数据进行基本处理,得到结构化的数值数据和非结构化的文本数据,再将时间序列要素添加结构化的数值数据和非结构化的文本数据中,提取客户的行为特征信息,进而使用特征信息训练模型,得到客户的需求预测信息,再依据外部的有效借贷数据对模型进行增量学习,进而模型输出的借贷需求预测信息就是符合客户及金融机构本身实情的结果,加入时间要素且自动提取特征,再增加入有效借贷数据训练模型,达到了提高了模型的泛化能力与预测准确度的技术效果。
7.鉴于上述问题,本技术实施例提供了一种基于深度学习模型的借贷意愿预估方法及系统。
8.第一方面,本技术实施例提供了一种基于深度学习模型的借贷意愿预估方法,其中,所述方法包括:通过对借贷数据进行数据采集和比例划分,获得第一借贷数据;将所述第一借贷数据输入数据处理模块中,其中,所述数据处理模块中包括数值处理单元和文本处理单元;根据所述数据处理模块,获得第一输出数据;将所述第一输出数据输入深度学习模型中从时间序列中提取用户第一代表行为特征;将所述第一代表行为特征作为第一输入信息;将所述第一输入信息作为训练借贷意愿预估模型的基础训练数据进行模型训练,获得第一预估信息;通过对用户的借贷外部变量进行有效性分析,获得第一有效借贷变量;将所述第一有效借贷变量对所述借贷意愿预估模型进行增量学习,获得所述借贷意愿预估模
型输出的第二预估信息。
9.另一方面,本技术实施例提供了一种基于深度学习模型的借贷意愿预估系统,其中,所述系统包括:第一获得单元:所述第一获得单元用于通过对借贷数据进行数据采集和比例划分,获得第一借贷数据;第一输入单元:所述第一输入单元用于将所述第一借贷数据输入数据处理模块中,其中,所述数据处理模块中包括数值处理单元和文本处理单元;第二获得单元:所述第二获得单元用于根据所述数据处理模块,获得第一输出数据;第一提取单元:所述第一提取单元用于将所述第一输出数据输入深度学习模型中从时间序列中提取用户第一代表行为特征;第一设定单元:所述第一设定单元用于将所述第一代表行为特征作为第一输入信息;第一处理单元:所述第一处理单元用于将所述第一输入信息作为训练借贷意愿预估模型的基础训练数据进行模型训练,获得第一预估信息;第二处理单元:所述第二处理单元用于通过对用户的借贷外部变量进行有效性分析,获得第一有效借贷变量;第三处理单元:所述第三处理单元用于将所述第一有效借贷变量对所述借贷意愿预估模型进行增量学习,获得所述借贷意愿预估模型输出的第二预估信息。
10.第三方面,本技术实施例提供了一种基于深度学习模型的借贷意愿预估系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现第一方面任一项所述方法的步骤。
11.本技术实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
12.由于采用了通过对借贷数据进行数据采集和比例划分,获得第一借贷数据;将所述第一借贷数据输入数据处理模块中,其中,所述数据处理模块中包括数值处理单元和文本处理单元;根据所述数据处理模块,获得第一输出数据;将所述第一输出数据输入深度学习模型中从时间序列中提取用户第一代表行为特征;将所述第一代表行为特征作为第一输入信息;将所述第一输入信息作为训练借贷意愿预估模型的基础训练数据进行模型训练,获得第一预估信息;通过对用户的借贷外部变量进行有效性分析,获得第一有效借贷变量;将所述第一有效借贷变量对所述借贷意愿预估模型进行增量学习,获得所述借贷意愿预估模型输出的第二预估信息的技术方案,通过采集借贷数据,并对借贷数据进行基本处理,得到结构化的数值数据和非结构化的文本数据,再将时间序列要素添加结构化的数值数据和非结构化的文本数据中,提取客户的行为特征信息,进而使用特征信息训练模型,得到客户的需求预测信息,再依据外部的有效借贷数据对模型进行增量学习,进而模型输出的借贷需求预测信息就是符合客户及金融机构本身实情的结果,加入时间要素且自动提取特征,再增加入有效借贷数据训练模型,达到了提高了模型的泛化能力与预测准确度的技术效果。
13.上述说明仅是本技术技术方案的概述,为了能够更清楚了解本技术的技术手段,而可依照说明书的内容予以实施,并且为了让本技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本技术的具体实施方式。
附图说明
14.图1为本技术实施例提供了一种基于深度学习模型的借贷意愿预估方法流程示意图;
15.图2为本技术实施例提供了一种基于深度学习模型的借贷意愿预估模型的模型输
出不确定性确定方法流程示意图;
16.图3为本技术实施例提供了一种基于深度学习模型的借贷意愿预估过程置信区间确定方法流程示意图;
17.图4为本技术实施例提供了一种基于深度学习模型的借贷意愿预估系统结构示意图;
18.图5为本技术实施例示例性电子设备的结构示意图。
19.附图标记说明:第一获得单元11,第一输入单元12,第二获得单元13,第一提取单元14,第一设定单元15,第一处理单元16,第二处理单元17,第三处理单元18,电子设备300,存储器301,处理器302,通信接口303,总线架构304。
具体实施方式
20.本技术实施例通过提供了一种基于深度学习模型的借贷意愿预估方法及系统,解决了现有技术中需要依赖专家经验对数据特征进行标注且由于缺乏包含时间序列的要素,使得无法对未来时间窗口内的行为趋势做预估,进而导致存在特征标注工作量较大且对客户需求预测准确度不足的技术问题。通过采集借贷数据,并对借贷数据进行基本处理,得到结构化的数值数据和非结构化的文本数据,再将时间序列要素添加结构化的数值数据和非结构化的文本数据中,提取客户的行为特征信息,进而使用特征信息训练模型,得到客户的需求预测信息,再依据外部的有效借贷数据对模型进行增量学习,进而模型输出的借贷需求预测信息就是符合客户及金融机构本身实情的结果,加入时间要素且自动提取特征,再增加入有效借贷数据训练模型,达到了提高了模型的泛化能力与预测准确度的技术效果。
21.申请概述
22.在金融行业中,传统的金融机构依靠客户的借贷案例结合专业经验对客户进行大体的需求评估,进而可以为客户提供更精准的金融服务。随着人工智能的蓬勃发展,通过采集大数据对客户的需求进行评估的方法逐渐被提出。目前的技术主要通过采集近期的客户数据,依赖专家经验人工标识客户的特征信息,进而训练模型对近期的数据处理评估客户需求,提高服务精准度。但现有技术中需要依赖专家经验对数据特征进行标注且由于缺乏包含时间序列的要素,使得无法对未来时间窗口内的行为趋势做预估,进而导致存在特征标注工作量较大且对客户需求预测准确度不足的技术问题。
23.针对上述技术问题,本技术提供的技术方案总体思路如下:
24.本技术实施例提供了一种基于深度学习模型的借贷意愿预估方法,其中,所述方法包括:通过对借贷数据进行数据采集和比例划分,获得第一借贷数据;将所述第一借贷数据输入数据处理模块中,其中,所述数据处理模块中包括数值处理单元和文本处理单元;根据所述数据处理模块,获得第一输出数据;将所述第一输出数据输入深度学习模型中从时间序列中提取用户第一代表行为特征;将所述第一代表行为特征作为第一输入信息;将所述第一输入信息作为训练借贷意愿预估模型的基础训练数据进行模型训练,获得第一预估信息;通过对用户的借贷外部变量进行有效性分析,获得第一有效借贷变量;将所述第一有效借贷变量对所述借贷意愿预估模型进行增量学习,获得所述借贷意愿预估模型输出的第二预估信息。
25.在介绍了本技术基本原理后,下面将结合说明书附图来具体介绍本技术的各种非
限制性的实施方式。
26.实施例一
27.如图1所示,本技术实施例提供了一种基于深度学习模型的借贷意愿预估方法,其中,所述方法包括:
28.s100:通过对借贷数据进行数据采集和比例划分,获得第一借贷数据;
29.具体而言,所述第一借贷数据为依据大数据对借贷客户数据进行采集并进行比例划分处理后的数据集合。处理方式举不设限制的一例:基于大数据对客户的借贷数据进行采集存储后,按照8:1:1的比例分别划分为训练数据集、验证数据集和测试数据集,其中,训练数据集用来后步训练客户借贷意愿预测模型的训练数据,验证数据集用来验证模型迭代的性能稳定程度,测试数据集用来检测模型的输出准确性和收敛程度,举例的划分比例并不对实际的划分比例进行限制,其它可以实现相同作用的划分比例同样落入本技术实施例的保护范围之内。通过将基于大数据采集的借贷数据进行比例划分后存储,得到第一借贷数据,为后步的模型训练提供全面的数据基础。
30.s200:将所述第一借贷数据输入数据处理模块中,其中,所述数据处理模块中包括数值处理单元和文本处理单元;
31.s300:根据所述数据处理模块,获得第一输出数据;
32.具体而言,所述数据处理模型为对数据进行预处理的模型,优选的预处理方式为主要分为两类:
33.当所述第一借贷数据为结构化的数值数据,则输入所述数据处理模型中的数值处理单元进行标准化(归一化)处理,示例性的使用min-max标准化处理方法或z-score标准化处理方法对所述第一借贷数据进行标准处理,所述第一借贷数据经过数据标准化处理后,各指标处于同一数量级,对于数值型数据进行标准化处理,方便在随机梯度下降的过程中,模型的结果可以更快的获得收敛性;对所述第一借贷数据去趋势性(上升/下降)和去周期性,以确保从时间序列中提取到最基本行为特征。
34.当所述第一借贷数据为非结构化的文本数据时,则输入所述数据处理模型中的文本处理单元进行特征数字化预处理,示例性的基于one-hot编码使用整数进行编码,编码过程即为使用n位状态寄存器来对所述第一借贷数据同一时间节点下借贷客户的n个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效,通过对非结构化的文本数据进行预处理便于和后步基于时间序列提取的行为特征向量相互对应。
35.在将所述第一借贷数据使用上述两种方式处理后,再将处理后的数据去中心化,去中心化之后所有的训练数据的重要程度都是相同的,避免其中一组训练数据的影响较大,进而提高训练得到模型的泛化能力,提高模型的处理数据准确性。通过对所述第一借贷数据进行预处理,得到的所述第一输出数据更加适用于模型构建的数据集合,提高了模型的可构建性,增加了模型的落地可能性。
36.s400:将所述第一输出数据输入深度学习模型中从时间序列中提取用户第一代表行为特征;
37.具体而言,为了增强基于所述第一输出数据对于客户未来时间需求预测的准确度,将所述第一输出数据输入深度学习模型中提取出和时间序列对应的用户行为特征,记为所述第一代表行为特征。示例性的:所述深度学习模型使用encoder-decoder lstm模型,
即为时间序列预测模型的一种,该encoder-decoder lstm模型由两个子模型组成双层结构,第一层子模型:用于读取和编码输入序列的encoder编码器;第二层子模型:将读取编码的输入序列并对输出序列中的每个元素进行时间序列下的用户行为特征预测的decoder解码器,其和lstm模型相连;通过多组处理,得到表征所述第一输出数据中单个元素在时间序列下的用户行为特征及对应用户预测行为的特征向量,记为所述第一行为特征返回保存至第一层的编码器中,当采集的特征向量达到预设覆盖率和预设数据量时停止采集,其中,预设覆盖率为预设的特征向量覆盖用户特征行为的种类的比例,预设数据量为预设的足够训练模型的数据量,都可以自行设定,在此不做限制。通过采集足够且具代表性的用户第一代表行为特征的特征向量,提高了模型对于客户未来时间需求预测精准度。
38.s500:将所述第一代表行为特征作为第一输入信息;
39.s600:将所述第一输入信息作为训练借贷意愿预估模型的基础训练数据进行模型训练,获得第一预估信息;
40.具体而言,将所述第一代表行为特征设定为所述第一输入信息训练借贷意愿预估模型,其中借贷意愿预测模型为基于神经网络训练的智能化模型,优选的构建方式为在上述深度学习模型的基础上,在编码器中存储的特征向量达到预设覆盖率和预设数据量时,去除解码器,在原有的编码器encoder上外接一个具有全连接结构的预测器,构建成借贷意愿预估模型的原始模型框架,再基于所述第一输入信息训练借贷意愿预估模型,训练过程中使用训练数据集训练模型,使用验证数据集验证模型迭代的性能度量,使用验证数据集验证模型的收敛程度,所述第一预估信息为预测模型训练过程产生的偏差参数,通过预测模型参数可以在训练过程中对模型的输出结果进行调整,进而得到更加准确的输出结果。
41.通过将基于时间序列提取的所述第一输入信息训练借贷意愿预估模型,提高了对于客户未来一段时间内的用户行为预测能力,进而针对性提供对应的金融服务,达到了增强模型对于客户未来时间需求预测精准度的技术效果。
42.s700:通过对用户的借贷外部变量进行有效性分析,获得第一有效借贷变量;
43.s800:将所述第一有效借贷变量对所述借贷意愿预估模型进行增量学习,获得所述借贷意愿预估模型输出的第二预估信息。
44.具体而言,所述第一有效借贷变量为在未来时间段内可实际使用的借贷服务功能,未来时间段和对于客户行为预测的时间段相同;进一步的,通过基于所述第一有效借贷变量对借贷意愿预估模型进行增量学习训练,得以将外部对于借贷影响的变量因素添加进意愿预测模型中,通过增量学习后的所述借贷意愿预估模型输出的所述第二预估信息准确的表征了符合实际复杂情况的用户借贷意愿,其中,外部因素包括但不限于城市、性别、节假日、申请的贷款类别等因素。增量学习指的是学习系统能不断地从新样本中学习新的知识,并能保存大部分以前已经学习到的知识,在原本训练完成的所述借贷意愿预估模型的基础上使用外部变量数据进行模型增量学习,提高了模型的适用性与处理结果的准确性,且相对于重新训练模型降低了时间成本,提高了训练效率。
45.进一步的,如图2所示,基于所述将所述第一输入信息作为训练借贷意愿预估模型的基础训练数据进行模型训练,获得第一预估信息,所述方法步骤s600还包括:
46.s610:构建模型评估单元,其中,所述模型评估单元包括第一评估单元和第二评估单元,所述第一评估单元为参数偏差评估,所述第二评估单元为影响偏差评估;
47.s620:将所述借贷意愿预估模型输入所述模型评估单元中,获得所述模型评估单元输出的第一评估信息和第二评估信息,其中,所述第一评估信息为所述第一评估单元的预估偏差信息,所述第二评估信息为所述第二评估单元的预估偏差信息;
48.s630:根据所述第一评估信息和所述第二评估信息,生成所述第一预估信息,其中,所述第一预估信息为预测偏差信息。
49.具体而言,所述模型评估单元为评估模型产生偏差的模组,包括对模型训练时产生的参数偏差进行评估的所述第一评估单元和对多次训练迭代过程影响带来的偏差进行评估的所述第二评估单元,偏差分为模型参数偏差和迭代过程影响带来的偏差,记为噪点影响偏差。
50.其中,模型参数偏差的确定方式为:为了提高模型的预测准确性,对模型经过多次迭代训练,训练过程的每一次都从测试集中选取新的样本点x
*
,在模型向前传递的过程中,随机的以概率p去掉每个隐藏层中的隐藏单元。随机丢弃隐藏单元时在编码器中使用变分丢弃法,在预测器中使用常规丢弃法,其中,变分丢弃法指的是在使用丢弃法时,对参数矩阵的每个元素进行随机丢弃,并在所有时刻都使用相同的丢弃掩码;常规丢弃法指的是当训练一个深度神经网络时,我们可以随机丢弃一部分神经元(同时丢弃其对应的连接边)得到一个节点更少的网络;概率p可自行设定,优选的为0.5。进一步的,将此过程重复b次就得到b个不同的值,记作值,记作为样本在编码器使用变分丢弃法后输入使用常规丢弃法之后的预测器中得到的输出值。更进一步,可以使用所有样本的不确定度评估模型的不确定性:其中其中表示b个样本在编码器使用变分丢弃法后输入预测器中得到的输出平均值,b表征至中的值,在样本b数量足够大的时候,使用样本的偏差可以表征模型的参数偏差,表示模型的参数偏差,记为所述第一评估信息。
51.b次的模型参数偏差求取过程可视为模型的b次迭代过程,在b次迭代过程中,使用验证数据集验证模型迭代的性能,验证迭代过程产生的偏差被称为噪点影响偏差,其中,噪点引起的不确定性确定方式为:依据数据在验证集上的表现而得出,x

={x
′1,

,x
′v}和y

={y
′1,

,y
′v}为验证集内的点,验证集上的数据的不确定度为其中,x

和y

为验证数据集集合,x
′1到x
′v为验证数据集中表征用户行为特征随时间序列变化的特征向量,y
′1到y
′v为验证数据集中表征用户预测行为特征的特征向量标识信息,为将x

在编码器使用变分丢弃法后得到特征向量输入预测器的对应结果,表示验证过程产生的偏差,记为所述第二评估信息。
52.更进一步,可以得到整个模型在经过b次迭代后的偏差数据,可使用x表示在b次迭代后模型的整体不确定性,记为所述第一预估信息,当所述第一预估信息达到预设的值持续一定时间后时,则表明模型已经基本收敛,其中,预设的值为模型预设准确度对应的偏差值。通过构建所述第一预估信息为模型收敛程
度定义基准值,提高了模型的可实现性。
53.进一步的,如图3所示,基于所述根据所述第一评估信息和所述第二评估信息,生成所述第一预估信息,所述方法步骤s630还包括:
54.s631:根据所述第一预估信息,构建第一置信区间;
55.s632:通过对所述第一置信区间进行置信水平分析,确定第一置信水平系数;
56.s633:当所述第一置信水平系数满足预设置信水平系数时,根据所述第一置信区间实现异常检测。
57.具体而言,所述第一置信区间指在某一置信水平下,样本统计值与总体参数值间误差范围,置信区间越大,置信水平越高;所述第一置信水平系数指总体参数值落在样本统计值某一区间内的概率。举不设限制的一例:以上述b次迭代产生b个用户预测特征行为结果对应于b个模型整体偏差,b个用户预测特征行为结果对应的均值为上述的第b次的模型整体偏差对应的所述第一预估信息x记为预设偏差值,构建预设置信区间当偏差值在预设置信区间之内,则可使用测试数据集进行测试,测试模型收敛与否,其中,在b次迭代中,落入预设置信区间的n个用户预测特征行为结果占据b个用户预测特征行为结果的比例即为所述预设置信水平系数;所述第一置信水平系数为1到b-1次迭代过程中的置信区间对应的置信水平系数,当所述第一置信水平系数和所述预设置信水平系数相同时,则可使用测试数据集检测模型的收敛程度,当检测结果为未收敛时,说明为异常情况,则需要继续对模型进行迭代训练;当所述第一置信水平系数和所述预设置信水平系数不同时,继续进行迭代训练,直到模型达到收敛时停止训练。通过构建所述第一置信区间,对达到所述预设置信区间的模型进行异常检测,保证模型达到收敛时才停止训练,提高了模型训练的准确性。
58.进一步的,基于所述将所述第一借贷数据输入数据处理模块中,其中,所述数据处理模块中包括数值处理单元和文本处理单元,所述方法步骤s200还包括:
59.s210:将所述第一借贷数据进行分类,获得第一数值借贷数据和第一文本借贷数据;
60.s220:将所述第一数值借贷数据输入所述数值处理单元中进行归一化处理和去异化处理,获得第二数值借贷数据;
61.s230:将所述第一文本借贷数据输入所述文本处理单元中进行编码处理,获得第二文本借贷数据;
62.s240:将所述第二数值借贷数据和所述第二文本借贷数据作为所述数据处理模块的输出信息。
63.具体而言,当所述第一借贷数据为结构化的数值数据,记为所述第一数值借贷数据;所述第二数值借贷数据为将所述第一数值借贷数据输入所述数据处理模型中的数值处理单元进行标准化(归一化)处理,再将和其他数值差异超过预设阈值的数据删除得到的数据集,其中,预设阈值可依据专家经验设定。示例性的使用min-max标准化处理方法或z-score标准化处理方法对所述第一借贷数据进行标准处理,所述第一借贷数据经过数据标准化处理后,各指标处于同一数量级,再将各数值进行比较,将超过预设阈值的单个数据删除。对于数值型数据进行标准化处理和去异化处理,方便在随机梯度下降的过程中,模型的
结果可以更快的获得收敛性;更进一步的,对所述第二借贷数据去趋势性(上升/下降)和去周期性,以确保从时间序列中提取到最基本行为特征。
64.当所述第一借贷数据为非结构化的文本数据时,记为所述第一文本借贷数据;所述第二文本数据为将所述第一文本借贷数据输入所述数据处理模型中的文本处理单元进行特征数字化预处理,示例性的基于one-hot编码使用整数进行编码,编码过程即为使用n位状态寄存器来对所述第一借贷数据同一时间节点下借贷客户的n个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效,通过对非结构化的文本数据进行预处理便于和后步基于时间序列提取的行为特征向量相互对应。
65.将预处理之后的所述第二数值借贷数据和所述第二文本借贷数据设为所述第一输出数据,通过对所述第一借贷数据进行预处理,得到的所述第一输出数据更加适用于模型构建的数据集合,提高了模型的可构建性,增加了模型的落地可能性。
66.进一步的,所述方法还包括步骤s900:
67.s910:构建第一滑动规则,其中,所述第一滑动规则为覆盖率滑动逻辑规则;
68.s920:所述滑动窗口根据所述第一滑动规则将所述第一借贷数据进行去时间化转换,获得所述第一借贷数据对应的第一借贷转换数据;
69.s930:将所述第一借贷转换数据输入片段检测模型中,获得所述片段检测模型中的第一检测结果。
70.具体而言,所述第一滑动规则指的是为了将时间序列对应的借贷数据去中心化,避免某个时间序列对应的所述第一借贷数据对模型的影响不同于其他时间序列对应的所述第一借贷数据,进而预设的去中心化规则;进一步的为了避免在去中心化的同时得到时没有时间要素的片段性数据,所以所述第一滑动规则预设为至少50%的覆盖率,所述滑动窗口即为对所述第一借贷数据进行去中心化处理的插件,对滑动窗口内的所述第一借贷数据进行去中心化处理,在此定义为去时间化转换,所述滑动窗口对所述第一借贷数据的覆盖率即为所述第一滑动规则预设的至少50%的覆盖率。当所述第一借贷数据去时间化转换后得到的数据记为所述第一借贷转换数据,此时为了避免得到的数据为片段性的数据,则将所述第一借贷转换数据输入片段检测模型中进行检测,所述片段检测模型是基于预设的时间序列构建的模型。当所述第一借贷转换数据输入片段检测模型时,所述第一借贷转换数据对应的时间序列小于预设的时间序列,则表明为片段性数据,需要重新采集处理;若所述第一借贷转换数据对应的时间序列大于等于预设的时间序列,则表示为预处理完成的数据,则进行后步模型构建。所述去时间化转换优选的作为步骤s200之后的预处理方式,通过预处理后的数据训练的模型的输出准确度更高。
71.进一步的,基于所述将所述第一有效借贷变量对所述借贷意愿预估模型进行增量学习,获得所述借贷意愿预估模型输出的第二预估信息,所述方法步骤s800还包括:
72.更进一步的,所述第一有效借贷变量包括第一预设变量比重。
73.s810:根据所述第一有效借贷变量,获得第一损失数据;
74.s820:将所述第一损失数据输入所述借贷意愿预估模型中进行增量学习,获得增量意愿预估模型,其中,所述增量意愿预估模型通过多组数据训练至收敛获得;
75.s830:根据所述增量意愿预估模型,获得所述第二预估信息。
76.具体而言,所述第一预设变量比重为表征不同的所述第一有效借贷变量对于用户
的借贷意愿预估信息影响程度的数据,示例性的如:城市、性别、节假日、申请的贷款类别、过去90天的借贷均值等外部变量信息对于客户的借贷意愿预估信息的影响程度是有差异化的,优选的依据专家经验评估得到不同的影响比重,得到所述第一预设变量比重;进一步的,所述第一损失数据为表征所述第一有效借贷变量对于借贷意愿预估信息的综合影响程度的信息;更进一步的,将所述第一损失数据输入所述借贷意愿预估模型进行增量学习,使用多组的所述第一损失数据对所述借贷意愿预估模型迭代训练,当达到收敛时,得到所述增量意愿预估模型,通过所述增量意愿预估模型输出的所述第二预估信息可以较准确的表征用户未来一段时间内的用户行为预测特征,通过采集的数据周期远大于可以预测的时长,示例性的如:处理三个月的历史数据分析未来15天的用户行为预测特征。
77.通过增量学习将外部的变量因素添加进借贷意愿预估因素中,由此训练得到的所述增量意愿预估模型可以更加准确的表征用户未来一段时间内的用户行为预测特征,进而提高了模型的适应能力与泛化能力。
78.综上所述,本技术实施例所提供的一种基于深度学习模型的借贷意愿预估方法及系统具有如下技术效果:
79.1.本技术实施例通过提供了一种基于深度学习模型的借贷意愿预估方法,通过采集借贷数据,并对借贷数据进行基本处理,得到结构化的数值数据和非结构化的文本数据,再将时间序列要素添加结构化的数值数据和非结构化的文本数据中,提取客户的行为特征信息,进而使用特征信息训练模型,得到客户的需求预测信息,再依据外部的有效借贷数据对模型进行增量学习,进而模型输出的借贷需求预测信息就是符合客户及金融机构本身实情的结果,加入时间要素且自动提取特征,再增加入有效借贷数据训练模型,达到了提高了模型的泛化能力与预测准确度的技术效果。
80.2.通过增量学习将外部的变量因素添加进借贷意愿预估因素中,由此训练得到的所述增量意愿预估模型可以更加准确的表征用户未来一段时间内的用户行为预测特征,进而提高了模型的适应能力与泛化能力。
81.实施例二
82.基于与前述实施例中一种基于深度学习模型的借贷意愿预估方法相同的发明构思,如图4所示,本技术实施例提供了一种基于深度学习模型的借贷意愿预估系统,其中,所述系统包括:
83.第一获得单元11:所述第一获得单元11用于通过对借贷数据进行数据采集和比例划分,获得第一借贷数据;
84.第一输入单元12:所述第一输入单元12用于将所述第一借贷数据输入数据处理模块中,其中,所述数据处理模块中包括数值处理单元和文本处理单元;
85.第二获得单元13:所述第二获得单元13用于根据所述数据处理模块,获得第一输出数据;
86.第一提取单元14:所述第一提取单元14用于将所述第一输出数据输入深度学习模型中从时间序列中提取用户第一代表行为特征;
87.第一设定单元15:所述第一设定单元15用于将所述第一代表行为特征作为第一输入信息;
88.第一处理单元16:所述第一处理单元16用于将所述第一输入信息作为训练借贷意
愿预估模型的基础训练数据进行模型训练,获得第一预估信息;
89.第二处理单元17:所述第二处理单元17用于通过对用户的借贷外部变量进行有效性分析,获得第一有效借贷变量;
90.第三处理单元18:所述第三处理单元18用于将所述第一有效借贷变量对所述借贷意愿预估模型进行增量学习,获得所述借贷意愿预估模型输出的第二预估信息。
91.进一步的,所述系统还包括:
92.第一构建单元:所述第一构建单元用于构建模型评估单元,其中,所述模型评估单元包括第一评估单元和第二评估单元,所述第一评估单元为参数偏差评估,所述第二评估单元为影响偏差评估;
93.第二输入单元:所述第二输入单元用于将所述借贷意愿预估模型输入所述模型评估单元中,获得所述模型评估单元输出的第一评估信息和第二评估信息,其中,所述第一评估信息为所述第一评估单元的预估偏差信息,所述第二评估信息为所述第二评估单元的预估偏差信息;
94.第一生成单元:所述第一生成单元用于根据所述第一评估信息和所述第二评估信息,生成所述第一预估信息,其中,所述第一预估信息为预测偏差信息。
95.进一步的,所述系统还包括:
96.第二构建单元:所述第二构建单元用于根据所述第一预估信息,构建第一置信区间;
97.第一确定单元:第一确定单元用于通过对所述第一置信区间进行置信水平分析,确定第一置信水平系数;
98.第一检测单元:所述第一检测单元用于当所述第一置信水平系数满足预设置信水平系数时,根据所述第一置信区间实现异常检测。
99.进一步的,所述系统还包括:
100.第一分类单元:所述第一分类单元用于将所述第一借贷数据进行分类,获得第一数值借贷数据和第一文本借贷数据;
101.第四处理单元:所述第四处理单元用于将所述第一数值借贷数据输入所述数值处理单元中进行归一化处理和去异化处理,获得第二数值借贷数据;
102.第五处理单元:所述第五处理单元用于将所述第一文本借贷数据输入所述文本处理单元中进行编码处理,获得第二文本借贷数据;
103.第一设定单元:所述第一设定单元用于将所述第二数值借贷数据和所述第二文本借贷数据作为所述数据处理模块的输出信息。
104.进一步的,所述系统还包括:
105.第三构建单元:所述第三构建单元用于构建第一滑动规则,其中,所述第一滑动规则为覆盖率滑动逻辑规则;
106.第六处理单元:所述第六处理单元用于所述滑动窗口根据所述第一滑动规则将所述第一借贷数据进行去时间化转换,获得所述第一借贷数据对应的第一借贷转换数据;
107.第三输入单元:所述第三输入单元用于将所述第一借贷转换数据输入片段检测模型中,获得所述片段检测模型中的第一检测结果。
108.进一步的,所述系统中所述第一有效借贷变量包括第一预设变量比重。
109.进一步的,所述系统还包括:
110.第三获得单元:所述第三获得单元用于根据所述第一有效借贷变量,获得第一损失数据;
111.第四输入单元:所述第四输入单元用于将所述第一损失数据输入所述借贷意愿预估模型中进行增量学习,获得增量意愿预估模型,其中,所述增量意愿预估模型通过多组数据训练至收敛获得;
112.第四获得单元:所述第四获得单元用于根据所述增量意愿预估模型,获得所述第二预估信息。
113.示例性电子设备
114.下面参考图5来描述本技术实施例的电子设备,
115.基于与前述实施例中一种基于深度学习模型的借贷意愿预估方法相同的发明构思,本技术实施例还提供了一种基于深度学习模型的借贷意愿预估系统,包括:处理器,所述处理器与存储器耦合,所述存储器用于存储程序,当所述程序被所述处理器执行时,使得系统以执行第一方面任一项所述的方法。
116.该电子设备300包括:处理器302、通信接口303、存储器301。可选的,电子设备300还可以包括总线架构304。其中,通信接口303、处理器302以及存储器301可以通过总线架构304相互连接;总线架构304可以是外设部件互连标(peripheral component interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称eisa)总线等。所述总线架构304可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
117.处理器302可以是一个cpu,微处理器,asic,或一个或多个用于控制本技术方案程序执行的集成电路。
118.通信接口303,使用任何收发器一类的系统,用于与其他设备或通信网络通信,如以太网,无线接入网(radio access network,ran),无线局域网(wireless local area networks,wlan),有线接入网等。
119.存储器301可以是rom或可存储静态信息和指令的其他类型的静态存储设备,ram或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,eeprom)、只读光盘(compact disc read-only memory,cd-rom)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线架构304与处理器相连接。存储器也可以和处理器集成在一起。
120.其中,存储器301用于存储执行本技术方案的计算机执行指令,并由处理器302来控制执行。处理器302用于执行存储器301中存储的计算机执行指令,从而实现本技术上述实施例提供的一种基于深度学习模型的借贷意愿预估方法。
121.可选的,本技术实施例中的计算机执行指令也可以称之为应用程序代码,本技术实施例对此不作具体限定。
122.本技术实施例通过提供了一种基于深度学习模型的借贷意愿预估方法及系统,解
决了现有技术中需要依赖专家经验对数据特征进行标注且由于缺乏包含时间序列的要素,使得无法对未来时间窗口内的行为趋势做预估,进而导致存在特征标注工作量较大且对客户需求预测准确度不足的技术问题。通过采集借贷数据,并对借贷数据进行基本处理,得到结构化的数值数据和非结构化的文本数据,再将时间序列要素添加结构化的数值数据和非结构化的文本数据中,提取客户的行为特征信息,进而使用特征信息训练模型,得到客户的需求预测信息,再依据外部的有效借贷数据对模型进行增量学习,进而模型输出的借贷需求预测信息就是符合客户及金融机构本身实情的结果,加入时间要素且自动提取特征,再增加入有效借贷数据训练模型,达到了提高了模型的泛化能力与预测准确度的技术效果。
123.本领域普通技术人员可以理解:本技术中涉及的第一、第二等各种数字编号仅为描述方便进行的区分,并不用来限制本技术实施例的范围,也不表示先后顺序。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“至少一个”是指一个或者多个。至少两个是指两个或者多个。“至少一个”、“任意一个”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个、种),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。
124.在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程系统。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包括一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘(solid state disk,ssd))等。
125.本技术实施例中所描述的各种说明性的逻辑单元和电路可以通过通用处理器,数字信号处理器,专用集成电路(asic),现场可编程门阵列(fpga)或其它可编程逻辑系统,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算系统的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。
126.本技术实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件单元、或者这两者的结合。软件单元可以存储于ram存储器、闪存、rom存储器、eprom存储器、eeprom存储器、寄存器、硬盘、可移动磁盘、cd-rom或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并
可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于asic中,asic可以设置于终端中。可选地,处理器和存储媒介也可以设置于终端中的不同的部件中。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
127.尽管结合具体特征及其实施例对本技术进行了描述,显而易见的,在不脱离本技术的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本技术的示例性说明,且视为已覆盖本技术范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术意图包括这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1