确定用户金融违约风险的方法及装置与流程

文档序号:17376752发布日期:2019-04-12 23:23阅读:133来源:国知局
确定用户金融违约风险的方法及装置与流程
本说明书一个或多个实施例涉及计算机
技术领域
,尤其涉及通过计算机确定用户金融违约风险的方法和装置。
背景技术
:随着计算机和互联网技术的发展,越来越多的业务通过计算平台来实现,例如商品交易、钱款支付、金融借贷、保险理赔等等。然而,在许多业务的执行和处理中,有一些用户操作行为对金融平台或其他用户而言有一定的金融风险,例如请求先享后付类服务,采用花呗、白条等透支服务,申请借贷等。这就需要对用户的金融违约风险预先进行评估和判断。常规技术中,为了防止和降低上述风险,往往通过用户的身份、历史交易行为等信息对用户的信用进行评估。然而,这些信息通常是静态信息,无法体现用户行为等信息之间的关联关系,并且对于新用户,可能无法获取相应信息,从而无法确定信用风险。因此,需要更有效的方式,利用更多的网络数据以及更有效的评测方式,对用户进行全面分析,提高对用户金融违约风险评估的有效性。技术实现要素:本说明书一个或多个实施例描述了一种确定用户金融违约风险的方法和装置,可以更有效地对用户的信用风险进行分析和评估。根据第一方面,提供了一种确定用户金融违约风险的方法,包括:获取待评测用户在第一时间段内的短期操作序列,以及第二时间段内的长期行为数据集序列,所述第二时间段大于所述第一时间段,所述短期操作序列包括按照时间顺序排列的、与所述待评测用户的操作行为相关的多条操作信息,所述长期行为数据集序列包括按照时间顺序排列的多个行为数据集,各行为数据集分别对应预设的第三时间段,所述行为数据集包括与所述待评测用户的交易行为相关的行为信息;利用基于循环神经网络的第一模型处理所述短期操作序列,获得第一输出结果;利用基于循环神经网络的第二模型处理所述长期行为数据集序列,获得第二输出结果;至少对所述第一输出结果和所述第二输出结果进行预定处理,并根据处理结果确定所述待评测用户的金融违约风险。在一些实施例中,所述操作信息包括以下至少一项:浏览信息、点击信息、登录的应用、登录的设备、地理位置信息。在一些实施例中,所述交易行为信息包括以下至少一项:交易时间、交易对象、交易金额。在一些实施例中,所述方法还包括:获取所述待评测用户的属性信息;利用预测模型处理所述属性信息,得到第三输出结果;以及所述至少对所述第一输出结果和所述第二输出结果进行预定处理,并根据处理结果确定所述待评测用户的金融违约风险包括:对所述第一输出结果、所述第二输出结果和所述第三输出结果进行所述预定处理,并根据处理结果确定所述待评测用户的金融违约风险。在一些实施例中,所述预定处理包括以下至少一项:求平均值;取最大值;作为特征输入预设的逻辑回归模型,得到逻辑回归结果。在一些实施例中,所述第一模型/所述第二模型包括多层叠加的长短期记忆模型lstm。在一些实施例中,所述第一模型/所述第二模型的训练样本包括多个标注用户,所述标注用户至少具有预先标注的信用标签。在一些实施例中,所述多个标注用户包括第一标注用户,所述第一标注用户对应的第一信用标签通过以下方式确定:获取所述第一标注用户在预定时间段内的信用记录;基于所述信用记录确定所述第一信用标签。在一些实施例中,所述基于所述信用记录确定所述第一信用标签包括:从所述信用记录中确定所述第一标注用户的守信次数和失信次数;在所述失信次数和所述守信次数的比例超过预设比例阈值的情况下,确定所述第一信用标签为失信用户。在一些实施例中,所述基于所述信用记录确定所述第一信用标签包括:检测所述第一标注用户的失信次数是否为零;在所述失信次数非零的情况下,确定所述第一信用标签为失信用户。根据第二方面,提供一种确定用户金融违约风险的装置,包括:获取单元,配置为获取待评测用户在第一时间段内的短期操作序列,以及第二时间段内的长期行为数据集序列,所述第二时间段大于所述第一时间段,所述短期操作序列包括按照时间顺序排列的、与所述待评测用户的操作行为相关的多条操作信息,所述长期行为数据集序列包括按照时间顺序排列的多个行为数据集,各行为数据集分别对应预设的第三时间段,所述行为数据集包括与所述待评测用户的交易行为相关的行为信息;第一处理单元,配置为利用基于循环神经网络的第一模型处理所述短期操作序列,获得第一输出结果;第二处理单元,配置为利用基于循环神经网络的第二模型处理所述长期行为数据集序列,获得第二输出结果;确定单元,配置为至少对所述第一输出结果和所述第二输出结果进行预定处理,并根据处理结果确定所述待评测用户的金融违约风险。根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。根据第四方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。通过本说明书实施例提供的确定用户的金融违约风险的方法和装置,分别利用基于循环神经网络的不同模型处理用户的短期操作序列、长期行为数据集序列,对用户进行风险评估,并至少将两种不同的处理结果进行综合处理,以得到用户金融违约风险结果。这样,一方面,利用更加深度的时序数据,另一方面,通过多个模型的输出结果进行综合确定最终结果。从而,可以提高确定用户金融违约风险的有效性。附图说明为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1示出本说明书披露的一个实施例的实施场景示意图;图2示出根据一个实施例的确定用户的金融违约风险的方法流程图;图3示出循环神经网络的一个神经元的时序状态示意图;图4示出利用基于循环神经网络的第一模型处理短期操作序列的示意图;图5示出利用基于循环神经网络的第二模型处理长期行为数据集序列的示意图;图6示出对第一输出结果和第二输出结果进行预定处理的示意图;图7示出利用基于全连接神经网络的预测模型处理属性信息的示意图;图8示出根据一个实施例的确定用户的金融违约风险的装置的示意性框图。具体实施方式下面结合附图,对本说明书提供的方案进行描述。图1为本说明书披露的一个实施例的实施场景示意图。如图1所示,用户可以通过终端进行各种操作,例如浏览网页,点击页面上的超链接等,还有可能通过网络,与后台服务器进行各种交互,例如进行多种与借贷相关的行为,如申请借款、还款、申请延期还款等。相应地,终端可以通过日志等记录用户的操作信息,后台服务器也可以记录用户进行的与后台服务器提供的服务相关的行为。例如,用户通过支付宝下的“蚂蚁花呗”申请了一笔借款,然后每月还款,这时网络平台即为支付宝平台,后台服务器就可以是支付宝平台服务器。可以理解,后台服务器可以是集中的服务器,也可以分布式服务器,还可以是互相完全独立的多个服务器,在此不做限定。为了对用户的信用风险进行评估,计算平台可以从各个借贷平台或终端获取相应的用户数据,由计算平台进行综合分析,确定出用户的金融违约风险。在说明书披露的实施例中,计算平台获取相关用户数据之后,可以利用机器学习和循环神经网络,采用多个神经网络模型相结合的构架,对这些数据进行全面分析,从而对金融风险进行评估。上述计算平台可以是任何具有计算、处理能力的装置、设备和系统,例如可以是服务器,它既可以作为独立的计算平台,也可以集成到为某些服务(如借贷)提供支持的后台服务器中。更具体地,计算平台一方面可以获取用户短期(如24个小时)内的各种操作形成的操作序列,通过基于循环神经网络的第一模型进行处理,以挖掘用户短期操作行为对用户信用的影响,得到第一输出结果。另一方面,计算平台还可以获取用户在若干个周期(例如1天)内的行为数据集,每个行为数据集可以包括用户在相应周期内的行为统计结果,计算平台可以利用基于循环神经网络的第二模型对这些行为数据集按照时间顺序排列成的长期行为数据集序列进行处理,得到第二输出结果。进一步地,计算平台还可以至少对第一输出结果和第二输出结果进行综合处理,从而进行最终的金融风险评估。下面描述计算平台评估金融违约风险的具体过程。图2示出根据一个实施例的确定用户金融违约风险的方法流程图。该方法的执行主体可以是任何具有计算、处理能力的系统、设备、装置、平台或服务器,例如图1所示的计算平台等。更具体地,例如可以是为借贷服务提供支持的借贷服务器等。如图2示,该方法包括以下步骤:步骤21,获取待评测用户在第一时间段内的短期操作序列,以及第二时间段内的长期行为数据集序列,其中,第二时间段大于第一时间段,短期操作序列包括按照时间顺序排列的、与待评测用户的操作行为相关的多条操作信息,长期行为数据集序列包括按照时间顺序排列的多个行为数据集,各行为数据集分别对应预设的第三时间段,每个行为数据集包括与待评测用户的交易行为相关的行为信息;步骤22,利用基于循环神经网络的第一模型处理短期操作序列,获得第一输出结果;步骤23,利用基于循环神经网络的第二模型处理长期行为数据集序列,获得第二输出结果;步骤24,至少对第一输出结果和第二输出结果进行预定处理,并根据处理结果确定待评测用户的金融违约风险。首先,在步骤21,获取待评测用户在第一时间段内的短期操作序列,以及第二时间段内的长期行为数据集序列。这里,第一时间段可以是相对较短的一个时间段,例如1天(24小时)、12个小时等。第二时间段可以是相对较长的一个时间段,例如1个月、3个月、1年等等。第二时间段可以远大于第一时间段。如此,为了描述方便,可以将第一时间段对应短期,第二时间段对应长期。短期操作序列可以包括按照时间顺序排列的、与待评测用户的操作行为相关的多条操作信息。操作信息可以包括但不限于浏览信息、点击信息、登录的应用、登录的设备、地理位置信息、交易信息等等中的一项或多项。浏览信息例如可以包括浏览的页面、页面网址、网站域名等。点击信息例如可以包括点击的超链接、所点击超链接对应的页面、提交表单所点击的按钮等等。登录的设备例如可以是台式计算机、笔记本电脑、平板电脑、智能手机等等。地理位置信息可以根据登录的设备的定位信息确定。例如,设备的定位信息可以根据智能手机上的sim卡当前距离最近的通信基站、计算机接入网络的ip地址、设备上的软/硬件定位装置(如gps定位系统)等等确定。在一个实现中,上述操作信息可以从用户当前登录的设备的操作日志中获取。在另一个实现中,上述操作信息还可以通过相同用户id登录的不同设备,在用户id登录期间的操作日志获取。在有一些实现中,上述操作信息还可以通过根据大数据确定的相似用户(或同一用户)在不同平台的用户id,在登录相应平台期间的操作日志获取。在此不做限定。短期操作序列可以将第一时间段内的各条操作信息按照发生的时间顺序排列。请参考表1,假设从操作日志中获取了如下操作信息:表1操作日志示意时间操作对象……10点01浏览商品页面……10点20点击购物车页面…………………………在表1示出的操作日志示意表格中,每一行代表一条操作信息。相应的短期操作序列可以表示为[浏览商品页面;点击购物车页面;……],还可以添加时间信息,表示为[10点01:浏览商品页面:10点20:点击购物车页面;……]。在一些实施例中,操作序列还可以用向量表示,例如其中可以表示浏览商品页面的操作向量,如[1,0,0,1……],可以表示点击购物车页面,如[0,1,0,0……],等等。在一个实施例中,还可以通过词向量模型(如word2vec)将各条操作信息通过词向量表示,在此不再赘述。如此,可以获取到用户在短期内的各种操作相关的具有时序特征的信息。上述的长期行为数据集序列可以包括,按照时间顺序排列的多个行为数据集。在第二时间段内,可以将预设的第三时间段(例如1天)作为一个周期。通常,第二时间段可以是第三时间段的整数倍。对于这样的周期,可以获取每个周期内与用户的交易行为有关的各种信息,将这样的信息整理为一个数据集。具体地,在一个实施例中,可以对用户在上述周期内的交易行为信息进行统计,形成数据集。在一个实施例中,与用户的交易行为相关的行为信息可以包括,在购物平台浏览商品、下单、所购买商品类型、商品价格、是否支付、付款金额等行为。在另一个实施例中,与用户的交易行为相关的行为信息可以包括,是否通过金融借贷平台进行借款、借款额度、是否还款等等。在另一个实施例中,与用户的交易行为相关的行为信息可以包括,与其他用户之间的转账行为、转账金额等等。在更多实施例中,与用户的交易行为相关的行为信息还可以包括更多信息,在此不再赘述。进一步地,可以对每个周期内的用户交易行为信息进行统计,形成相应周期内的行为数据集。例如,{浏览商品页面:5次;支付:1次……}。其中,5次、1次等还可以替换成与次数正相关的权重值。浏览商品页面、支付等还可以替换成字符或词向量。如此,对于多个周期的行为数据集,可以构成具有时序特征的长期行为数据集序列。通过长期行为数据集序列,可以体现用户长期的交易行为习惯等。例如每个月从固定日期(如工资到账的日期)购买行为较多,交易金额相对较大,逐渐衰减到无购买行为、或较少购买行为、交易金额相对较小等,直到下个月的上述固定日期再重复这样的过程。可以理解,在一些实现中,上述第一时间段、第二时间段都可以是,从当前时间开始向前回溯的时间段。通过以上描述可知,上述短期操作序列和长期行为数据集序列都是具有时序特征的数据序列。对于这样的序列,可以通过循环神经网络模型来处理,从而从时序的角度对用户的行为进行预测。可以理解,循环神经网络(rnn,recurrentneuralnetworks)是一种时间递归神经网络,可用于处理序列数据。在rnn中,一个序列当前的输出与其前面的输出相关联。具体的,rnn会对前面的信息进行记忆并应用于当前输出的计算中,即隐藏层之间的节点是有连接的,并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。如图3示出的循环神经网络时序示意图中,第t次的隐含层状态可以表示为:st=f(u*xt+w*st-1);其中,xt为第t次输入层的状态,st-1为第t-1次隐含层状态,f为计算函数,w、u为权重。如此,rnn将之前的状态循环回当前输入,考虑了历史输入的影响,因而适合于具有时序的数据序列。更进一步地,在一个实施例中,在rnn架构下,可以采用长短期记忆模型(lstm,longshorttermmemory)进行上述序列数据的处理。如前所述,在rnn中当前隐含层状态依赖于之前的状态输出,因此在处理时,需要将当前的隐含态的计算与前n次的计算关联,即st=f(u*xt+w1*st-1+w2*st-2+…+wn*st-n)。随着n的增大,计算量呈指数式增长,导致模型训练的时间大幅增加。为此,提出lstm模型来解决长期依赖的问题。在lstm模型中,通过设置让信息选择性通过的“遗忘门”来丢弃某些不再需要的信息,如此对输入的不必要的干扰信息进行判断和屏蔽,从而更好地对数据序列进行分析处理。请参考图3,对于lstm中的某个神经元,用xt-1、xt、xt+1分别表示t-1时刻、t时刻和t+1时刻的输入,st-1、st、st+1分别表示t-1时刻、t时刻和t+1时刻该神经元的状态,而ct-1、ct、ct+1分别表示t-1时刻、t时刻和t+1时刻的输出,其中:st=g(u*xt+w*ct-1+bs);ct=f(v*st-1+bc);st+1=g(u*xt+w*ct+bs);ct+1=f(v*st+bc);其中,u、w、v为权重。可以看出,在lstm模型中,每个神经元的当前状态由当前时刻的输入和前一时刻的输出共同决定,每个神经元的当前输出和前一时刻的状态相关。通过lstm模型对数据序列进行分析,可以有选择地记忆信息,挖掘出长距离的数据依赖。在一个实施例中,还可以采用多层叠加的lstm模型来处理多条数据按照时序构成的序列。在图2示出的实施例中,通过步骤22和步骤23分别对上述短期操作序列和长期行为数据集序列进行处理。可以理解,步骤22和步骤23可以并行执行,也可以调换顺序执行,本说明书实施例对此不做限定。具体地,在步骤22中,利用第一循环神经网络处理上述短期操作序列,获得第一输出结果。对于短期操作序列的各条数据,依次输入lstm模型。对每条数据而言,各个元素分别对应输入层的各个神经元,每个神经元的当前输出影响下一条数据输入该神经元后的输出。图4示出根据一个实施例的利用循环神经网络的处理短期操作序列的示意图。如图4所示,用序号1、2、3、4、5、6、7……表示短期操作序列的各条数据,例如序号1对应第1条操作信息:浏览购物页面a,序号2对应第2条操作信息:付款30元,等等。在图4的示例中,循环神经网络包括多层叠加的lstm模型。作为示意,图4仅示出了多层叠加的lstm模型在t-1、t、t+1时刻的时序。在图4中,t-1时刻,多层叠加的lstm模型接受序号为3的一条操作信息。该条操作信息经过lstm模型的处理,每层的输出被记录。在t时刻,lstm模型接受序号为4的一条操作信息。lstm模型处理该条操作信息时,同时考虑各层中t-1时刻的输出记录。以此类推,直至上述短期操作序列被完全处理。经过多层循环神经网络的处理,可以获得第一输出结果。该第一输出结果是与短期操作序列中的各条操作信息及其产生顺序相关的一个中间结果。在一个实施例中,该第一输出结果可以是一个用户信用/风险分数。此时,用于处理上述短期操作序列的循环神经网络可以以多个标注用户作为样本进行训练。这多个标注用户分别对应有历史短期操作序列和预先标注的信用标签。其中,标注用户的历史短期操作序列和上述短期操作序列可以具有一致的时间切入点。这里的时间切入点,可以理解为通过本实施例的确定用户的金融违约风险的时机。例如,对于某个借贷平台(如“花呗”),上述短期操作序列是用户在该平台开通服务前24小时内的操作信息按照时序排列得到的序列,则标注用户可以是在该平台已经开通服务的用户,标注用户的历史短期操作序列是相应用户在该平台开通服务前24小时内的操作信息按照时序排列得到的序列。该例子中的时间切入点是用户在该平台开通服务。而标注用户对应的信用标签,可以是根据用户在该平台或其他平台的信用情况标注的。可以获取相应用户在预定时间段内的信用记录,并基于信用记录确定相应的信用标签。这里的预定时间段例如可以是在相应平台开通服务后的3个月、6个月、1年等。可以理解,对用户的标注信息可以包括诸如“失信用户”、“守信用户”之类的标签,该标签也可以通过数值(如1、0)进行表示。用户的标注信息可以通过人工确定,也可以通过计算机进行。在一个实施例中,可以从用户的信用记录中确定该用户的守信次数和失信次数,并在失信次数和守信次数的比例超过预设比例阈值(如1:1)的情况下,确定相应用户的信用标签为“失信用户”。否则,确定相应用户的信用标签为“守信用户”。在另一个实施例中,可以检测用户的失信次数是否为零,在失信次数非零的情况下,确定相应用户的信用标签为“失信用户”。否则,确定相应用户的信用标签为“守信用户”。值得说明的是,在本说明书实施例中,虽然可以通过计算机确定作为样本的用户的标注信息,但却不能直接利用该标注方法对用户金融违约风险进行评测。这是因为,确定用户标注信息的方法简单、粗略,往往对应两个结果中的一个,来表示用户的金融违约风险偏向,而本说明书实施例旨在提供一种确定用户金融违约风险的方案,这种方案,具有普适性,可以较准确地进行风险评估,对于没有信用记录的新用户、信用记录较少的老用户等,都可以给出较准确的风险度估计,而这是上述确定用户标注信息的方法不能实现的。为了区分,将以上训练的循环神经网络称为第一循环神经网络。通过该步骤,可以挖掘出待评估用户的短期操作信息对用户风险的影响。除了利用第一循环神经网络处理待评测用户的短期操作序列之外,另一方面,还通过步骤23,利用第二循环神经网络处理长期行为数据集序列,获得第二输出结果。对于长期行为数据集序列中的各个行为数据集,可以依次输入lstm模型。对一个行为数据集而言,各个元素分别对应输入层的各个神经元,每个神经元的当前输出影响下一条数据输入该神经元后的输出。图5示出根据一个实施例的利用第二循环神经网络的处理长期行为数据集序列的示意图。如图5所示,用序号按照日期3号、4号……表示各个短周期内的行为数据集,例如3号对应3号这天的行为数据集,4号对应4号这天的行为数据集,等等。作为示意,图5仅示出了多层叠加的lstm模型在t-1、t、t+1时刻的时序。在图5中,t-1时刻,多层叠加的lstm模型接受3号这天的行为数据集。该行为数据集经过lstm模型的处理,每层的输出被记录。在t时刻,lstm模型接受4号这天的行为数据集。lstm模型处理该行为数据集时,同时考虑各层中t-1时刻的输出记录。以此类推,直至上述长期行为数据集序列被完全处理。经过第二循环神经网络的处理,可以获得第二输出结果。该第二输出结果是与长期行为数据集序列的各个行为数据集的时序相关的一个中间结果。在一个实施例中,该第二输出结果可以是另一个用户信用/风险分数。可以理解,处理上述长期行为数据集序列的循环神经网络也可以以多个标注用户作为样本进行训练。这多个标注用户分别对应有历史长期行为数据集序列和预先标注的信用标签。其中,标注用户的历史长期行为数据集序列和待评估用户的长期行为数据集序列,也具有一致的时间切入点。例如,对于某个借贷平台(如“花呗”),上述长期行为数据集序列是用户在该平台开通服务前1个月内的行为信息,按照时序排列得到的序列,则标注用户可以是在该平台已经开通服务的用户,标注用户的历史长期行为数据集序列是相应用户在该平台开通服务前1个月内的行为信息按照时序排列得到的序列。这里的时间切入点是用户在该平台开通服务。标注用户对应的信用标签的标注方法和步骤22中的标注方法一致,在此不再赘述。通过该步骤,可以挖掘出待评估用户的长期行为信息对用户风险的影响。进一步地,在步骤22、步骤23的基础上,通过步骤24,至少基于对第一输出结果和第二输出结果的预定处理,以根据处理结果确定待评测用户的金融违约风险。可以理解,预定处理是预先存储的处理方法。如图6所示。金融违约风险可以通过分数、小数、类别、偏向等来表示,在此不做限定。在一个实施例中,该处理方法可以是简单规则,例如求和、求平均值、求最大值,等等。以求平均值为例,可以将第一输出结果和第二输出结果的平均值作为待评测用户的金融违约风险的量值。可选地,还可以先判断进行处理的结果(如第一输出结果和第二输出结果)是否包括异常值(如超出预定范围,或者为空等),如果包括异常值,则排除异常值,取另一个值。如此,在待评测用户的短期操作序列或者长期行为序列中的一个无法获取等情况下,仍然可以得到待评测用户的金融违约风险。在一个实施例中,该处理方法还可以包括将上述输出结果作为特征输入逻辑回归模型(如lr模型),通过该逻辑回归模型在对第一输出结果、第二输出结果进行线性回归的基础上,进行一个逻辑运算,使得模型的输出值落入预设区间(如0-1之间)。该逻辑回归模型可以是预先训练的模型,也可以是预先设定的模型,在此不做限定。其中,预先设定的模型可以是认为确定计算方法和参数的模型。可以理解,短期操作信息和长期行为信息都是用户独特的纵向特征,通过这种独特的纵向特征,对用户金融违约风险的评价更加精准。同时,由于通过多个模型分别处理多种时序数据,对多个评估结果进行综合,避免单面评估,或一种数据无效对评估结果的影响。根据一个可能的设计,上述方法还可以包括:获取待评测用户的属性信息,利用预先训练的预测模型处理该属性信息,得到第三输出结果。这里,属性信息可以是用于表示用户属性的信息,例如性别、年龄、职业、收入、财产状况等等。预测模型的训练样本可以包括多个标注用户。这些标注用户分别对应有属性信息数据集,以及信用标签,在此不再赘述。其中,信用标签的确定方法同前,在此不再赘述。该预测模型可以是通过梯度提升决策树(gbdt)、全连接神经网络等等训练的模型。以该预测模型是通过全连接神经网络训练的模型为例,请参考图7。利用全连接神经网络处理该属性信息的过程如图7所示,将一个待评测用户的属性信息输入全连接神经网络,全连接神经网络的每个隐含层的输出与前一层的各个神经元的输出有关。此时,在步骤24,还可以对第一输出结果、第二输出结果和第三输出结果一起进行上述预定处理,以根据处理结果确定待评测用户的金融违约风险。由于用户的属性信息具有比较泛化的特征,可以对横向评估用户的信用度,评价角度更广。回顾以上过程,在对用户进行金融违约风险评估时,针对用户的纵向数据,分别利用不同的循环神经网络处理用户的短期操作序列,以及长期行为数据集序列,对用户进行风险评估,并至少将两种不同的处理结果进行综合处理。这样,一方面,利用更加深度的数据,另一方面,即使一个结果异常,也能通过另一个结果确定最终结果。从而,可以提高确定用户金融违约风险的有效性。此外,还可以通过用户的属性信息作为横向信息,对用户的风险度进行评估,利用更多数据,进行全面分析,提高评估结果的准确度。根据另一方面的实施例,还提供一种确定用户的金融违约风险的装置。图8示出根据一个实施例的确定用户的金融违约风险的装置的示意性框图。如图8所示,针对确定用户的金融违约风险的装置800包括:获取单元81,配置为获取待评测用户在第一时间段内的短期操作序列,以及第二时间段内的长期行为数据集序列,第二时间段大于所述第一时间段,短期操作序列包括按照时间顺序排列的、与待评测用户的操作行为相关的多条操作信息,长期行为数据集序列包括按照时间顺序排列的多个行为数据集,各行为数据集分别对应预设的第三时间段,行为数据集包括与待评测用户的交易行为相关的行为信息;第一处理单元82,配置为利用基于循环神经网络的第一模型处理短期操作序列,获得第一输出结果;第二处理单元83,配置为利用基于循环神经网络的第二模型处理长期行为数据集序列,获得第二输出结果;确定单元84,配置为至少对第一输出结果和第二输出结果进行预定处理,并根据处理结果确定待评测用户的金融违约风险。在一个实施例中,上述操作信息包括以下至少一项:浏览信息、点击信息、登录的应用、登录的设备、地理位置信息。在一个实施例中,上述行为信息包括以下至少一项:交易时间、交易对象、交易金额。根据一个可能的设计,装置800还可以包括第三处理单元(未示出),配置为:获取待评测用户的属性信息;利用预测模型处理上述属性信息,得到第三输出结果。此时,确定单元84进一步还可以配置为:对第一输出结果、第二输出结果和第三输出结果进行上述预定处理,并根据处理结果确定待评测用户的金融违约风险。在一个实施例中,上述预定处理可以包括以下至少一项:求平均值;取最大值;作为特征输入预设的逻辑回归模型,得到逻辑回归结果。根据一种实施方式,第一模型/第二模型包括多层叠加的长短期记忆模型lstm。在一个实施例中,第一模型/第二模型的训练样本包括多个标注用户,标注用户至少具有预先标注的信用标签。该信用标签可以通过人工确定,也可以通过装置800确定。该信用标签通过装置800确定时,装置800还可以包括标注单元(未示出)。为了描述方便,将多个标注用户中的任一个标注用户称为第一标注用户,标注单元可以通过以下方式确定第一标注用户对应的第一信用标签:获取第一标注用户在预定时间段内的信用记录;基于信用记录确定第一信用标签。在一个进一步的实施例中,标注单元可以从上述信用记录中确定第一标注用户的守信次数和失信次数;在失信次数和守信次数的比例超过预设比例阈值的情况下,确定第一信用标签为失信用户。在另一个进一步的实施例中,标注单元可以检测第一标注用户的失信次数是否为零;在失信次数非零的情况下,确定第一信用标签为失信用户。值得说明的是,图8所示的装置800是与图2示出的方法实施例相对应的装置实施例,图2示出的方法实施例中的相应描述同样适用于装置800,在此不再赘述。通过以上装置,充分利用用户短期和长期操作的时序数据,通过多个模型的输出结果进行综合确定最终结果。从而,可以提高确定用户金融违约风险的有效性。根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2所描述的方法。根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2所述的方法。本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1