一种确定风险评估参数的方法及装置与流程

文档序号:11583844阅读:508来源:国知局
一种确定风险评估参数的方法及装置与流程

本发明涉及计算机技术领域,具体涉及一种确定风险评估参数的方法、建立评估信息决策模型的方法及装置。



背景技术:

当前很多业务与风险评估参数都是直接相关的,风险评估参数直接影响到业务申请是否能够成功。业务提供方在为用户分配业务时会根据已有的风险评估参数来评估是否为该用户分配业务。

风险评估参数可以根据评估信息来确定,但评估信息具有一定的随意性,比较容易进行人为修改。这样,根据评估信息确定的风险评估参数就会不准确。

现有技术主要通过拉伸时间跨度和严格变量条件两种方式,排除用户在社交网络所作的有目的性的舞弊行为,从而排除舞弊评估信息。但这种方法在排除舞弊评估信息的同时也排除了一些有用的评估信息,从而导致风险评估参数的准确性差。



技术实现要素:

为了解决现有技术中风险评估参数的准确性差的问题,本发明实施例提供一种确定风险评估参数的方法,可以将舞弊行为和舞弊信息也引入到决策模型中来,确保信息的全面性,从而提高风险评估参数的准确性。本发明实施例还提供了相应的装置。

本发明第一方面提供一种确定风险评估参数的方法,包括:

获取待确定风险评估参数的用户的评估信息;

对所述用户的评估信息进行变量梳理,得到第一类型的变量值和第二类型的变量值;

根据所述第一类型的变量值、所述第二类型的变量值和具有评估信息决策功能的决策模型确定所述用户的评估信息的风险评估参数;

其中,所述第一类型的变量值为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量值为根据是否达到舞弊决策条件确定。

本发明第二方面提供一种建立评估信息决策模型的方法,包括:

获取大量用户的评估信息样本;

对所述评估信息样本进行变量梳理,得到第一类型的变量和第二类型的变量;

根据所述第一类型的变量和所述第二类型的变量,建立评估信息决策模型;

其中,所述第一类型的变量为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量为根据是否达到舞弊决策条件确定。

本发明第三方面提供一种确定风险评估参数的装置,包括:

获取单元,用于获取待确定风险评估参数的用户的评估信息;

变量梳理单元,用于对所述获取单元获取的所述用户的评估信息进行变量梳理,得到第一类型的变量值和第二类型的变量值;

确定单元,用于根据所述变量梳理单元得到的所述第一类型的变量值、所述第二类型的变量值和具有评估信息决策功能的决策模型确定所述用户的评估信息的风险评估参数;

其中,所述第一类型的变量值为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量值为根据是否达到舞弊决策条件确定。

本发明第四方面提供一种建立评估信息决策模型的装置,包括:

获取单元,用于获取大量用户的评估信息样本;

变量梳理单元,用于对所述获取单元获取的所述评估信息样本进行变量梳理,得到第一类型的变量和第二类型的变量;

确定单元,用于根据所述变量梳理单元得到的所述第一类型的变量和所述第二类型的变量,建立评估信息决策模型;

其中,所述第一类型的变量为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量为根据是否达到舞弊决策条件确定。

与现有技术中通过拉伸时间跨度和严格变量条件两种方式,排除用户在社交网络所作的有目的性的舞弊行为,在排除舞弊评估信息的同时也排除了一些有用的评估信息,从而导致风险评估参数的准确性差。本发明实施例提供的确定风险评估参数的方法,可以将舞弊评估信息也引入到决策模型中来,从而增强模型在应用中的自适应性,即评分模型已经考虑了用户可能采取的一些舞弊行为,因而模型在应用中会更加稳定,更具有鲁棒性确保信息的全面性,从而提高风险评估参数的准确性。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是一建模方法的建模流程示意图;

图2是本发明实施例中决策建模方法的建模流程示意图;

图3是本发明实施例中确定风险评估系数的方法的一实施例示意图;

图4是本发明实施例中建立评估信息决策模型的方法的一实施例示意图;

图5是本发明实施例中确定风险评估系数的装置的一实施例示意图;

图6是本发明实施例中建立评估信息决策模型的装置的一实施例示意图;

图7是本发明实施例中确定风险评估系数的装置的一实施例示意图;

图8是本发明实施例中建立评估信息决策模型的装置的一实施例示意图。

具体实施方式

本发明实施例提供一种确定风险评估参数的方法,可以将舞弊评估信息也引入到决策模型中来,确保信息的全面性,从而提高风险评估参数的准确性。本发明实施例还提供了相应的装置。以下分别进行详细说明。

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例技术方案涉及基于计算机系统确定风险评估参数的方法。下面首先对确定风险评估参数的方法涉及到的一些术语进行简单说明。

术语“风险评分卡”是指:一种风险评估模型,例如用于评估用户信用风险高低的风险评估模型,通常有监督学习和半监督学习(如果有拒绝推断的话)两种。监督目标(即目标变量)通常是用户在一段时间内是否违约,比如用户在发放贷款后6个月内是否发生90天以上逾期。构建风险评分卡的方法通常分为两类:模型法和专家法。

术语“征信评分”:是评分机构或征信公司利用征信机构的信息开发的用于评估用户信用风险或者欺诈风险的评分模型。

术语“逻辑回归”(lr,logisticregression):目前应用比较成熟、广泛的用于开发风险评分卡的一种方法,是一种广义的线性回归方法。

术语“鲁棒性”(robustness):指模型从开发到实施过程中的稳定性,鲁棒性高的模型实施效果更理想。

术语“ks”(kolmogorovsmirnov):kolmogorov和smirnov两位前苏联数学家的名字,ks是一种衡量评分模型效果好坏的常用指标,处于0-100之间,值越大代表模型效果越好。通常情况下ks=25左右是金融机构对风险评分卡的接受标准。

术语“psi”(populationstabilityindex):是一种反映人群的物理和行为特征稳定性的指标,主要通过两个时点的数据对比计算得出,计算公式:

psi=∑((n1i/n1)-(n2i/n2))*ln((n1i/n1)/(n2i/n2))

其中,n1i,n2i-两个时点的人群1和人群2的第i个分箱的人数,一般地i=10;

n1,n2-两个时点的人群1和人群2的总人数。

一般地psi在0.2以上,代表人群波动很大,很不稳定,应停止使用;psi在0.1-0.2之间,表示人群不太稳定,应查明原因并决定是否使用;psi在0.1以下一般是可以接受的,表示人群比较稳定。

信用评分是征信评分中的一种,信用评分主要用来评估和反映用户信用风险的高低,通常高分代表风险较低,低分代表风险较高。目前的信用评分模型是一种典型的有监督学习,其目标通常是用户在一段时间内是否违约,比如用户在发放贷款后6个月内是否发生90天以上逾期。通常地,用户信用风险有两个因素决定:还款能力和还款意愿。其中,还款意愿主要取决于用户违约成本的高低,如果违约成本较低,收益较高,用户就更容易违约。反之,就更不容易违约。还款能力则主要由用户的资金实力决定。因此,对信用风险有预测能力的变量也主要分为两大类:一类和还款意愿相关,一类和还款能力相关。

本发明实施例中把评估信息引入信用评分模型,可以增加用户信用评分的广泛度,不用局限于当前在金融机构的信用记录,而且,针对在金融机构没有信用记录的用户也可以进行风险评估。但评估信息可能会遭到用户有目的性的操作,也就是说用户的评估信息中可能存在舞弊信息,在预防评估信息舞弊方面可以采用舞弊信息排除的方法。舞弊信息排除的方法可以从还款意愿和还款能力两个方面来解决。还款意愿类变量主要通过增加舞弊的时间成本来解决,还款能力类的变量主要通过增加舞弊的资金成本来。

(1)增加舞弊的时间成本

本节以变量“好友数量”为例来阐明,它主要反映用户的还款意愿。一般地,如果一个人好友数量越多,表示这个人越注重社交,违约时的社交成本相对比较高,在欠款催收时也更容易被找到,因此正常情况下,好友越多,还款意愿越高,信用风险相对越低。主要通过两种方式增加用户舞弊的时间成本。

a拉长时间:由使用较短时间的变量改为较长时间的变量。比如,当前的好友数改为过去12个月平均的好友数。

b严格条件:即增加一些限制条件。因为好友数相对来说还是比较容易添加的,甚至有专业加好友机构代加好友,比如添加200好友收费20元。并且,如果付更高费用,代加好友还能满足一些个性化条件,比如开户时长在3个月以上、每月收发信息在10条以上等。为了应对这些舞弊行为,需要识别并过滤这些恶意添加的信息。更严格条件可能是要求,1.除注册当月外,其他月份的好友是自然增长的。2.好友之间应该有一定互动。

通过上述方法处理后的变量可能是表1中的情况,比如“过去12个月开户时间在3个月以上的互动的月均好友数”,用户舞弊的成本就会高很多,相对地信息会真实、稳定很多。

表1增加舞弊时间成本

表1中的拉长时间和严格条件可以根据需求设定,而且表1只是举例说明,不限于表1所列出的几种情况。

表2增加舞弊资金成本

表2中的拉长时间和严格条件可以根据需求设定,而且表1只是举例说明,不限于表2所列出的几种情况。

本实施例中以“已结清的贷款金额”和“理财金额”为例来阐明。贷款金额和理财金额直接反映用户的还款能力,已结清代表用户的还款意愿。一般地,已结清的贷款金额越大,用户的信用风险就越低,反之,信用风险就越高。但是,不排除有些人通过重复借贷并快速还款来刷信用的可能。在互联网现金贷业务的发展过程中就出现了这种情况,有用户为了提升自己的信用评分,最多出现一个月内发生100多次借款,且当天还款。互联网借贷一般为了提升用户体验,设置贷款犹豫期,犹豫期一般在1-3天。犹豫期内还款一般是不收取借贷手续费和利息的,因此用户反复借贷并快速还款并未产生资金成本。

对于增加舞弊资金成本的实际操作,也可以通过拉长时间和严格条件两种方法来实现,结果见表2。比如“过去12个月的已结清的最大生息贷款金额”,如果用户要想舞弊,资金成本就会增加很多。

现有技术主要通过拉伸时间跨度和严格变量条件两种方式,排除用户在社交网络所作的有目的性的舞弊行为。但这种方法在排除舞弊信息的同时也排除了一些有用的信息,排除信息意味着损失一部分信息。这种做法带来的直接后果是信用评分模型的效果受到了一定的影响。

因此,本发明实施例中,把用户的有目的性的舞弊行为也作为自变量考虑进来,用于和其他信息一起构建信用评分模型。一般地,当用户有目的性的进行舞弊行为时,信用风险相对较高。反之,信用风险较低。因此决策建摸是一种考虑了更多信息的全信息建模,模型的效果相对会更好,模型的鲁棒性也更高。

评估信息可以包括用户在社交网络的好友记录和金融记录等,当然,也可以包括其他记录,计算机系统可以对用户的评估信息进行变量梳理,变量梳理的方式可以参阅表3进行理解。

表3决策变量梳理

表3中的决策变量实际上只是对应不同舞弊决策条件的变量。例如:

过去24个月内(开户最早两个月除外)出现过一个月内新增好友超过30人的月数是否大于等于3的舞弊决策条件设为决策变量d1。

过去12个月内是否有两次以上的犹豫期退款的舞弊决策条件设为决策变量d2。

过去6个月内是否存在三次以上当天购买并第二天赎回金额在1000元以上理财的行为的舞弊决策条件设为决策变量d3。

表3只是举例说明,不限于表3所列出的几种情况。

如前所述,本发明实施例中,把变量分为两大类:一类是反映用户还款能力的变量,主要是支付、会员等和用户资金相关的支付贷款类变量;另一类是反映用户还款意愿的变量,主要指社交类型的变量。我们把用户可能针对这两类变量采取的决策(投机性的舞弊行为)进行分析梳理。决策变量梳理依赖于业务经验和数据分析,这一步工作量比较大,本文将以上述三个变量为例介绍。当然,实际决策建模和使用决策模型确定风险评估参数的过程中不限于以上三个变量,可以有更多的变量。

表3是梳理结果,可以看出,一些决策变量可作为剔除舞弊信息后的有益补充。比如上述表3所列出的几个舞弊决策条件d1、d2和d3“过去6个月内是否存在三次以上当天购买并第二天赎回金额在1000元以上理财的行为(d3)”,若用户有这种行为,很大程度上可能是因为用户想通过资金的快速进出提升信用评分,或者是用户对资金使用没有规划,这两种情况可能都是负面的信息。如果出现上述行为,用户的信用风险也相对越高,则是取1,不是取0。同理,过去24个月内(开户最早两个月除外)出现过一个月内新增好友超过30人的月数是否大于或等于3,(d1),是取1,否取0。例如:一个社交应用刚开通时可能会出现突击加好友的状况,大量同学聚会也可能会出现突击加好友的状况,所以,本发明实施例中将变量d1设定为若过去24个月内有超过或等于3个月出现突击加大量好友的状况,则认为用户是有目的性的操作,用户的信用风险也相对越高,若有,则取1,没有取0。当然,此处大于或等于3只是举例说明,也可以是其他限制条件。同理,过去12个月内是否有两次以上的犹豫期退款,是取1,否取0(d2)。

经过这种处理之后的变量的作用也是显而易见的,下面我把这些变量的缺失和分布情况通过举例的方式列出如表4。表4中是对大量用户的统计,以原始变量r1“过去12个月的月均好友数”为例,原始变量的均值为48,最大值为999。加入开户时间和好友互动两个条件后,生成变量x1“过去12个月开户时间在3个月以上的互动的月均好友数”,其均值和最大值分别为20和150,比原始变量r1小很多。主要原因是,有大约6%的人发生了“过去24个月内(开户最早两个月除外)出现过一个月内新增好友超过30人的月数大于或等于3”的操作,即d1变量的均值为6%(0.06)。

表4决策变量分布

通过表3和表4的举例示例,下面构建针对不同情况的模型:

基于逻辑回归方法,基于简单处理变量r1-r3的建模结果如(1)和(2):

logodds=f(x)==a0+a1r1+a2r2+a3r3(1)

probability=exp(logodds)/(1+exp(logodds))(2)

基于一般防舞弊法处理后的变量x1-x3的建模结果如(3)和(4):

logoddsx=f(xx)==b0+b1x1+b2x2+b3x3(3)

probabilityx=exp(logoddsx)/(1+exp(logoddsx))(4)

基于决策建模法的建模结果则如(5)和(6):

logoddsd=f(xd)==b0+b1x1+b2x2+b3x3+c1d1+c2d2+c3d3(5)

probabilityd=exp(logoddsd)/(1+exp(logoddsd))(6)

其中,所述x1…xm为第一类型的变量,m为大于3的整数,d1…d3为第二类型的变量,n为大于3的整数,b0为初始权重,b1…b3分别为x1…x3的权重,c1…c3分别为d1…d3的权重,logoddsd为函数的因变量,probabilityd为用户的评估信息的风险评估参数。

参阅表4,因表4是对大量用户的统计,所以x1…x3,d1…d3都取表4中的均值的一列。

若是对单个用户进行统计,则d1…d3要么取0,要么取1。

其中,所述第一类型的变量值为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量值为根据是否达到舞弊决策条件确定。

logoddsd的取值范围是负无穷到正无穷,probabilityd的取值范围是0到1。probabilityd的取值越大,说明风险越高。

比较上述公式,可以发现,决策建模的模型会纳入更多地考量因素,模型结果一般会更加有效、稳定。

下面,简要比较决策建模法和前两种方法在建模流程上的区别。前两种的建模流程如图1,图1是前两种建模方法的建模流程。

决策建模法则要增加一个步骤:决策变量梳理。纳入决策变量后进行建模后的建模流程如图2,图2是本发明实施例中用于确定风险评估参数的决策建模的过程。

图1所示的过程包括从存储服务器获取原始数据,然后对原始数据进行准备、清洗、变量衍生、建模宽表、变量分析、筛选、构建逻辑回归模型,得到模型结果。

上述过程中的各个环节都为现有技术,本处不做过多赘述,其中,构建逻辑回归模型为上述公式(1)和公式(2)的简单模型。

从图1和图2中可以看出,本发明实施例的建模过程增加了决策变量梳理的过程。

决策变量梳理的过程可以参阅表3和表4进行理解,在增加了决策变量梳理后所构建的逻辑回归模型即为上述公式(5)和公式(6)所描述的决策模型,从而模型结果也就相应的发生了变化。

决策建模法在对原始变量进行处理的同时,充分地考虑了用户可能采取的舞弊行为,利用更多信息进行建模,充分挖掘了所有采集数据的价值,从而使信用评分模型具有突出的效果,更强的稳定性和适应性。下面采用一些实验数据对上述三种方法的建模结果进行了对比如下,结果如表5所示。

表5弱变量组建模法的效果对比

表5显示,决策建模的入选变量更多,不但在开发和验证样本上的效果好,更重要的是,在最能预测未来实施效果的跨期检验上ks为17,明显优于其他两种方法的13和15。

表6是入选变量的psi,其计算主要基于开发样本(2014年)和跨期检验(2015年)对应两个时段的数据进行计算。简单处理法的变量和评分psi都比较大,模型很不稳定,这和表5中ks波动比较大是对应的。而决策建模法的变量psi是可以被接受的,由于考量了多个维度的信息,评分相对比较稳定,评分psi是最小的,模型最为稳定。

表6变量及模型的psi(跨期样本和开发样本两个时段比较)

本发明实施例提及了三种建模方法,包括:简单处理法、一般防舞弊法和决策建模法。

简单处理法。这种方法在传统建模中比较常用,因为最为简单易行。此方法的不足同样明显,模型的稳定性和鲁棒性很差,一般不建议在社交数据建模上使用。

一般防舞弊法。这种方法加入了增加用户时间成本和资金成本的考量,建模的结果相对比较稳定,操作起来也比较便捷。这种方法的缺陷是,没有全面利用用户决策相关的信息,这对构建模型来说是一个损失。

决策建模的方法,即把用户为提升信用评分而采取的一些非正常的操作,比如突击加好友,短时间内有大量的贷款借还行为等,也作为自变量放入到模型中来,从而增强模型在应用中的自适应性。即评分模型已经考虑了用户可能采取的一些舞弊行为,因而模型在应用中会更加稳定,更具有鲁棒性。

参阅图3,本发明实施例提供的确定风险评估参数的方法的一实施例包括:

101、获取待确定风险评估参数的用户的评估信息。

用户的评估信息可以是用户的社交信息和网络中的金融行为信息。例如:好友数量和借贷状况等记录。

102、对所述用户的评估信息进行变量梳理,得到第一类型的变量值和第二类型的变量值。

其中,所述第一类型的变量值为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量值为是否达到舞弊决策条件确定。

达到舞弊决策条件,则取值为1,未达到舞弊决策条件,则取值为0。

该过程可以参阅表3和表4进行理解,本处不做过多赘述。

103、根据所述第一类型的变量值、所述第二类型的变量值和具有评估信息决策功能的决策模型确定所述用户的评估信息的风险评估参数。

该过程可以参阅上述决策模型的公式(5)和公式(6)进行理解。

与现有技术中通过拉伸时间跨度和严格变量条件两种方式,排除用户在社交网络所作的有目的性的舞弊行为,在排除舞弊评估信息的同时也排除了一些有用的评估信息,从而导致风险评估参数的准确性差相比。本发明实施例提供的确定风险评估参数的方法,可以将舞弊信息也引入到决策模型中来,从而增强模型在应用中的自适应性,即评分模型已经考虑了用户可能采取的一些舞弊行为,因而模型在应用中会更加稳定,更具有鲁棒性确保信息的全面性,从而提高风险评估参数的准确性。

可选地,所述对所述用户的评估信息进行变量梳理,得到第一类型的变量值和第二类型的变量值,可以包括:

对所述用户的评估信息进行分类,得到评估信息分类组;

针对每个评估信息分类组分别执行舞弊信息排除和是否达到舞弊决策条件确定的操作,得到第一类评估信息分类组和第二类评估信息分类组;

针对每个第一类评估信息分类组确定一个第一类型的变量值,针对每个第二类评估信息分类组确定一个第二类型的变量值。

本发明实施例中,舞弊信息可以是指因舞弊行为导致的好友增加数量。

可选地,所述根据所述第一类型的变量值、所述第二类型的变量值和具有评估信息决策功能的决策模型确定所述用户的评估信息的风险评估参数,包括:

根据如下公式确定所述用户的评估信息的风险评估参数:

logoddsd=b0+b1x1+b2x2+b3x3+…+bmxm+c1d1+c2d2+c3d3+…cndn;

probabilityd=exp(logoddsd)/(1+exp(logoddsd));

其中,所述x1…xm为第一类型的变量值,m为大于3的整数,d1…dn为第二类型的变量值,n为大于3的整数,b0为初始权重,b1…bm分别为x1…xm的权重,c1…cn分别为d1…dn的权重,logoddsd为函数的因变量值,probabilityd为用户的评估信息的风险评估参数。

参阅图4,本发明实施例提供的建立评估信息决策模型的方法的一实施例包括:

201、获取大量用户的评估信息样本。

202、对所述评估信息样本进行变量梳理,得到第一类型的变量和第二类型的变量。

其中,所述第一类型的变量为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量为根据是否达到舞弊决策条件确定。

该过程可以参阅表3和表4进行理解,本处不做过多赘述。

203、根据所述第一类型的变量和所述第二类型的变量,建立评估信息决策模型。

该过程可以参阅上述决策模型的公式(5)和公式(6)进行理解。

与现有技术中通过拉伸时间跨度和严格变量条件两种方式,排除用户在社交网络所作的有目的性的舞弊行为,在排除舞弊评估信息的同时也排除了一些有用的评估信息,从而导致模型的稳定性差相比。本发明实施例提供的建立评估信息决策模型的方法,可以将舞弊行为也引入到决策模型中来,从而增强模型在应用中的自适应性,即评分模型已经考虑了用户可能采取的一些舞弊行为,因而模型在应用中会更加稳定,更具有鲁棒性确保信息的全面性。

可选地,所述对所述评估信息样本进行变量梳理,得到第一类型的变量和第二类型的变量,可以包括:

对所述评估信息样本进行分类,得到评估信息分类组;

针对每个评估信息分类组分别执行舞弊信息排除和是否达到舞弊决策条件确定的操作,得到第一类评估信息分类组和第二类评估信息分类组;

针对每个第一类评估信息分类组确定一个第一类型的变量,针对每个第二类评估信息分类组确定一个第二类型的变量。

可选地,所述根据所述第一类型的变量和所述第二类型的变量,建立评估信息决策模型,可以包括:

建立如下公式所表示的评估信息决策模型:

logoddsd=b0+b1x1+b2x2+b3x3+…+bmxm+c1d1+c2d2+c3d3+…cndn;

probabilityd=exp(logoddsd)/(1+exp(logoddsd));

其中,所述x1…xm为第一类型的变量,m为大于3的整数,d1…dn为第二类型的变量,n为大于3的整数,b0为初始权重,b1…bm分别为x1…xm的权重,c1…cn分别为d1…dn的权重,logoddsd为函数的因变量,probabilityd为用户的评估信息的风险评估参数。

参阅图5,本发明实施例提供的确定风险评估参数的装置30的一实施例包括:

获取单元301,用于获取待确定风险评估参数的用户的评估信息.

变量梳理单元302,用于对所述获取单元301获取的所述用户的评估信息进行变量梳理,得到第一类型的变量值和第二类型的变量值。

其中,所述第一类型的变量值为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量值为根据是否达到舞弊决策条件确定。

确定单元303,用于根据所述变量梳理单元303得到的所述第一类型的变量值、所述第二类型的变量值和具有评估信息决策功能的决策模型确定所述用户的评估信息的风险评估参数.

与现有技术中通过拉伸时间跨度和严格变量条件两种方式,排除用户在社交网络所作的有目的性的舞弊行为,在排除舞弊评估信息的同时也排除了一些有用的评估信息,从而导致风险评估参数的准确性差相比。本发明实施例提供的确定风险评估参数的装置,可以将舞弊信息和舞弊行为也引入到决策模型中来,从而增强模型在应用中的自适应性,即评分模型已经考虑了用户可能采取的一些舞弊行为,因而模型在应用中会更加稳定,更具有鲁棒性确保信息的全面性,从而提高风险评估参数的准确性。

可选地,所述变量梳理单元302用于:

对所述用户的评估信息进行分类,得到评估信息分类组;

针对每个评估信息分类组分别执行舞弊信息排除和是否达到舞弊决策条件确定的操作,得到第一类评估信息分类组和第二类评估信息分类组;

针对每个第一类评估信息分类组确定一个第一类型的变量值,针对每个第二类评估信息分类组确定一个第二类型的变量值。

可选地,所述确定单元303用于:

根据如下公式确定所述用户的评估信息的风险评估参数:

logoddsd=b0+b1x1+b2x2+b3x3+…+bmxm+c1d1+c2d2+c3d3+…cndn;

probabilityd=exp(logoddsd)/(1+exp(logoddsd));

其中,所述x1…xm为第一类型的变量值,m为大于3的整数,d1…dn为第二类型的变量值,n为大于3的整数,b0为初始权重,b1…bm分别为x1…xm的权重,c1…cn分别为d1…dn的权重,logoddsd为函数的因变量值,probabilityd为用户的评估信息的风险评估参数。

本发明实施例所提供的确定风险评估参数的装置30可以参阅上述的方法部分的描述进行理解,本处不做过多赘述。

参阅图6,本发明实施例提供的建立评估信息决策模型的装置40的一实施例包括:

获取单元401,用于获取大量用户的评估信息样本.

变量梳理单元402,用于对所述获取单元401获取的所述评估信息样本进行变量梳理,得到第一类型的变量和第二类型的变量。

其中,所述第一类型的变量为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量为根据是否达到舞弊决策条件确定。

确定单元403,用于根据所述变量梳理单元402得到的所述第一类型的变量和所述第二类型的变量,建立评估信息决策模型。

与现有技术中通过拉伸时间跨度和严格变量条件两种方式,排除用户在社交网络所作的有目的性的舞弊行为,在排除舞弊评估信息的同时也排除了一些有用的评估信息,从而导致模型的稳定性差相比。本发明实施例提供的建立评估信息决策模型的装置,可以将舞弊信息和舞弊行为也引入到决策模型中来,从而增强模型在应用中的自适应性,即评分模型已经考虑了用户可能采取的一些舞弊行为,因而模型在应用中会更加稳定,更具有鲁棒性确保信息的全面性。

可选地,所述变量梳理单元402用于:

对所述评估信息样本进行分类,得到评估信息分类组;

针对每个评估信息分类组分别执行舞弊信息排除和是否达到舞弊决策条件确定的操作,得到第一类评估信息分类组和第二类评估信息分类组;

针对每个第一类评估信息分类组确定一个第一类型的变量,针对每个第二类评估信息分类组确定一个第二类型的变量。

可选地,所述确定单元403用于:

建立如下公式所表示的评估信息决策模型:

logoddsd=b0+b1x1+b2x2+b3x3+…+bmxm+c1d1+c2d2+c3d3+…cndn;

probabilityd=exp(logoddsd)/(1+exp(logoddsd));

其中,所述x1…xm为第一类型的变量,m为大于3的整数,d1…dn为第二类型的变量,n为大于3的整数,b0为初始权重,b1…bm分别为x1…xm的权重,c1…cn分别为d1…dn的权重,logoddsd为函数的因变量,probabilityd为用户的评估信息的风险评估参数。

本发明实施例所提供的建立评估信息决策模型的装置40可以参阅上述的方法部分的描述进行理解,本处不做过多赘述。

图7是本发明实施例提供的确定风险评估参数的装置50的结构示意图。所述确定风险评估参数的装置50包括处理器510、存储器550和输入/输出i/o设备530,存储器550可以包括只读存储器和随机存取存储器,并向处理器510提供操作指令和数据。存储器550的一部分还可以包括非易失性随机存取存储器(nvram)。

在一些实施方式中,存储器550存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:

在本发明实施例中,通过调用存储器550存储的操作指令(该操作指令可存储在操作系统中),

获取待确定风险评估参数的用户的评估信息;

对所述用户的评估信息进行变量梳理,得到第一类型的变量值和第二类型的变量值;

根据所述第一类型的变量值、所述第二类型的变量值和具有评估信息决策功能的决策模型确定所述用户的评估信息的风险评估参数;

其中,所述第一类型的变量值为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量值为根据是否达到舞弊决策条件确定。

与现有技术中通过拉伸时间跨度和严格变量条件两种方式,排除用户在社交网络所作的有目的性的舞弊行为,在排除舞弊评估信息的同时也排除了一些有用的评估信息,从而导致风险评估参数的准确性差相比。本发明实施例提供的确定风险评估参数的装置,可以将舞弊信息和舞弊行为也引入到决策模型中来,从而增强模型在应用中的自适应性,即评分模型已经考虑了用户可能采取的一些舞弊行为,因而模型在应用中会更加稳定,更具有鲁棒性确保信息的全面性,从而提高风险评估参数的准确性。

处理器510控制确定风险评估参数的装置50的操作,处理器510还可以称为cpu(centralprocessingunit,中央处理单元)。存储器550可以包括只读存储器和随机存取存储器,并向处理器510提供指令和数据。存储器550的一部分还可以包括非易失性随机存取存储器(nvram)。的应用中确定风险评估参数的装置50的各个组件通过总线系统520耦合在一起,其中总线系统520除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线系统520。

上述本发明实施例揭示的方法可以应用于处理器510中,或者由处理器510实现。处理器510可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器510中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器510可以是通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器550,处理器510读取存储器550中的信息,结合其硬件完成上述方法的步骤。

可选地,处理器510用于:

对所述用户的评估信息进行分类,得到评估信息分类组;

针对每个评估信息分类组分别执行舞弊信息排除和是否达到舞弊决策条件确定的操作,得到第一类评估信息分类组和第二类评估信息分类组;

针对每个第一类评估信息分类组确定一个第一类型的变量值,针对每个第二类评估信息分类组确定一个第二类型的变量值。

可选地,处理器510用于:

根据如下公式确定所述用户的评估信息的风险评估参数:

logoddsd=b0+b1x1+b2x2+b3x3+…+bmxm+c1d1+c2d2+c3d3+…cndn;

probabilityd=exp(logoddsd)/(1+exp(logoddsd));

其中,所述x1…xm为第一类型的变量值,m为大于3的整数,d1…dn为第二类型的变量值,n为大于3的整数,b0为初始权重,b1…bm分别为x1…xm的权重,c1…cn分别为d1…dn的权重,logoddsd为函数的因变量值,probabilityd为用户的评估信息的风险评估参数。

图8是本发明实施例提供的建立评估信息决策模型的装置60的结构示意图。所述建立评估信息决策模型的装置60包括处理器610、存储器650和输入/输出i/o设备630,存储器650可以包括只读存储器和随机存取存储器,并向处理器610提供操作指令和数据。存储器650的一部分还可以包括非易失性随机存取存储器(nvram)。

在一些实施方式中,存储器650存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:

在本发明实施例中,通过调用存储器650存储的操作指令(该操作指令可存储在操作系统中),

获取大量用户的评估信息样本;

对所述评估信息样本进行变量梳理,得到第一类型的变量和第二类型的变量;

根据所述第一类型的变量和所述第二类型的变量,建立评估信息决策模型;

其中,所述第一类型的变量为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量为根据是否达到舞弊决策条件确定。

与现有技术中通过拉伸时间跨度和严格变量条件两种方式,排除用户在社交网络所作的有目的性的舞弊行为,在排除舞弊评估信息的同时也排除了一些有用的评估信息,从而导致模型的稳定性差相比。本发明实施例提供的建立评估信息决策模型的装置,可以将舞弊信息和舞弊行为也引入到决策模型中来,从而增强模型在应用中的自适应性,即评分模型已经考虑了用户可能采取的一些舞弊行为,因而模型在应用中会更加稳定,更具有鲁棒性确保信息的全面性。

处理器610控制建立评估信息决策模型的装置60的操作,处理器610还可以称为cpu(centralprocessingunit,中央处理单元)。存储器650可以包括只读存储器和随机存取存储器,并向处理器610提供指令和数据。存储器650的一部分还可以包括非易失性随机存取存储器(nvram)。的应用中建立评估信息决策模型的装置60的各个组件通过总线系统620耦合在一起,其中总线系统620除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线系统620。

上述本发明实施例揭示的方法可以应用于处理器610中,或者由处理器610实现。处理器610可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器610中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器610可以是通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器650,处理器610读取存储器650中的信息,结合其硬件完成上述方法的步骤。

可选地,处理器610用于:

对所述评估信息样本进行分类,得到评估信息分类组;

针对每个评估信息分类组分别执行舞弊信息排除和是否达到舞弊决策条件确定的操作,得到第一类评估信息分类组和第二类评估信息分类组;

针对每个第一类评估信息分类组确定一个第一类型的变量,针对每个第二类评估信息分类组确定一个第二类型的变量。

可选地,处理器610用于:

建立如下公式所表示的评估信息决策模型:

logoddsd=b0+b1x1+b2x2+b3x3+…+bmxm+c1d1+c2d2+c3d3+…cndn;

probabilityd=exp(logoddsd)/(1+exp(logoddsd));

其中,所述x1…xm为第一类型的变量,m为大于3的整数,d1…dn为第二类型的变量,n为大于3的整数,b0为初始权重,b1…bm分别为x1…xm的权重,c1…cn分别为d1…dn的权重,logoddsd为函数的因变量,probabilityd为用户的评估信息的风险评估参数。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:rom、ram、磁盘或光盘等。

以上对本发明实施例所提供的确定风险评估参数的方法、建立评估信息决策模型的方法以及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1