一种信息风险评估方法及装置与流程

文档序号:12597745阅读:169来源:国知局
一种信息风险评估方法及装置与流程

本申请涉及信息安全技术领域,特别涉及一种信息风险评估方法及装置。



背景技术:

随着互联网的发展,越来越多的人都开始通过互联网进行电子交易或者电子金融业务,网络中也出现了很多恶意用户在电子交易中伤害他人利益的情况,为了防止这种恶意行为,出现了分析银行卡、用户身份等电子交易信息是否存在风险的方案,从而对电子交易或者电子金融等业务进行风险评估,可以在一定程度上提高电子交易或者电子金融业务的安全性。

在现有技术中对银行卡的风险识别中通常使用归一化的活动识别网络的风险(risk scoring of activity identity network,rain)评估方式,该评估方式在获取银行卡的特征信息后,带入逻辑回归函数求解参数a,然后通过该逻辑回归函数对待评估的银行卡的特征信息进行分析,最终得到该银行卡的评估结果(通常以数值表示),从而可以根据该评估结果对该银行卡进行相应处理。

但是本申请的发明人发现rain评估方式比较死板,在某些情况下对正常的特征信息也给以很高风险的评分,造成部分银行卡风险评分偏高而影响用户的正常使用。



技术实现要素:

为了解决现有技术中由于rain评估方法会将一些正常的信息给予较高的风险值,造成对这部分信息进行误操作的问题,提出了一种信息风险评估方法及装置,通过计算设定rain评估方法的起始点的方法,可以避免一些正常的信息被rain评估方法评价以高风险值。

本申请提供的一种信息风险评估方法,包括,

获取被分析信息中的特征信息;

确定所述特征信息的起始点;

根据所述起始点将所述特征信息转换为0及原有值;

将所述特征信息输入到rain评估模块中,用以计算所述特征信息的风险值。

本申请实施例还提供了一种信息风险评估的装置,包括,

获取模块,用于获取被分析信息中的特征信息;

确定模块,用于确定所述特征信息的起始点;

转换模块,用于根据所述起始点将所述特征信息转换为0及原有值;

评估模块,用于计算输入的所述特征信息的风险值。

由以上本申请实施例提供的技术方案可见,可以以更加符合实际业务经验的方式对诸如银行卡、用户信息等信息进行风险评估,重新定义特征信息的起始点,使得rain评估方法更加准确,避免将一些正常的特征信息识别为高风险,从而避免了一些对于这部分信息的错误控制操作。

当然实施本申请的任一产品或者方法必不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1所示为本申请实施例一种信息风险评估的方法流程图;

图2所示为本申请实施例一种信息风险评估装置的结构示意图;

图3所示为本申请实施例中一种银行卡风险评估的具体方法流程图;

图4所示为本申请实施例特征信息的分布示意图。

具体实施方式

本申请实施例提供一种信息风险评估方法及装置。

为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

如图1所示为本申请实施例一种信息风险评估的方法流程图,在该图所示实施例中通过确定特征信息的起始点,将一部分特征信息的取值置为0,从而可以控制该部分的特征信息在rain的风险评估方法中的风险值,使得这部分正常的特征信息不会出现现有rain风险评估方法中的高风险值的问题,由此提高了整个评估方法的准确性。

该图中步骤具体包括,步骤101,获取被分析信息中的特征信息。

步骤102,确定所述特征信息的起始点。

步骤103,根据所述起始点将所述特征信息转换为0及原有值。

步骤104,将所述特征信息输入到rain评估模块中,用以计算所述特征信息的风险值。

根据本申请的一个实施例,所述获取被分析信息中的特征信息包括,根据被分析信息的类型获取该被分析信息中相应的特征信息,其中所述被分析信息包括银行卡信息,用户信息,用户住址信息等等,进一步,以银行卡信息举例来说,相应的特征信息可能包括使用同一张银行卡的人数,银行卡一段时间内的使用次数等等。

根据本申请的一个实施例,确定所述特征信息的起始点具体包括:

寻找所述特征信息不同取值的分布变化达到预定条件的取值点;

将所述取值点作为所述特征信息的起始点。

其中,所述特征信息不同取值的分布是指,一个特征信息有几个取值,每个取值所具有的被分析信息的个数(也就是每个取值时特征信息的数量),例如,被分析信息为银行卡,一个月中使用银行卡的次数作为特征信息,一共有1万张银行卡,每张银行卡中都具有该特征信息,共有4000张银行卡在一个月中使用1次银行卡,5000张银行卡为一个月中使用了2次银行卡,1000张银行卡为一个月中使用了3次银行卡;所述分布变化是指,银行卡由4000张变化到5000张再变化到1000张,两两之差为5000-4000=1000和5000-1000=4000。

根据本申请的一个实施例,寻找所述特征信息不同取值的分布变化达到预定条件的取值点进一步包括,寻找所述特征信息不同取值分布的拐点,将该拐点作为所述取值点。其中,可以通过求解所述特征信息分布的一阶导数来寻找拐点,通过上一个实施例的例子,一个月使用了3次银行卡即为拐点,也就是取值点。

根据本申请的一个实施例,寻找所述特征信息不同取值的分布变化达到预定条件的取值点进一步包括,计算所述特征信息不同取值的分布中相邻两个特征信息数量的比值,将比值最大的相应特征信息取值作为取值点。参考上述实施例,4000张银行卡与5000张银行卡的比值,可以使用大的数字作为分子,小的数字作为分母,从而得到这两个特征信息数量的比值为5/4,5000张银行卡与1000张银行卡的比值,还是使用大的数字作为分子,小的数字作为分母,从而得到这两个特征信息数量的比值为5/1,其中5/1为最大的比值,因此以5000张银行卡的特征信息取值,即一个月使用了2次银行卡作为取值点。当然,使用小的数字作为分子,大的数字作为分母也是可以进行上述判断的,只需要适应性的调整阀值即可,在此不再赘述。

类似上述步骤的寻找取值点的方式还有很多,例如计算相邻两个特征信息数量的环比变化率,即((当前特征信息数量-上一次特征信息数量)/上一次特征信息数量)*100%,当相邻两个特征信息数量的环比变化率最大时,取相应特征信息取值作为取值点,以上述实施例为例,在特征信息取值为1和2时的环比变化率为25%,特征信息取值为2和3时的环比变 化率为80%,其中80%的环比变化率较大,因此以5000张银行卡的特征信息取值(一个月内2次使用银行卡)作为取值点。其它的方式在本申请中不再赘述,只要能够找到特征信息不同取值的分布变化明显的特征信息取值,就可以找到相应的取值点,从而相应的确定该特征信息的起始点。

根据本申请的一个实施例,将所述取值点作为所述特征信息的起始点中进一步包括,根据所述特征信息的经验值,对所述取值点进行调整。其中,当有两个或者多个特征信息取值点的变化接近(例如斜率接近、环比变化率接近或者比值接近等等),被分析信息为银行卡,特征信息为一个月内使用银行卡的次数,对于该特征信息来说,一个月内使用2次银行卡和一个月内使用3次银行卡的变化接近,可以以2次作为取值点也可以以3次作为取值点,而相应的经验值可能一个月内使用3次银行卡也是正常的,此时可以根据该经验值将一个月内3次使用银行卡作为取值点。

根据本申请的一个实施例,根据所述起始点将所述特征信息转换为0及原有值进一步包括,将小于等于所述起始点的特征信息转换为0,将大于所述起始点的特征信息保持为原有值。参照上述实施例,当起始点为2时(一个月内使用2次银行卡),则一个月内使用1次银行卡和一个月内使用2次银行卡两种情况均被转换为0,该特征信息从一个月内使用3次银行卡这个取值开始。

根据本申请的一个实施例,将所述特征信息输入到rain评估模块中,用以计算所述特征信息的风险值进一步包括,所述rain评估模块采用的逻辑回归函数可以为:

其中,f(x)为特征信息的风险值,x为特征信息的取值,a为参数。在现有技术中,rain评估模块从A(Acivity,账户行为)、I(Identity,账户基本属性)、N(Network,账户关系)的三个大的维度来预测账户的风险,该方法通过确定特征信息的阀值K和相应的归一化后的分值P,带入上述逻辑回归函数计算出参数a的值,形成完整的rain评估模块,再将待分析特征信息的不同取值输入到该函数中得到相应特征信息取值的风险值,具体的rain评估方法可以参考现有技术中的方案,在此不再赘述,现有技术中由于是将特征信息的每个取值都输入函数中进行计算,因此造成某些正常的特征信息取值的风险值偏高,造成错误的风险评估。在本申请技术方案中,将经过上述步骤处理后得到的特征信息取值带入该逻辑回归函数,当1次和2次使用银行卡的情况下,将0带入函数后,计算得到这两个特征信息取值的风险值为0,当3次使用银行卡的情况下,将3带入函数后,计算得到相应特征信息取值的风险值。这样可以得到避免某些正常特征信息取值得到高风险值的评估,从而避免了对该被 分析信息(本例中为银行卡)的后续错误控制操作(可能会冻结该银行卡的使用或者标记该银行卡为高风险,在某些应用中不允许使用)。

根据本申请的一个实施例,在将所述特征信息输入到rain评估模块中,用以计算所述特征信息的风险值之后还包括,将该被分析信息的所有特征信息中最大的风险值作为该被分析信息的风险值。

根据本申请的一个实施例,将所述被分析信息的风险值扩大相同倍数,例如将0-1之间的风险值同时扩大100倍,调整到0-100区间进行风险值的判断。

通过上述本申请实施例的方法,可以以更加符合实际业务经验的方式对诸如银行卡、用户信息等信息进行风险评估,重新定义特征信息的起始点,使得rain评估方法更加准确,避免将一些正常的特征信息识别为高风险,从而避免了一些对于这部分信息的错误控制操作。

如图2所示为本申请实施例一种信息风险评估装置的结构示意图,本实施例中的装置可以采用专用逻辑电路或者芯片实现,或者安装运行于现有的高性能计算机中,包括但不限于服务器、并行计算机系统等。

该图中具体包括,获取模块201,用于获取被分析信息中的特征信息。

确定模块202,用于确定所述特征信息的起始点。

转换模块203,用于根据所述起始点将所述特征信息转换为0及原有值。

评估模块204,用于计算输入的所述特征信息的风险值。

根据本申请的一个实施例,所述获取模块进一步用于根据被分析信息的类型获取该被分析信息中相应的特征信息。

根据本申请的一个实施例,所述确定模块进一步用于寻找所述特征信息不同取值的分布变化达到预定条件的取值点;将所述取值点作为所述特征信息的起始点。

根据本申请的一个实施例,所述确定模块进一步用于寻找所述特征信息不同取值分布的拐点,将该拐点作为所述取值点。

根据本申请的一个实施例,所述确定模块进一步用于计算所述特征信息不同取值的分布中相邻两个特征信息数量的比值,将比值最大的相应特征信息取值作为取值点。

根据本申请的一个实施例,还包括调整模块205,与所述确定模块相连接,根据所述特征信息的经验值,对所述取值点进行调整。

根据本申请的一个实施例,所述转换模块进一步用于将小于等于所述起始点的特征信息转换为0,将大于所述起始点的特征信息保持为原有值。

根据本申请的一个实施例,所述评估模块还用于将该被分析信息的所有特征信息中最大 的风险值作为该被分析信息的风险值。

根据本申请的一个实施例,还包括放大模块206,与所述评估模块相连接,用于将所述被分析信息的风险值扩大相同倍数。

通过上述本申请实施例的装置,可以以更加符合实际业务经验的方式对诸如银行卡、用户信息等信息进行风险评估,重新定义特征信息的起始点,使得rain评估方法更加准确,避免将一些正常的特征信息识别为高风险,从而避免了一些对于这部分信息的错误控制操作。

如图3所示为本申请实施例中一种银行卡风险评估的具体方法流程图,在本实施例中以银行卡为例对风险评估进行说明,在现有的rain风险评估方法之前加入了确定临界点(benchmark point)的步骤,重新确定了rain风险评估方法中变量的起始点,避免了现有rain风险评估方法将一些正常的特征信息给予高风险评估的错误,使得风险评估更加准确。

具体包括步骤301,获取银行卡风险评估中的特征信息。

在本步骤中,银行卡可能有多个信息段,例如卡号、用户名、开户行等等,还包括很多用于风险评估的特征信息,例如,一段时间内该银行卡的使用次数,一段时间内使用该银行卡的人数,绑定的手机号码等,这些特征信息可以用来银行卡的风险评估,因此在本步骤中先获得银行卡的特征信息,在本实施例中以一个月内该银行卡的使用次数作为特征信息进行说明,其它的特征信息可以参照本实施例的分析步骤。

步骤302,获得多张银行卡的相应特征信息取值。

在本实施例中以1万张银行卡为例进行说明,分别获取了1万张银行卡在一个月内的使用次数数据,该部分数据可以从电子交易的数据库中获得,并形成单独的数据表格。

其中,3000张银行卡一个月内使用1次,相应的特征信息取值为1;4000张银行卡一个月内使用2次,相应的特征信息取值为2;2000张银行卡一个月内使用3次,相应的特征信息取值为3;1000张银行卡一个月内使用4次,相应的特征信息取值为4。

步骤303,获得上述特征信息在不同取值时的分布。

根据前一步骤可知,特征信息取值为1时,银行卡为3000张;特征信息取值为2时,银行卡为4000张;特征信息取值为3时,银行卡为2000张;特征信息取值为4时,银行卡为1000张,形成如图4所示为本申请实施例特征信息的分布示意图,其中x轴为特征信息的取值(银行卡月均使用次数),y轴为银行卡数量。

步骤304,根据所述特征信息的分布寻找变化率较大的取值点,也就是寻找所述特征信息分布的临界点(benchmark point)。

在本实施例中,可以通过计算该曲线的一阶导数的方式得到相应的拐点,由于特征信息 的取值和银行卡数量有很多,因此可能形成的特征信息分布曲线的拐点也有多个,可以取拐点斜率最大的作为最终的拐点,该拐点也就是上述的变化率较大的取值点。

在本例中寻找出的取值点为特征信息取值为2的拐点。

通过以上方式可以根据特征信息不同取值的分布变化得到变化率较大的取值点,当然也还可以通过其它方式来获得变化率较大的取值点,例如,将特征信息取值为1时的特征信息数量与特征信息取值为2时的特征信息数量做差,得到第一差值1000,再将特征信息取值为2时的特征信息数量与特征信息取值为3时的特征信息数量做差,得到第二差值2000,将特征信息取值为3时的特征信息数量与特征信息取值为4时的特征信息数量做差,得到第三差值1000,所述第二差值为三个差值之中的最大差值,则认为特征信息取值为2时的特征信息分布变化达到预定条件,也就是说当特征信息取值为2时,特征信息不同取值的分布变化率较大,此时的特征信息取值2可以作为该特征信息的取值点。

还可以根据相邻特征信息取值的比值来确定该特征信息变化率较大的取值点,例如,特征信息取值为1时的特征信息数量与特征信息取值为2时的特征信息数量的比值为第一比值4/3,特征信息取值为2时的特征信息数量与特征信息取值为3时的特征信息的比值为第二比值4/2,特征信息取值为3时的特征信息数量与特征信息取值为4时的特征信息的比值为第三比值2/1,第二比值和第三比值为三个比值之中最大的两个比值,因此确定特征信息取值2或者特征信息取值3为该特征信息的变化率较大的取值点。

步骤305,结合银行卡使用次数的业务经验值来对所述取值点进行调整。

具体的,当特征信息取值点2与特征信息取值点3的变化率为整个特征信息的分布中变化率较大的两个取值点,且两个取值点的变化率较为接近,例如取值点2和取值点3的斜率比较接近,或者取值点2特征信息数量与取值点3特征信息数量的第一比值,取值点3特征信息数量与取值点4特征信息数量的第二比值较为接近(如上一步骤中比值关系寻找取值点的实施例),则需要根据银行卡使用次数的经验值来进行筛选,例如银行卡使用次数的经验值为2,根据上面的两个特征信息取值2和3,再考虑到经验值2,则该特征信息分布的取值点为2。

其中,银行卡使用次数经验值是根据历史特征信息取值的经验累积结果,本步骤305在某些场景中可以省却。

步骤306,将所述取值点作为该特征信息的起始点。

步骤307,将小于等于所述起始点的特征信息取值转换为0,将大于所述起始点的特征信息取值保留为原有值。

在本实施例中,特征信息取值1和特征信息取值2均被转换为0,特征信息取值3和特 征信息4保留。

步骤308,将所述特征信息取值输入到rain(risk scoring of activity identity network)评估模块中,进行特征信息的风险值评估。

采用现有技术中的rain评估方法进行风险值评估,例如,首先确定特征信息的阀值K(例如为2)以及相对应的归一化后的分值P(例如为0.9),然后带入逻辑回归函数:其中x为特征信息取值,f(x)为特征信息的风险值,求解参数a,得到rain评估模块的最终逻辑回归函数,例如阀值K取2,归一化分值为0.9,带入到逻辑回归函数计算出的参数a为1.4725。

将上述特征信息的取值输入到逻辑回归函数中,在银行卡使用次数为1和2的时候,由于前述起始点设定的原因,此时的x均为0,风险值f(x)计算结果为0,在银行卡使用次数为3时,x为原有的3,此时f(x)计算结果0.9761,在银行卡使用次数为4时,x为原有的4,此时f(x)计算结果0.9944,也就是说,在一个月内使用银行卡1次和2次的情况均为合理现象,不应当作为风险。

在现有技术rain风险评估方法中,银行卡使用次数为1时的相应风险值f(x)为0.6268,银行卡使用次数为2时的相应风险值f(x)为0.9001,在现有技术的场景中,由于银行卡使用次数为2的风险值较高,可能会被监控处理,造成银行卡不能使用等情况。但在本申请的技术方案中银行卡使用次数为1和2的时候,风险值均为0,将作为安全处理。

步骤309,对银行卡中所有的特征信息进行上述步骤303-步骤308,得到各个特征信息的风险值。

步骤310,将银行卡所有特征信息中最大的风险值作为该银行卡的风险值评估结果。

步骤311,将上述风险值扩大100倍,形成0至100区间内的风险值,用以对银行卡的风险程度进行评价。

通过上述本申请实施例中的方法及装置,可以以更加符合实际业务经验的方式对诸如银行卡、用户信息等信息进行风险评估,重新定义特征信息的起始点,使得rain评估方法更加准确,避免将一些正常的特征信息识别为高风险,从而避免了一些对于这部分信息的错误控制操作。

对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将 改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable Gate Array,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片2。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware Description Language)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby Hardware Description Language)等,目前最普遍使用的是VHDL(Very-High-Speed Integrated Circuit Hardware Description Language)与Verilog2。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。

本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

虽然通过实施例描绘了本申请,本领域普通技术人员知道,本申请有许多变形和变化而不脱离本申请的精神,希望所附的权利要求包括这些变形和变化而不脱离本申请的精神。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1