风险识别方法和装置与流程

文档序号:35922057发布日期:2023-11-04 07:48阅读:39来源:国知局
风险识别方法和装置与流程

本说明书一个或多个实施例涉及电子信息技术,尤其涉及风险识别方法和装置。


背景技术:

1、随着互联网技术的迅猛发展,人们越来越多地利用互联网进行通信、学习、工作,甚至通过互联网进行交易、支付、转账、投资等行为。一方面这些行为可能存在一定的风险;另一方面也有一些不法分子容易利用互联网的技术缺陷、法律缺陷等进行不法行为。这些都对网络行为的安全性带来了威胁,因此风险识别就尤为重要。

2、目前,机器学习作为人工智能技术的重要分支,已经广泛应用于多种风控场景中。通过训练用于风险识别的人工神经网络模型对发生的事件进行风险识别。

3、但是,人工神经网络模型识别的准确性取决于训练样本的数量及质量,在很多情况下,训练样本的数量或质量无法保证,从而导致人工神经网络模型对于风险识别的准确性较低,无法满足业务要求。另一方面,人工神经网络模型的训练及识别过程都是一种黑盒操作,其可解释性及合理性无法保证,因此,也无法满足业务要求。


技术实现思路

1、本说明书一个或多个实施例描述了风险识别方法和装置,无需基于人工神经网络模型进行风险识别,满足业务要求。

2、根据第一方面,提供了一种风险识别方法,其中,该方法包括:

3、预先设置各个风险表达要素;

4、实时得到各种风险类型的统计样本;

5、根据各种风险类型的统计样本,实时确定各个风险表达要素的取值;

6、当发生一个事件时,得到发生该事件时各个风险表达要素的取值;

7、根据发生该事件时各个风险表达要素的取值,确定狄利克雷(dirichlet)分布的分布参数的取值;

8、根据狄利克雷(dirichlet)分布的分布参数的取值,确定所发生的该事件符合各种风险类型的各概率值。

9、其中,所述各个风险表达要素包括如下中的至少一种:

10、风险事件变量x;

11、风险事件可能的结果的集合{x1,x2,x3,...,xn};在该集合中,第i个风险事件可能的结果xi用于表征:属于预先定义的第i种风险类型;n为预先定义的风险类型的数量;

12、风险事件可能的结果对应的基础比例{a1,a2,a3,...,an};其中,基础比例ai对应第i个风险事件可能的结果xi,ai用于表征:在没有统计信息的情况下确定出的xi发生的预设比例值;

13、风险事件可能的结果对应的置信质量{b1,b2,b3,...,bn};其中,置信质量bi对应第i个风险事件可能的结果xi,置信质量bi用于表征:在基于统计信息的情况下确定出的xi发生的比例值;

14、风险事件可能的结果的不确定性u;

15、风险事件的前件和后件。

16、其中,所述根据各种风险类型的统计样本,实时确定各个风险表达要素的取值,包括如下中的至少一种:

17、当风险表达要素包括风险事件可能的结果对应的基础比例{a1,a2,a3,...,an}时,确定所述ai的取值等于其预设比例值;

18、当风险表达要素包括风险事件可能的结果对应的置信质量{b1,b2,b3,...,bn}时,根据n种风险类型的统计样本的总数量以及第i种风险类型的统计样本的数量,计算bi值;

19、当风险表达要素包括风险事件可能的结果的不确定性u时,根据已经统计过的统计样本的总数量确定u的取值,其中,统计样本的总数量越大,u的取值越小。

20、其中,所述根据发生该事件时各个风险表达要素的取值确定狄利克雷(dirichlet)分布的分布参数的取值,包括:

21、执行如下计算:

22、当u≠0时,

23、当u=0时,∝i=bim+aiw

24、其中,∝i表示狄利克雷(dirichlet)分布的分布参数的第i个元素的取值,对应于第i个风险事件可能的结果xi;w为预设的常数;m为风险识别系统所部署的环境支持的最大整数值,用于代表正无穷。

25、其中,所述根据狄利克雷(dirichlet)分布的分布参数的取值确定当前发生的该事件符合各种风险类型的各概率值,包括执行如下计算:

26、pi=∝i/∝0;其中,

27、pi表示所发生的该事件符合第i种风险类型的概率值。

28、其中,在所述根据发生该事件时各个风险表达要素的取值确定狄利克雷(dirichlet)分布的分布参数的取值之后,进一步包括:

29、利用如下计算式计算所述事件符合每一种风险类型的概率值的不确定性:

30、

31、其中,var[xi]表示所述事件符合第i种风险类型的概率值的不确定性;∝i表示狄利克雷(dirichlet)分布的分布参数的第i个元素的取值,对应于第i个风险事件可能的结果xi;n为风险类型的数量。

32、其中,在所述根据发生该事件时各个风险表达要素的取值确定狄利克雷(dirichlet)分布的分布参数的取值之后,进一步包括:

33、利用如下计算式计算所述事件符合的任意两种风险类型的概率值之间的相对不确定性:

34、

35、其中,cov[xi,xj]表示:对于所述事件符合第i种风险类型的概率值与所述事件符合第j种风险类型的概率值,该两个概率值之间的相对不确定性;∝i表示狄利克雷(dirichlet)分布的分布参数的第i个元素的取值,对应于第i个风险事件可能的结果xi;∝j表示狄利克雷(dirichlet)分布的分布参数的第j个元素的取值,对应于第j个风险事件可能的结果xj;δij是克罗内克符号(kronecker delta);n为风险类型的数量。

36、根据第二方面,提供了一种风险识别装置,其中,该装置包括:

37、风险表达要素存储模块,配置为保存各个风险表达要素;

38、统计样本获取模块,配置为实时得到各种风险类型的统计样本;

39、风险表达要素取值模块,配置为根据各种风险类型的统计样本,实时确定各个风险表达要素的取值;

40、参数确定模块,配置为当发生一个事件时,得到发生该事件时各个风险表达要素的取值;根据发生该事件时各个风险表达要素的取值,确定狄利克雷(dirichlet)分布的分布参数的取值;

41、概率值确定模块,配置为根据狄利克雷(dirichlet)分布的分布参数的取值,确定所发生的该事件符合各种风险类型的各概率值。

42、其中,各个风险表达要素包括如下中的至少一种:

43、风险事件变量x;

44、风险事件可能的结果的集合{x1,x2,x3,...,xn};在该集合中,第i个风险事件可能的结果xi用于表征:属于预先定义的第i种风险类型;n为预先定义的风险类型的数量;

45、风险事件可能的结果对应的基础比例{a1,a2,a3,...,an};其中,基础比例ai对应第i个风险事件可能的结果xi,用于表征:在没有统计信息的情况下确定出的xi发生的预设比例值;

46、风险事件可能的结果对应的置信质量{b1,b2,b3,...,bn};其中,置信质量bi对应第i个风险事件可能的结果xi,用于表征:在基于统计信息的情况下确定出的xi发生的比例值;

47、风险事件可能的结果的不确定性u;

48、风险事件的前件和后件。

49、其中,所述参数确定模块被配置为执行如下计算:

50、当u≠0时,

51、当u=0时,∝i=bim+aiw

52、其中,∝i表示狄利克雷(dirichlet)分布的分布参数的第i个元素的取值,对应于第i个风险事件可能的结果xi;w为预设的常数;m为风险识别系统所部署的环境支持的最大整数值,用于代表正无穷。

53、根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行本说明书任一实施例所述的方法。

54、根据第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现本说明书任一实施例所述的方法。

55、本说明书各个实施例提供的风险识别方法及装置,不是基于人工神经网络,因此不会受限于训练样本的数量及质量。本说明书实施例是基于统计样本即对客观现实中已经发生的各种风险类型的事件的统计,并借助于狄利克雷分布来实现风险识别的,因此,使得风险识别的结果更符合统计概率,更具有科学性。并且,本说明书实施例提出的风险识别的方法将对一个事件的风险性相关的判断依据体现为具有可解释性的各个风险表达要素,并基于统计样本来实时更新各个风险表达要素的取值,从而根据各个风险表达要素的取值确定一个事件属于各种风险类型的概率。可见,本说明书实施例提出的方法不是一种黑盒操作,而是具有可解释性及合理性的方法,因此使得风险识别结果更实用。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1