基于大数据风控的信息判别方法及系统与流程

文档序号:36703838发布日期:2024-01-16 11:38阅读:21来源:国知局
基于大数据风控的信息判别方法及系统与流程

本发明涉及人工智能,具体而言,涉及一种基于大数据风控的信息判别方法及系统。


背景技术:

1、大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。基于数据处理能力的不断提高,可以对大数据进行有效的信息挖掘,如在风控领域中,可以提取到风控用户的用户数据(如身份数据、信贷数据等),然后,可以基于用户数据进行分析挖掘,以确定是否具有风险或具有的风险程度等信息,但是,在现有技术中,存在风控判别的可靠度不佳的问题。


技术实现思路

1、有鉴于此,本发明的目的在于提供一种基于大数据风控的信息判别方法及系统,以在一定程度上提高风控判别的可靠度。

2、为实现上述目的,本发明实施例采用如下技术方案:

3、一种基于大数据风控的信息判别方法,包括:

4、对于待分析风控用户,分析出所述待分析风控用户在预设时间区间中,进行的预设类用户交互行为,并分析出所述预设类用户交互行为相关的、所述待分析风控用户以外的至少一个交互风控用户;

5、依据所述待分析风控用户的待分析用户表征数据和所述预设类用户交互行为对应的行为内容表征数据,分析出所述待分析风控用户对应的待分析用户描述向量;

6、依据所述至少一个交互风控用户中的每一个交互风控用户对应的交互用户表征数据和所述至少一个交互风控用户在所述预设时间区间中分别进行的指定类用户交互行为对应的行为内容表征数据,分析出所述至少一个交互风控用户中的每一个交互风控用户对应的交互用户描述向量,所述交互用户表征数据、所述待分析用户表征数据和所述行为内容表征数据各自具有的数据形式包括文本数据、音频数据和/或图像数据;

7、基于所述待分析用户描述向量和所述至少一个交互风控用户中的每一个交互风控用户对应的交互用户描述向量之间的向量匹配参数,确定出向量匹配参数符合预先配置的用户筛选规则的第一数量个交互风控用户,并将所述第一数量个交互风控用户标记为所述待分析风控用户的关联风控用户,以得到第一数量个关联风控用户;

8、基于所述第一数量个关联风控用户中的每一个关联风控用户对应的风控维度表征数据和所述待分析风控用户对应的风控维度表征数据,对所述待分析风控用户进行风控判别操作,以输出对应的目标风控判别结果,所述目标风控判别结果用于反映所述待分析风控用户的风险程度。

9、在一些优选的实施例中,在上述基于大数据风控的信息判别方法中,所述对于待分析风控用户,分析出所述待分析风控用户在预设时间区间中,进行的预设类用户交互行为,并分析出所述预设类用户交互行为相关的、所述待分析风控用户以外的至少一个交互风控用户的步骤,包括;

10、分析出所述待分析风控用户在预设时间区间中作为主动交互用户和被动交互用户时,进行的各个用户交互行为,以及,对该用户交互行为进行标记,以标记为所述待分析风控用户进行的预设类用户交互行为,所述主动交互用户是指所述待分析风控用户主动与其它风控用户进行交互,所述被动交互用户是指所述待分析风控用户被动与其它风控用户进行交互;

11、对所述待分析风控用户进行的各预设类用户交互行为对应的用户中所述待分析风控用户外以外的每一个用户进行标记,以标记为交互风控用户。

12、在一些优选的实施例中,在上述基于大数据风控的信息判别方法中,所述待分析用户表征数据包括各维度的用户属性表征数据,所述预设类用户交互行为对应的行为内容表征数据包括所述待分析风控用户进行的交互行为对应的交互内容;

13、所述依据所述待分析风控用户的待分析用户表征数据和所述预设类用户交互行为对应的行为内容表征数据,分析出所述待分析风控用户对应的待分析用户描述向量的步骤,包括:

14、基于所述待分析用户表征数据中包括的各维度的用户属性表征数据,分析出对应的用户属性关键数据;

15、基于所述预设类用户交互行为对应的行为内容表征数据,分析出所述预设类用户交互行为对应的行为记录性关键数据;

16、基于所述预设类用户交互行为对应的行为内容表征数据,分析出所述预设类用户交互行为对应的行为特异性关键数据;

17、基于所述待分析风控用户对应的用户属性关键数据、所述行为记录性关键数据和所述行为特异性关键数据,分析出所述待分析风控用户对应的待分析用户描述向量。

18、在一些优选的实施例中,在上述基于大数据风控的信息判别方法中,所述基于所述预设类用户交互行为对应的行为内容表征数据,分析出所述预设类用户交互行为对应的行为记录性关键数据的步骤,包括:

19、基于所述预设类用户交互行为对应的行为内容表征数据,分析出所述待分析风控用户主要进行的各个用户交互行为对应的行为数量第一统计值,以及,分析所述各个用户交互行为分别对应的交互行为持续时长,所述待分析风控用户主要进行的各个用户交互行为是指,在该用户交互行为中所述待分析风控用户的用户交互数据量的占比不小于预先配置的参考占比;

20、确定出对应的交互行为持续时长属于预先配置的第一参考持续时长区间内的各个用户交互行为对应的行为数量第二统计值,以及,依据所述行为数量第一统计值和所述行为数量第二统计值,分析出所述预设类用户交互行为对应的可关注行为表征参数;

21、基于所述行为数量第一统计值和所述可关注行为表征参数,分析出所述预设类用户交互行为对应的行为记录性关键数据。

22、在一些优选的实施例中,在上述基于大数据风控的信息判别方法中,所述基于所述预设类用户交互行为对应的行为内容表征数据,分析出所述预设类用户交互行为对应的行为特异性关键数据的步骤,包括:

23、基于所述预设类用户交互行为对应的行为内容表征数据,分析出所述待分析风控用户主要进行的各个用户交互行为,以及,提取到所述各个用户交互行为中的目标行为内容表征数据,所述待分析风控用户主要进行的各个用户交互行为是指,在该用户交互行为中所述待分析风控用户的用户交互数据量的占比不小于预先配置的参考占比;

24、分别将所述目标行为内容表征数据进行数据分段操作,以形成对应的各个重要性数据片段和各个重要性数据片段分别对应的出现表征参数,以及,提取到预先配置每一个数据维度对应的交互内容数据片段簇,所述数据维度是指对应的行为内容表征数据的数据形式,所述出现表征参数用于反映与对应的重要性数据片段相同的重要性数据片段的数量;

25、分析出与所述各个重要性数据片段之间的语义相关度大于或等于预先确定的参考语义相关度的目标交互内容数据片段簇,并将所述目标交互内容数据片段簇对应的重要性数据片段进行标记,以标记为所述预设类用户交互行为对应的行为特异性关键数据。

26、在一些优选的实施例中,在上述基于大数据风控的信息判别方法中,所述分析出与所述各个重要性数据片段之间的语义相关度大于或等于预先确定的参考语义相关度的目标交互内容数据片段簇的步骤,包括:

27、选择出所述各个重要性数据片段中对应的出现表征参数具有最大值的目标重要性数据片段,以及,分析出与所述目标重要性数据片段之间的语义相关度大于或等于预先确定的参考语义相关度的目标交互内容数据片段,以及,对包括所述目标交互内容数据片段的交互内容数据片段簇进行标记,以标记为与所述各个重要性数据片段之间的语义相关度大于或等于预先确定的参考语义相关度的目标交互内容数据片段簇;或者

28、分析出所述各个重要性数据片段分别所在的待定交互内容数据片段簇,以及,基于所述各个重要性数据片段分别对应的出现表征参数,分析出各个待定交互内容数据片段簇中包括的重要性数据片段的数据片段数量,并对包括的重要性数据片段的数据片段数量具有最大值的待定交互内容数据片段簇进行标记,标记为与所述各个重要性数据片段之间的语义相关度大于或等于预先确定的参考语义相关度的目标交互内容数据片段簇。

29、在一些优选的实施例中,在上述基于大数据风控的信息判别方法中,所述交互用户表征数据包括各维度的用户属性表征数据,所述指定类用户交互行为对应的行为内容表征数据包括所述交互风控用户进行的交互行为对应的交互内容;

30、所述依据所述至少一个交互风控用户中的每一个交互风控用户对应的交互用户表征数据和所述至少一个交互风控用户在所述预设时间区间中分别进行的指定类用户交互行为对应的行为内容表征数据,分析出所述至少一个交互风控用户中的每一个交互风控用户对应的交互用户描述向量的步骤,包括:

31、对于所述至少一个交互风控用户,确定出对应的交互用户表征数据中包括的各维度的用户属性表征数据,以输出所述至少一个交互风控用户中的每一个交互风控用户对应的用户属性关键数据;

32、基于所述指定类用户交互行为对应的行为内容表征数据,确定出所述至少一个交互风控用户中的每一个交互风控用户对应的行为记录性关键数据和行为特异性关键数据;

33、基于所述至少一个交互风控用户中的每一个交互风控用户对应的用户属性关键数据、所述行为记录性关键数据和所述行为特异性关键数据,确定出所述至少一个交互风控用户中的每一个交互风控用户对应的交互用户描述向量。

34、在一些优选的实施例中,在上述基于大数据风控的信息判别方法中,所述基于所述第一数量个关联风控用户中的每一个关联风控用户对应的风控维度表征数据和所述待分析风控用户对应的风控维度表征数据,对所述待分析风控用户进行风控判别操作,以输出对应的目标风控判别结果的步骤,包括:

35、提取到所述待分析风控用户对应的风控维度表征数据,以得到第一风控维度表征数据,所述第一风控维度表征数据是指用于对所述待分析风控用户进行风控判定的数据;

36、提取到所述第一数量个关联风控用户中的每一个关联风控用户对应的风控维度表征数据,以得到第一数量个第二风控维度表征数据,所述第二风控维度表征数据是指用于对所述关联风控用户进行风控判定的数据;

37、对所述第一风控维度表征数据进行特征挖掘操作,以形成所述待分析风控用户对应的第一风控数据描述向量,以及,分别对每一个所述第二风控维度表征参数进行特征挖掘操作,以形成所述待分析风控用户对应的第一数量个第二风控数据描述向量;

38、基于所述第一数量个第二风控数据描述向量,对所述第一风控数据描述向量进行深度关联挖掘操作,形成目标深度数据描述向量;

39、基于所述目标深度数据描述向量,对所述待分析风控用户进行风控判别操作,以输出对应的目标风控判别结果。

40、在一些优选的实施例中,在上述基于大数据风控的信息判别方法中,所述基于所述第一数量个第二风控数据描述向量,对所述第一风控数据描述向量进行深度关联挖掘操作,形成目标深度数据描述向量的步骤,包括:

41、基于所述待分析用户描述向量和所述至少一个交互风控用户中的每一个交互风控用户对应的交互用户描述向量之间的向量匹配参数,分别确定出所述第一数量个第二风控数据描述向量各自对应的重要性参数;

42、对于所述第一数量个第二风控数据描述向量中的每一个第二风控数据描述向量,利用级联连接的多个深度关联挖掘单元,基于该第二风控数据描述向量,对所述第一风控数据描述向量进行深度关联挖掘操作,以形成该第二风控数据描述向量对应的关联深度数据描述向量;

43、基于所述第一数量个第二风控数据描述向量各自对应的重要性参数,对每一个所述第二风控数据描述向量对应的关联深度数据描述向量进行第一聚合操作,以形成对应的聚合数据描述向量;

44、将所述聚合数据描述向量和所述第一风控数据描述向量进行第二聚合操作,以形成对应的目标深度数据描述向量。

45、本发明实施例还提供一种基于大数据风控的信息判别系统,包括处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序,以实现上述的基于大数据风控的信息判别方法。

46、本发明实施例提供的基于大数据风控的信息判别方法及系统,可以先分析出待分析风控用户的预设类用户交互行为、交互风控用户;依据待分析风控用户的待分析用户表征数据和预设类用户交互行为的行为内容表征数据,分析出待分析用户描述向量;依据交互风控用户对应的交互用户表征数据和进行的指定类用户交互行为对应的行为内容表征数据,分析出交互用户描述向量;基于待分析用户描述向量和交互用户描述向量之间的向量匹配参数,确定出关联风控用户;基于关联风控用户对应的风控维度表征数据和待分析风控用户对应的风控维度表征数据,输出目标风控判别结果。基于前述的内容,由于会先进行可靠地关联风控用户的筛选操作,使得在基于关联风控用户对应的风控维度表征数据,对待分析风控用户进行关联的风控判别操作的时候,依据更为可靠,因此,可以在一定程度上提高风控判别的可靠度,从而改善现有技术中存在的可靠度不佳的问题。

47、为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1