数据处理方法、装置、设备、可读存储介质及程序产品与流程

文档序号:35234670发布日期:2023-08-25 02:31阅读:19来源:国知局
数据处理方法、装置、设备、可读存储介质及程序产品与流程

本申请涉及计算机,具体而言,本申请涉及一种数据处理方法、装置、设备、可读存储介质及程序产品。


背景技术:

1、风险控制是指采取各种措施和方法,减少风险事件发生的各种可能性,或减少风险事件发生时造成的损失。风险控制场景例如商户风险控制场景,在商户风险控制场景中,需要对非法商户的团伙作案、批量注册等行为进行及时发现和管控。现有技术中往往通过暴力计算或人工经验来识别非法商户,对非法商户的识别过程耗时过长,消耗更多的电力、空间和人力资源,而且识别非法商户的准确度也不高。


技术实现思路

1、本申请针对现有的方式的缺点,提出一种数据处理方法、装置、设备、计算机可读存储介质及计算机程序产品,用于解决在商户风险控制场景中如何提高对非法商户识别的效率和准确度的问题。

2、第一方面,本申请提供了一种数据处理方法,包括:

3、获取图结构数据;

4、基于图结构数据,确定多个连通子图,以及多个连通子图的有根子图集合;

5、基于多个连通子图中每个连通子图的编号向量和有根子图集合,确定每个连通子图对应的特征嵌入向量;

6、基于每个连通子图中节点的业务属性,确定每个连通子图对应的业务特征向量;

7、基于每个连通子图对应的特征嵌入向量和每个连通子图对应的业务特征向量,确定每个连通子图对应的图向量;

8、基于每个连通子图对应的图向量,确定多个连通子图中与每个连通子图相似的连通子图。

9、在一个实施例中,获取图结构数据,包括:

10、获取关系图谱,关系图谱中各节点的类型相同,关系图谱中各边所表示的两个节点之间关系的类型相同,关系图谱为一种图结构数据。

11、在一个实施例中,基于图结构数据,确定多个连通子图,包括:

12、基于图结构数据,确定节点表和关系表,节点表包括图结构数据中各节点的编号,关系表包括各节点之间的关系;

13、基于节点表和关系表,确定多个连通子图,以及各节点分别对应的连通子图的编号。

14、在一个实施例中,基于图结构数据,确定多个连通子图的有根子图集合,包括:

15、基于图结构数据,确定多个连通子图;

16、针对多个连通子图中每个连通子图,在每个连通子图中任意选取一个节点作为根节点,并确定根节点的若干度的邻居;

17、基于根节点和根节点的若干度的邻居,确定根节点对应的至少一个有根子图;

18、将各根节点对应的有根子图,进行负采样处理,得到多个连通子图的有根子图集合。

19、在一个实施例中,基于多个连通子图中每个连通子图的编号向量和有根子图集合,确定每个连通子图对应的特征嵌入向量,包括:

20、将多个连通子图中每个连通子图的编号向量和有根子图集合输入至预设的结构向量化模型,基于预设的迭代训练轮数,对预设的结构向量化模型进行迭代训练,得到训练后的结构向量化模型,以及训练后的结构向量化模型输出的每个连通子图对应的特征嵌入向量。

21、在一个实施例中,基于每个连通子图中节点的业务属性,确定每个连通子图对应的业务特征向量,包括:

22、将每个连通子图中各节点之间任一种相同类型的业务属性,进行聚合处理,确定任一种相同类型的业务属性对应的特征值,各节点之间包括多种相同类型的业务属性;

23、基于多种相同类型的业务属性分别对应的特征值,确定每个连通子图对应的业务特征向量,业务特征向量的维度与多种相同类型的数量相同。

24、在一个实施例中,基于每个连通子图对应的特征嵌入向量和每个连通子图对应的业务特征向量,确定每个连通子图对应的图向量,包括:

25、将每个连通子图对应的特征嵌入向量和每个连通子图对应的业务特征向量分别进行归一化处理,得到归一化后的特征嵌入向量和归一化后的业务特征向量;

26、将归一化后的特征嵌入向量和归一化后的业务特征向量,进行拼接处理,得到每个连通子图对应的图向量。

27、在一个实施例中,基于每个连通子图对应的图向量,确定多个连通子图中与每个连通子图相似的连通子图,包括:

28、基于每个连通子图对应的图向量,确定二叉树结构,二叉树结构中的每个节点用于表征一个子空间,一个子空间包括多个连通子图中的至少一个连通子图;

29、基于每个连通子图对应的图向量和二叉树结构,确定多个连通子图中与每个连通子图相似的连通子图。

30、第二方面,本申请提供了一种数据处理装置,包括:

31、第一处理模块,用于获取图结构数据;

32、第二处理模块,用于基于图结构数据,确定多个连通子图,以及多个连通子图的有根子图集合;

33、第三处理模块,用于基于多个连通子图中每个连通子图的编号向量和有根子图集合,确定每个连通子图对应的特征嵌入向量;

34、第四处理模块,用于基于每个连通子图中节点的业务属性,确定每个连通子图对应的业务特征向量;

35、第五处理模块,用于基于每个连通子图对应的特征嵌入向量和每个连通子图对应的业务特征向量,确定每个连通子图对应的图向量;

36、第六处理模块,用于基于每个连通子图对应的图向量,确定多个连通子图中与每个连通子图相似的连通子图。

37、第三方面,本申请提供了一种电子设备,包括:处理器、存储器和总线;

38、总线,用于连接处理器和存储器;

39、存储器,用于存储操作指令;

40、处理器,用于通过调用操作指令,执行本申请第一方面的数据处理方法。

41、第四方面,本申请提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被用于执行本申请第一方面的数据处理方法。

42、第五方面,本申请提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现本申请第一方面中数据处理方法的步骤。

43、本申请实施例提供的技术方案,至少具有如下有益效果:

44、获取图结构数据,例如关系图谱,关系图谱中节点的类型是商户节点;基于图结构数据,确定多个连通子图,以及多个连通子图的有根子图集合;基于多个连通子图中每个连通子图的编号向量和有根子图集合,确定每个连通子图对应的特征嵌入向量;基于每个连通子图中节点的业务属性,确定每个连通子图对应的业务特征向量;基于每个连通子图对应的特征嵌入向量和每个连通子图对应的业务特征向量,确定每个连通子图对应的图向量;基于每个连通子图对应的图向量,确定多个连通子图中与每个连通子图相似的连通子图,例如,多个连通子图中存在一个连通子图为非法商户对应的连通子图,基于该连通子图对应的图向量,确定多个连通子图中与该连通子图相似的连通子图,与该连通子图相似的连通子图对应其他非法商户,如此,可以快捷的确定与非法商户相似的其他非法商户,从而提高了对大量非法商户识别的效率和准确度。



技术特征:

1.一种数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取图结构数据,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述图结构数据,确定多个连通子图,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于所述图结构数据,确定所述多个连通子图的有根子图集合,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于所述多个连通子图中每个连通子图的编号向量和所述有根子图集合,确定所述每个连通子图对应的特征嵌入向量,包括:

6.根据权利要求1所述的方法,其特征在于,所述基于所述每个连通子图中节点的业务属性,确定所述每个连通子图对应的业务特征向量,包括:

7.根据权利要求1所述的方法,其特征在于,所述基于所述每个连通子图对应的特征嵌入向量和所述每个连通子图对应的业务特征向量,确定所述每个连通子图对应的图向量,包括:

8.根据权利要求1所述的方法,其特征在于,所述基于所述每个连通子图对应的图向量,确定所述多个连通子图中与所述每个连通子图相似的连通子图,包括:

9.一种数据处理装置,其特征在于,包括:

10.一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1-8中任一项所述方法的步骤。

11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8中任一项所述方法的步骤。

12.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8中任一项所述方法的步骤。


技术总结
本申请实施例提供了一种数据处理方法、装置、设备、可读存储介质及程序产品,涉及人工智能领域,应用场景包括但不限于商户风险控制等场景。该方法包括:获取图结构数据;基于图结构数据,确定多个连通子图,以及多个连通子图的有根子图集合;基于多个连通子图中每个连通子图的编号向量和有根子图集合,确定每个连通子图对应的特征嵌入向量;基于每个连通子图中节点的业务属性,确定每个连通子图对应的业务特征向量;基于每个连通子图对应的特征嵌入向量和每个连通子图对应的业务特征向量,确定每个连通子图对应的图向量;基于每个连通子图对应的图向量,确定多个连通子图中与每个连通子图相似的连通子图。

技术研发人员:张硕硕
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:
技术公布日:2024/1/14
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1