用户社区的构建方法、装置、存储介质及电子设备与流程

文档序号:37145454发布日期:2024-02-26 16:58阅读:19来源:国知局
用户社区的构建方法、装置、存储介质及电子设备与流程

本发明涉及计算机,特别涉及一种用户社区的构建方法、装置、存储介质及电子设备。


背景技术:

1、目前,为了满足银行的识别异常交易的需求,通常需要根据用户转账数据构建用户社区,使得银行能够了解用户之间的社交关系。然而,现有的用户社区发现方法中,社区数目通常由人工基于经验设定,然而基于人工设定社区数目得到的用户社区往往不能准确的反映用户的社交关系,使得构建出的用户社区的质量差。


技术实现思路

1、本发明所要解决的技术问题是提供一种用户社区的构建方法、装置、存储介质及电子设备,能够提高用户社区的质量,提高用户体验。具体方案如下:

2、一种用户社区的构建方法,包括:

3、响应于数据处理指令,获得各个待处理的转账数据;

4、确定各个所述转账数据中的每个账户所属的用户;

5、根据各个所述转账数据构建各个所述用户的属性网络图,所述属性网络图包含每个所述用户的转账关系以及转账时间;

6、根据所述属性网络图中包含的每个所述用户的转账关系以及转账时间,生成每个所述用户的用户向量表示;

7、利用预设的模拟退火算法确定各个所述用户向量表示对应的目标用户社区数量;

8、基于所述目标用户社区数量对各个所述用户的用户向量表示进行聚类处理,获得聚类结果,所述聚类结果包括所述目标用户社区数量的聚类簇,每个所述聚类簇包括至少一个所述用户向量表示;

9、根据每个所述聚类簇中的用户向量表示,构建每个所述聚类簇对应的用户社区。

10、上述的方法,可选的,所述获得各个待处理的转账数据,包括:

11、获取各个原始转账数据;

12、基于每个所述原始转账数据中的附言信息,对各个所述原始转账数据进行数据清洗,获得各个待处理的转账数据。

13、上述的方法,可选的,所述确定各个所述转账数据中的每个账户所属的用户,包括:

14、确定各个所述转账数据中包含的各个用户标识以及每个所述用户标识对应的账户;

15、对于每个所述用户标识,若所述用户标识对应的账户的数量为一个,则将用户标识对应的账户,作为所述用户标识对应的用户的账户;若用户标识对应的账户的数量为多个,则将所述用户标识作为目标用户标识;

16、根据所述目标用户标识所属的转账数据构建所述目标用户标识对应的各个账户的转账关系图,所述转账关系图包括各个所述账户的账户节点的转账关系;

17、基于所述目标用户标识对应的各个账户的转账关系图,对所述目标用户标识对应的各个所述账户的账户节点进行聚类处理,获得每个所述目标用户标识对应的账户聚类结果,账户聚类结果包括多个账户聚类簇,每个所述账户聚类簇包括至少一个所述账户的账户节点;

18、确定每个所述账户聚类结果中的每个所述账户聚类簇对应的用户,不同的所述账户聚类簇对应的用户不同;

19、将每个所述账户聚类簇中的各账户节点所属的账户,作为每个所述账户聚类簇对应的用户的账户。

20、上述的方法,可选的,所述基于每个所述目标用户标识对应的各个账户的转账关系图,对每个所述目标用户标识对应的各个账户进行聚类处理,获得账户聚类结果,包括:

21、基于每个所述目标用户标识对应的各个账户的转账关系图,确定出各个所述账户节点之间路径以及距离;

22、根据各个所述账户节点之间的路径以及距离,计算出各个所述账户的账户节点之间的相似度;

23、基于各个所述账户的账户节点之间的相似度构建各个所述账户的账户节点之间的相似性矩阵;

24、基于各个所述账户的账户节点之间的相似性矩阵对各个所述账户的账户节点进行聚类处理,获得账户聚类结果。

25、上述的方法,可选的,所述根据所述属性网络图中包含的每个所述用户的转账关系以及转账时间,生成每个所述用户的用户向量表示,包括:

26、基于所述属性网络图中包含的每个所述用户的转账关系以及转账时间,对所述属性网络图中的每个所述用户的用户节点进行随机游走,生成节点序列;所述节点序列包含各个所述用户的用户节点的初始向量表示;

27、基于预设的随机梯度下降方法以及负采样技术对每个所述用户的用户节点的初始向量进行优化,得到每个所述用户的用户向量表示。

28、上述的方法,可选的,所述利用预设的模拟退火算法确定各个所述用户向量表示对应的目标用户社区数量,包括:

29、获取预设的模拟退火算法的初始参数,所述初始参数包括初始温度、终止温度、用户社区数量上限值、用户社区数量下限值以及用户社区数量初始值;

30、将所述用户社区数量初始值作为当前的第一用户社区数量,将所述初始温度作为当前的目标温度;

31、利用所述第一用户社区数量进行聚类测试,获得所述第一用户社区数量对应的聚类测试结果;

32、利用当前的所述第一用户社区数量以及当前的所述目标温度计算得到第二用户社区数量;

33、利用所述第二用户社区数量进行聚类测试,获得新的聚类测试结果;

34、对第一模块度与第二模块度进行比较,获得比较结果;所述第一模块度为所述第一用户社区数量对应的聚类测试结果的质量评价结果;所述第二模块度为所述第二用户社区数量对应的聚类测试结果的质量评价结果;

35、基于所述比较结果选择所述第一用户社区数量以及所述第二用户社区数量中的一者,作为当前新的第一用户社区数量,并降低所述目标温度,获得当前新的目标温度;

36、在当前新的所述目标温度不低于所述终止温度的情况下,返回执行所述利用当前的所述第一用户社区数量以及当前的所述目标温度计算得到第二用户社区数量的步骤;

37、在当前新的所述目标温度低于所述终止温度的情况下,将所述新的第一用户社区数量确定为目标用户社区数量。

38、一种用户社区的构建装置,包括:

39、执行单元,用于响应于数据处理指令,获得各个待处理的转账数据;

40、第一确定单元,用于确定各个所述转账数据中的每个账户所属的用户;

41、第一构建单元,用于根据各个所述转账数据构建各个所述用户的属性网络图,所述属性网络图包含每个所述用户的转账关系以及转账时间;

42、生成单元,用于根据所述属性网络图中包含的每个所述用户的转账关系以及转账时间,生成每个所述用户的用户向量表示;

43、第二确定单元,用于利用预设的模拟退火算法确定各个所述用户向量表示对应的目标用户社区数量;

44、聚类单元,用于基于所述目标用户社区数量对各个所述用户的用户向量表示进行聚类处理,获得向量表示聚类结果,所述向量表示聚类结果包括所述目标用户社区数量的聚类簇,每个所述聚类簇包括至少一个所述用户向量表示;

45、第二构建单元,用于根据每个所述聚类簇中的用户向量表示,构建每个所述聚类簇对应的用户社区。

46、上述的装置,可选的,所述执行单元,包括:

47、获取子单元,用于获取各个原始转账数据;

48、数据清洗子单元,用于基于每个所述原始转账数据中的附言信息,对各个所述原始转账数据进行数据清洗,获得各个待处理的转账数据。

49、一种存储介质,所述存储介质包括存储指令,其中,在所述指令运行时控制所述存储介质所在的设备执行如上述的用户社区的构建方法。

50、一种电子设备,包括存储器,以及一个或者一个以上的指令,其中一个或一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行如上述的用户社区的构建方法。

51、基于上述本发明实施提供的一种用户社区的构建方法及装置、存储介质及电子设备,该方法包括:可以先获得各个待处理的转账数据;确定各个所述转账数据中的每个账户所属的用户;然后根据各个所述转账数据构建各个所述用户的属性网络图,所述属性网络图包含每个所述用户的转账关系以及转账时间;根据所述属性网络图中包含的每个所述用户的转账关系以及转账时间,生成每个所述用户的用户向量表示;利用预设的模拟退火算法确定各个所述用户向量表示对应的目标用户社区数量;基于所述目标用户社区数量对各个所述用户的用户向量表示进行聚类处理,获得向量表示聚类结果,所述向量表示聚类结果包括所述目标用户社区数量的聚类簇,每个所述聚类簇包括至少一个所述用户向量表示;根据每个所述聚类簇中的用户向量表示,构建每个所述聚类簇对应的用户社区。可以利用模拟退火算法确定各个用户向量表示对应的目标用户社区数量,能够有效地提高用户社区的质量。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1