本技术涉及大数据,尤其涉及一种异常发现方法、装置、设备及存储介质。
背景技术:
1、随着大数据技术发展,机构间的数据合作越来越需要考虑数据隐私保护问题。目前隐私计算技术主要聚焦于联邦学习、安全求交、匿踪查询等场景,这些场景都是针对单点数据进行联合计算,从关联网络的角度挖掘跨机构数据间的关联关系及影响关系却鲜有研究。
2、然而,当前关联网络中的标签传播算法其计算的数据源均在本地,无法实现隐私保护前提下的跨机构数据联合应用。但是,在机构双方原始数据不出库的前提下,进行跨机构数据挖掘却具有重要的现实意义,例如,在机构很多涉及用户资金转移的场景下,可以通过研究用户资金流转的路径是否异常来发现用户异常。
3、可见,亟需一种在保护己方数据隐私安全的前提下进行跨机构多方数据异常挖掘的解决方案。
技术实现思路
1、本技术提供一种异常发现方法、装置、设备及存储介质,用于在保护己方数据隐私安全的前提下提出跨域关联网络异常结构挖掘方法。
2、第一方面,本技术提供一种异常发现方法,包括:
3、根据第一机构方和第二机构方各自的转账行为信息,分别对应生成第一方关联网络和第二方关联网络,所述第一方关联网络和所述第二方关联网络各自的节点和边分别表征各自的账户信息和转账信息;
4、通过隐私求交算法根据所述第一方关联网络和所述第二方关联网络生成虚拟联邦关联网络,所述虚拟联邦关联网络包含所述第一方关联网络和所述第二方关联网络以及部分公共节点之间的新增边;
5、根据所述第一方关联网络和所述第二方关联网络每个节点的本地链路集以及所述公共节点的特征标签及加密信息,通过跨域迭代确定所述虚拟联邦关联网络中是否存异常结构,所述异常结构用于确定异常转账行为。
6、在一种可能的设计中,还包括:在生成所述虚拟联邦关联网络之后,还包括:
7、分别在所述第一方关联网络和所述第二方关联网络遍历各自所有节点进行游走,根据所述第一方关联网络和所述第二方关联网络各自的节点为起点且以所述公共节点为终点分别确定各自节点的转账链路;
8、根据所述第一方关联网络和所述第二方关联网络各自节点的转账链路以及链路游走次数生成所述第一方关联网络和所述第二方关联网络每个节点的本地链路集。
9、在一种可能的设计中,在生成所述虚拟联邦关联网络之后,还包括:
10、根据所述隐私求交算法交换所述虚拟联邦关联网络中所述公共节点的特征标签及加密信息,所述公共节点的特征标签用于标记所述公共节点的转账链路。
11、在一种可能的设计中,所述通过跨域迭代确定所述虚拟联邦关联网络中是否存异常结构,包括:
12、根据所述第一方关联网络每个节点的本地链路集获取第一链路,所述第一链路的起点为所述第一方关联网络中的任意节点,所述第一链路的终点为第一公共节点,所述第一公共节点是处于所述第一方关联网络的公共节点;
13、将所述第一链路的终点与所述第二方关联网络中的节点根据所述加密信息进行加密对齐以获取第二公共节点,并根据所述第二方关联网络中每个节点的本地链路集获取各第二链路,所述各第二链路是处于所述第二方关联网络中且以所述第二公共节点为起点的所有链路,所述第二公共节点是处于所述第二方关联网络的公共节点;
14、将所述各第二链路中的所有终点与所述第一方关联网络中的节点根据所述加密信息进行加密对齐以获取到第三公共节点,并根据所述第一方关联网络中每个节点的本地链路集获取各第三链路,所述各第三链路是处于所述第一方关联网络中且以所述第三公共节点为起点的所有链路,所述第三公共节点是处于所述第一方关联网络的公共节点;
15、若所述各第三链路中的终点包括有所述第一链路的起点,则确定所述虚拟联邦关联网络中存在所述异常结构,所述异常结构为所述第一链路的节点、所述第二公共节点以及所述第三公共节点生成的环状结构;
16、若所述各第三链路中的终点未包括有所述第一链路的起点,且所述跨域迭代次数未超过预设迭代次数,继续所述跨域迭代直到发现所述异常结构或者结束以所述第一链路的起点开始的本轮跨域迭代。
17、在一种可能的设计中,若所述各第三链路中的终点未包括有所述第一链路的起点,且所述跨域迭代次数超过所述预设迭代次数,结束以所述第一链路的起点开始的本轮跨域迭代。
18、在一种可能的设计中,在获取到所述第一链路之后,还包括标记所述第一链路的特征标签;
19、在获取到所述各第二链路之后,还包括标记所述各第二链路的特征标签;
20、在获取到所述各第三链路之后,还包括标记所述各第三链路的特征标签。
21、在一种可能的设计中,在发现所述异常结构之后,还包括:
22、根据所述环状结构包括的链路被标记的特征标签,获取各第一异常节点和各第二异常节点,所述各第一异常节点为所述环状结构中属于所述第一方关联网络的节点,所述各第二异常节点为所述环状结构中属于所述第二方关联网络的节点;
23、根据所述各第一异常节点于所述第一机构方生成所述第一机构方的异常结构,以及根据所述各第二异常节点于所述第二机构方生成所述第二机构方的异常结构;
24、为所述第一机构方的异常结构和所述第二机构方的异常结构分别生成各自对应的异常标识,使得所述第一机构方和所述第二机构方根据各自的所述异常标识对所述异常转账行为进行处置。
25、在一种可能的设计中,账户信息包括银行卡号,所述转账信息包括转账金额、转账笔数、转账时间及时间间隔中的至少一种。
26、在一种可能的设计中,在生成所述第一方关联网络和所述第二方关联网络每个节点的本地链路集之后,还包括:
27、分别根据所述第一方关联网络和所述第二方关联网络每个节点的本地链路集生成所述第一方关联网络和所述第二方关联网络各自节点的关联属性表;
28、其中,所述关联属性表包括所述转账链路的起点和终点以及所述转账链路被游走次数。
29、在一种可能的设计中,所述第一方关联网络和所述第二方关联网络分别为有向图。
30、第二方面,本技术提供一种异常发现装置,包括:
31、第一网络生成模块,用于根据第一机构方和第二机构方各自的转账行为信息,分别对应生成第一方关联网络和第二方关联网络,所述第一方关联网络和所述第二方关联网络各自的节点和边分别表征各自的账户信息和转账信息;
32、第二网络生成模块,用于通过隐私求交算法根据所述第一方关联网络和所述第二方关联网络生成虚拟联邦关联网络,所述虚拟联邦关联网络包含所述第一方关联网络和所述第二方关联网络以及部分公共节点之间的新增边;
33、跨域迭代模块,用于根据所述第一方关联网络和所述第二方关联网络每个节点的本地链路集以及所述公共节点的特征标签及加密信息,通过跨域迭代确定所述虚拟联邦关联网络中是否存异常结构,所述异常结构用于确定异常转账行为。
34、在一种可能的设计中,所述装置,还包括:本地节点预处理模块;所述本地节点预处理模块,用于:
35、分别在所述第一方关联网络和所述第二方关联网络遍历各自所有节点进行游走,根据所述第一方关联网络和所述第二方关联网络各自的节点为起点且以所述公共节点为终点分别确定各自节点的转账链路;
36、根据所述第一方关联网络和所述第二方关联网络各自节点的转账链路以及链路游走次数生成所述第一方关联网络和所述第二方关联网络每个节点的本地链路集。
37、在一种可能的设计中,所述装置,还包括:跨域节点预处理模块;所述跨域节点预处理模块,用于:
38、根据所述隐私求交算法交换所述虚拟联邦关联网络中所述公共节点的特征标签及加密信息,所述公共节点的特征标签用于标记所述公共节点的转账链路。
39、在一种可能的设计中,所述跨域迭代模块,具体用于:
40、根据所述第一方关联网络每个节点的本地链路集获取第一链路,所述第一链路的起点为所述第一方关联网络中的任意节点,所述第一链路的终点为第一公共节点,所述第一公共节点是处于所述第一方关联网络的公共节点;
41、将所述第一链路的终点与所述第二方关联网络中的节点根据所述加密信息进行加密对齐以获取第二公共节点,并根据所述第二方关联网络中每个节点的本地链路集获取各第二链路,所述各第二链路是处于所述第二方关联网络中且以所述第二公共节点为起点的所有链路,所述第二公共节点是处于所述第二方关联网络的公共节点;
42、将所述各第二链路中的所有终点与所述第一方关联网络中的节点根据所述加密信息进行加密对齐以获取到第三公共节点,并根据所述第一方关联网络中每个节点的本地链路集获取各第三链路,所述各第三链路是处于所述第一方关联网络中且以所述第三公共节点为起点的所有链路,所述第三公共节点是处于所述第一方关联网络的公共节点;
43、若所述各第三链路中的终点包括有所述第一链路的起点,则确定所述虚拟联邦关联网络中存在所述异常结构,所述异常结构为所述第一链路的节点、所述第二公共节点以及所述第三公共节点生成的环状结构;
44、若所述各第三链路中的终点未包括有所述第一链路的起点,且所述跨域迭代次数未超过预设迭代次数,继续所述跨域迭代直到发现所述异常结构或者结束以所述第一链路的起点开始的本轮跨域迭代。
45、在一种可能的设计中,所述跨域迭代模块,还用于:
46、若所述各第三链路中的终点未包括有所述第一链路的起点,且所述跨域迭代次数超过所述预设迭代次数,结束以所述第一链路的起点开始的本轮跨域迭代。
47、在一种可能的设计中,所述跨域迭代模块,还用于:
48、在获取到所述第一链路之后,标记所述第一链路的特征标签;
49、在获取到所述各第二链路之后,还标记所述各第二链路的特征标签;
50、在获取到所述各第三链路之后,还标记所述各第三链路的特征标签。
51、在一种可能的设计中,所述异常发现装置,还包括:异常结构标识与处置模块,用于:
52、根据所述环状结构包括的链路被标记的特征标签,获取各第一异常节点和各第二异常节点,所述各第一异常节点为所述环状结构中属于所述第一方关联网络的节点,所述各第二异常节点为所述环状结构中属于所述第二方关联网络的节点;
53、根据所述各第一异常节点于所述第一机构方生成所述第一机构方的异常结构,以及根据所述各第二异常节点于所述第二机构方生成所述第二机构方的异常结构;
54、为所述第一机构方的异常结构和所述第二机构方的异常结构分别生成各自对应的异常标识,使得所述第一机构方和所述第二机构方根据各自的所述异常标识对所述异常转账行为进行处置。
55、在一种可能的设计中,账户信息包括银行卡号,所述转账信息包括转账金额、转账笔数、转账时间及时间间隔中的至少一种。
56、在一种可能的设计中,所述本地节点预处理模块,还用于:
57、分别根据所述第一方关联网络和所述第二方关联网络每个节点的本地链路集生成所述第一方关联网络和所述第二方关联网络各自节点的关联属性表;
58、其中,所述关联属性表包括所述转账链路的起点和终点以及所述转账链路被游走次数。
59、在一种可能的设计中,所述第一方关联网络和所述第二方关联网络分别为有向图。
60、第三方面,本技术提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;
61、所述存储器存储计算机执行指令;
62、所述处理器执行所述存储器存储的计算机执行指令,以实现第一方面中所提供的任意一种可能的异常发现方法。
63、第四方面,本技术提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现第一方面中所提供的任意一种可能的异常发现方法。
64、第五方面,本技术提供一种计算机程序产品,包括计算机执行指令,该计算机执行指令被处理器执行时用于实现第一方面中所提供的任意一种可能的异常发现方法。
65、本技术提供一种异常发现方法、装置、设备及存储介质,首先根据第一机构方和第二机构方各自的转账行为信息,分别生成第一方关联网络和第二方关联网络,第一方关联网络和第二方关联网络各自的节点和边分别表征各自的账户信息和转账信息。然后通过隐私求交算法根据第一方关联网络和第二方关联网络生成虚拟联邦关联网络,虚拟联邦关联网络包含第一方关联网络和第二方关联网络以及公共节点之间的新增边。再根据第一方关联网络和第二方关联网络每个节点的本地链路集以及公共节点的特征标签及加密信息,通过跨域迭代确定虚拟联邦关联网络中是否存异常结构,该异常结构用于确定异常转账行为。在涉及关联网络计算的场景中,可以实现在保护己方数据隐私安全的前提下,融合多方数据进行异常结构挖掘的效果,实现隐私保护前提下的跨机构数据联合应用,相比于单方数据的使用,能够丰富数据完整度,达到更精准效果,同时不对外暴露己方用户行为特征及数据。