反洗钱智能自动导侦的方法、计算机可读存储介质与流程

文档序号:24177817发布日期:2021-03-09 10:49阅读:117来源:国知局
反洗钱智能自动导侦的方法、计算机可读存储介质与流程

1.本发明是关于计算机技术领域,特别是关于一种反洗钱智能自动导侦的方法、计算机可读存储介质。


背景技术:

2.传统的反洗钱工作利用资金异常检测等基于启发式的刑侦手段来对洗钱行为进行判断并采取下一步的行动。但是随着移动互联网、云计算、物联网为代表的一系列通信技术发展,网络洗钱犯罪行为也越来越多。网络洗钱活动利用大量的交易记录来隐藏实际的资金转移链条,犯罪侦查难度增加。目前通常凭借人工对数据信息进行分析从而获得洗钱线索,但是大数据背景下,由于该方法的技术瓶颈高、分析效率非常低,难度非常大,显然不适应现实的需要。
3.公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。


技术实现要素:

4.本发明的目的在于提供一种反洗钱智能自动导侦的方法、计算机可读存储介质,其能够自动快速且较为准确地挖掘出资金交易网络中的可疑节点。
5.为实现上述目的,本发明提供了一种反洗钱智能自动导侦的方法,包括:建立原始资金交易网络图;基于佩奇排序算法对所述原始资金交易网络图中的各个结点进行佩奇排序值的计算,将所述佩奇排序值大于第一预设阈值的各个结点作为导侦目标账户结点;将所述原始资金交易网络图中的有向边转换方向从而得到资金来源网络图;基于个性化佩奇排序算法从所述资金来源网络图中确定出各个导侦目标账户结点的关联账户结点;构建各个所述导侦目标账户结点与其对应的所述关联账户结点之间的连接关系,生成资金交易关键网络图。
6.在本发明的一实施方式中,所述反洗钱智能自动导侦的方法还包括:将所述资金交易关键网络图进行前向扩展从而找出放置阶段的起始账户结点与分发阶段的中间账户结点的关系,生成扩展后的资金交易关键网络图。
7.在本发明的一实施方式中,所述建立原始资金交易网络图包括:获取银行交易流水记录,对其中的错误数据进行筛选以及删除,并且对入账方向进行统一从而形成源账户a
i
到目标账户b
j
的交易记录;对各个转账交易对进行分组求和,建立各个转账交易对的三元组,其中,所述三元组的元素包括源账号a
i
、目标账户b
j
、源账号a
i
转入目标账号b
j
的总金额;建立网络图,其中,源账户a
i
以及目标账户b
j
组成了所述网络图中的各个结点,源账号a
i
转入目标账号b
j
的路径组成了所述网络图中的各个有向边,其中,源账号a
i
转入目标账号b
j
的金额为有向边的权重;从所述网络图中选取最大弱连通分量子图作为所述原始的资金交易网络图。
8.在本发明的一实施方式中,所述各个结点的佩奇排序值的算法为:
[0009][0010]
其中,pr(v
i
)为结点v
i
的佩奇排序值,m(v
i
)是指向结点v
i
的结点的集合,l(v
j
)是结点v
j
连出的边的个数,n为结点的总数,d为一个阻尼因子,其中0≤d≤1。
[0011]
在本发明的一实施方式中,基于个性化佩奇排序算法从所述资金来源网络图中确定出各个导侦目标账户结点的关联账户结点包括:基于个性化佩奇排序算法,分别计算所述资金来源网络图中的各个结点相对于某一导侦目标账户结点s的邻近度值;将相对于某一导侦目标账户结点s的邻近度值大于第二预设阈值的各个结点作为所述导侦目标账户结点s的关联账户结点,其中,所述邻近度值的算法包括:π(s,t)=π
f
(s,t)+∑
v∈v
r
f
(s,v)
·
π(v,t),其中,π(s,t)表示结点t相对于导侦目标账户结点s的邻近度值;π
f
(s,t)表示从导侦目标账户结点s出发的随机游走,当前走到结点t,并最终停在t的概率;r
f
(s,v)表示从导侦目标账户结点s出发的随机游走,当前走到结点v,继续向前走的概率;π(v,t)表示结点t相对于导侦目标账户结点v的邻近度值;v表示所述资金来源网络图中的各个结点的集合。
[0012]
在本发明的一实施方式中,构建各个所述导侦目标账户结点与其对应的所述关联账户结点之间的连接关系,生成资金交易关键网络图包括:基于迪杰斯特拉路径查找算法来构建所述导侦目标账户结点与所述关联账户结点之间的连接关系,生成所述资金交易关键网络图。
[0013]
在本发明的一实施方式中,基于迪科斯特拉路径查找算法来构建所述导侦目标账户结点与所述关联账户结点之间的连接关系,生成所述资金交易关键网络图包括:将所述资金来源网络图中的各条边的权重取倒数,从而生成权重图;寻找出各个关联账户结点与其对应的所述导侦目标账户结点之间的最短路径。
[0014]
在本发明的一实施方式中,在寻找出所有的所述最短路径之后,还包括:对寻找出的所有的最短路径进行剪枝操作。
[0015]
在本发明的一实施方式中,所述放置阶段的起始账户结点为所述佩奇排序值小于第三预设阈值的各个结点。
[0016]
基于同样的发明构思,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序用于执行上述任一实施方式所述的反洗钱智能自动导侦的方法。
[0017]
与现有技术相比,根据本发明的反洗钱智能自动导侦的方法、计算机可读存储介质,从原始数据的清洗、导侦目标账户结点的确认、资金交易网络的建立、可疑交易的深度挖掘、资金交易关键网络图的生成等各个步骤都可以实现自动化完成,大大提升了整个反洗钱侦测工作的效率;利用个性化佩奇排序算法以及基于迪杰斯特拉算法建立了不同可疑交易之间的资金关键网络图,这为反洗钱监测工作提供了更多且较为可靠的线索;本发明能够自动快速且较为准确地挖掘出资金交易网络中的可疑节点。
附图说明
[0018]
图1是根据本发明一实施方式的反洗钱智能自动导侦的方法的步骤组成;
[0019]
图2是根据本发明一实施方式的可视化的资金交易关键网络图;
[0020]
图3是根据本发明一实施方式的可视化的前向扩展后的资金交易关键网络图。
具体实施方式
[0021]
下面结合附图,对本发明的具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
[0022]
除非另有其它明确表示,否则在整个说明书和权利要求书中,术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分,而并未排除其它元件或其它组成部分。
[0023]
为了能够克服现有技术的问题,发明人对洗钱交易进行了研究,展开了如下分析,发明人发现,违法人员为了降低洗钱交易被发现的概率,处于核心位置的账户结点往往会被刻意的隐藏起来,这给传统的资金交易网络发掘方法增加了不小难度,当放置阶段账户与整合阶段账户之间增加了大量的中间账户之后,资金交易网络的复杂度将会呈现指数级别的增长,而对于佩奇排序算法而言,这种复杂性的增长并不会成为佩奇排序算法性能的瓶颈,因此可以使用佩奇排序算法对资金交易网络中的重要账户进行侦测。发明人还发现利用个性化佩奇排序算法可以找到与这些重要账户有重大关联的关联账户,即通过初始结点的随机游走寻找出相对于该初始结点比较重要的结点,当把算法应用于导侦时,则能够从某些高度可疑的起始结点,通过个性化佩奇排序算法找到其不限资金交易层数的主要资金来源账户和路径,从而进一步的挖掘和展现出其主要洗钱犯罪网络。
[0024]
基于上述分析,本发明提出了一种反洗钱智能自动导侦的方法、计算机可读存储介质,以佩奇排序算法得到导侦目标账户结点为中心,使用个性化佩奇排序算法对隐藏的资金交易网络进行深度发掘并找到关键结点,构建导侦目标账户结点与关键结点之间的连接关系,最终生成资金交易关键网络图,从而能够自动快速且较为准确地挖掘出资金交易网络中的可疑节点。
[0025]
具体而言,图1是根据本发明一实施方式的反洗钱智能自动导侦的方法,该方法包括:步骤s1~步骤s5。
[0026]
在步骤s1中建立原始资金交易网络图。
[0027]
具体而言,所述建立原始资金交易网络图包括:获取银行交易流水记录,对其中的错误数据进行筛选以及删除,并且对入账方向进行统一从而形成源账户a
i
到目标账户b
j
的交易记录;对各个转账交易对进行分组求和,建立各个转账交易对的三元组,其中,所述三元组的元素包括源账号a
i
、目标账户b
j
、源账号a
i
转入目标账号b
j
的总金额;建立网络图,其中,源账户a
i
以及目标账户b
j
组成了所述网络图中的各个结点,源账号a
i
转入目标账号b
j
的路径组成了所述网络图中的各个有向边,其中,源账号a
i
转入目标账号b
j
的金额为有向边的权重;从所述网络图中选取最大弱连通分量子图作为所述原始的资金交易网络图。
[0028]
在步骤s2中基于佩奇排序算法对所述原始资金交易网络图中的各个结点进行佩奇排序值的计算,将所述佩奇排序值大于第一预设阈值的各个结点作为导侦目标账户结点。
[0029]
因为建立的原始资金交易网络通常会拥有上万个结点,并且资金交易网络形成的有向图结构属于稠密图,因此使用传统的侦测手段较难发现重要的目标。为此,本实施方式中在有向图上使用佩奇排序来寻找原始资金交易网络中最为关键的结点。佩奇排序
(pagerank)算法是图的链接分析的算法,属于图数据上的无监督机器学习算法。其具体定义如下:对于任意一个度为n的有向图g,其结点为v
i
,i=1,2,

n。在图g上的一个一般的随机游走模型,即一阶马尔科夫链,均存在平稳分布,并且达到平稳分布之后,每个结点的佩奇排序值pr(v
i
)定义为:
[0030][0031]
其中,m(v
i
)是指向结点v
i
的结点的集合,l(v
j
)是结点v
j
连出的边的个数,d(0≤d≤1)为一个系数,称为阻尼因子。所有结点的佩奇排序值组成了一个平稳分布向量,记为r。
[0032][0033]
向量r为该有向图的一般佩奇排序值。在运行佩奇排序算法之后,就会依据图中不同结点的pagerank值得到一份名单,名单中名次靠前的账户就是在资金交易网络中收益较高的账户,这些账户在资金交易网络中充当非常重要的角色。这些排名靠前的结点很有可能成为洗钱网络在整合阶段中的目标结点,同时也就是算法输出的导侦目标账户。表1是根据本实施方式的一个实际实验过程中生成的佩奇排序值靠前的名单,其中第一预设阈值为0.003。
[0034]
表1
[0035][0036][0037]
如表1所示,排位在1、2、3、4、6、8、9的人员是经过分析师验证之后具有较高关注度价值的人员,而佩奇排序的结果表明具有较高关注度的人员往往也具有较高的pagerank值,因此佩奇排序的有效价值也得以体现。
[0038]
在步骤s3中将所述原始资金交易网络图中的有向边转换方向从而得到资金来源网络图。
[0039]
在步骤s4中基于个性化佩奇排序算法从所述资金来源网络图中确定出各个导侦目标账户结点的关联账户结点。
[0040]
具体而言,在获得导侦目标账户之后,考虑如何对导侦目标账户进行深度的挖掘。进行挖掘可以采用的方法是找到与目标结点有直接交易的结点,但是在大数据网络资金交易中,这些结点即使与目标结点有着直接的联系,这些结点可能也没有较高的重要程度,可能整个交易过程中只有一笔资金交易,而且这样的结点有上百个之多,因此,在该步骤s4中使用个性化佩奇排序算法来寻找与目标结点关联度最高的结点。
[0041]
个性化佩奇排序算法(peronalized pagerank)作为佩奇排序算法的一种重要扩展,是用来衡量网络中的邻近度关系的算法,所谓邻近度π(s,t)代表了从s的角度来看,t的重要程度,因此邻近度不具有对称性,即π(s,t)≠π(t,s)。针对于初始结点s,个性化佩奇排序算法在衡量某一目标结点t相对于结点s的邻近度时,是通过随机游走的方式进行估计的。从初始结点s出发按照图中的边权重展开游走,在随机游走每到达一个结点后以α的概率停止于这一结点;之后以1-α的概率继续以当前结点为起始结点展开随机游走。
[0042]
对于每个结点v,都存在停留概率和继续前进概率。其中停留概率π
f
(s,v)表示从s出发的随机游走,当前走到v,并最终停在v的概率;继续前进概率r
f
(s,v)则表示从s出发的随机游走,当前走到v,继续向前走的概率。邻近度则可按照下式进行计算:π(s,t)=π
f
(s,t)+∑
v∈v
r
f
(s,v)
·
π(v,t)。通俗的理解,个性化佩奇排序算法为从某一个结点出发,从图上随机游走到另一个结点的概率。因此个性化佩奇排序算法可以很好地找到图上一个结点的相似结点。在运行个性化佩奇排序算法来寻找与导侦目标账户最为接近的关联账户的时候,分别计算所述资金来源网络图中的各个结点相对于某一导侦目标账户结点s的邻近度值;将相对于某一导侦目标账户结点s的邻近度值大于第二预设阈值(可以根据经验值来设定)的各个结点作为所述导侦目标账户结点s的关联账户结点。这些关联账户结点在图结构中与导侦目标账户结点拥有高度的相关性并且与更多的账户连接。这些关联账户结点可以为发现洗钱网络的关键网络图做出重要的指向性作用。
[0043]
在步骤s5中构建各个所述导侦目标账户结点与其对应的所述关联账户结点之间的连接关系,生成资金交易关键网络图。
[0044]
具体而言,基于迪杰斯特拉路径查找算法来构建所述导侦目标账户结点与所述关联账户结点之间的连接关系,生成所述资金交易关键网络图。
[0045]
首先将所述资金来源网络图中的各条边的权重取倒数,从而生成权重图;然后寻找出各个关联账户结点与其对应的所述导侦目标账户结点之间的最短路径。
[0046]
构造两类账户连接关系的本质就是寻找这些账户之间最主要的交易记录。构造权重图之后,将寻找账户之间的最显著交易问题转化为最短路径问题,这样的转化极大程度降低了问题的复杂性。由于关联账户结点与导侦目标账户结点之间可能存在着大量的路径,因此找出资金交易量最高的路径(权重图中的最短路径)可以极大简化图结构,并且不会丢失关键信息。
[0047]
优选地,生成路径之后,可以对交易网络进行简化操作,保留那些交易额较高的结点,同时利用剪枝操作减少资金循环流动的情况。
[0048]
可选地,一实施方式中除了寻找原始数据中的可疑交易来作为反洗钱工作导侦,另外对资金交易网络进行可视化,在保留很有限可疑账户结点的同时,求展示资金交易过
程可疑账户的主要行为以及这些行为之间相应的联系。这些联系具体在可视化图像中,可以将具有不同行为的账户按照不同颜色进行标注,包括初始账户、中间账户、关联账户、导侦目标账户。这样的分类方式可以为反洗钱监测工作的人工侦测阶段提供更多的相关信息。图2为根据该实施方式简化后的资金交易网络通过电脑软件进行可视化后的效果图。其中,生成的资金交易网络中,拥有洗钱过程的资金分发阶段以及资金整合阶段。
[0049]
优选地,为了获得更多线索,一实施方式的反洗钱智能自动导侦的方法还包括:将步骤s5中得到的资金交易关键网络图进行前向扩展从而找出放置阶段的起始账户结点与分发阶段的中间账户结点的关系,生成扩展后的资金交易关键网络图。其中,可以根据人工经验来确定出起始账户结点,也可以将佩奇排序值小于第三预设阈值(可选地,如0.001)的结点作为起始账户结点。该实施方式中增加了洗钱过程的资金放置阶段,通过前向扩展从而找出处于放置阶段的起始账户与分发阶段的中间账户之间的联系,从而生成更加完整的资金交易关键网络图,提供更多的线索。图3是根据本实施方式的前向扩展后的资金交易关键网络图。
[0050]
基于同样的发明构思,本实施方式还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序用于执行上述任一实施方式所述的反洗钱智能自动导侦的方法。
[0051]
综上,根据本实施方式的反洗钱智能自动导侦的方法、计算机可读存储介质,从原始数据的清洗、导侦目标账户结点的确认、资金交易网络的建立、可疑交易的深度挖掘、资金交易关键网络图的生成等各个步骤都可以实现自动化完成,大大提升了整个反洗钱侦测工作的效率;利用个性化佩奇排序算法以及基于迪杰斯特拉算法建立了不同可疑交易之间的资金关键网络图,这为反洗钱监测工作提供了更多且较为可靠的线索;本发明能够自动快速且较为准确地挖掘出资金交易网络中的可疑节点。
[0052]
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0053]
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0054]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0055]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或
其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0056]
前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1