挖掘相关联犯罪嫌疑人的系统及方法

文档序号:6464953阅读:245来源:国知局
专利名称:挖掘相关联犯罪嫌疑人的系统及方法
技术领域
本发明涉及公安犯罪网络分析领域,特别是指在一种大规模犯罪网络中挖 掘相关联犯罪嫌疑人的系统,另外还涉及挖掘相关联犯罪嫌疑人的方法。
背景技术
自911事件以来,各个国家的安全部门十分重视犯罪数据的搜集和相关数 据库的建设,同时基于相关数据库在数据挖掘方面进行了一系列的研究。犯罪 数据的分析以及挖掘是从显性的数据入手,寻找出某些隐性的有用信息。从犯 罪网络中可能隐藏的心理、行为或者其他的因素来提炼出相关的模式,以此来 提供线索、协助办案,同时,尽可能地把提取的特征模式用于监控之中,实现 预警。
数据挖掘(DataMining)旨在从大量的、不完全的、有噪声的、模糊的、 随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信 息和知识。还有很多和这一术语相近似的术语,如从数据库中发现知识(KDD)、 数据分析、数据融合(Data Fusion)以及决策支持等。于这些概念相提并论, 是因为数据挖掘瞄准的对象是阐述个体间联系的相关性知识、而非描述个体属 性、支零破碎的数据。
现有的犯罪网络分析方法从手工方法到基于图像展现的分析最后到目前比 较成熟的社会网络分析(SNA)。社会网络分析目前已经广泛应用于国家贸易关 系的分析、社会人物关系的分析、社会结构的发现和理解以及组织通信行为的 研究。但所有的分析目前还仅仅停留在手工分析的层面上,即仍然是所谓第一 代的犯罪网络分析方法。这种分析方法面对庞大的数据量时,效率并不是很高,而且具有一定的随机性。干警通常是凭借多年的经验有目的地在茫茫数据中寻 找自己认为有用的信息,事实上数据的分析依然是完全在靠人力完成
现有的挖掘系统及方法某些过于理论化,或者只有方法而缺乏一定数据的 积累;某些可实用的、高性能的方法仅能处理中小规模的犯罪网络;而某些针 对大规模犯罪网络的工具和方法,仅停留在初步挖掘或侧重于人工处理后的图 形化展示,在挖掘方面仅担当辅助型的角色。这些挖掘系统和挖掘方法效率不 高,依靠人力分析,随机性很强,容易遗漏。

发明内容
本发明的目的在于提供一种在大规模犯罪网络中高效、全面的挖掘相关联 犯罪嫌疑人的系统。
本发明提供了一种挖掘相关联犯罪嫌疑人的系统,包括 确定和量化犯罪网络中人员之间关联优先级的关联量化模块;
计算犯罪与中心犯罪嫌疑人关联系数,并构造关联人员集合的犯罪关联函数
模块;
利用犯罪关联系数使关联人员集合大小始终控制在人力可排査的范围内的 结点筛选模块。
进一步的,所述关联量化模块利用层次结构分析法确定每个关联在网络中的 优先级;将优先级平均地映射到
空间进行量化。
进一步^J,所述犯罪关联函数模块的关联函数f的定义为 jmax(4c,max(4^/0.,力n,j、l…"/ ^c
L i / = c
n:集合C的元素个数;
Aij:结点i,j之间的直接犯罪关联值。另外,本发明也提供了一种挖掘相关联犯罪嫌疑人的方法,该方法包括如下 步骤
1) 用户输入中心犯罪嫌疑人的信息,在犯罪网络中找到对应结点;
2) 利用犯罪关联函数模块构造关联人员集合,其初始元素为用户确定的中 心犯罪嫌疑人的结点;
3) 根据犯罪网络中的人员交互关联,选取关联人员集合中未被扩展过的每 一个结点,将其定位于犯罪网络,并在该网络中进行关联扩展;
4) 利用犯罪关联函数模块计算被扩展结点的犯罪关联系数值,将该值不低 于阈值的结点加入关联人员集合;
5) 重复步骤3)和4),直到关联人员集合不再有新的结点加入或者犯罪网 络全部结点均被扩展完毕;
6) 根据关联人员集合中的各个结点与中心犯罪嫌疑人的犯罪关联系数,利 用关联量化模块进行排序,取一定量结点作为候选的相关联嫌疑犯进行排査。
进一步的,所述步骤l)中确定的犯罪网络是一个定量表示可能的犯罪个体 之间关联的优化图论模型,模型表达如下 G=(c,C,A, S,f),其中
G:犯罪网络,
C:中心犯罪嫌疑人,由用户输入, C:犯罪网络中全部结点的集合, A:犯罪网络中全部犯罪关联的集合, f:计算犯罪关联系数的函数。 进一步的,所述步骤4)中关联人员集合新增的结点为犯罪网络中与中心犯罪嫌疑人相关联的一部分人群,定义为S={X I f(X,C)^k},其中k为犯罪关联 阈值;初始情况S^c)。
进一步的,所述步骤6)还包括必要时利用结点筛选模块使人员关联集合 大小始终控制在人力可排査的范围内的步骤。
本发明与背景技术相比,具有的有益的效果是实现结点数量为千万级 (107 108)的犯罪网络完全扫描;控制关联人员集合的增长,使得该扫描过程 可以在计算能力受到较大限制、低端的数据库服务器上较快地完成;将犯罪关 联全面地筛选,再采用AHP方法确定优先级,最后使用平均等比量化,充分考 虑到了多种犯罪关联在办案、计算分析中的复杂多样性,使得犯罪网络模型更 加逼近真实情况;设计良好有效的犯罪关联函数,深入挖掘了犯罪行为之间存 在关联性,并且使得在庞大的犯罪网络上的大多数操作可以在较浅深度内收敛, 始终保持局部性访问;并且采用确定的挖掘方法,是一种稳定、可再现的方法。
本发明是针对相同网络不同案件背景进行优化建模,对多种犯罪关联进行 细化提取分析,进而在此基础上展开优化控制候选结点数量得到犯罪嫌疑人挖 掘结果。本发明通过建立包含信息更丰富、关联性更强的犯罪网络,加上合适 的量化方法、良好的犯罪关联函数构造及,从而保证了更快的挖掘速度和更高 的准确率。


图1为犯罪网络与关联人员集合。
具体实施例方式
本发明中挖掘相关联犯罪嫌疑人的系统主要包括关联量化模块、犯罪关联函 数模块和结点筛选模块。 1、关联量化模块该模块负责关联优先级的确定和量化。首先整合多个公安业务数据库,将社
会人员关联信息和犯罪分子关联信息合并,并构造一个犯罪网络;在该网络中提取人员之间的各种关联信息,例如同案犯关联、旅馆同房关联、电话通话关联、飞机同行关联、亲属关联、同事关联、同乡关联等;采用现有的成熟技术层次结构分析法(AHP)确定每个关联在网络中的优先级;将优先级平均地映射到
空间则完成量化过程;关联优先级会根据案件的不同而发生变化,可以通过修改判断矩阵来体现关联差异性,因此量化结果也会改变。
R为关联表达式,R(x,y,r)表示结点x,y之间存在关联集合r;其中r^Ur,Ur^同案犯,旅馆同房...},为关联全集;
Pr(rx)表示关联rx的优先级,其中rxEUr;例如可以设置Pr(旅馆同房)〉Pr(同
乡);
Q(rx)表示关联rx的量化数值,随优先级的增大而增大。2、犯罪关联函数模块
该模块负责犯罪关联系数的计算。在计算第i个结点的犯罪关联系数时,首先判断i是否与中心犯罪嫌疑人c存在直接犯罪关系,若存在先将f(i, c)值暂时设为Pr(ric),否则设为0;再从关联人员集合中选取未进行比较的结点,判断结点i通过其余任意结点jES与c进行关联的系数是否大于f(i, c),如果大于就更新f(,c)值为Pr(rijff(j,c);从而可以初步衡量i结点与中心犯罪嫌疑人c的关联程度。
关联函数f的定义
<formula>formula see original document page 8</formula>
n:集合C的元素个数;Aij:结点i,j之间的直接犯罪关联值;
如图1为犯罪网络与关联人员集合,括号中的数字表示该点与中心犯罪嫌疑人c的犯罪关联系数,设置了 k=0.35,所以C,,C2,C4,C6四个结点与c共同构成了关联人员集合。3、结点筛选模块
该模块负责维护关联集合,使其大小始终控制在人力可排査的范围内。当每个结点计算完毕时,如果关联集合的数量已经超出预设的集合最大结点数,那么对关联集合的每个元素按照它们的犯罪关联系数进行排序,从具有最小犯罪关联系数的结点开始删除,直到未删除的结点数量不超过集合最大结点数;若关联集合的结点数没有超过集合最大结点数,将关联系数小于阈值k的结点删除。
本发明挖掘相关联犯罪嫌疑人的方法,包括如下步骤
1) 用户输入中心犯罪嫌疑人的身份证号码,在犯罪网络中找到对应结点;
2) 利用犯罪关联函数模块构造关联人员集合,其初始元素为用户确定的中心犯罪嫌疑人;
3) 根据犯罪网络中的人员交互关联,选取关联人员集合中未被扩展过的每一个结点,将其定位于犯罪网络,并在该网络中进行关联扩展;
4) 利用犯罪关联函数模块计算被扩展结点的犯罪关联系数值,将该值不低于阈值的结点加入关联人员集合;
5) 重复步骤(3)和(4),直到关联人员集合不再有新的结点加入或者犯罪网络全部结点均被扩展完毕。
6) 利用关联量化模块,根据关联人员集合中的各个结点与中心犯罪嫌疑人的犯罪关联系数进行排序,取一定量结点作为候选的相关联嫌疑犯进行排査。其中,
步骤1)中确定的犯罪网络是一个定量表示可能的犯罪个体之间关联的优化图论模型,模型表达如下
G:犯罪网络,G=(C,C,A,S,f),其中C:中心犯罪嫌疑人,由用户输入;C:犯罪网络中全部结点的集合;A:犯罪网络中全部犯罪关联的集合;f:计算犯罪关联系数的函数;
步骤4)中的关联人员集合该集合中的结点代表了犯罪网络中与中心犯罪嫌疑人相关联的一部分人群,定义为S={X I f(X,C^k},其中k为犯罪关联阈值;初始情况S^c〉;
步骤4)中的犯罪关联函数f为计算犯罪关联系数的函数。f(i, C)表示为结点i与中心结点C的犯罪关联程度。形式化定义为
/v. 、 fmax(4,max(4 },乂 = 1..." "c
L 1 z = c
n:集合C的元素个数;
Aij:结点i,j之间的直接犯罪关联值;
V/,C, f(i, C)E
;其中f(i, C)越大表明i, C之间存在犯罪关联的可能性越大。这样精确地定义与C的传递犯罪关联值。
权利要求
1、一种挖掘相关联犯罪嫌疑人的系统,其特征在于包括确定和量化犯罪网络中人员之间关联优先级的关联量化模块;计算犯罪与中心犯罪嫌疑人关联系数,并构造关联人员集合的犯罪关联函数模块;利用犯罪关联系数使关联人员集合大小始终控制在人力可排查的范围内的结点筛选模块。
2、 根据权利要求1所述的挖掘相关联犯罪嫌疑人的系统,其特征在于所述关 联量化模块利用层次结构分析法确定每个关联在网络中的优先级;将优先级 平均地映射到
空间进行量化。
3、 根据权利要求1所述的挖掘相关联犯罪嫌疑人的系统,其特征在于所述犯罪关联函数模块的关联函数f的定义为-n:集合C的元素个数; Aij:结点i,j之间的直接犯罪关联值。
4、 一种挖掘相关联犯罪嫌疑人的方法,其特征在于该方法包括如下步骤1) 用户输入中心犯罪嫌疑人的信息,在犯罪网络中找到对应结点;2) 利用犯罪关联函数模块构造关联人员集合,其初始元素为用户确定的中 心犯罪嫌疑人的结点;3) 根据犯罪网络中的人员交互关联,选取关联人员集合中未被扩展过的每 一个结点,将其定位于犯罪网络,并在该网络中进行关联扩展;4) 利用犯罪关联函数模块计算被扩展结点的犯罪关联系数值,将该值不低 于阈值的结点加入关联人员集合;5) 重复步骤3)和4),直到关联人员集合不再有新的结点加入或者犯罪网络全部结点均被扩展完毕;6) 根据关联人员集合中的各个结点与中心犯罪嫌疑人的犯罪关联系数,利用关联量化模块进行排序,取一定量结点作为候选的相关联嫌疑犯进行排查。
5、 根据权利要求4所述挖掘相关联犯罪嫌疑人的方法,其特征在于所述步骤1)中确定的犯罪网络是一个定量表示可能的犯罪个体之间关联的优化图论模型,模型表达如下G=(c,C,A,S,f),其中G:犯罪网络,C:中心犯罪嫌疑人,由用户输入,C:犯罪网络中全部结点的集合,A:犯罪网络中全部犯罪关联的集合,f:计算犯罪关联系数的函数。
6、 根据权利要求4所述挖掘相关联犯罪嫌疑人的方法,其特征在于所述步骤4)中关联人员集合新增的结点为犯罪网络中与中心犯罪嫌疑人相关联的一部分人群,定义为S={X I f(X,C)》k},其中k为犯罪关联阈值;初始情况S={C}。
7、 根据权利要求4所述挖掘相关联犯罪嫌疑人的方法,其特征在于所述步骤6)还包括必要时利用结点筛选模块使人员关联集合大小始终控制在人力可排査的范围内的步骤。
全文摘要
本发明涉及公安犯罪网络分析领域,特别是指在挖掘相关联犯罪嫌疑人的系统和方法。该系统系统包括关联量化模块、犯罪关联函数模块和结点筛选模块。本发明也提供了挖掘相关联犯罪嫌疑人的方法1)在犯罪网络中找到中心犯罪嫌疑人的对应结点;2)构造关联人员集合;3)根据人员交互关联进行关联扩展;4)将被扩展结点的犯罪关联系数值不低于阈值的结点加入关联人员集合;5)重复步骤3)和4),直到关联人员集合不再有新的结点加入或犯罪网络全部结点均被扩展;6)根据各个结点与中心犯罪嫌疑人的犯罪关联系数排序,取一定量结点作为相关联嫌疑犯进行排查。本发明的挖掘系统和方法效率大大提高,而且可以将犯罪关联全面地筛选。
文档编号G06F17/30GK101464877SQ200810121668
公开日2009年6月24日 申请日期2008年10月27日 优先权日2008年10月27日
发明者吴朝晖, 夏超伦, 姜晓红 申请人:浙江大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1