基于大数据平台的高危人员分析和识别方法与流程

文档序号:12471335阅读:1158来源:国知局

本发明涉及计算机程序领域,尤其涉及的是一种基于大数据平台的高危人员分析和识别方法。



背景技术:

“治安高危人员”指对社会治安秩序和公共安全有现存或潜在危害的人群。识别和监控这类人群需要对大量普通人群筛查、分析;同时对经过筛查后确定为“治安高危人员”的人群进行监控也是一个庞大、繁复的工作。通常,筛查和监控此类人员主要依赖于群众举报和公安部门留存的记录,这种方法往往效率低、实效性差、耗费大量人力。

随着大量社会记录电子化、数据化,通过采用数据挖掘、机器学习的方法对这些海量数据进行分析建模从而实现对“治安高危人员”的自动筛查、动态监控成为可能。数据挖掘是大数据知识发现中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

同时,人类是天然的社会性生物,因此人类的行为也自然的带有社会性。因此,研究社交网络在犯罪行为中的作用也成为了犯罪学研究领域的一个重要课题。已有的研究表明,社交网络在团伙犯罪行为中起到了重要的辅助作用。此外,犯罪社交网络并不是分离的,而是由一系列的社团交织而成。对于公安部门的决策者来说,从社交网络中挖掘犯罪信息变得越来越重要。

目前学术界关于大数据技术和社交网络分析已经有大量的算法成果,但是这些算法多是过于理论化,并没有结合实际应用场景做特定的优化,尤其是针对警用犯罪分析方面的优化更少。另外,如何将大数据技术和社交网络分析方法进行结合,并对发现结果合理展现,从而更好的辅助治安人员也没有很好的解决方案。

因此,现有技术存在缺陷,需要改进。



技术实现要素:

本发明所要解决的技术问题是:提供一种基于大数据分析技术和社交网络分析的高危人群的“识别”、“社团结构分析”、“社团角色分析”方法,从而对潜在高危人员进行分级、精准监控。

本发明的技术方案如下:一种基于大数据平台的高危人员分析和识别方法,包括,S1:通过确定的高危人员与其他非高危人员的交互信息,找到潜在高危人员;S2:基于高危人员相关数据,构建高危人员识别模型;并且,通过高危人员的交互相关信息,构建高危人员关系网络;S3:通过高危人员识别模型将对关系网络中的潜在高危人员进行识别,确认为高危人员;S4:通过高危人群关系网络进行社团划分,得到高危人群的社团网络;S5:对高危人群的社团网络进行社团网络分析,确定社团中成员扮演的角色、在社团的重要性,进而实现分级监控;S6:返回步骤S1。

应用于上述技术方案,所述的高危人员分析和识别方法中,步骤S5中,确定社团中成员扮演的角色包括核心人员、掮客人员和普通人员。

应用于各个上述技术方案,所述的高危人员分析和识别方法中,步骤S5中,统计社团网络中所有节点的点度中心度DC,统计所有节点的紧密中心度CC,根据计算w1DC+w2CC,对所有节点进行排序,排名前N的节点为核心人员,其中,w1,w2为权重。

应用于各个上述技术方案,所述的高危人员分析和识别方法中,步骤S5中,将划分得到的两个或者以上物理相连的社团,当社团中存在节点v 与两个或者两个以上的社团构成连接,且通过比较关系强度添加到社团中,则v为掮客人员,并且,将非核心人员和非掮客人员设置为普通人员。

应用于各个上述技术方案,所述的高危人员分析和识别方法中,步骤S1中,高危人员与其他非高危人员的交互信息包括通话记录数据信息、社交软件记录数据信息。

应用于各个上述技术方案,所述的高危人员分析和识别方法中,步骤S2中,高危人员相关数据包括高危人员的身份证登记数据,手机基站定位数据,社会保障数据,教育就业信息数据,犯罪记录数据,籍贯信息数据;高危人员的交互相关信息包括通话记录数据信息、社交软件记录数据信息。

应用于各个上述技术方案,所述的高危人员分析和识别方法中,步骤S3中具体包括:S31:定义关系网络为G=(V,E,w),V为网络中的节点表示网络中的人员,E为网络中的边表示人员间的关系,w表示关系的强度;初始时V,E,w=φ,将确定的高危人员及其之间的关系、关系强度加入G;S32:根据这些确定的高危人员的交互信息以及步骤31中所述的关系强度算法得到与高危人员存在直接关联的潜在高危人员及其关系强度;S33:将得到的潜在高危人员通过步骤32中所述的高危人员识别模型计算其疑似程度,若疑似程度高于阈值th则认定该潜在人员为疑似高危人员;S34:将疑似高危人员、人员间关系及关系强度加入G;S35:重复步骤S32~S34直到新加入的疑似人员与确定的高危人员的最短距离为定义的6,则将疑似高危人员确认为高危人员。

应用于各个上述技术方案,所述的高危人员分析和识别方法中,步骤S4中具体包括:

S41:将高危人员关系网络Gs(Vs,Es)的节点按边权重降序添加到列表L←V;

S42:若L≠φ,则初始化临时社团Cpre←φ,同时定义空集合L1←φ,L2←φ;否则转到步骤S48;

S43:若还没有生成社团,即k=0,则找出L中的第一个节点f←l1;否则,找出L中的第一个节点f←li满足若没有li满足条件,则f←l1

S44:将f及其邻居添加到集合L1中:L1←{f,Γ1(f)};将f邻居的邻居添加到集合L2中:L2←{Γ2(f)};

S45:考察所有的vi∈L1,若vi满足且则将vi添加到临时社团Cpre中:Cpre←vi;若执行完该步骤后,Cpre=φ则转到步骤S48;

S46:若k=0,则将Cpre作为一个社团C1←Cpre并保存到社团划分C中C←{C1},将Cpre中的节点从L中移除L←L\Cpre,记录社团数k←1;

S47:若k≠0,则对C中的所有社团Ci按照生成的先后顺序一一考察,若满足条件:n_avgwei(Cpre∪Ci)≥n_avgwei(Cpre),并且Cpre与Ci之间相连的边的权重大于|Cpre|·|Ci|·avgwei(G)/(|V|-1),那么将Cpre与Ci合并Ci←Ci∪Cpre,将Cpre中的节点从L中移除L←L\Cpre,并停止考察;

S471:若没有Ci满足上述条件,且|Cpre|>2,则Cpre作为一个独立社团k++,Ck←Cpre并保存到社团划分C中C←C∪{Ck},并将Cpre中的节点从L中移除L←L\Cpre

S472:若以上条件都不满足,则将Cpre添加到临时列表中Lpre中Lpre←Lpre∪Cpre并且将Cpre中的节点从L中移除L←L\Cpre

S48:转到步骤S42;

S49:初始化孤立节点列表Lleft←φ,对于所有的剩余节点v∈L∪Lpre,计算v与C中所有社团的连接权重,并将其添加到连接权重最高的社团中,若这样社团存在多个,v添加到生成较早的社团中;

S410:若Lleft≠φ,则将剩余节点作为独立的社团添加到C中;

S411:输出社团划分C;

其中:表示C的归一化平均权重,表示关系网络G的平均权重;δ(v)表示与v相连所有的边权重之和,表示C内部与v相连所有的边权重之和。

采用上述方案,本发明引入了高危人员的社团网络属性,从而实现了“重点人员,重点监控”。同时,方法利用大数据平台对于大规模数据的处理能力,有效的提高了分析识别效率,并且分析结果动态更新。从而实现此类人群的特殊防范管理,从而降低整个社会的犯罪率,提高社会和谐稳定度。

具体实施方式

以下具体实施例对本发明进行详细说明。

本实施例提供了一种基于大数据平台的高危人员分析和识别方法,其具体操作步骤如下:

S1:根据高危人员的交互信息,其中,高危人员的交互信息包括通话记录数据、社交软件记录数据,搜索和挖掘与确定高危存在交互关系的人员作为潜在高危人员。人员间关系强度的计算方法如下:

①主被叫通话频率fp:定义,人员A通话总时长为EpA,人员B通话总时长为EpB,A与B之间通话总时长为EpAB,则

②社交软件的交互信息fc:定义,人员A社交软件信息总条数为TcA,人员B社交软件信息总条数为TcB,A与B之间交互信息条数为TcAB,则

③人员A与人员B之间的关系强度为conStrength=wpfp+wcfc,其中wp+wc=1为权重。

S2:基于高危人员相关数据,构建高危人员识别模型;并且,通过高危人员的交互相关信息,构建高危人员关系网络。

其中,基于高危人员相关数据,包括:身份证登记数据,手机基站定位数据,社会保障数据,教育就业信息数据,犯罪记录数据,籍贯信息数据,构建高危人员识别模型,并对模型进行推导。

S3通过高危人员的交互相关信息,例如,通话记录数据,社交软件使用记录数据,......等,构建高危人员关系网络。同时,利用高危人员识别模型将对关系网络中的非疑似高危人员进行过滤。具体步骤如下:

①定义关系网络为G=(V,E,w),V为网络中的节点表示网络中的人员,E为网络中的边表示人员间的关系,w表示关系的强度。初始时V,E,w=φ,将确定的高危人员及其之间的关系、关系强度加入G。

②根据这些高危人员的交互信息以及1中所述的关系强度算法得到与高危人员存在直接关联的潜在高危人员及其关系强度。

③将得到的潜在高危人员通过2中所述的高危人员识别模型计算其疑似程度,若疑似程度高于阈值th则认定该潜在人员为疑似高危人员。

④将疑似高危人员、人员间关系及关系强度加入G。

⑤重复步骤②~④直到新加入的疑似人员与确定的高危人员的最短距离为6。

步骤S4:通过高危人群关系网络进行社团划分,得到高危人群的社团网络;

对高危人员关系网络进行社团划分:具体算法如下

其中:表示C的归一化平均权重,表示关系网络G的平均权重;δ(v)表示与v相连所有的边权重之和,表示C内部与v相连所有的边权重之和。

步骤S5:对高危人群的社团网络进行社团网络分析,确定社团中成员扮演的角色、在社团的重要性,进而实现分级监控;

社团内部角色分析:结合社会学中社团角色分类描述,通过SNA分析算法,确定社团内部的“核心成员”,“掮客人员”,“一般成员”。其具体操作步骤如下:

核心成员:

①对于社团中每个成员vi,计算其节点度中心度其中Degree(vi)表示vi的度数。

②对于社团中每个成员vi,计算其紧密度中心度其中,d(vi,vj)表示vi和vj之间的最短路径包含的边数或者边权重之和。

③对于社团中每个成员vi,计算αi=w1DC(vi)+w2CC(vi)。

④对于社团内全体成员,按照α大小降序排列。排名靠前的前N个成员为核心成员。

掮客成员:对于步骤4中算法步骤⑨中所有节点V,若V与两个或两个以上社团相连,则V为掮客人员。

普通人员:社团既非核心成员也非掮客人员的其他成员。

以上仅为本发明的较佳实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1