基于空间轨迹大数据分析的人员管控方法及系统的制作方法

文档序号:8498913阅读:435来源:国知局
基于空间轨迹大数据分析的人员管控方法及系统的制作方法
【技术领域】:
[0001] 本发明涉及人员行为模式分析技术领域,具体地说是一种能够根据空间活动轨迹 对一批重点监控人员进行聚类的基于空间轨迹大数据分析的人员管控方法及系统。
【背景技术】:
[0002] 随着第二代居民身份证的普及,二代证读卡器的应用也逐渐深入到各行各业,例 如网吧、旅馆、银行、火车站等。因此,基于二代证的人员轨迹信息数据也呈爆发式的增长。 在公安部门,经常需要通过身份证对一些特定的重点人员进行跟踪和管控。重点人员管控 是公安情报工作的重要内容,也是基层民警对人员和辖区管理的重点,但现阶段重点人员 管控只存在于数据层面,大部分分析模型设置的不科学,致使公安情报部门和基层民警管 控工作疲于应付,没有落到实处,没有形成直观的管控思维。
[0003] 近年来,各地公安部门先后建立了警用地理信息系统平台,为公安部门的业务发 展、工作能力提升提供了新的技术支撑。警用地理信息系统平台是改变公安信息化格局的 重要平台,公安部门情报分析应用与警用地理信息系统平台的结合将成为今后公安工作的 总体思路。
[0004] 当前,公安行业已经进入了大数据时代。大数据分析是公安业务今后发展的重要 方向,也是公安部门必须面临的挑战。通过对空间轨迹进行大数据分析,公安人员能够快速 的挖掘重点人员之间的潜在联系,进行分类处理,这对公安部门管控重点人员能够起到很 好的辅助作用。
[0005] 目前学术界关于人员轨迹分析已经有大量的研宄成果,但是这些研宄成果多是过 于理论化,并没有结合实际应用场景做特定的优化,尤其是针对警用犯罪行为分析方面的 优化更少。基层公安部门人力有限,只能在一定辖区地理范围内开展工作,所以基于空间轨 迹的大数据分析算法输出的结果必须要满足现实需求才能真的起到有益作用。

【发明内容】

[0006] 本发明针对现有技术存在的缺点和不足,提出一种从海量的人员轨迹数据中,挖 掘重点人员潜在联系,并合理分配管控任务的基于空间轨迹大数据分析的人员管控方法及 系统。
[0007] 本发明通过以下措施达到:
[0008] 一种基于空间轨迹大数据分析的人员管控方法,其特征在于包括以下步骤:
[0009] 步骤1 :重点人员轨迹数据抽取,对用户指定的重点人员、空间区域以及时间范 围,根据身份证号从多个数据库查询该人员的轨迹地址信息;根据轨迹地址名称,从地址库 中找到对应的地理经炜度坐标。最终,每个重点人员都可以表示为一个对应的地理坐标序 列;
[0010] 步骤2 :轨迹数据向量化,对用户指定的空间区域进行网格化处理,对每个网格进 行编号;然后根据第一步提取的坐标信息,对每个重点人员的轨迹序列进行基于网格序号 的直方图统计,重点人员在某个网格范围内出现一次,那么该网格对应的直方图计数加一, 最终,每个重点人员都可以表示为一个向量;
[0011] 步骤3 :对轨迹模式进行潜语义分析,将一批重点人员的轨迹向量表示为一个矩 阵,其中矩阵的每一列表示一个重点人员的轨迹,每一行表示用户指定的空间区域的一个 网格,矩阵的一个元素表示某个重点人员在该网格范围内出现的次数,对矩阵进行奇异值 分解,然后降维重建矩阵,重建后的矩阵即为重点人员轨迹模式的潜在语义矩阵;
[0012] 步骤4 :对重点人员进行聚类。根据前一步获得的潜在语义矩阵,使用k-means方 法对重点人员进行聚类处理;
[0013] 步骤5 :根据聚类处理结果分配管控任务。
[0014] 本发明所述步骤3中的潜语义分析采用如下模型实现:该模型的核心是奇异值分 解,奇异值分解表不为:
[0015] X = U 2 VT
[0016]其中X表示输入矩阵,U和V表示两个正交矩阵,2表示对角矩阵。
[0017] 本发明步骤4中运行的聚类算法采用k-means方法,算法过程中使用余弦距离或 欧式距离作为度量标准。
[0018] 两个向量的余弦距离的定义如下:
[0019]
【主权项】
1. 一种基于空间轨迹大数据分析的人员管控方法,其特征在于包括以下步骤: 步骤1:重点人员轨迹数据抽取,对用户指定的重点人员、空间区域以及时间范围,根 据身份证号从多个数据库查询该人员的轨迹地址信息;根据轨迹地址名称,从地址库中找 到对应的地理经炜度坐标,最终每个重点人员都可以表示为一个对应的地理坐标序列; 步骤2 :轨迹数据向量化,对用户指定的空间区域进行网格化处理,对每个网格进行编 号;然后根据第一步提取的坐标信息,对每个重点人员的轨迹序列进行基于网格序号的直 方图统计,重点人员在某个网格范围内出现一次,那么该网格对应的直方图计数加一,最终 每个重点人员都可以表示为一个向量; 步骤3 :对轨迹模式进行潜语义分析,将一批重点人员的轨迹向量表示为一个矩阵,其 中矩阵的每一列表示一个重点人员的轨迹,每一行表示用户指定的空间区域的一个网格, 矩阵的一个元素表示某个重点人员在该网格范围内出现的次数,对矩阵进行奇异值分解, 然后降维重建矩阵,重建后的矩阵即为重点人员轨迹模式的潜在语义矩阵; 步骤4 :对重点人员进行聚类,根据前一步获得的潜在语义矩阵,使用k-means方法对 重点人员进行聚类处理; 步骤5 :根据聚类处理结果分配管控任务。
2. 根据权利要求1所述的一种基于空间轨迹大数据分析的人员管控方法,其特征在于 所述步骤3中的潜语义分析采用如下模型实现:该模型的核心是奇异值分解,奇异值分解 表示为:X = U E VT,其中X表示输入矩阵,U和V表示两个正交矩阵,E表示对角矩阵;具 体包括:将每个重点人员的上网轨迹抽象为一个向量,那么一批人员的轨迹向量表示为一
位置的关系,每一行ri= [Xi,i…Xi,n]表示一个空间位置的向量,该向量描述了该空间位 置与每个人员的关系,对矩阵X进行奇异值分解,得到两个正交矩阵和一个对角矩阵:
其中〇 i,. . .,〇 ^皮称为奇异值,u p . . .,%和V p . . .,V1被称为左奇异向量和右奇异 向量,当选择k个最大的奇异值,和它们对应的U与V中的向量相乘,则能得到一个X矩阵 的k阶近似,此时该矩阵和X矩阵相比有着最小误差,且将空间位置向量和轨迹向量映射 到语义空间,用G表示矩阵Vt的第i列向量,则向量与含有k个奇异值的矩阵相乘,实现 从高维空间到低维空间的一个变换,这种变化用以下公式表示:Xfc =仏心以',基于奇异值 分解,在低维空间比较两个重点人员的轨迹相似度,计算向量与4 ?引的距离即可得 出。
3. 根据权利要求1所述的一种基于空间轨迹大数据分析的人员管控方法,其特征在于 所述聚类算法采用k-means方法,K-means需要优化的目标函数如下: J =Ekrnk*D(xn,Uk),其中1^在数据点xn被归类到第k类的时候为1,否则为0, D(xn,yk)表示数据点Xn和第k类的中心y k的距离,本实施例中D(xn,yk)采用余弦距离
其中xn>i和y ^分别表示向量xjP y k的第i个元素。
4. 一种基于空间轨迹大数据分析的人员管控系统,其特征在于设有数据库单元、初级 用户指定参数单元、空间轨迹数据提取单元、轨迹数据向量化单元、潜语义分析单元、聚类 单元、次级用户指定参数单元、结果输出单元,其中数据库单元和初级用户指定参数单元的 输出送入空间轨迹数据提取单元的输入端,空间轨迹数据提取单元与轨迹数据向量化单 元、潜语义分析单元、聚类单元、结果输出单元依次串接,次级用户指定参数单元的输出端 送入聚类单元,其中 数据库单元主要用于为分析提供原始数据,数据库单元中包含了多个公安基础数据 库,包括人员轨迹数据库、地址数据库、人口数据库、犯罪记录数据库等;这些数据库彼此之 间通过身份证号、地址名称等字段进行关联; 初级用户指定参数单元主要用于用户指定空间轨迹数据提取的各个参数,提供灵活配 置的功能,便于系统适用于不同的应用场景; 空间轨迹数据提取单元根据初级用户制定参数单元传入的参数,从数据库单元查询指 定的数据,并以地理坐标序列的形式返回查询结果; 轨迹数据向量化单元从空间轨迹数据提取单元获取地理坐标序列及用户指定参数,通 过对用户指定的区域网格化以及对地理坐标序列进行直方图统计,将轨迹数据转化为空间 向量,并将结果传入下一单元; 潜语义分析单元对传入的空间向量进行分析,通过对向量矩阵进行SVD分解降维,得 到潜语义矩阵。潜语义矩阵反映了重点人员和空间轨迹的潜在关系,该单元最终输出潜语 义矩阵到下一单元; 次级用户指定参数单元主要用于指定聚类的个数以及聚类算法中距离度量所采用的 方法; 聚类单元根据次级用户指定参数单元传入的参数,对潜语义矩阵进行分析挖掘,找到 其中的隐藏模式;根据选择的度量函数计算不同潜语义向量之间的相似性,将模式相近的 向量划分到同一簇中,不相近的向量划分到不同的簇中;根据潜语义向量的聚类结果,得到 重点人员的划分结果; 结果输出单元根据聚类单元的划分结果,输出将重点人员的管控任务的任务划分形 式。
【专利摘要】本发明涉及人员行为模式分析技术领域,具体地说是一种基于空间轨迹大数据分析的人员管控方法及系统,其包括重点人员轨迹数据抽取,对用户指定的重点人员、空间区域以及时间范围,根据身份证号从多个数据库查询该人员的轨迹地址信息;根据轨迹地址名称,从地址库中找到对应的地理经纬度坐标。最终,每个重点人员都可以表示为一个对应的地理坐标序列;轨迹数据向量化;对轨迹模式进行潜语义分析,对矩阵进行奇异值分解,然后降维重建矩阵,重建后的矩阵即为重点人员轨迹模式的潜在语义矩阵;对重点人员进行聚类,根据聚类处理结果分配管控任务,本发明相对于现有技术能够从海量的人员轨迹数据中,挖掘重点人员潜在联系,并合理分配管控任务。
【IPC分类】G06F17-30, G06Q10-06
【公开号】CN104820905
【申请号】CN201510259492
【发明人】孙圣鹏, 张玉超, 纪圣华
【申请人】威海北洋电气集团股份有限公司
【公开日】2015年8月5日
【申请日】2015年5月19日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1