一种面向电子数据的人物刻画方法与流程

文档序号:23711736发布日期:2021-01-23 21:08阅读:277来源:国知局
一种面向电子数据的人物刻画方法与流程

[0001]
本发明涉及电子人物刻画分析技术领域,更具体涉及一种面向电子数据的人物刻画方法,应用于公共安全行业刑事侦查工作中。


背景技术:

[0002]
公共安全行业领域中,民警在抓获犯罪嫌疑人员后,随即对其进行相关信息以及手机电子数据信息的采集,在信息采集后,民警即对嫌疑人进行调查及相关研判工作。
[0003]
目前民警对嫌疑人员的调查和研判工作,均需要较多的人员来参与工作,并且缺乏基于电子行为的专业分析方法,民警需要手动对人物信息逐一核查,增加了人工研判难度,造成对人物分析难度大、效率低下等问题。
[0004]
当前市面上存在五花八门的电子数据应用软件,由于缺乏针对人物视角的分析方法,并且对电子数据内容挖掘深度不足,而技术层面缺乏与标准化的标签体系加以结合,造成对人物分析的展示结果不标准,更没有体系,导致民警对目标人物的情况难以理解以及掌握的信息不全面。
[0005]
面对大量的待侦查案件与待调查的犯罪嫌疑人,如何通过快速、自动的手段实现从大量且多源头的电子数据里提炼、挖掘、归纳出与人物相关的特征数据与关键信息,从而实现对人物的精准刻画,是我们亟待解决的问题,是减轻民警核查嫌疑人工作量的必然举措,是帮助民警快速且全面掌握分析对象的有力手段。


技术实现要素:

[0006]
本发明需要解决的技术问题是提供一种面向电子数据的人物刻画方法,以解决目前民警对嫌疑人员的调查和研判工作时对人物分析难度大、效率低下的问题,以缓解民警手动对人物信息逐一核查所需的工作量,降低人工研判难度,让民警能快速掌握目标人物情况。
[0007]
为解决上述技术问题,本发明所采取的技术方案如下。
[0008]
一种面向电子数据的人物刻画方法,包括以下步骤:
[0009]
s1、建立类案作案特征库,并构建人物标签体系;
[0010]
s2、结合人物标签体系对各类涉案人员进行标签化处理;
[0011]
s3、构建自动一体化人物刻画分析流程,并将以下步骤加入流程;
[0012]
s4、对采集到的多源头电子数据及第三方收集的电子数据进行汇聚清洗;
[0013]
s5、对汇聚后的电子数据进行预处理;对电子数据进行预处理的过程包括:
[0014]
s51、对汇聚后的电子数据进行要素特征识别,并对被分析人物进行标签化处理;
[0015]
s52、对涉案人员与电子数据进行身份对比处理,挖掘出人物的关系圈;
[0016]
s53、在电子数据中比对出相关行为轨迹,进行去噪处理,再进行轨迹拟合处理;
[0017]
s6、经步骤s5处理后的数据与相应人物进行关联,形成人物画像;
[0018]
s7、输出人物画像。
[0019]
进一步优化技术方案,所述步骤s1包括以下步骤:
[0020]
s11、对各类案件涉案人员的涉案行为特征及人们通用行为特征进行梳理,形成人物的所有特征集合;
[0021]
s12、对步骤s11中的特征集合进行分级分类,形成类案人员行为标签及通用行为标签;
[0022]
s13、对步骤s12中形成的标签定义同义词、近义词库,构建人物标签体系。
[0023]
进一步优化技术方案,所述步骤s12中,从不同类案的作案手段以及人们的通用行为描述两个方面对步骤s11中的特征集合进行分级分类。
[0024]
进一步优化技术方案,所述步骤s4中,多源头电子数据是指在派出所、受害现场、作案现场、刑事js实验室里对涉案人员相关的电子设备所采集到的电子数据。
[0025]
进一步优化技术方案,所述步骤s4中,对电子数据进行汇聚清洗的步骤包括:
[0026]
s41、将电子数据集中汇聚到原始电子数据库;
[0027]
s42、对原始电子数据库中的数据根据电子数据格式规范进行转换,形成标准数据库;
[0028]
s43、根据业务定义的唯一数据键将数据去重,并去除无效数据。
[0029]
进一步优化技术方案,所述步骤s51包括以下步骤:
[0030]
s511、基于步骤s4的基础上,遍历扫描所有数据中的文本内容,从中提取人物特征;
[0031]
s512、基于人物标签体系将人物特征要素与人物标签进行转换;
[0032]
s513、将标签与各类人员进行关联处理;
[0033]
s514、通过nlp语义识别技术从好友通联内容中提取人物的外号及好友印象内容。
[0034]
进一步优化技术方案,所述步骤s52包括以下步骤:
[0035]
s521、对所有涉案人员与所有电子数据通过身份证号、手机号、网络身份号码进行交叉比对,运算出涉案人员的前科劣迹以及人物拥有的网络身份;
[0036]
s522、通过涉案人员身份证号、手机号、网络身份号码对所有电子数据进行层层关联比对,挖掘出人物的关系圈。
[0037]
进一步优化技术方案,所述步骤s53中,轨迹拟合处理包括以下步骤:
[0038]
对于不同地点发生的轨迹,当各轨迹时间相邻在x分钟内,且地点相差在方圆x米以内,则进行第一次拟合;
[0039]
对于某个轨迹点首次出现在a地点,而x分钟后出现在b地点,而x分钟后又出现回在a地点,则进行第二次拟合。
[0040]
进一步优化技术方案,所述步骤s6中,将经步骤s5预处理结果按人物为单位,根据身份证号码、手机号码属性进行关联,组装形成人物画像;人物画像中包含人物的背景、兴趣、关系圈、行为规律。
[0041]
由于采用了以上技术方案,本发明所取得技术进步如下。
[0042]
本发明应用于公共安全行业刑事侦查工作中,运用大数据的比对、关联、攫取、挖掘等分析手段作为基础技术手段,自动对多源电子数据进行汇聚整合后,从经过数据加工预处理的电子数据中提取人物的生活行为特征、身份特征、通联特征等,然后把这些特征逐一与相应人物对应关联起来,并形成人物画像,本发明能从人物的背景、兴趣、关系圈、行为
规律等几个方面去精准、快速地对目标人物进行直观地分析,从而缓解民警手动对人物信息逐一核查所花的工作量,降低了人工研判难度,让民警能快速掌握目标人物情况。
[0043]
本发明是以用户实际业务需求为指引,以对嫌疑人的分析业务为切入点,以大数据、云计算为基础技术,以智能化精准人物刻画为目的,通过整合运用多种数据关联分析算法(关联分析方法“fp-growth算法”),结合自动化处理而形成的一整套人物分析方案。
[0044]
本发明中结合可定义的人物标签体系,不仅能根据不同涉案类别所具有的手段特征,对涉案人员进行分级、分类地标签化处理,同时能根据涉案人员的住、行、背景、好友印象等通用维度对人员进行标签化处理,这样能让民警能够快速初步了解涉案人员。
[0045]
本发明能根据身份证号、手机号及其它任意号码与所有电子数据进行碰撞比对,并通过层层挖掘关联,得以明确人员的背景信息、关注的话题信息以及关联的好友信息,这样能让民警进一步掌握涉案人员的动态及关系圈。
[0046]
本发明能对涉案人员的轨迹去噪,并根据时间、空间,加以适当偏移量合并相似相邻轨迹,能简化民警对涉案人员轨迹的理解,对其轨迹更一目了然。
[0047]
本发明整个分析方法的过程是采用了自动化处理机制,只要不断有电子数据进入,就能自动对各类涉案人员进行自动刻画分析。
附图说明
[0048]
图1为本发明的架构流程图;
[0049]
图2为本发明刻画后的人物画像概念图。
具体实施方式
[0050]
下面将结合附图和具体实施例对本发明进行进一步详细说明。
[0051]
一种面向电子数据的人物刻画方法,结合图1至图2所示,包括以下步骤:
[0052]
s1、建立类案作案特征库,并构建人物标签体系。
[0053]
步骤s1包括以下步骤:
[0054]
s11、根据刑事侦查工作经验对各类案件涉案人员的涉案行为特征及人们通用行为特征进行梳理,形成人物的所有特征集合。
[0055]
s12、对步骤s11中的特征集合进行分级分类,形成标准化的“类案人员行为标签”及“通用行为标签”。
[0056]
步骤s12中,从不同类案的作案手段以及人们的通用行为描述两个方面对步骤s11中的特征集合进行分级分类。
[0057]
作案手段包括翻墙、踩点、尾随、购买大量电话卡等。
[0058]
人们的通用行为描述包括背景、技能、住宿、轨迹、好友印象等。
[0059]
s13、对步骤s12中形成的标签定义同义词、近义词库,构建人物标签体系。
[0060]
特征集合经过分级分类后转化为“标签”,即以人物为中心按照“类案涉案行为”及“通用行为”两方面构建了“标签体系”。
[0061]
s2、结合人物标签体系对各类涉案人员进行标签化处理。
[0062]
s3、构建“自动一体化人物刻画分析流程”模型,并启动该流程模型。
[0063]
流程处理内容包括:1)多源电子数据汇聚;2)电子数据预处理;3)生成人物画像等
全套处理过程。
[0064]
其中,电子数据预处理为以下步骤s5中的内容,包括:特征提取及标签化处理、人物身份比对及关系统挖掘、行为去噪及轨迹拟合等步骤。
[0065]
s4、对采集到的多源头电子数据及第三方收集的电子数据进行汇聚清洗。
[0066]
步骤s4中,多源头电子数据是指在派出所、受害现场、作案现场、刑事js实验室里对涉案人员相关的电子设备所采集到的电子数据。
[0067]
步骤s4中,对电子数据进行汇聚清洗的步骤包括:
[0068]
s41、将电子数据集中汇聚到原始电子数据库。
[0069]
s42、对原始电子数据库中的数据根据该行业的电子数据格式规范进行转换,形成标准数据库。
[0070]
s43、根据业务定义的唯一数据键将数据去重,并去除无效数据。
[0071]
s5、对汇聚后的电子数据进行预处理;对电子数据进行预处理的过程包括:
[0072]
s51、对汇聚后的电子数据进行要素特征识别,并对被分析人物进行标签化处理。
[0073]
步骤s51包括以下步骤:
[0074]
s511、基于步骤s4多源电子数据汇聚的基础上,遍历扫描所有数据中的文本内容,从中提取人物特征。人物特征不仅限于身份证号及电话号码等的号码、敏感关键词、行为轨迹、涉案前科(盗窃、骗)等。
[0075]
s512、基于人物标签体系将人物特征要素与人物标签进行转换。例如:同一地点停留2小时以上=滞留=逗留=驻留。
[0076]
s513、将标签与各类人员进行关联处理,标签根据不同分类打到不同类人员身上。
[0077]
s514、通过nlp语义识别技术从好友通联内容中提取人物的外号及好友印象内容,最后完成对被分析人物的标签化处理。
[0078]
步骤s514包括以下步骤:
[0079]
s5141、以积累的针对刑事侦查行业的特征识别训练集及相关的词库作为识别的基础,词库包括称谓(如大哥、老大),以及对人描述的形容词(如凶猛、大胆);
[0080]
s5142、遍历标准电子数据库的所有人员好友通联文本数据,运用特征提取规则算法(bi-lstm-crf算法)从中提取其好友对本人的称谓及印象描述;
[0081]
s5143、提取称谓及印象描述后,再将其与被刻画人物作关联。
[0082]
s52、对涉案人员与电子数据进行身份对比处理,挖掘出人物的关系圈。
[0083]
步骤s52包括以下步骤:
[0084]
s521、对所有涉案人员与所有电子数据通过身份证号、手机号、网络身份号码等属性进行交叉比对,运算出涉案人员的前科劣迹以及人物拥有的网络身份。
[0085]
交叉比对即用归案涉案人员的各种属性值分别与电子数据中提取到的身份证号、手机号、网络身份号码作逐一比对。
[0086]
网络身份可以为qq或其他软件的身份。
[0087]
步骤s521能够运算出涉案人员的前科劣迹以及网络身份的具体原理如下:
[0088]
1、涉案人员与电子数据交叉比对后,会与电子数据进行关联。
[0089]
2、电子数据中含有以往犯罪活动的属性信息,有电子数据必有相关案件,所以涉案人员与电子数据关联后,会与案件前科“过往犯过的事”进行关联;
[0090]
3、涉案人员与电子数据关联后,就可通过电子数据获取里面的网络身份。
[0091]
s522、通过涉案人员身份证号、手机号、网络身份号码等对所有电子数据进行层层关联比对,挖掘出人物的关系圈。
[0092]
步骤s522能够挖掘出人物的关系圈的具体原理如下:
[0093]
1、通过涉案人员的身份证、手机号等号码到电子数据库中与所有在库中的其它人员逐个属性作精确、模糊比对,从而找到人与人的关系、即第一层人物关系圈;
[0094]
2、对各个人员的日常活动行为,运用关联分析方法“fp-growth算法”计算出每个人的日常活动的频繁项集,再从频繁项目集挑选出强关联的频繁活动项集,产生这些频繁活动项集的人员,作为第二层人物关系圈。
[0095]
s53、通过人员身份证、手机号等号码在所有电子数据中比对出相关行为轨迹,进行去噪处理,再进行轨迹拟合处理。
[0096]
去噪处理的目的是过滤掉无效、重复的轨迹数据。
[0097]
轨迹拟合处理即根据时间、空间合并相似相邻轨迹。
[0098]
步骤s53中,轨迹拟合处理包括以下步骤:
[0099]
对于不同地点发生的轨迹,当各轨迹时间相邻在x分钟内,且地点相差在方圆x米以内,则进行第一次拟合。
[0100]
对于某个轨迹点首次出现在a地点,而x分钟后出现在b地点,而x分钟后又出现回在a地点,则进行第二次拟合。
[0101]
s6、经步骤s5处理后的数据与相应人物进行关联,形成人物画像。
[0102]
步骤s6中,将经步骤s5预处理结果按人物为单位,根据身份证号码、手机号码等属性进行关联,组装形成人物画像;人物画像中包含人物的背景、兴趣、关系圈、行为规律。
[0103]
背景包括身份、前科、印象等;兴趣包括关注话题等;关系圈包括亲密关系、朋友圈等;行为规律包括通联规律、行为规律等。
[0104]
s7、输出人物画像。
[0105]
相比之下,以往类似的人物分析方法,不是专门针对电子数据进行,并没有结合不同涉案人员的作案手段、以及活动行为进行分析,更没有贴近类案的业务去形式人物的标签体系,这样则不够标准化,刻画出来的信息不准确;同时,没有以电子数据为基础作为起点,去与第三方收集的数据进行整合、延伸,形成更大更广的“电子数据链”;也缺乏从标签构建、多源电子数据汇聚、到输出人物画像等一整套的自动处理引擎,导致对人物分析的角度不够有针对性,也不贴合侦查业务实践。
[0106]
本发明是以用户实际业务需求为指引,以对嫌疑人的分析业务为切入点,以大数据、云计算为基础技术,以智能化精准人物刻画为目的,通过整合运用多种数据关联分析算法(关联分析方法“fp-growth算法”),结合自动化处理而形成的一整套人物分析方案。
[0107]
本发明是一种针对人物的、面向刑事侦查业务的、基于电子数据的人物刻画分析方法,从人物的背景、兴趣、关系圈、行为规律等多个方面对人物进行分析。
[0108]
本发明中结合可定义的人物标签体系,不仅能根据不同涉案类别所具有的手段特征,对涉案人员进行分级、分类地标签化处理,同时能根据涉案人员的住、行、背景、好友印象等通用维度对人员进行标签化处理,这样能让民警能够快速初步了解涉案人员。
[0109]
本发明能根据身份证号、手机号及其它任意号码与所有电子数据进行碰撞比对,
并通过层层挖掘关联,得以明确人员的背景信息、关注的话题信息以及关联的好友信息,这样能让民警进一步掌握涉案人员的动态及关系圈。
[0110]
本发明能对涉案人员的轨迹去噪,并根据时间、空间,加以适当偏移量合并相似相邻轨迹,能简化民警对涉案人员轨迹的理解,对其轨迹更一目了然。
[0111]
本发明整个分析方法的过程是采用了自动化处理机制,只要不断有电子数据进入,就能自动对各类涉案人员进行自动刻画分析。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1