用于警情数据的信息抽取方法与流程

文档序号:33713092发布日期:2023-04-01 01:05阅读:来源:国知局

技术特征:
1.用于警情数据的信息抽取方法,其特征在于,包括如下步骤:步骤一:对各区域的历史突发警情信息进行汇集,并根据警情处理结果对所述突发警情信息进行特征标注;步骤二:统合标注后的突发警情信息作为样本集,构建基于bert的警情诊断模型,输出有关警情特征的概要性描述文本;步骤三:实时采集公安平台的突发警情信息,并对这些信息进行分词、降噪,经过预处理后转换成预设信息格式的突发警情文本;步骤四:对突发警情文本进行切词处理,然后对突发警情文本嵌入语义特征、句特征以及位置特征,将三大特征相加构成模型输入向量;将模型输入向量传输至警情诊断模型,对警情特征进行诊断,并输出诊断结果;所述警情特征包括警情发生地点、警情类别以及警情等级;步骤五:根据诊断结果分配对应数量的巡警人员进行处理;具体为:获取诊断结果中对应的警情发生地点、警情类别以及警情等级;以警情发生地点为中心,将半径r1的区域标记为警情波及区域;其中r1为预设值;获取警情波及区域的网格区域人口密度为rl;将警情等级标记为d1;获取警情波及区域的警情吸引值为jx;设定所述警情类别对应的预设类别值为l1;通过气象平台调取警情波及区域当天的气象数据,计算对应的气象影响系数qx;利用公式wx=rl
×
b1+jx
×
b2+d1
×
b3+l1
×
b4+qx
×
b5计算得到警情威胁值wx,其中b1、b2、b3、b4、b5均为预设系数因子;根据警情威胁值wx确定需分配的巡警人员数量为rz;具体为:数据库内存储有警情威胁范围与巡警人数阈值的对照表。2.根据权利要求1所述的用于警情数据的信息抽取方法,其特征在于,其中,警情吸引值jx的具体计算方法为:获取所述警情波及区域的历史警情处理结果;在预设时间段内,统计所述警情波及区域的警情发生总次数为c1;将每次警情的预设类别值、警情等级以及巡警处理人数依次标记为lt、dt、rt;利用公式gt=lt
×
g1+dt
×
g2+rt
×
g3计算得到警处值gt,其中g1、g2、g3均为系数因子;将警处值gt与预设阈值相比较;统计gt≥预设阈值的次数占比为zb1,当gt≥预设阈值时,获取gt与预设阈值的差值并求和得到超警总值pz;利用公式jx=c1
×
g4+zb1
×
g5+pz
×
g6计算得到警情吸引值jx,其中g4、g5、g6均为系数因子。3.根据权利要求1所述的用于警情数据的信息抽取方法,其特征在于,其中,气象影响系数qx的具体计算方法为:获取警情波及区域当天的气象数据,所述气象数据包括若干个气象因子的最大预计数据;气象因子包括气温、降雨量、光照和风力等级;将各气象因子的最大预计数据与数据库中存储的对应气象因子的安全数据进行对比,得到各气象因子的数据差值;获取大于零的各气象因子的数据差值,结合数据库中存储的各气象因子对巡查任务的
影响因子,计算对应的气象影响系数qx。4.根据权利要求1所述的用于警情数据的信息抽取方法,其特征在于,其中,警情诊断模型的具体构建步骤为:将样本集按照设定比例划分为训练集、测试集和校验集;再对样本集进行数据预处理,即切词;然后对切词结果进行语义嵌入、句嵌入和位置嵌入,以获得模型的输入文本向量;最后将训练集、测试集和校验集输入bert模型以训练得到警情诊断模型;其中,bert模型的语义提取层是一个以transformer编码器为基本单元的多层双向解码器,包括注意力机制、层标准化和残差连接以及前馈神经网络三个部分。5.根据权利要求1所述的用于警情数据的信息抽取方法,其特征在于,其中,分词是指利用中文分词技术,将突发警情文本表示为一个个词语组成的向量;中文分词技术采用开源的ansj分词器作为中文分词器;降噪是指对词语列表进行筛选,以获得一个包含关键词而没有噪音词的词语列表。6.根据权利要求5所述的用于警情数据的信息抽取方法,其特征在于,其中,切词处理具体表现为:基于jieba切词技术,并补充警情领域相关的命名实体,构建警情诊断词典,由此对突发警情文本进行切词处理。7.根据权利要求6所述的用于警情数据的信息抽取方法,其特征在于,其中,对突发警情文本嵌入语义特征、句特征以及位置特征,具体为:采用word2vec模型,将切词结果利用词的上下文信息,生成表示词语间关联关系的低维词向量,即语义特征向量;将突发警情文本的奇数句文本和偶数句文本分别嵌入ea和eb以学习相邻告警信息语句的逻辑关系;其中,ea赋值为1,eb赋值为0;对切词结果进行位置编码,以确定每个词语的位置信息,学习各词语的时序特征和词语间的相关性。

技术总结
本发明公开了用于警情数据的信息抽取方法,涉及信息处理技术领域,包括:对各区域的历史突发警情信息进行汇集,并统合标注后的突发警情信息作为样本集,构建基于BERT的警情诊断模型;实时采集公安平台的突发警情信息,并进行分词、降噪,经过预处理后转换成预设信息格式的突发警情文本;对突发警情文本进行切词处理,然后对突发警情文本嵌入语义特征、句特征以及位置特征,将三大特征相加构成模型输入向量;将模型输入向量传输至警情诊断模型,对警情特征进行诊断,并输出诊断结果,极大改善了文本信息杂乱的状况;根据诊断结果分配对应数量的巡警人员进行处理,合理有效分配现场巡警人员及时处理突发警情,达到资源利用最大化。达到资源利用最大化。达到资源利用最大化。


技术研发人员:高坤祥 马伟
受保护的技术使用者:安徽中科新辰技术有限公司
技术研发日:2022.11.15
技术公布日:2023/3/31
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1