一种基于搜索引擎的重复报警识别方法和系统的制作方法

文档序号:10725092阅读:219来源:国知局
一种基于搜索引擎的重复报警识别方法和系统的制作方法
【专利摘要】本发明涉及一种基于搜索引擎的重复报警识别方法和系统,所述方法包括以下步骤:S1、构建GIS地址库;S2、设定事发要素权重值及重复报警阈值;S3、基于搜索引擎在GIS地址库匹配最相似的事发地址地图坐标,将匹配度最高的地址库地图坐标赋值给当前事发地址地图坐标;S4、确定事发地址覆盖范围半径r,根据事发地址地图坐标计算Δt时期内覆盖半径范围内的报警信息;S5、基于步骤S4的查询结果,将当前报警信息的事发要素与查询结果的事发要素通过搜索引擎及分词技术计算匹配度,比较匹配度与阈值,匹配度高于阈值的报警则提示当前报警可能为重复报警,并将对应报警信息对比展示。能够识别有效重复报警,识别准确率较高,能够提高接处警效率。
【专利说明】
一种基于搜索引擎的重复报警识别方法和系统
技术领域
[0001]本发明涉及公安、医疗接警领域,更具体的说,是涉及一种基于搜索引擎的重复报警识别方法和系统。
【背景技术】
[0002]现有重复信息识别的方法主要是对单要素文本进行分词计算匹配度,而没有对多要素分词匹配计算信息综合匹配度,导致匹配度不高。且现有重复信息识别的方法没有涉及时间、空间的匹配处理。对于公安、医疗接警领域,时间、空间是很重要的要素,对于时间、空间的匹配处理能够大大提到重复信息识别的准确率。
[0003]在公安、医疗接警领域,目前能够给接警员提供识别有效重复警情的工具几乎没有,识别重复警情更多的依赖于人的经验及运气,重复警情识别率低,导致接警、派警、处警各环节处理重复警情时均存在人力资源浪费的情况。如何通过智能方法有效识别重复警情,减少资源浪费,提高接处警效率,成为亟待解决的问题。

【发明内容】

[0004]有鉴于此,有必要针对上述问题,提供一种基于搜索引擎的重复报警识别方法和系统,能够识别有效重复报警,识别准确率较高,能够提高接处警效率。
[0005]为了实现上述目的,本发明的技术方案如下:
[0006]—种基于搜索引擎的重复报警识别方法,包括以下步骤:
[0007]S1、构建GIS地址库;
[0008]S2、设定事发要素权重值及重复报警阈值;
[0009]S3、基于搜索引擎在GIS地址库匹配最相似的事发地址地图坐标,将匹配度最高的地址库地图坐标赋值给当前事发地址地图坐标;
[0010]S4、确定事发地址覆盖范围半径r,根据事发地址地图坐标计算At时期内覆盖半径范围内的报警信息;
[0011]S5、基于步骤S4的查询结果,将当前报警信息的事发要素与查询结果的事发要素通过搜索引擎及分词技术计算匹配度,比较匹配度与阈值,匹配度高于阈值的报警则提示当前报警可能为重复报警,并将对应报警信息对比展示。
[0012]作为优选的,在步骤S2中,所述事发要素包括事发地址、事发时间、事发类型、报警人姓名、报警人电话、报警描述。
[0013]作为优选的,所述步骤S3具体包括:将事发地址进行分词,并通过搜索引擎将分词结果与GIS地址库地址进行匹配,将匹配度最高的地址库地图坐标赋值给当前事发地址地图坐标。
[0014]作为优选的,所述步骤S4中,一定时期At内覆盖半径范围内的报警信息满足的条件为:
[0015]事发时间tl一待查询的事发时间t2〈 Δ t
[0016](事发地址坐标经度1n—待查询的事发地址坐标经度x)2+(事发地址坐标玮度Iat—待查询的事发地址坐标玮度y)2〈事发地址覆盖范围半径r2(距离转换为经玮度单位)。
[0017]作为优选的,所述步骤S2中,根据事发要素属性及批量数据实验确定各要素权重值(vl ,v2,v3...vN),阈值Vmin。
[0018]作为优选的,所述步骤S5具体包括:将当前报警信息的事发要素与查询结果的事发要素通过搜索引擎及分词技术计算匹配度,得到各要素匹配度(ml,m2,m3...mN),与每条报警信息匹配度(vl*ml,v2*m2,v3*m3...vN*mN),匹配度与阈值Vmin进行比较,大于Vmin的报警信息则提示为可能重复报警。
[0019]作为优选的,所述事发各要素匹配度计算报警信息匹配度与阈值比较的过程包括:
[0020]vl*ml+v2*m2+v3*m3...+vN*mN>Vmin。
[0021 ]作为优选的,还包括步骤S6:
[0022]将当前报警信息与识别的重复报警信息对比展示,进行人工二次确认。
[0023]—种根据上述方法进行重复报警识别的系统,包括报警模块和重复报警识别模块,所述报警模块包括接警系统客户端和接警系统数据库;所述重复报警识别模块包括地址库、分词工具、搜索引擎、比较判断单元;
[0024]所述接警系统客户端用于将报警数据录入到接警系统数据库;所述接警系统数据库用于存储报警数据;
[0025]所述地址库用于构建GIS地址库;所述分词工具用于对关键词进行自动分词;所述搜索引擎用于将分词结果进行匹配,并计算匹配度;
[0026]所述比较判断单元用于设置阈值,将匹配度与阈值进行比较,并大于阈值的报警信息则提示为可能重复报警信的信息。
[0027]作为优选的,所述重复报警模块还包括一显示单元,用于显示识别为可能重复报警的报警信息。
[0028]与现有技术相比,本发明的有益效果在于:本发明结合GIS地址库,分词匹配赋予事发地址地图坐标,而不依赖于报警人必须提供GPS坐标信息,根据事发各要素计算当前报警信息与历史报警信息的匹配度与阈值的比较,给接警员提供是否为重复警情的有效参考,能够有效的识别是否为重复警情,提高接处警效率。
【附图说明】
[0029]图1为本发明实施例的方法流程图;
[0030]图2为本发明实施例系统结构框图。
【具体实施方式】
[0031]下面结合附图和实施例对本发明所述的一种基于搜索引擎的重复报警识别方法和系统作进一步说明。
[0032]以下是本发明所述的一种基于搜索引擎的重复报警识别方法和系统的最佳实例,并不因此限定本发明的保护范围。
[0033]图1示出了一种基于搜索引擎的重复报警识别方法,包括以下步骤:
[0034]S1、构建GIS(Geographic Informat1n System,,地理信息系统)地址库;在本实施例中,GIS地址库数据来源有以下几种方式:公安标准地址库、高德或其他GIS厂家地址库、自主学习的地址,根据事发地址人工定位后自动归入地址库。
[0035]S2、设定事发要素权重值及重复报警阈值;
[0036]S3、基于搜索引擎在GIS地址库匹配最相似的事发地址地图坐标,将匹配度最高的地址库地图坐标赋值给当前事发地址地图坐标;
[0037]S4、确定事发地址覆盖范围半径r,根据事发地址地图坐标计算At时期内覆盖半径范围内的报警信息;
[0038]S5、基于步骤S4的查询结果,将当前报警信息的事发要素与查询结果的事发要素通过搜索引擎及分词技术计算匹配度,比较匹配度与阈值,匹配度高于阈值的报警则提示当前报警可能为重复报警,并将对应报警信息对比展示。分词工具可选择HTTPCWS、IKAnalyzer等。搜索引擎,也有多种可以选择,如Solr、Elasticsearch等
[0039]作为优选的,在步骤S2中,所述事发要素包括事发地址、事发时间、事发类型、报警人姓名、报警人电话、报警描述。
[0040]作为优选的,所述步骤S3具体包括:将事发地址进行分词,并通过搜索引擎将分词结果与GIS地址库地址进行匹配,将匹配度最高的地址库地图坐标赋值给当前事发地址地图坐标。
[0041]作为优选的,所述步骤S4中,事发地址坐标经玮度(lon,lat),待查询的事发地址坐标经玮度(x,y),事发时间tl,待查询的事发时间t2,一定时期范围At,计算满足条件的历史报警信息。一定时期At内覆盖半径范围内的报警信息满足的条件为:
[0042]tl—t2<At
[0043](1n—x)2+(lat—y)2〈r2(距离转换为经玮度单位)。
[0044]作为优选的,所述步骤S2中,根据事发要素属性及批量数据实验确定各要素权重值(vl ,v2,v3...vN),阈值Vmin。
[0045]作为优选的,所述步骤S5具体包括:将当前报警信息的事发要素与查询结果的事发要素通过搜索引擎及分词技术计算匹配度,得到各要素匹配度(ml,m2,m3...mN),与每条报警信息匹配度(vl*ml,v2*m2,v3*m3...vN*mN),匹配度与阈值Vmin进行比较,大于Vmin的报警信息则提示为可能重复报警。
[0046]作为优选的,所述事发各要素匹配度计算报警信息匹配度与阈值比较的过程包括:
[0047]vl*ml+v2*m2+v3*m3...+vN*mN>Vmin;其中各要素匹配度(ml,m2,m3...mN)值的获取是基于搜索引擎对各要素分词后的结果进行计算得到。
[0048]作为优选的,还包括步骤S6:
[0049]将当前报警信息与识别的重复报警信息对比展示,进行人工二次确认。
[0050]图2示出了一种根据上述方法进行重复报警识别的系统,包括报警模块和重复报警识别模块,所述报警模块包括接警系统客户端和接警系统数据库;所述重复报警识别模块包括地址库、分词工具、搜索引擎、比较判断单元;
[0051]所述接警系统客户端用于将报警数据录入到接警系统数据库;所述接警系统数据库用于存储报警数据;
[0052]所述地址库用于构建GIS地址库;所述分词工具用于对关键词进行自动分词;所述搜索引擎用于将分词结果进行匹配,并计算匹配度;
[0053]所述比较判断单元用于设置阈值,将匹配度与阈值进行比较,并大于阈值的报警信息则提示为可能重复报警信的信息。
[0054]作为优选的,所述重复报警模块还包括一显示单元,用于显示识别为可能重复报警的报警信息,可以将当前报警信息与识别的重复报警信息对比展示,进行人工二次确认。
[0055]与现有技术相比,本发明的有益效果在于:本发明结合GIS地址库,分词匹配赋予事发地址地图坐标,而不依赖于报警人必须提供GPS坐标信息,根据事发各要素计算当前报警信息与历史报警信息的匹配度与阈值的比较,给接警员提供是否为重复警情的有效参考,能够有效的识别是否为重复警情,提高接处警效率。
[0056]以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
【主权项】
1.一种基于搜索引擎的重复报警识别方法,其特征在于,包括以下步骤: 51、构建GIS地址库; 52、设定事发要素权重值及重复报警阈值; 53、基于搜索引擎在GIS地址库匹配最相似的事发地址地图坐标,将匹配度最高的地址库地图坐标赋值给当前事发地址地图坐标; 54、确定事发地址覆盖范围半径r,根据事发地址地图坐标计算At时期内覆盖半径范围内的报警信息; 55、基于步骤S4的查询结果,将当前报警信息的事发要素与查询结果的事发要素通过搜索引擎及分词技术计算匹配度,比较匹配度与阈值,匹配度高于阈值的报警则提示当前报警可能为重复报警,并将对应报警信息对比展示。2.根据权利要求1所述的基于搜索引擎的重复报警识别方法,其特征在于,在步骤S2中,所述事发要素包括事发地址、事发时间、事发类型、报警人姓名、报警人电话、报警描述。3.根据权利要求1所述的基于搜索引擎的重复报警识别方法,其特征在于,所述步骤S3具体包括:将事发地址进行分词,并通过搜索引擎将分词结果与GIS地址库地址进行匹配,将匹配度最高的地址库地图坐标赋值给当前事发地址地图坐标。4.根据权利要求1所述的基于搜索引擎的重复报警识别方法,其特征在于,所述步骤S4中,一定时期A t内覆盖半径范围内的报警信息满足的条件为: 事发时间tl一待查询的事发时间t2〈 Δ t (事发地址坐标经度1n—待查询的事发地址坐标经度x)2+(事发地址坐标玮度Iat—待查询的事发地址坐标玮度y)2〈事发地址覆盖范围半径r2(距离转换为经玮度单位)。5.根据权利要求1所述的基于搜索引擎的重复报警识别方法,其特征在于,所述步骤S2中,根据事发要素属性及批量数据实验确定各要素权重值(vl,v2,v3...vN),阈值Vmin。6.根据权利要求5所述的基于搜索引擎的重复报警识别方法,其特征在于,所述步骤S5具体包括:将当前报警信息的事发要素与查询结果的事发要素通过搜索引擎及分词技术计算匹配度’得到各要素匹配度^^^…^^^与每条报警信息匹配度…*!!!^*!^^*m3...vN*mN),匹配度与阈值Vmin进行比较,大于Vmin的报警信息则提示为可能重复报警。7.根据权利要求6所述的基于搜索引擎的重复报警识别方法,其特征在于,所述事发各要素匹配度计算报警信息匹配度与阈值比较的过程包括: vl*ml+v2*m2+v3*m3...+vN*mN>Vmin。8.根据权利要求6所述的基于搜索引擎的重复报警识别方法,其特征在于,还包括步骤S6: 将当前报警信息与识别的重复报警信息对比展示,进行人工二次确认。9.一种根据权利要求1至8任一所述的方法进行重复报警识别的系统,其特征在于,包括报警模块和重复报警识别模块,所述报警模块包括接警系统客户端和接警系统数据库;所述重复报警识别模块包括地址库、分词工具、搜索引擎、比较判断单元; 所述接警系统客户端用于将报警数据录入到接警系统数据库;所述接警系统数据库用于存储报警数据; 所述地址库用于构建GIS地址库;所述分词工具用于对关键词进行自动分词;所述搜索引擎用于将分词结果进行匹配,并计算匹配度; 所述比较判断单元用于设置阈值,将匹配度与阈值进行比较,并大于阈值的报警信息则提示为可能重复报警信的信息。10.根据权利要求1所述的重复报警识别系统,其特征在于,所述重复报警模块还包括一显示单元,用于显示识别为可能重复报警的报警信息。
【文档编号】G06F17/30GK106095967SQ201610436993
【公开日】2016年11月9日
【申请日】2016年6月17日
【发明人】李小龙, 杨波, 贺珊, 张雪琼
【申请人】武汉烽火众智数字技术有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1