一种对相似事件信息进行分析聚合的处理方法及系统与流程

文档序号:12465339阅读:422来源:国知局
一种对相似事件信息进行分析聚合的处理方法及系统与流程

本发明涉及城市公共安全事件管理领域,具体涉及一种对相似事件信息进行分析聚合的处理方法及系统。



背景技术:

在城市公共安全管理中,可根据相似事件数量,判定事件的危害性,为领导决策提供数据支撑。而事件来源的多样化,事件信息录入的主客观因素,对相似事件的比对判断有较大影响,同一事件的描述可能是一句话,也可能是一篇长文,如何将不同来源的事件信息进行比对分析,寻找相似事件信息进行归并聚合,分析事件趋势,是个需要探讨的问题。

当前对相似事件的比对判断,常用的方法是通过对事件内容进行相似度的计算,达到一定相似度值即判断为事件相似,但对于城市公共安全事件,由于所有事件信息主要反映某市内发生或发现的相关事件信息,事件的来源相对比较局限,事件数量较少,采用这种方式计算相似度存在很大误差。而且地址信息不够规范化,相同地址信息采用不同的地址描述方式则计算出来的相似度存在很大误差。



技术实现要素:

本发明在于为解决上述问题而提供一种对相似事件信息进行分析聚合的处理方法及系统,本方法及系统主要针对城市公共安全事件信息,通过地址知识库提取事件地址信息,根据事件标签知识库对事件信息进行打签,通过比对模型知识库,计算事件信息的相似度。

本发明一种对相似事件信息进行分析聚合的处理方法,包括如下步骤:

S1:建立事件信息的知识库的步骤:建立一个包括有地址知识库、事件标签知识库、比对模型库的知识库;

S2:对事件信息的地址信息进行提取的步骤:根据步骤S1所建立的地址知识库,对输入的事件信息进行地址信息提取,将提取的地址信息标准化;

S3:对事件信息的进行事件分类的步骤:根据步骤S1所建立的事件标签知识库,对输入的事件信息进行分类打签,且同一事件信息至少标注一个事件标签;

S4:对事件信息的进行相似比对的步骤:根据步骤S1所建立的比对模型库,以及根据步骤S2提取的地址信息和步骤S3标注的事件标签,对输入的事件信息进行粗筛选,再对粗筛选的事件信息进行逐一比对相似度,最终将该事件信息进行归类聚合。

进一步的,方法还包括更新事件信息的知识库的步骤:对知识库中的地址知识库、事件标签知识库、比对模型库的更新。

进一步的,S1步骤中,事件标签知识库中的事件标签为多级标签。

进一步的,S1步骤中,比对模型库中比对模型根据不同的事件分类有不同的地址匹配规则。

进一步的,若同一事件信息涉及多个地址信息,则将事件信息按多个事件信息分别处理,这多个事件信息都分别进行S2的对事件信息的地址信息进行提取的步骤、S3的对事件信息的进行事件分类的步骤和S4的对事件信息的进行相似比对的步骤。

进一步的,S4步骤包括:

S41:相似事件粗筛选步骤:从比对模型库中选择已定义的比对模型,根据提取的事件地址信息、事件标签信息和事件发生时间区间对输入事件进行粗筛选,形成相似事件集合;

S42:事件相似比对步骤:对S41步骤中的相似事件集合根据标准化的地址信息和事件标签逐一比对相似度;

S43:归类聚合步骤:根据S42步骤的比对结果,进行归类聚合。

本发明还包括一种对相似事件信息进行分析聚合的处理系统,包括:

建立事件信息的知识库的模块:用于建立一个包括有地址知识库、事件标签知识库、比对模型库的知识库;

对事件信息的地址信息进行提取的模块:用于根据建立的地址知识库,对输入的事件信息进行地址信息提取,将提取的地址信息标准化;

对事件信息的进行事件分类的模块:用于根据建立的事件标签知识库,对输入的事件信息进行分类打签,且同一事件信息至少标注一个事件标签;

对事件信息的进行相似比对的模块:用于根据建立的比对模型库,以及根据提取的地址信息和标注的事件标签,对输入的事件信息进行粗筛选,再对粗筛选的事件信息进行逐一比对相似度,最终将该事件信息进行归类聚合。

本发明的有益效果是:

1.通过抽取出的地址信息和分析事件标签属性判断事件相似性,减少事件其他描述信息对事件相似度判断产生影响。

2.对抽取地址进行规范化,尽量做到相同地址信息不同的地址描述方式通过地址抽取规范化后的地址是一致的。

附图说明

图1为本发明的主要功能模块图;

图2为本发明的主要实现流程图。

具体实施方式

为进一步说明各实施例,本发明提供有附图。这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。图中的组件并未按比例绘制,而类似的组件符号通常用来表示类似的组件。

现结合附图和具体实施方式对本发明进一步说明。

对于信息处理领域中,往往需要对一类包括有时间、地址、事件等属性的信息(这类信息亦可以称为事件信息),进行一定的预先处理,以利于后续进行更复杂的信息分析、计算、预测等。在这种事件信息的预先处理中进行分析聚合是最为基本和必要的首要步骤。例如,在天气事件信息、灾害事件信息、城市管理事件信息等信息处理领域中都有广泛应用。为了快速有效地对事件信息进行分析聚合处理,本发明提出一种解决方案。

下面以应用于城市公共安全为例来展示本发明,但本领域技术人员可以根据实际应用场合对本发明进行实施和适当调整,不应视为本发明的限制。

本发明的该实施例以应用于城市公共安全管理中为例,根据归类聚合的相似事件数量,判定事件的危害性,为领导决策提供数据支撑。其中计算事件的相似性主要根据事件内容、事件时间、事件地点三元素判定事件的相似性,进行归类聚合。首先通过地址知识库提取城市公共安全事件内容信息中的地址信息,然后通过事件标签知识库对城市公共安全事件进行分类标签,最后根据地址信息和分类标签判断事件相似性,进行事件的归类聚合。

本发明的该实施例的一种对相似事件信息进行分析聚合的处理方法,其主要实现流程参见图2:包括如下步骤:

S1建立事件信息的知识库的步骤:建立一个包括有地址知识库、事件标签知识库、比对模型库的知识库。

S11地址知识库建立:因本发明主要针对城市公共安全事件的判定,相对比较区域化,事件来源于同一城市 ,因此事件信息中的地址信息大多比较本地化,很多地址信息只是简单的小区门牌号。同时,由于本发明局限于城市公共安全,所有事件来源于同一城市,事件中的地址信息绝大多数不包含省、市信息,甚至是区(县)信息。因此,需针对区域化的城市建立地址信息知识库,维护本地的地址信息,提高事件信息中地址信息提取的准确度。

S12事件标签知识库建立:城市公共安全事件相对比较局限性,可通过建立和维护事件标签关键词知识库,对事件进行分类打标。事件标签要分为多级,便于事件相似比对模型使用。

S13比对模型库建立:通过分析已有的事件信息,制定事件相似度比对方法及规则,形成事件相似度比对模型。

比对模型可根据不同的事件分类制定不同的地址匹配规则,比如:一个违章搭建事件,那么他的地址匹配规则至少要对应到某个小区单元或楼层,一个下水道井盖丢失事件,就只需对应到某条路,或某个区域即可。

S2对事件信息的地址信息进行提取的步骤:根据步骤S1所建立的地址知识库,对输入的事件信息进行地址信息提取,将提取的地址信息标准化。(如:XX小区和XX花园指的是同一小区,通过地址知识库将此地址信息进行标准化处理,统一提取地址为:XX小区或XX花园)。同时,根据提取的地址内容根据地址级别属性进行拆分,如:区(县)、小区(村)、单元、门牌号等级别属性,形成一个二维地址信息表。针对同一事件涉及的多个地址信息,可将事件按多条事件处理。

S3对事件信息的进行事件分类的步骤:根据步骤S1所建立的事件标签知识库,对输入的事件信息进行分类打签,同一事件可能涉及多个标签。

S4对事件信息的进行相似比对的步骤:根据步骤S1所建立的比对模型库,以及根据步骤S2提取的地址信息和步骤S3标注的事件标签,对输入的事件信息进行粗筛选,再对粗筛选的事件信息进行逐一比对相似度,最终将该事件信息进行归类聚合。

S41相似事件粗筛选步骤:从比对模型库中选择已定义的比对模型,根据提取的事件地址信息、事件标签信息和事件发生时间区间对输入事件进行粗筛选,形成相似事件集合;

S42事件相似比对步骤:对S41步骤中的相似事件集合根据标准化的地址信息和事件标签逐一比对相似度;

地址信息比对:主要是将事件中提取的标准化地址信息进行比对分析,计算相似度;

事件标签比对:主要根据事件已标识的标签进行比对,计算相似性。

S43:归类聚合步骤:根据S42步骤的比对结果,进行归类聚合。

本方法还包括更新事件信息的知识库的步骤:对知识库中的地址知识库、事件标签知识库、比对模型库的不断更新,使得对事件的归类聚合更加精确。

本发明一种对相似事件信息进行分析聚合的处理系统,主要功能模块包括知识库建立、地址信息提取、事件分类、事件相似比对四个模块,参见图1。具体为:

建立事件信息的知识库的模块:用于建立一个包括有地址知识库、事件标签知识库、比对模型库的知识库;

对事件信息的地址信息进行提取的模块:用于根据建立的地址知识库,对输入的事件信息进行地址信息提取,将提取的地址信息标准化;

对事件信息的进行事件分类的模块:用于根据建立的事件标签知识库,对输入的事件信息进行分类打签,且同一事件信息至少标注一个事件标签;

对事件信息的进行相似比对的模块:用于根据建立的比对模型库,以及根据提取的地址信息和标注的事件标签,对输入的事件信息进行粗筛选,再对粗筛选的事件信息进行逐一比对相似度,最终将该事件信息进行归类聚合。

本发明一种对相似事件信息进行分析聚合的处理方法及系统,通过地址知识库提取事件地址信息,根据事件标签知识库对事件信息进行打签,通过比对模型知识库,计算事件信息的相似度。具体的,通过抽取出的地址信息和分析事件标签属性判断事件相似性,减少事件其他描述信息对事件相似度判断产生影响。另外,对抽取地址进行规范化,尽量做到相同地址信息不同的地址描述方式通过地址抽取规范化后的地址是一致的。

尽管结合优选实施方案具体展示和介绍了本发明,但所属领域的技术人员应该明白,在不脱离所附权利要求书所限定的本发明的精神和范围内,在形式上和细节上可以对本发明做出各种变化,均为本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1