一种采集交通事件信息的方法

文档序号:6692366阅读:200来源:国知局
专利名称:一种采集交通事件信息的方法
技术领域
本发明涉及道路交通信息应用领域,尤其涉及一种采集交通事件信息的方法。
背景技术
目前,交通事件信息采集和发布技术已日趋成熟,实时准确的交通事件信息可以为先进的出行者信息系统(Advanced Traffic Information System,简称ATIS)和先进的交通管理系统(Advanced Traffic Management System,简称ATMS)实现路径诱导提供有效信息,从而便于出行者和交通管理人员进行查询和各种决策。现有采集交通事件信息的方式,采用穷举的方式对文本信息逐字进行匹配,利用自然语言语法的规则分析全句表达的信息,从而获取交通事件信息。在实现上述采集交通事件信息的过程中,发明人发现现有技术中至少存在如下问题在采用穷举法对文本信息逐字进行匹配时,需要对数据库中包含匹配字的所有词组进行遍历,一般情况下文本信息中的信息量很大,对文本信息逐字进行匹配的方式效率低,浪费运营资源。此外,现有技术通过分析文本信息中全句表达的信息采集交通事件信息,采集的交通事件信息不易分类和检索。

发明内容
本发明的实施例提供一种采集交通事件信息的方法,能够提高采集交通事件信息的效率,采集的交通事件信息易于分类和检索。本发明实施例提供了一种采集交通事件信息的方法,包括获取文本信息中的至少两个关键词;将所述至少两个关键词按照预定规则进行组合,得到交通事件信息。本发明实施例提供的采集交通事件信息的方法,能够在文本信息中检索事件因素的关键词,按照预设规则将检索到的多种事件因素的关键词进行组合,从而得到交通事件信息。相对于现有技术中对文本信息逐字穷举匹配的方式,可以节省信息处理量,提高采集交通事件信息的效率。同时,按照事件因素采集交通事件信息的方式相对于分析全句表达含义的信息采集方式,便于对采集的交通事件信息进行分类和查找。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图I为本发明实施例中采集交通事件信息的方法的流程图;图2为本发明实施例中另一个采集交通事件信息的方法的流程图;图3为本发明实施例中获取关键词的方法的流程图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明实施例提供了一种采集交通事件信息的方法,如图I所示,所述方法包括如下步骤101、获取文本信息中的至少两个关键词。所述文本信息为通过短信告知、电话爆料、广播和监控摄像头等方式获取并转化为文本格式的交通信息。所述采集交通事件信息就是对该文本信息中的关键词进行分析和获取,从而得到能够清楚表述一件交通时间的多个关键词的组合。102、将获取的至少两个关键词按照预定规则进行组合,得到交通事件信息。将获取到的多个关键词按照预定规则进行组合,根据每个关键词所表达的信息, 得到一件交通事件的完整信息。现有技术中采集交通事件信息的方式,是对整个文本信息进行分析和概述,其分析的手段是对文本信息中的每一个字进行穷举和匹配。这种采集交通事件信息的方式,需要对文本信息逐字进行匹配,在耗费大量信息处理资源的同时,无法提高信息采集效率,不能适应出行者和交通管理者快速获取交通事件信息的需求。同时,对于实时性要求高的交通事件,现有技术无法快速采集和发布交通事件信息,不能适应突发性场景的需求,不利于交通管理者处理应急交通事件。本发明实施例提供的采集交通事件信息的方法,能够通过获取文本信息中多个关键词的信息获取交通事件信息,避免现有技术中对文本信息逐字匹配的问题,可以提高交通事件信息的采集效率,满足出行者和交通管理者对高时效性交通事件信息的需求。进一步的,本发明实施例提供了另一种采集交通事件信息的方法,如图2所示,所述方法是对图I所示方法的进一步扩展,所述方法包括如下步骤201、获取文本信息中至少两种事件因素的关键词。所述事件因素包括事件位置、事件起始时间、事件终止时间以及事件类型。如图3 所示,所述获取文本信息中至少两种事件因素的关键词的实现方式为301、获取事件位置关键词。302、获取事件起始时间关键词。303、获取事件终止时间关键词。304、获取事件类型关键词。具体的,步骤301获取事件位置关键词的实现方式为在文本信息中检索预设的位置特定词,从而得到所述事件位置关键词。所述预设的位置特定词可以是道路名称,所述道路名称由交通信息处理人员在数据库或服务器中预先存储的某一市、县、省或自治区内, 所有市级道路、县级道路省级道路以及国道的名称(或代码)。交通信息处理人员可以根据城市的交通流量特点及热点地区对某一地区的道路进行更为精细的划分,并储存在数据库或服务器中,本发明实施例对划分道路名称的粒度和数量不做限制。
可选的,还可以在文本信息中检索用于表示方向的方向特定词,例如东、南、西、 北、路口东、路口南、路口西、路口北等。如果在文本信息中检索到方向特定词,则将检索到的道路名称和检索到的方向特定词合并,从而得到事件位置关键词。例如,在某一文本信息中检索到“平安大街”和“西”,则得到事件位置关键词为“平安大街西”。进一步的,所述预设的位置特定词还可以是表示位置的地名、桥名等,方向特定词也可以是针对地名、桥名等特点的方向特定词,例如西口、桥下、桥南等。由此得到事件位置关键词可以诸如为“西四路口东”、“西四北五条西口”、“阜成门桥下”等,本发明实施例对此不做枚举。在本发明实施例的一个应用场景中,当在文本信息中检索到至少两个位置特定词时,可以通过预设介词将至少两个位置特定词进行连接,从而得到事件位置关键词。例如, 当在文本信息中检索到“官园桥”和“西直门桥”两个位置特定词时,获取的组合事件位置关键词可以是“官园桥到西直门桥”或“西直门桥到官园桥”。当获取到至少两个方向特定词时,还可以通过预设的介词将多个方向特定词进行连接,从而获取组合方向特定词。例如,“由南到北”、“从东到西”等。其他还可以表示方向的组合方向特定词还包括“入口到出口”、“进出收费站”等。在连接多个方向特定词时,可以按照检索方向特定词的顺序(即多个方向特定词在文本信息中出现的顺序),连接多个方向特定词。例如在文本信息中先检索出“南”再检索出“北”,则得到的组合方向特定词为 “从南到北”,由此可以避免错误采集信息(“从北到南”)。将组合方向特定词和组合位置特定词合并,即得到事件位置关键词。例如得到的事件位置关键词可以是“官园桥至西直门桥从南到北方向”。步骤302、获取事件起始时间关键词的实现方式具体为在文本信息中检索交通信息处理人员预设的起始特定词,例如“开始”、“发生”、 “出现”等关键词。当检索出起始特定词时,将接收所述文本信息的时刻作为事件起始时间关键词。进一步的,检索文本信息中以汉字或数字表示的时间关键词,当检索到以汉字或数字表示的时间关键词时,将该时间关键词与上述起始特定词进行合并,从而获取事件起始时间关键词。例如,某文本信息为“西直门内大街由西向东方向上午十点开始道路作业。”,则根据获取的“开始”一词可知“上午十点”为事件起始时间关键词。在检索时间关键词时,可以在已检索到的起始特定词相邻的字段内检索时间关键词,由此可以避免将表示终止时间的时间关键词误判为起始时间关键词。例如,某文本信息为“西直门内大街由西向东方向上午十点开始道路作业,下午一点结束道路作业。”由于“上午十点”与“开始”相邻, 所以将“上午十点”与“开始”合并作为起始时间关键词,以避免将“下午一点”与“开始”合并作为起始时间关键词。可选的,对于“匝道”、“辅路”等特殊路链,还可以“打开”、“开放”等关键词作为起始特定词,与以汉字或数字表示的时间关键词进行结合。可选的,可以由交通信息处理人员对起始特定词相邻字段的长度进行设置,在设置的字段长度内检索时间关键词,本发明实施例对设置起始特定词相邻字段长度不做限制。步骤303、获取事件终止时间关键词的实现方式具体为
在文本信息中检索交通信息处理人员预设的终止特定词,例如“结束”、“完成”等关键词。当检索出终止特定词时,将接收所述文本信息的时刻作为事件终止时间关键词。进一步的,检索文本信息中以汉字或数字表示的时间关键词,当检索到以汉字或数字表示的时间关键词时,将该时间关键词与上述终止特定词进行合并,从而获取事件终止时间关键词。例如,某文本信息为“西直门内大街由西向东方向上午十点开始道路作业, 下午一点结束道路作业。”,则根据获取的“结束” 一词可知“下午一点”为事件终止时间关键词。在检索时间关键词时,可以在已检索到的终止特定词相邻的字段内检索时间关键词, 由此可以避免将表示起始时间的时间关键词误判为终止时间关键词。例如,某文本信息为 “西直门内大街由西向东方向上午十点开始道路作业,下午一点结束道路作业。”由于“下午一点”与“结束”相邻,所以将“下午点”与“结束”合并作为终止时间关键词,以避免将“上午十点”与“结束”合并作为终止时间关键词。可选的,可以由交通信息处理人员对终止特定词相邻字段的长度进行设置,在设置的字段长度内检索时间关键词,本发明实施例对设置终止特定词相邻字段长度不做限制。在本发明实施例的另一个应用场景中,当文本信息中不含有诸如“开始”、“结束” 等起始和终止特定词时,若在文本信息中检索到两个或多个以汉字或数字表示的时间关键词,则将在时序上最小的汉字或数字作为事件起始时间关键词,将在时序上最大的汉字或数字作为事件终止时间关键词。例如某文本信息为“西直门内大街由西向东方向上午十点到下午一点进行道路作业。”,该文本信息中不包括“开始”、“结束”等关键词。则将时序上最小的时间关键词“上午十点”作为事件起始时间关键词,将时序上最大的时间关键词“下午一点”作为事件终止时间关键词。需要说明的是,所述“时序上”是指按照时间顺序对汉字或数字比较大小。例如,在上述文本信息中,从关键词内容上判断,“十点”大于“一点”,但在时序上判断,所述“十点” 为“上午十点”,所述“一点”为“下午一点”,所以“上午十点”小于“下午一点”。此外,所述 “最大”和“最小”是以该文本信息为判断范围,所述“上午十点”是在该文本信息中出现过的汉字或数字中最小的时间关键词,所述“下午一点”是在该文本信息中出现过的汉字或数字中最大的时间关键词。步骤304、获取事件类型关键词的实现方式具体为A)在文本信息中检索预设的事件名称特定词,当检索到事件名称特定词时,获得事件名称特定词的代码。所述事件名称特定词可以是交通信息处理人员预设的事件名称特定词,例如“交通管制”、“交通事故”、“施工作业”、“道路障碍”等。B)根据事件名称特定词的代码在预设的关系映射表中查找事件类型关键词对应的事件编码,从而得到事件类型关键词。进一步的,步骤A)可以细化为在文本信息中依次检索预设的事件大类名称特定词、事件中类名称特定词和事件小类名称特定词,并获得对应的代码。所述事件中类名称从属于事件大类名称并对事件大类做进一步分类。所述事件小类名称从属于事件中类名称并对事件中类再做进一步分类。由此可以对交通事件类型进行细化,获取更为精细的交通事件信息。
具体的,如表I所示,首先在文本信息中检索事件大类名称,例如检索到“交通管制”,则事件大类名称代码为O。当检索到事件大类名称后,在事件大类名称的范围内检索事件中类名称,例如检索到“转弯限制”,则事件中类名称代码为2。同样,当检索到事件中类名称后,在事件中类名称的范围内检索事件小类名称,例如检索到“禁止左转”,则事件小类名称代码为2。对应步骤A)的细化,步骤B)可以进一步细化为将步骤A)中获取的事件大、中、 小类名称特定词的代码按照大、中、小的顺序排列,得到事件名称特定词的代码序列。然后根据该代码序列在表I中查找对应的事件编码,从而得到事件类型关键词。例如,步骤A) 中获取的事件名称特定词分别是“交通管制”、“转弯限制”、“禁止左转”,则步骤B)中得到事件名称特定词的代码序列为022。然后根据该代码序列在表I中查找事件编码,从而得到事件类型关键词。代码序列022对应的事件编码为514,即事件类型关键词为514。
事件大类名称事件大类名称代码事件中类名称事件中类名称代码事件小类名称事件小类名称代码代码序列事件编码交通管制O无限制O无限制O000O交通管制O通行限制I禁止通行I011257交通管制O转弯限制2禁止右转I021513交通管制O转弯限制2禁止左转2022514交通事件I无原因O无原因O100409权利要求
1.一种采集交通事件信息的方法,其特征在于,包括获取文本信息中的至少两个关键词;将所述至少两个关键词按照预定规则进行组合,得到交通事件信息。
2.根据权利要求I所述的方法,其特征在于,所述获取文本信息中的至少两个关键词, 包括获取文本信息中至少两种事件因素的关键词,所述事件因素包括事件位置、事件起始时间、事件终止时间以及事件类型。
3.根据权利要求2所述的方法,其特征在于,所述获取文本信息中至少两种事件因素的关键词,包括至少获取所述文本信息中事件起始时间因素或事件终止时间因素的关键词。
4.根据权利要求3所述的方法,其特征在于,获取事件位置关键词,包括在所述文本信息中检索预设的位置特定词,从而得到所述事件位置关键词;在所述文本信息中检索预设的方向特定词;当检索到所述方向特定词时,将所述位置特定词和所述方向特定词合并,从而得到所述事件位置关键词。
5.根据权利要求4所述的方法,其特征在于,当获取到至少两个位置特定词时,通过预设介词将所述至少两个位置特定词进行连接,从而得到所述事件位置关键词;当获取到至少两个方向特定词时,通过所述预设介词将所述至少两个方向特定词进行连接,将连接后的至少两个方向特定词与所述位置特定词合并,从而得到所述事件位置关键词。
6.根据权利要求4或5所述的方法,其特征在于,获取事件起始时间关键词,包括 在所述文本信息中检索预设的起始特定词,从而得到所述事件起始时间关键词;获取事件终止时间关键词,包括在所述文本信息中检索预设的终止特定词,从而得到所述事件终止时间关键词。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括在所述起始特定词的相邻字段内检索作为时间关键词的汉字/数字;当检索出作为时间关键词的汉字/数字时,将所述时间关键词和所述起始特定词合并,从而得到所述事件起始时间关键词;在所述终止特定词的相邻字段内检索作为时间关键词的汉字/数字;当检索出作为时间关键词的汉字/数字时,将所述时间关键词和所述终止特定词合并,从而得到所述事件终止时间关键词。
8.根据权利要求7所述的方法,当在所述文本信息中未检索出起始特定词和终止特定词时,其特征在于,包括如果在所述文本信息中检索出至少两个以汉字/数字代表的时间关键词,则将在时序上最小的汉字/数字作为起始时间关键词,将在时序上最大的汉字/数字作为终止时间关键词。
9.根据权利要求8所述的方法,其特征在于,获取事件类型关键词,包括在所述文本信息中检索预设的事件名称特定词,当检索到事件名称特定词时,获得所述事件名称特定词的代码;根据所述事件名称特定词的代码在预设的关系映射表中查找所述事件类型关键词对应的事件编码,从而得到事件类型关键词。
10.根据权利要求9所述的方法,其特征在于,所述在所述文本信息中检索预设的事件名称特定词,包括在所述文本信息中依次检索预设的事件大类名称特定词、事件中类名称特定词以及事件小类名称特定词,并获得对应的代码;所述根据所述事件名称特定词的代码在预设的关系映射表中查找所述事件类型关键词对应的事件编码,包括顺序排列事件大类名称特定词的代码、事件中类名称特定词的代码以及事件小类名称特定词的代码,得到事件名称特定词的代码序列;根据所述代码序列在预设的关系映射表中查找事件编码,从而得到事件类型关键词。
11.根据权利要求10所述的方法,其特征在于,所述将所述至少两个关键词按照预定规则进行组合,得到交通事件信息,包括通过预设的字符将所述至少两个关键词按照与事件位置、事件起始时间、事件终止时间以及事件类型对应的关系进行连接,从而得到交通事件信息。
全文摘要
本发明公开了一种采集交通事件信息的方法,涉及道路交通信息应用领域,为提高交通事件信息的采集效率而发明。所述方法包括获取文本信息中的至少两个关键词,所述至少两个关键词中至少包含一个事件时间关键词;将所述至少两个关键词按照预定规则进行组合,得到交通事件信息。本发明主要应用于道路信息的获取和发布。
文档编号G08G1/01GK102610101SQ201210096509
公开日2012年7月25日 申请日期2012年4月1日 优先权日2012年4月1日
发明者李建军, 王晓瑄 申请人:北京世纪高通科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1