事件信息的获取方法和装置的制作方法

文档序号:6605351阅读:184来源:国知局
专利名称:事件信息的获取方法和装置的制作方法
技术领域
本发明涉及交通信息服务领域,尤其涉及一种事件信息的获取方法及装置。
背景技术
现代汽车工业的发展,引发了一系列的交通问题交通拥挤、道路堵塞、交通事故 发生频繁。这些问题不仅给人们的日常出行生活带来了诸多不便,同时也给社会造成了巨 大的经济损失。当前,除了在道路基础设施建设和相关法律法规制定方面做出的努力之外, 世界上各国正在致力于利用先进的计算机信息处理技术、电子通信技术、自动控制技术、网 络技术以及其他的科学技术,智能化、全方位、实时、准确、高效的对交通运输进行综合管理 和控制,智能交通系统(Intelligent Transportation System, ITS)的研究与开发应运而 生。对于智能交通系统来说,实时的全面的收集交通事件信息是实现智能交通系统各 项功能的基础。在现有技术中,收集交通事件信息的方法主要是相关人员手动且主动的去 查找、收集,将收集到的交通事件信息存储到数据库中。但是上述方法效率低,并且需要大量的人力物力,为ITS的推广带来阻碍。

发明内容
本发明的实施例提供一种事件信息的获取方法及装置,以便提高事件信息的收集 效率。为达到上述目的,本发明的实施例采用如下技术方案一种事件信息的获取方法,包括通过至少一个数据源获取事件信息,并按不同的城市对获取的所述事件信息进行 分类;根据数据库中按城市分类存入的事件信息过滤所述分类后对应城市的事件信息 中的冗余部分;将过滤掉冗余部分后的所述事件信息存入所述数据库。一种事件信息的获取装置,包括获取单元,用于通过至少一个数据源获取事件信息;分类单元,用于对获取的所述事件信息按不同城市进行分类;过滤单元,用于根据数据库中按城市分类存入的事件信息过滤所述分类后对应城 市的事件信息中的冗余部分;存放单元,用于将过滤掉冗余部分后的所述事件信息存入所述数据库。本发明实施例提供的技术方案具有如下有益效果可从多种数据源自动获取到事 件信息,并在分类后过滤掉其中的冗余部分,便于使用,减少了全部由人工收集事件信息时 耗费的人力物力,提高了事件信息的收集效率,为智能交通系统的准确性作出了贡献。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。图1为本发明实施例1事件信息的获取方法的主要流程示意图;图2为本发明实施例1事件信息的获取方法的流程示意图;图3为本发明实施例2事件信息的获取装置的结构示意图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。并且,以下各实施例均为本发明的可选方案,实施例的 排列顺序及实施例的编号与其优选执行顺序无关。实施例1本实施例提供一种事件信息的获取方法,可具体用于收集交通方面的事件信息, 如图1所述,该方法主要包括步骤101,通过至少一个数据源获取事件信息,并按不同的城市对获取的所述事件 信息进行分类。在本实施例中,该至少一个数据源可具体为交管部门,网络爬虫搜索到的提供事 件信息的网页,以及人工服务。相应地,步骤101可通过如下三种方式实现参照图2,当所述数据源是网络爬虫搜索到的提供事件信息的网页时;201,通过网络爬虫搜索提供事件信息的网页;202,从所述网页上提取交通方面的文字信息;203,将提取到的文字信息解析成单独的词汇;204,根据模糊匹配规则将所述词汇匹配成第一事件信息,并按不同的城市对获取 的所述事件信息进行分类;举例来说,为了较少不必要的数据量,保证数据准确性,网络爬虫仅对特定的网 页,如各个城市的交管网页,华北高速网页等进行搜索,因为每个网页的源代码中都会存在 许多用于装饰网页或与交通事件信息无关的代码等,所以需要从这些源代码中提取出交通 方面的文字信息,如从北京交管网页中提取出交通方面的文字信息为为了国庆期间的安 全保证,10月1日晚9点-12点,某某街道不允许通行等,可通过开源等中文分词系统将该 文字信息解析成一个一个单独的词汇,并根据将晚、下午等词汇匹配成PM,将不允许通行, 限行等词汇匹配成禁止通行的模糊匹配规则转换形成第一事件信息,该第一事件信息按照 城市分入北京,具体内容可为国庆期间的安全保证,10月1日PM9-12点,某某街道,禁止 通行。进一步,因为不同的网页对同一事件信息的记录,描述的标准不同,因此会出现虽
5然是同一事件信息但记录,描述的方式各种各样,这样事件信息不利于查找和管理,因此为 了对事件信息进行统一的管理,在得到第一事件信息后,参照图2中205,可根据第一转换 规则分别将第一事件信息按照统一的事件记录格式进行转换。例如统一的事件记录格式为1 城市名称,2 事件时间3 事件原因,4 交通措 施,5 地点等。对应该统一的事件记录格式对于北京交管网页制定的第一转换规则可为 城市名称放在1 后,事件时间放在2 后,事件原因放在3 后,交通措施放在4 后。相应 地,按照上述事件记录的格式,第一事件信息转换后为1 北京,2 :10月1日PM9-12点,3 国庆期间的安全保证,4 禁止通行,5 某某街道等。参照图2中的206,当所述数据源是交管部门时;实时监控交管部门发布的交通事件文件,根据所述交通事件文件获取第二事件信 息,并按不同的城市对获取的所述事件信息进行分类。举例来说,上海世博举办期间,上海交管部门会发布(包括通过公告,或邮件通 知的方式)一些outlook类型的交通事件文件,文件中记录了一些事件信息如SH,1011, 0501000, JD-I, PS世博交通秩序等。由于这些事件信息大多数均是以代码的形式出现的, 因此需要根据这些代码的意义(如SH代表上海,1011代表浦东区,0501000代表5月1日 全天,JD-I代表机动车限行,PS代表备注内容)制定相应的编码规则,实时监控上海交管部 门发布的交通事件文件,并可根据该编码规则将交管部门发布的文件中的事件信息自动将 对应转换成第二事件信息,该第二事件信息按照城市分入上海市,具体内容可为上海,浦 东地区,5月1日全天,机动车限行,备注世博交通秩序。进一步,因为交管部门是用其内部的标准对事件信息记录,描述的,因此不便于与 其他事件信息一起进行管理,因此也需要在得到第二事件信息后,参照图2中205,根据第 二转换规则分别将第二事件信息按照统一的事件记录格式进行转换。举例来说,统一的事件记录格式为1 城市名称,2 事件时间3 事件原因,4 交 通措施,还可以包括,5:地点等。对应该统一的事件记录格式制定的第二转换规则可为城 市名称代码SH对应转换成上海后放在1 后,事件时间代码0501000对应转换成5月1日全天后放在2 后,事件原因代码JD-I对应转换成机动车禁止通行后放在3 后,交通措施代码PS对应转换成世博交通秩序后放在4 后,事件地点代码1011对应转换成浦东区后放在5 后等。相应地,按照上述事件记录的格式,第二事件信息转换后为1 上海,2 :5月1日 全天,3 世博交通秩序,4 机动车禁止通行,5 浦东区等。请见图2中207,当所述数据源是人工服务时,接收人工按照统一的事件记录格式 录入的第三事件信息,并按不同的城市对获取的所述事件信息进行分类。举例来说,可通过 专门人员收听广播,接听热线电话,浏览相关交通网站收集交通事故道路整修等事件信息, 并按照统一的事件记录格式,如1 城市名称,2 事件时间3 事件原因,4 交通措施,还可 以包括5地点等录入到系统作为第三事件信息,第三事件信息因为是人工按照统一的事件 记录格式进行输入的,因此无需在担心记录,描述的方式不同的问题。步骤102,根据数据库中按城市分类存入的事件信息过滤所述分类后对应城市的 事件信息中的冗余部分。
数据库中的事件信息也是按照不同城市进行分类存储的,因此,在将步骤101中 获取到的事件信息按照不同城市进行分类后,需要与存入数据库中同城市下的事件信息进 行一下对比,以便过滤掉其中重复,或彼此间有出入的事件信息。步骤102具体可通过如下一种或几种方式实现请见图2中208,在每个城市的事件信息中,以来自所述城市的人工录入的第三事 件信息为准,过滤掉所述数据库中所述城市的事件信息中与第三事件信息重复或相矛盾的 事件信息;举例来说,在上海的事件信息中,以来自上海人工输入的第三事件信息A为准,若 数据库中上海的事件信息B中有与A重复,或有出入的地方,则可排除该B。在每个城市的事件信息中,以根据所述城市的交管部门获取的第二事件信息为 准,过滤掉所述数据库中所述城市的事件信息中与第二事件信息重复或相矛盾的事件信 肩、ο举例来说,在上海的事件信息中,以来自上海的交管部门的第二事件信息C为准, 若数据库中上海的事件信息D中有与C重复,或有出入的地方,如C的事件时间是5月1日 全天,D的事件时间是5月1日PM10-12,则可排除D0又或者,在每个城市的事件信息中,若从所述城市网页上获取的第一事件信息与 该城市人工录入的第三事件信息或来自交管部门的第二事件信息重复或矛盾,则过滤掉所 述第一事件信息;举例来说,从网页上获取的第一事件信息Y与人工录入的第三事件信息S,(或来 自交管部门的第二事件信息E)有出入或重复,则可排除Y。步骤103,将过滤掉冗余部分后的所述事件信息存入所述数据库。接续步骤102中的例子,过滤点B,D,Y,将A,C,S (或E)存入到数据库中,参照图 2 中 209。本实施例提供的方法可通过交管部门,网页和人工服务等多个数据源得到事件信 息,并经过将该获取到的事件信息按城市分类,统一记录格式,过滤冗余的事件信息,再存 入到数据库中的过程,可取得及时,大量,自动的收集到事件信息,提高事件信息的收集效 率的技术效果。实施例2本实施例提供一种事件信息的获取装置,可用于上述实施例1中,如图3所示,包 括获取单元31,分类单元32,过滤单元33,存放单元34。获取单元31,用于通过至少一个数据源获取事件信息;分类单元32,用于对获取 的所述事件信息按不同城市进行分类;过滤单元33,用于根据数据库中按城市分类存入的 事件信息过滤所述分类后对应城市的事件信息中的冗余部分;存放单元34,用于将过滤掉 冗余部分后的所述事件信息存入所述数据库。其中,获取单元31包括爬取模块311,监控获取模块312,录入模块313。爬取模块311,用于通过网络爬虫搜索提供事件信息的网页,从所述网页上提取交 通方面的文字信息,并将提取到的文字信息解析成单独的词汇,再根据模糊匹配规则将所 述词汇匹配成第一事件信息;监控获取模块312,用于实时监控交管部门发布的交通事件文件,并根据所述交通事件文件获取第二事件信息。录入模块313,接收人工按照统一的事件记录格式录入的第三事件信息。另外,在本实施例中,还可包括转换单元35。该转换单元35,用于经分类单元32分类后的,根据第一转换规则将所述爬取模块 311的第一事件信息按照统一的事件记录格式进行转换,以及经分类单元32分类后的,根 据第二转换规则将所述监控获取模块312的第二事件信息按照统一的事件记录格式进行 转换。并且,在本实施例中的过滤单元33包括第一过滤模块331,第二过滤模块332。第一过滤模块331,用于在每个城市的事件信息中,若从所述城市的网页上获取的 第一事件信息与所述城市的人工录入的第三事件信息重复或矛盾,则过滤掉所述第一事件 信息,或者若从所述城市的网页上获取的第一事件信息与所述城市的管部门的第二事件信 息重复或矛盾,则过滤掉所述第一事件信息;第二过滤模块332,用于在每个城市的事件信息中,以来自所述城市的人工录入的 第三事件信息为准,过滤掉所述数据库中所述城市的事件信息中与第三事件信息重复或相 矛盾的事件信息,或者以根据所述城市的交管部门获取的第二事件信息为准,过滤掉所述 数据库中所述城市的事件信息中与第二事件信息重复或相矛盾的事件信息。本实施例提供的装置可通过至少一个数据源自动的获取到事件信息,提高的事件 信息的收集效率,有利于ITS系统各项功能的实现和推广,并且可按照统一的事件记录格 式转换收集到的事件信息,加强了对事件信息的管理能力。通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借 助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是 更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献 的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中, 如计算机的软盘,硬盘或光盘等,包括若干指令用以使得一台设备执行本发明各个实施例 所述的方法。以上所述,仅为本发明的具体实施方式
,但本发明的保护范围并不局限于此,任何 熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵 盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
权利要求
一种事件信息的获取方法,其特征在于,包括通过至少一个数据源获取事件信息,并按不同的城市对获取的所述事件信息进行分类;根据数据库中按城市分类存入的事件信息过滤所述分类后对应城市的事件信息中的冗余部分;将过滤掉冗余部分后的所述事件信息存入所述数据库。
2.根据权利要求1所述的方法,其特征在于,当所述数据源是网络爬虫搜索到的提供 事件信息的网页时;所述通过至少一个数据源获取事件信息包括通过网络爬虫搜索提供事件信息的网页,并从所述网页上提取交通方面的文字信息;将提取到的文字信息解析成单独的词汇;根据模糊匹配规则将所述词汇匹配成第一事件信息;或者当所述数据源是交管部门时,所述通过至少一个数据源获取事件信息包括实时监控交管部门发布的交通事件文件,并根据所述交通事件文件获取第二事件信肩、o
3.根据权利要求2所述的方法,其特征在于,在对获取的所述事件信息按不同城市进 行分类之后,该方法还包括根据第一和第二转换规则分别将第一和第二事件信息按照统一的事件记录格式进行 转换。
4.根据权利要求3所述的方法,其特征在于,当所述数据源是人工服务时,所述通过至 少一个数据源获取事件信息还包括接收人工按照统一的事件记录格式录入的第三事件信息。
5.根据权利要求4所述的方法,其特征在于,所述根据数据库中按城市分类存入的事 件信息过滤所述分类后对应城市的事件信息中的冗余部分具体至少包括如下之一在每个城市的事件信息中,若从所述城市的网页上获取的第一事件信息与所述城市的 人工录入的第三事件信息重复或矛盾,则过滤掉所述第一事件信息;在每个城市的事件信息中,若从所述城市的网页上获取的第一事件信息与所述城市的 管部门的第二事件信息重复或矛盾,则过滤掉所述第一事件信息;在每个城市的事件信息中,以来自所述城市的人工录入的第三事件信息为准,过滤掉 所述数据库中所述城市的事件信息中与第三事件信息重复或相矛盾的事件信息;在每个城市的事件信息中,以根据所述城市的交管部门获取的第二事件信息为准,过 滤掉所述数据库中所述城市的事件信息中与第二事件信息重复或相矛盾的事件信息。
6.一种事件信息的获取装置,其特征在于,包括 获取单元,用于通过至少一个数据源获取事件信息;分类单元,用于对获取的所述事件信息按不同城市进行分类; 过滤单元,用于根据数据库中按城市分类存入的事件信息过滤所述分类后对应城市的 事件信息中的冗余部分;存放单元,用于将过滤掉冗余部分后的所述事件信息存入所述数据库。
7.根据权利要求6所述的装置,其特征在于,所述获取单元包括爬取模块,用于通过网络爬虫搜索提供事件信息的网页,从所述网页上提取交通方面的文字信息,并将提取到的文字信息解析成单独的词汇,再根据模糊匹配规则将所述词汇 匹配成第一事件信息;监控获取模块,用于实时监控交管部门发布的交通事件文件,并根据所述交通事件文 件获取第二事件信息。
8.根据权利要求7所述的装置,其特征在于,该装置还包括转换单元,用于根据第一转换规则将所述爬取模块的第一事件信息按照统一的事件记 录格式进行转换,根据第二转换规则将所述监控获取模块的第二事件信息按照统一的事件 记录格式进行转换。
9.根据权利要求8所述的装置,其特征在于,所述获取单元还包括录入模块,接收人工按照统一的事件记录格式录入的第三事件信息。
10.根据权利要求9所述的装置,其特征在于,所述过滤单元包括第一过滤模块,用于在每个城市的事件信息中,若从所述城市的网页上获取的第一事 件信息与所述城市的人工录入的第三事件信息重复或矛盾,则过滤掉所述第一事件信息, 或者若从所述城市的网页上获取的第一事件信息与所述城市的管部门的第二事件信息重 复或矛盾,则过滤掉所述第一事件信息;第二过滤模块,用于在每个城市的事件信息中,以来自所述城市的人工录入的第三事 件信息为准,过滤掉所述数据库中所述城市的事件信息中与第三事件信息重复或相矛盾的 事件信息,或者以根据所述城市的交管部门获取的第二事件信息为准,过滤掉所述数据库 中所述城市的事件信息中与第二事件信息重复或相矛盾的事件信息。
全文摘要
本发明的实施例公开了一种事件信息的获取方法及装置,涉及交通信息服务领域,解决了现有技术中收集交通事件信息效率低的技术问题。本发明实施例的方法主要包括通过至少一个数据源获取事件信息,并按不同的城市对获取的所述事件信息进行分类;根据数据库中按城市分类存入的事件信息过滤所述分类后对应城市的事件信息中的冗余部分;将过滤掉冗余部分后的所述事件信息存入所述数据库。本发明实施例主要应用在事件信息收集方面。
文档编号G06F17/30GK101894151SQ20101021813
公开日2010年11月24日 申请日期2010年6月24日 优先权日2010年6月24日
发明者张潜, 李建军, 胡健 申请人:北京世纪高通科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1