面向车牌识别数据的旅行时间实时预测方法及装置的制造方法

文档序号:9418159阅读:475来源:国知局
面向车牌识别数据的旅行时间实时预测方法及装置的制造方法
【技术领域】
[0001] 本发明涉及信息技术领域及智能交通领域,具体而言,涉及在Apache Storm和 Hadoop MapReduce集群环境使用所述方法,完成旅行时间预测的实时预测技术,及一种实 时预测路段旅行时间的方法和装置。
【背景技术】
[0002] 路段旅行时间是交通领域中最为广泛关注的交通运行状态信息,与其它诸如地点 交通参数相比,可以更好地评价道路的畅通程度,反映道路的运输效率,体现道路交通拥挤 状态。随着城市规模的扩大,高峰时刻的交通拥堵已成常态,如何发布前方道路交通拥堵状 况的出行服务,向出行者预测未来时刻道路状况的变化趋势,引导出行者选择最佳路由到 达目的地,已成为国内外同行争相研究的课题。路段旅行时间预测,是交通流诱导系统重点 研究内容,被认为是预测现代城市拥挤问题最为有效手段之一。所谓旅行时间,通常是指全 路网中所有的路段旅行时间;而路段旅行时间是指在给定时间区间内,某个路段所有经过 车辆通过时间的平均值。对于交通管理部门,通过旅行时间可以评判路况和优化线路设计。 对于交通参与民众,关心是当前时刻从现在位置到达前方目的地所经历的时间,而这也刚 好是旅行时间所涵盖的业务含义。
[0003] 针对路况信息,当前技术与方法可以使得采集频率在30秒到2分钟之间,信息发 布频率在5分钟到10分钟左右,而作为复杂聚集运算的旅行时间的预测,计算频率也多在 数十分钟,这与日益增长交通信息即时性需求产生了矛盾。根据旅行时间预测的基础数据 来源,将国内外旅行时间研究现状分如下两类:(1)基于移动型交通信息采集技术的预测 方法。例如,面向浮动车采集的GPS位置数据,可以通过卡尔曼滤波模型,实现旅行时间实 测和旅行时间预测运算。但是,由于浮动车采集的样本量有限、且数据较单一,导致旅行时 间预测精度不高。(2)基于固定型交通信息采集技术的预测方法。以固定型交通检测器采 集的交通流量、密度、速度、时间占有率、空间占有率等参数作为旅行时间预测的输入变量。 例如,面向关键路口识别摄像头的车牌数据集,可以实现旅行时间的实测与预测计算,具有 较高的预测精度,同时实时性较好。
[0004] 现有技术中也公开了一些技术方案实现旅行时间的预测。如申请号为 CN200910083285的专利文献《一种旅行时间预测的方法》;申请号为CN201310227307的专 利文献《旅行时间的获取方法及装置、预测系统》;申请号为CN201310227309的专利文献《高 速公路旅行时间的预测方法及装置》;申请号为CN201410270534的专利文献《一种快速准确 预测车辆通过路段旅行时间的方法》;申请号为CN201410291290的专利文献《一种预测快速 路未来时刻所需旅行时间的系统及方法》等。分析其中的技术细节可知,旅行时间的实时预 测的研究尚处于发展阶段,技术仍然不成熟。主要存在以下三方面的问题或缺陷:
[0005] 第一方面,当前工作大多面向有限的历史数据集。例如,如数天、数月内浮动车的 监控数据,而非实时的监控数据。这对当前海量交通数据带来复杂性考虑不足,导致大数据 环境下处理效率低下或查询缓慢,对近期旅行时间预测的指导意义有限。
[0006] 第二方面,当前工作大多基于移动型交通信息实现预测。例如,针对来自公交车、 高速公路通勤车辆的车载GPS数据,而非识别精度更高的固定型交通信息。这使得车辆覆 盖范围有限,有效时间不连续,导致大数据环境下的预测效果实用性有限。
[0007] 第三方面,当前方法计算时多没有考虑车辆作为移动对象的特点,只是一种特定 的在线计算或离线运算。事实上,无论何种车辆采集数据,必然是同时具有时间和空间两种 维度的信息;而在这两个相互独立的属性上,往往是存在规律和趋势的。也即,旅行时间首 先具有即时性的需求,要求计算能尽快返回结果,其次,旅行时间也存在反映最近趋势的需 求,若不能兼顾历史数据上的这类规律,势必导致预测结果精度有限。
[0008] 针对相关技术中的上述问题,迄今为止目前尚未提出有效的解决方案。

【发明内容】

[0009] 本发明的目的是为了克服上述技术缺陷,从而解决面向车牌识别数据的旅行时间 实时预测效率和准确性不高的问题。
[0010] 本发明通过定义时间区间和路段规则库,提出一种面向车牌识别数据的旅行时间 实时预测方法,一方面可以面向实时的流数据基于两阶段时空并行化技术保证计算的即时 响应,另一方面可以面向累积的海量历史数据基于朴素贝叶斯定时挖掘规则,并在Apache Storm上结合Hadoop MapReduce的低延迟,实现了实测和预测计算。
[0011] Hadoop是一种分布式系统基础构架,实现了一个分布式文件系统,MapReduce 是构建在Hadoop文件系统之上的一种编程模型,用于海量数据集的并行运算,Hadoop MapReduce在信息技术领域中具有一般的唯一含义,是本领域技术人员所公知的。Apache Storm是一个由Twitter开源的大数据处理系统,用于流式大数据的实时计算,其在信息技 术领域中具有一般的唯一含义,是本领域技术人员所公知的。
[0012] 具体而言,本发明的一个方面,提供了一种面向车牌识别数据的旅行时间实时预 测方法,其特征在于,所述方法包括:
[0013] (1)先验规则挖掘步骤,用于构建先验规则库;
[0014] (2)旅行时间实测计算步骤,用于计算当前时刻路网中的路段旅行时间实测值,并 累积实测结果集;
[0015] (3)旅行时间预测计算步骤,用于预测下一时刻路网中的路段旅行时间变化率,并 计算相应的旅行时间预测值。
[0016] 优选地,其中所述的先验规则挖掘步骤,是基于朴素贝叶斯理论的先验规则挖掘, 包括:
[0017] (1)路段属性的先验规则挖掘,输入海量历史的旅行时间实测结果集,输出路段属 性先验规则库;
[0018] (2)时间区间属性的先验规则挖掘,输入海量历史的旅行时间实测结果集,输出时 间区间属性先验规则库。
[0019] 优选地,面向车牌识别数据的旅行时间实时预测方法,其中的先验规则挖掘步骤, 针对路段属性,挖掘路段属性先验规则库;该挖掘路段属性先验规则库过程面向旅行时间 实测结果集,对其路段属性进行划分,将时间区间按先后顺序,在每个路段下某时间区间的 旅行时间值,与下一个时间区间的值计算变化率,将其划入对应变化率的分类,统计各路段 的旅行时间变化率分类的分布情况;该挖掘路段属性先验规则库过程在给定的旅行时间变 化率分类、计算频率、时间区间单位下,可描述为如下两个MapReduce作业步骤:
[0020] (1)第一个作业,以给定的计算频率和时间区间单位下,按照路段属性划分实测结 果集,归类相应路段下的时间区间,以及该时间区间下的旅行时间值;
[0021] (2)第二个作业,以给定的计算频率和时间区间单位下,挖掘路段属性下旅行时间 的变化规律,根据指定的旅行时间变化率分类,统计每个路段下各个分类的旅行时间变化 率的分布。
[0022] 优选地,所述的面向车牌识别数据的旅行时间实时预测方法,其中的先验规则挖 掘步骤,针对时间区间属性,挖掘时间区间属性先验规则库;该挖掘时间区间属性先验规 则库过程面向旅行时间实测结果集,将在一天中的时间区间作为主键对路段进行划分,在 每个路段下某时间区间的旅行时间值,与下一个时间区间的值计算变化率,将其划入对应 变化率的分类,统计各路段的旅行时间变化率分类的分布情况;该挖掘时间区间属性先验 规则库过程在给定的旅行时间变化率分类、计算频率、时间区间单位下,可描述为如下两个 MapReduce作业步骤:
[0023] (1)第一个作业,以给定的计算频率和时间区间
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1