基于海量车牌自动识别数据的动态拼车方法和系统的制作方法

文档序号:9217277阅读:298来源:国知局
基于海量车牌自动识别数据的动态拼车方法和系统的制作方法
【技术领域】
[0001]本发明涉及互联网大数据分析挖掘技术领域,具体涉及到互联网(包含移动互联网)、手机和电脑等可联网终端、Hadoop和Spark等大数据分析挖掘工具,尤其涉及一种基于海量车牌自动识别数据的动态拼车方法和系统。
【背景技术】
[0002]海量车牌自动识别(The Automatic Number Plate Recognit1n)数据是对交通摄像头捕捉到的道路交通数据进行处理生成的数据,简称ANPR数据,至少包含〈车牌号,监测点,时间点 > 三个字段的信息。
[0003]Hadoop是一个能够对大量数据进行分布式存储和处理的软件框架,它以一种可靠、高效、可伸缩的方式进行数据处理;HDFS是Hadoop框架中的一个高度容错性的用于存储管理数据的文件系统,能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。Spark是继Hadoop之后的新一代大数据分布式处理框架,是一个基于内存计算的开源集群计算系统。
[0004]可拼车车辆组的查询分为有目标车牌号和无目标车牌号的可拼车车辆组查询,基于Hadoop和Spark等技术,可以对海量车牌自动识别数据进行分析处理,为动态拼车系统提供了技术可行性。
[0005]当前的拼车方法一般主要基于用户输入的出发地、目的地以及出发时间等信息进行匹配筛选,无法及时在用户出行路线变换(包括出发地、目的地变化或出发地和目的地相同但途径路线变化)时做出动态调整。动态拼车方法通过对海量车牌识别数据的分析,根据用户的出行轨迹,无需用户输入出发地和目的地,通过指定目标车牌号和时间范围或者只指定时间范围来发现拼车对象,并可根据用户出行路线及时进行动态调整。其中指定目标车牌号和时间范围适用于用户在已知某一车辆车牌号,需要查询某段时间可拼车车辆组的场景;只指定一段时间则适用于仅通过给定时间范围查询所有可拼车车辆组的场景。
[0006]由于车牌识别数据的数据量大,现有技术很难基于对海量车牌识别数据的高效分析来进行动态拼车。据统计,中国一个大型城市部署的带车牌识别功能的摄像头可达到5000个,高峰期每个摄像头车牌识别数据的采集频率可达I条/秒,每天的交通高峰折算率按0.33统计的话,则一天的车辆识别数据记录数将达到1.44亿条,数据量约12G。当前技术在处理如此大量的车牌自动识别数据时往往存在计算和存储的瓶颈,查询和分析需要很长的时间,不能及时的将查询分析结果反馈给用户。
[0007]随着硬件和软件技术的发展,大规模并行处理技术的成熟,针对现有拼车方法和系统存在的上述问题,有必要在云计算环境下的数据并行处理与分析框架的基础上,发明一种为用户提供高效的动态拼车对象发现的方法和系统,及时准确的将拼车对象发现结果反馈给用户。

【发明内容】

[0008]本发明的目的在于解决上述现有方法和系统中存在的问题,基于Hadoop和Spark等技术,提出一种高效的利用海量车牌自动识别数据,对在同一时段共同出现在一定数量监测点的车辆进行并行分析和挖掘,来发现可拼车车辆组的动态拼车方法和系统。
[0009]基于海量车牌自动识别数据的动态拼车方法和系统包括动态拼车方法和系统两部分。动态拼车系统基于云计算环境下的Hadoop和Spark并行框架,通过高效的分析处理数据,及时准确的为用户提供拼车推荐服务。不同于传统拼车方法和系统需要出发地和目的地等作为查询条件,该方法和系统通过给定一段时间范围,即可对共同出现在一定数量监测点的车辆进行分析和挖掘,实现可拼车车辆组的动态推荐功能。动态拼车方法分为以下步骤:(1)获取用户查询条件(2)查询车辆轨迹(3)查询点伴随车辆组(4)查询可拼车车辆组(5)产生拼车推荐结果(6)将推荐结果反馈给用户。其中步骤(2) (3) (4) (5)都是基于Spark框架进行的分布式并行查询与分析,特别是步骤(4),使用并行化的频繁项集发现算法来挖掘可拼车车辆组。
[0010]该动态拼车方法和系统所处理的数据是海量车牌自动识别数据,是对交通摄像头捕捉到的海量道路交通数据进行处理后生成的数据,数据至少包含〈车牌号,监测点,时间点〉三个字段的信息。一一是否数据分析层完成
[0011]基于海量车牌自动识别数据的动态拼车方法是根据一段时间范围内车辆所经过的监测点位置序列得到车辆轨迹,根据车辆轨迹得到一定时间范围内共同经过同一监测点的点伴随车辆组,根据点伴随车辆组得到一定时间内在一定数目的监测点共同出现的可拼车车辆组。其中,可拼车车辆是指可以提供拼车服务的车主的车辆,有拼车需求的人可以搭乘此车辆进行拼车,可拼车车辆的集合称为可拼车车辆组。一定数目的监测点数量必须大于等于设定的监测点数量阈值,而监测点阈值由系统根据不同时段车流量自动设定。
[0012]一种基于海量车牌自动识别数据的动态拼车方法和系统,包含以下几个层次:
(1)数据采集层。负责采集从城市交通摄像头中产生的监控数据,并将数据输送到存储层O
(2)存储层。存储层由HDFS和关系数据库组成,分别负责存储从采集层传送过来的监控数据和从数据分析层传送过来的处理后的结果数据。
(3)数据分析层。根据服务层传送过来的用户查询条件利用Spark框架分析处理HDFS中的监控数据,并将分析结果存储到关系数据库中。
(4)服务层。接收用户输入的查询条件,将查询条件传送给数据分析层,并负责从关系数据库中查询数据分析层处理后的结果,将查询分析结果返回给用户。
[0013]用户通过前台操作界面或者REST对外服务接口输入查询条件,系统通过后台获取用户输入的查询条件。查询条件可包括:(I)目标车牌号和起止时间;(2)起止时间。
[0014]查询条件分别对应系统的两种查询分析功能,分别是有目标车牌号的可拼车车辆组查询和无目标车牌号的可拼车车辆组查询,其中“目标车牌号”是指已知的某车辆的车牌号,可以查询与其行驶路线相似的其他可拼车的车辆组。
[0015]本发明提出的一种基于海量车牌自动识别数据的动态拼车方法和系统中,动态拼车分析模块包括以下四个数据分析处理子模块:
(I)车辆轨迹查询子模块。根据用户输入的查询条件,基于海量车牌自动识别数据,通过后台查询目标车辆或所有车辆的轨迹。 (2)点伴随车辆组查询子模块。根据车辆轨迹计算点伴随车辆组。
(3)可拼车车辆组查询子模块。对点伴随车辆组利用关联规则分析方法,基于频繁子集发现算法计算可拼车车辆组。然后将可拼车车辆组的查询结果存入关系数据库便于查询。
(4)拼车推荐子模块。根据上下文中的用户个人信息和历史查询记录,结合可拼车车辆组的查询结果,将拼车推荐结果按照匹配优先级排序后存储到关系数据库中便于服务层将结果反馈给用户。
本发明还包括以下方案
一种基于海量车牌自动识别数据的动态拼车系统,其特征在于该系统包括数据采集模块、存储模块、数据分析模块和服务模块,其中:
数据采集模块采集从城市交通摄像头中产生的监控数据,并将数据输送到存储模块;存储模块存储从数据采集模块传送过来的监控数据和从数据分析模块传送过来的处理后的结果数据;
数据分析模块根据服务模块传送过来的用户查询条件分析处理存储模块中的监控数据,并将分析结果存储到存储模块中;
服务模块接收用户输入的查询条件,将查询条件传送给数据分析模块,并从存储模块中查询数据分析模块处理后的结果,将查询分析结果返回给
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1