基于含多源粗差的车牌识别数据的车辆出行轨迹提取方法与流程

文档序号:16927675发布日期:2019-02-22 20:00阅读:240来源:国知局
基于含多源粗差的车牌识别数据的车辆出行轨迹提取方法与流程
本发明属于城市交通系统运营、规划与管理等相关的应用领域,具体涉及一种基于含多源粗差的车牌识别数据的车辆出行轨迹提取方法。
背景技术
:随着城市机动车保有量的急剧增加,汽车已经成为人们出行首选的交通工具,车辆的出行轨迹因其隐含了丰富的交通出行与状态信息,而随之成为研究城市交通流时空分布特性的基础,如何提取车辆的历史行车路径已然成为当下热门的研究课题。传统的基于人工调查的方法不仅耗时长、成本高,需要投入大量的人力、物力和财力,而且得到的结果与实际情况还不一定完全相符,有时还会对路网交通的运行造成一定的干扰。于是有研究学者尝试利用装有车载gps装置的车辆所产生的实时定位数据来拟合车辆的行驶路径。但对于城市庞大的汽车保有量来说,装有gps设备的车辆比重相对较小,无法做到对每一辆车的实时追踪。因此,有必要寻找一种更为有效的信息采集和分析手段来获取实时、准确的行车数据。路网的卡口系统是一种对通过卡口位置的机动车辆进行拍摄、记录与处理的交通监测系统。与gps采集数据相比,路网的卡口系统不仅能够全天候、大范围检测整个城市区域内路网车辆的通过情况,而且收集到的数据实时性好、采集率高。但是也同样存在着车牌识别错误率高、卡口时间不统一、卡口位置有误差等诸多问题。目前,每个城市卡口的布点率以及设备的准确性参差不齐,需要针对每个城市的实际情况来制定一套行之有效的办法从而最大程度的利用好这些车牌识别数据,进而为交通部门制定决策法规提供更为可靠的数据支持。技术实现要素:本发明的目的是提供一种基于含多源粗差的车牌识别数据的车辆出行轨迹提取方法。为达到上述目的,本发明提供的基于含多源粗差的车牌识别数据的车辆出行轨迹提取方法,包括步骤:第一步,对路网卡口系统捕获的车牌识别数据进行粗差探测和剔除;所述粗差探测和剔除进一步包括:(1.1)识别并剔除离散点和跳跃点,具体为:(1.1a)利用路网中各卡口站点间的空间位置关系构建卡口站点邻接表;(1.1b)利用sql语句从车牌识别数据中获得同一车辆单次出行经过的点位,将所获得点位按该车辆经过时间排序获得该车辆该次出行的点位集;(1.1c)结合邻接表,逐一判断点位集中各点位是否为离散点或跳跃点;所述离散点指与其前后点位间的可达距离均远大于s0的点位,s0为与所在城市相邻点位间距离相关的距离阈值,距离阈值s0的设置是用来剔除与相邻点位间距离完全不合理的离散型点位;所述跳跃点指与前一点位时间上相邻但空间位置不相邻的点位;(1.1d)剔除离散点和跳跃点对应的车牌识别数据;(1.2)基于行车距离值的粗差点验证,具体为:遍历剔除了离散点和跳跃点的点位集,计算当前点位和其前后点位间的可达距离的较小值s、以及其前后点位间的最短可达距离s’,当s远大于s’,则当前点位为粗差点,剔除其对应的车牌识别数据;(1.3)基于行车速度值的粗差点验证,具体为:遍历经过行车距离值验证的点位集,逐一获取车辆在点位集中相邻两点位间的行车速度值,当行车速度值不合理,则相邻两点位中后一点位为粗差点,剔除其对应的车牌识别数据;第二步,基于粗差剔除后的车牌识别数据提取车辆出行轨迹,具体为:(2.1)对经过第一步进行粗差剔除后的点位集,获取点位集中每相邻两点位间的最短路径,所有最短路径组成车辆出行轨迹的覆盖树;(2.2)采用路径计算算法对覆盖树计算最长路径,即车辆出行轨迹。进一步的,判断离散点的一种具体方法为:设置一经验值n,判断点位与其前后两点位间的可达距离是否均大于n*s0,若均大于n*s0,则该点位为离散点;反之则不是;n取值需考虑路网中所设置卡口之间距离,并经反复调试来获取合适值。进一步的,子步骤(1.2)中,判断行车速度值不合理的一种具体方法为:考虑车辆行车速度上限及城市的实际行车情况,设置一行车速度阈值,车辆在相邻两点位间的行车速度值大于行车速度阈值,则认为行车速度值不合理。进一步的,子步骤(1.3)中,判断s是否远大于s’的一种具体方法为:设置一经验值n’和判断式s>n’*s’,当符合判断式,则认为s远大于s’;n’取值需考虑城市的实际出行情况和路况,并经反复调试来获取合适值。进一步的,子步骤(2.1)中,点位集中每相邻两点位间的最短路径采用如下方法获得:判断相邻两点位所在路段是否为相邻路段,若为相邻路段,直接取相邻两点位之间的路径作为最短路径;否则,利用路径计算算法计算最短路径。进一步的,子步骤(2.2)中,采用路径计算算法对覆盖树计算最长路径,具体为:从覆盖树中任意选择一路段s,从路段s出发,采用路径计算算法求最长路径,将该最长路径另一端点所在路段记为s’;从路段s’出发,再次采用路径计算算法求最长路径,即车辆出行轨迹。所述路径计算算法为dijkstra算法或a*算法。本发明具有如下特点和有益效果:本发明提出了一种利用含多源粗差的车牌识别数据提取城市车辆出行轨迹的方法,特别在涉及交通大数据的挖掘与分析时,采用本发明方法能更有效的计算出城市车辆的历史出行轨迹,计算出的历史出行轨迹不仅能够全面系统地再现复杂的交通运行场景,还可为基础od矩阵的调查和更新工作提供思路和有效的技术手段,进一步还能为交通部门制定相关的决策、法规提供更为可靠的数据支撑。需要说明的是,od代表交通起止点,文中所述od矩阵即一二维表格,表格中元素代表起止点间的交通出行量。od矩阵也称od表、od调查结果。附图说明图1是实施例1中邻接表示意图,其中,图(a)所示为路网和卡口站点之间位置的简单示意图,图(b)是基于图(a)所建立的邻接表结构;图2是实施例1中所计算的机动车出行轨迹的覆盖树;图3是实施例1中基于覆盖树所计算的机动车出行轨迹;图4~5是实施例2中所涉及项目的概况,其中,图4上半部分是目前研究区域内的车辆通行情况,主要是以地面交通为主,结合图5可以发现目前地面共有9车道(包含2个公交车道)可供机动车行驶;改造后的路段变成地面4车道(包含2个公交车道)和地下4车道,具体见图4和图5的下半部分所示。具体实施方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。实施例1本发明首先需要对原始数据(即路网卡口系统捕获的原始车牌识别数据)进行粗差探测和剔除;然后,基于粗差剔除后的车牌识别数据,结合路径计算算法提取城市车辆的出行轨迹。本实施例将结合附图对本发明具体实施过程的原理进行详细说明。第一步,车牌识别数据的粗差探测和剔除。本发明利用的原始数据为路网卡口系统捕获的车牌识别数据,其中包含大量因客观原因所产生的多源粗差数据。为确保机动车出行轨迹提取的准确性,应识别并剔除原始数据中的粗差数据。粗差数据的探测与剔除的原理包括如下两部分:(1)基于卡口站点和路网间的空间位置关系、以及卡口站点间的空间拓扑关系,剔除不合理的车牌识别数据。具体来说,先基于卡口站点和路网的空间位置关系、以及卡口站点间的空间拓扑关系,构建路网中各卡口站点的邻接表,见图1所示。图1(a)中,a、b、c、d、e、f分别表示不同的卡口站点,简记为点位。根据常识可知,假设当前时刻某车牌出现在e处,则下一时刻该车牌只能出现在e的相邻点位d、b、f处;若出现在其他点位,则认为下一时刻所在点位为粗差点,该下一时刻所在点位的车牌识别数据为粗差数据,应剔除。基于图1(a)构建图1(b),具体来说,先对图1(a)中a、b、c、d、e、f依次编号为1、2、3、4、5、6,然后分别以a、b、c、d、e、f为顶点,例如以e为顶点,则当前时刻出现在e处的某车牌,其下一时刻只能出现在d、b、f处,则可表示为图1(b)第5行。利用sql查询语句获得同一车辆单次出行经过的点位,将所获得点位按该车辆经过时间排序获得该车辆该次出行的点位集。结合构建的邻接表对点位集中各点位逐一识别是否为粗差点。本发明中粗差点进一步包括离散点和跳跃点。离散点指与其他点位孤立的点位,离散点处所对应的车牌识别数据为粗差数据,应剔除。当前点位是否为离散点,可根据当前点位与其前后两个点位之间的距离来判断,点位集中当前点位的前后两个点位即当前点位的前后时刻点。假设当前点位为b,其前后两个点位为a和c,a、b、c则为时间上顺次连续的三个点位。如果sab>>s0且sbc>>s0,则点位b为离散点。其中,sab表示点位a和b之间的可达距离,sbc表示点位b和c之间的可达距离,s0为与所在城市相邻点位间距离相关的距离阈值,距离阈值s0的设置是用来剔除与相邻点位间距离完全不合理的离散点位。s0的一种具体取值方法为:取为有效点位集中相邻两点位之间距离的平均值,有效点位集是由经本发明方法验证为正确的点位构成的集合,这里,正确的点位指不是离散点也不是跳跃点的点位。对于点位集中第一个点位,先假设其为正确点位,利用基于行车距离值和基于行车速度值的验证规则对第二个点位进行判断,如果第二个点位被判断为粗差点,则否认第一个点位的正确性;否则,第一个点位即为正确点。如果否认了第一个点位的正确性,则将第二个点位作为第一个点位,利用基于行车距离值和基于行车速度值的验证规则对第二个点位进行判断,直至找到第一个和第二个正确点为止,将正确点放入有效点位集。在对点位集进行离散点和跳跃点的探测过程,将探测到的非离散点和非跳跃点也放入有效点位集。在判断是否远大于的一种具体方法为:通过设置一经验值n,来判断sab和sbc是否远大于s0。可设置判断式sab>n*s0和sbc>n*s0,当两个判断式均符合时,则b被判断为离散点。n取值根据城市路网中所设置卡口之间距离设置,其实质为经验值,实际应用中需反复调试来获取合适值。跳跃点指在时间上存在先后相邻关系、在空间位置上却不相邻的点位。例如,当前时刻某车牌出现在e处,该某车牌上一时刻出现在c处,c和e在时间上相邻而在空间位置上非相邻,则当前时刻e处为跳跃点,应剔除当前时刻e处所对应的车牌识别数据。判断跳跃点时,需遍历点位集,当前点位和其前一点位如果为时间相邻的点位,仅需要判断两者是否空间位置相邻;若两者空间位置不相邻,则认为当前点位是粗差点。(2)由于卡口摄像头的识别准确率较低,尚存在着大量其他类型的粗差,仅仅根据邻接表来剔除原始数据中的粗差还远远不够。所以,本发明通过对连续拍摄的车牌识别数据制定相应的验证规则,以进一步去除粗差数据。所述验证规则如下:2-1基于行车距离值的验证规则:按时间顺序遍历点位集中的各点位,取当前点位的前一时刻和后一时刻点位,计算当前点位和其前后时刻点位之间的可达距离的较小值,记为s;再计算前一时刻点位和后一时刻点位间的最短可达距离,记为s’;如果s>>s’,即中间点位与其前后两点位间距离的最小值远大于前后两点位之间的距离,此时显然存在不合理,则认为当前点位是粗差点,剔除粗差点所对应的车牌识别数据;否则,认为当前点位是正确点位。可通过设置一经验值n’,来判断s是否远大于s’。具体来说,设置判断式s>n’*s’,当符合判断式,则认为s远大于s’。n’取值需考虑城市的实际出行情况和路况,并经反复调试来获取合适值。2-2基于行车速度值的验证规则:具体来说,设置行车速度阈值,该行车速度阈值的设置应考虑车辆行车速度上限及城市的实际行车情况。只有同一车辆在相邻两点位之间的行车速度值不大于行车速度阈值时,才认为是合理。那么,当车辆在相邻两点位之间的行车速度值大于行车速度阈值,则认为行车速度值不合理,将该相邻两点位中后一时刻点位认为粗差点,将后一时刻点位对应的车牌识别数据剔除。本实施例中行车速度阈值设为70km/h。具体实施时,可利用sql语句,对进行过一次粗差剔除后的车牌识别数据进行查询,获得同一车辆按时间顺序排列的点位集,根据点位集对同一车辆在相邻的两点位之间的行车速度值进行验证。第二步,基于粗差剔除后的车牌识别数据提取车辆出行轨迹。对每一辆车,基于其车牌,从粗差剔除后的车牌识别数据中查询其单次出行所经过的点位的集合,记为点位集,点位集中各点位按照时间顺序排列。采用路径计算算法对点位集中每相邻两点位分别进行最短路径计算。由于路网卡口系统的点位存在偏差,即点位与路网数据并不能完全吻合,所有的最短路径只能组成车辆出行轨迹的覆盖树,见图2中深黑线。需要说明的是,在进行最短路径计算前,先判断相邻的两点位所在路段是否相邻,若所在路段相邻,直接取该两点位之间的路径作为该两点位的最短路径;否则采用路径计算算法对覆盖树计算最长路径,获得最终的车辆出行轨迹,见图3中深黑线。具体来说,在计算最长路径时,首先从覆盖树中任意选择一路段s,从路段s出发求最长路径,将该最长路径另一端点所在路段记为s’,从路段s’出发再次求最长路径,即最终的机动车出行轨迹。本实施例中,路径计算算法可采用dijkstra算法或者a*算法等。实施例2本实施例为实施例1方法在宁波市政府振兴三江口商业核心区项目中的应用情况,用来验证改造方案的可行性。根据目前宁波市城区的交通状况,拟调整扩大城区主干道地面的步行空间,将地面交通改造成连续的慢行网络,并将主城区干道交通下穿过境,使主城区向轻车化城区转型,改造后的车道分配情况从原来的9车道(包含2个公交车道)变成地面4车道(包含2个公交车道)和地下4车道,见图4~5所示。为验证该改造方案的可行性,需要统计每天经过主干道所在路段的过境交通情况。本实施例采用实施例1方法提取了2018年6月1号至2018年6月7号一周的时间内、通过相关路段每一辆机动车的出行轨迹,并根据出行轨迹进行车流量统计。经统计,长春路以西进入柳汀街的车流量中,平均有15.2%的车流量从灵东或灵西岗驶出;在同一时间段内,从灵东灵西岗以东驶入的车流量中,平均有18.8%的车流量从马园或柳汀岗(长春路以西)驶出,具体见表1所示。表1相关路段的车流量统计时间2018/6/12018/6/22018/6/32018/6/42018/6/52018/6/62018/6/7长春路以西进入柳汀街的车辆数5961897475887517808782747770上述车辆从灵东或灵西岗驶出的车辆数710152011971003128013571257所占百分比11.9%16.9%15.8%13.3%15.8%16.4%16.2%灵东灵西岗以东驶入的车辆数1059414635109209706130311414814003上述车辆从马园或柳汀岗(长春路以西)驶出的车辆数1446309122311947258526592505所占百分比13.6%21.1%20.4%20.1%19.8%18.8%17.9%由表1可以发现,在该主干道上,不到20%的交通量为过境交通,即这些车辆是可以使用隧道通行的,而剩余的交通量均为该路段上的到发交通,需要使用地面路段。因此,下穿路段的利用率并不高,并没有起到对路面交通分流的作用。另一方面,由于地面车道的减少,地面两车道无法承担该区域的到发交通需求;不仅如此,下穿隧道通行能力产生冗余后,会吸引更多的过境交通使用下穿隧道通行,从而给隧道上下游的相关路口带来巨大的交通压力。综上所述,下穿隧道方案的地面两车道无法承担该区域的社会车辆到发交通需求,降低了三江口核心区社会车辆的可达性。该方案应予以否决。本发明提出了利用车牌识别数据提取机动车出行轨迹的方法,但是车牌识别数据存在较大粗差,且路网数据和卡口数据存在一定位置偏差,因此,本发明方法首先利用路网的空间位置关系构建卡口间的邻接表,来剔除原始车牌识别数据中的离散点和跳跃点。同时,利用剔除粗差后的车牌识别数据计算不太准确的出行轨迹,即覆盖树;在覆盖树的基础上利用图论中的最长路径算法,得到完整且准确的机动车出行轨迹。实验表明,本发明方法在城市路网流量统计、单双号限行、流量监控等领域都能够得到较好的应用。对于本领域内的技术人员,在上述说明基础上还可以做出其他不同形式的变化或变动,而这些属于本发明实质精神而衍生出的其他变化或变动仍属于本发明保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1