本发明涉及公共汽车等领域,具体为一种公交车辆信息的自动识别方法。
背景技术
如今,科技迅速发展,有许多的技术能够提供定位服务,比如全球定位系统(gps),射频识别(rfid),智能电话传感器,可穿戴的智能设备,gsm信标,红外或超声系统等等,这些技术的广泛应用将会产生海量的轨迹数据,这些轨迹数据中包含大量有用的信息,具有极高的研究价值。常见的轨迹包括人类活动轨迹,动物迁徙轨迹以及交通轨迹等等。每一种类型的轨迹数据具有其自身的特性,可以用于不同的挖掘目的。
近年来,政府在许多城市升级了城市公交系统的基础设施,给公交车配备了gps设备,可以记录公交车的轨迹信息,最终将这些轨迹信息存储到服务系统中。通过对公交轨迹数据的挖掘分析,可以分析人们的出行模式以及城市交通规划等等。在对公交轨迹分析挖掘的过程中,经常需要使用公交车的调度信息,然而这些调度信息目前公交车系统主要依赖于人工调度,整合这些信息将花费大量的人力物力,其次即使少数城市已经有智能调度系统,这些系统仍然不成熟,覆盖范围不够广,难以用于分析挖掘。因此需要用技术的手段识别公交车运行的公交线路的信息,本发明称其为公交轨迹线路识别。
公交轨迹线路识别主要涉及公交轨迹相似度计算,目前常用的轨迹相似度计算方法包括欧式距离,hausdoff距离,dtw距离以及lcss(最长公共子序列)距离等等,使用这些轨迹相似度计算方法主要有如下问题:(1)公交路网中公交线路数目较多,且计算两条轨迹的相似度的时间复杂度较高,故直接计算公交轨迹和公交线路的轨迹相似度的时间复杂度高,效率低下。(2)公交车在特定路网往复行驶,且可能运行多条公交线路,不是所有轨迹相似度计算方法都适用。
技术实现要素:
为了解决上述技术问题,本发明提供一种公交车辆信息的自动识别方法。
实现上述目的的技术方案是:一种公交车辆信息的自动识别方法,包括以下步骤,数据获取步骤,获取未知公交车辆行驶轨迹数据和公交路网数据,所述未知公交车辆行驶轨迹由轨迹点构成,所述未知公交车辆行驶轨迹数据包括每一所述轨迹点的位置信息,所述公交路网数据包括公交站点的位置信息以及经过每一所述公交站点的公交线路标识,所述公交路线标识包括对应该公交路线的已知公交车辆信息;位置信息处理步骤,对所述未知公交车辆行驶轨迹数据和公交路网数据中的位置信息进行数值化处理;公交站点筛选步骤,判断每一所述轨迹点的位置信息是否在其中一所述公交站点的位置信息的预设阈值范围内,若是,则筛选出该公交站点;公交线路筛选步骤,统计每一所述公交路线上所有筛选出的公交站点的实际数量,计算实际数量与每一所述公交路线上所有公交站点的原始数量的比值,当实际数量与原始数量的比值达到预设阈值时,该将该公交线路作为候选公交路线;候选集统计步骤,汇集所有候选公交路线形成候选集;行驶线路判定及公交车辆信息识别步骤,判断行驶线路与候选公交路线的相似度,若相似度达到预设阈值时,则将该候选公交路线的公交线路标识标记给行驶路线。
在本发明一较佳的实施例中,所述位置信息处理步骤中包括,坐标系建立步骤,建立平面直角坐标系,设置相互垂直的x轴和y轴;坐标位置计算步骤,在所述二维直角坐标系中通过二维坐标表示所述轨迹点和公交站点的位置信息,分别计算所述轨迹点和公交站点到x轴的距离和到y轴的距离。
在本发明一较佳的实施例中,所述位置信息处理步骤中,在所述坐标位置计算步骤之后还包括,栅格化步骤,将所述平面直角坐标系划分为具有预设边长的栅格。
在本发明一较佳的实施例中,所述位置信息处理步骤中,在所述栅格化步骤之后还包括,编码计算步骤,包括分别计算所述轨迹点到y轴的距离与边长的比值和所述轨迹点到x轴的距离与边长的比值,将所述轨迹点到y轴的距离与边长的比值和所述轨迹点到x轴的距离与边长的比值作为该轨迹点的轨迹点编码;编码处理步骤,将所有轨迹点编码制作成编码序列表。
在本发明一较佳的实施例中,所述编码计算步骤还包括分别计算所述公交站点到y轴的距离与边长的比值和所述轨迹点到x轴的距离与边长的比值,将所述公交站点到y轴的距离与边长的比值和所述轨迹点到x轴的距离与边长的比值作为该轨迹点的公交站点编码;所述编码处理步骤还包括将所有公交站点编码关联至所述公交路网数据,制作公交线路排序表。
在本发明一较佳的实施例中,所述公交站点筛选步骤中包括,编码获取步骤,在所述编码序列表中获取任意一所述轨迹点编码;编码对比步骤,对比所获取的轨迹点编码与所有公交站点编码,判断该所获取的轨迹点编码是否在其中一所述公交站点编码的预设阈值范围内,若是,则进入标定步骤,若否,则返回编码获取步骤;标定步骤,判定所述公交站点编码是否被标记过,若未被标定过,则标定该公交站点;筛选步骤,筛选出所有被标定的公交站点。
在本发明一较佳的实施例中,在所述行驶线路判定步骤中包括,最长公共子序列选定步骤,在所有具有公交站点编码的候选公交线路中配比得到多个公共子序列,选取编码序列最长的公共子序列作为最长公共子序列;相似度计算步骤,计算最长公共子序列与所有候选公交线路中的编码序列的比值,当该比值达到相似度的预设阈值时,则选定该候选公交线路为公交轨迹;信息识别步骤,将该候选公交路线的公交线路标识标记给行驶路线。
在本发明一较佳的实施例中,所述相似度的预设阈值为90%。
在本发明一较佳的实施例中,所述公交线路筛选步骤中,所述实际数量与原始数量的比值的预设阈值为70%。
本发明的优点是:本发明的公交车辆信息的自动识别方法,结合公交车在特定路网上往复行驶的特性缩小需要计算轨迹相似度的公交线路的数目,并选择合适的轨迹相似度计算方法确定公交车运行的公交线路信息;在公交路网中公交线路数目较多的情况下,降低了计算两条轨迹的相似度的时间复杂度,提高了计算效率,同时,提高了精确度。
附图说明
下面结合附图和实施例对本发明作进一步解释。
图1是本发明实施例的公交车辆信息的自动识别方法步骤图。
图2是本发明实施例的位置信息处理步骤图。
图3是本发明实施例的公交站点筛选步骤图。
图4是本发明实施例的行驶线路判定及公交车辆信息识别步骤图。
图5是本发明实施例的栅格化步骤中某轨迹点p的坐标图。
图6是本发明实施例的公交路网倒排表g'示意图。
图7是本发明实施例的某一公交车辆行驶轨迹示意图。
图8是本发明实施例的筛选出的公交站点或公交路线示意图。
图9是本发明实施例的公交车辆行驶轨迹最终识别示意图。
具体实施方式
实施例:如图1所示,一种公交车辆信息的自动识别方法,包括步骤s1)-s6)。
步骤s1)数据获取步骤,获取未知公交车辆行驶轨迹数据和公交路网数据,所述未知公交车辆行驶轨迹由轨迹点构成,所述未知公交车辆行驶轨迹数据包括每一所述轨迹点的位置信息,所述公交路网数据包括公交站点的位置信息以及经过每一所述公交站点的公交线路标识,所述公交路线标识包括对应该公交路线的已知公交车辆信息。如某一公交轨迹t为一系列公交车的轨迹点构成,每一个轨迹点表示公交车在某一时刻所处位置的位置信息,即t={p1,…,pn}={<lat1,lng1,t1>,…,<latn,lngn,tn>}。公交路网g,由多条公交线路构成,每一条公交线路l的信息包含公交线路名称,公交站点的位置信息,即l={lname:{s1,s2,…,sk}},其中lname表示公交线路的名称,而si表示公交线路包含的公交站点的位置信息,因此公交路网g={l1,l2,…,ln}。
步骤s2)位置信息处理步骤,对所述未知公交车辆行驶轨迹数据和公交路网数据中的位置信息进行数值化处理。所述位置信息处理步骤中包括步骤s21)-s25),如图2所示,步骤s21)坐标系建立步骤,建立平面直角坐标系,设置相互垂直的x轴和y轴;步骤s22)坐标位置计算步骤,在所述二维直角坐标系中通过二维坐标表示所述轨迹点和公交站点的位置信息,分别计算所述轨迹点和公交站点到x轴的距离和到y轴的距离。步骤s23)栅格化步骤,将所述平面直角坐标系划分为具有预设边长的栅格。步骤s24)编码计算步骤,包括分别计算所述轨迹点到y轴的距离与边长的比值和所述轨迹点到x轴的距离与边长的比值,将所述轨迹点到y轴的距离与边长的比值和所述轨迹点到x轴的距离与边长的比值作为该轨迹点的轨迹点编码;以及分别计算所述公交站点到y轴的距离与边长的比值和所述轨迹点到x轴的距离与边长的比值,将所述公交站点到y轴的距离与边长的比值和所述轨迹点到x轴的距离与边长的比值作为该轨迹点的公交站点编码。如对公交轨迹点进行编码,将轨迹点p映射到平面直角坐标系,并分别计算该点在平面直角坐标系中的距离x轴和y轴的距离,设栅格的边长为d,则
步骤s3)公交站点筛选步骤,判断每一所述轨迹点的位置信息是否在其中一所述公交站点的位置信息的预设阈值范围内,若是,则筛选出该公交站点。所述公交站点筛选步骤中包括步骤s31)-s34):如图3所示,步骤s31)编码获取步骤,在所述编码序列表中获取任意一所述轨迹点编码;步骤s32)编码对比步骤,对比所获取的轨迹点编码与所有公交站点编码,判断该所获取的轨迹点编码是否在其中一所述公交站点编码的预设阈值范围内,若是,则进入标定步骤,若否,则返回编码获取步骤;在该步骤s32)中,为了达到一定的精确度,因此,轨迹点编码与公交站点编码要求一致。步骤s33)标定步骤,判定所述公交站点编码是否被标记过,若未被标定过,则标定该公交站点;步骤s34)筛选步骤,筛选出所有被标定的公交站点。
步骤s4)公交线路筛选步骤,如图6至图8所示,统计每一所述公交路线上所有筛选出的公交站点的实际数量,计算实际数量与每一所述公交路线上所有公交站点的原始数量的比值,当实际数量与原始数量的比值达到预设阈值时,该将该公交线路作为候选公交路线。如果超过某个阈值,比如70%,则认为该线路是公交车的候选线路。其中,站点覆盖率计算公式如下:
步骤s5)候选集统计步骤,汇集所有候选公交路线形成候选集。
步骤s6)行驶线路判定步骤,如图9所示,判断行驶线路与候选公交路线的相似度,若相似度达到预设阈值时,则将该候选公交路线的公交线路标识标记给行驶路线,并将对应该候选公交路线的已知公交车辆信息作为该未知公交车辆的信息。在所述行驶线路判定及公交车辆信息识别步骤中包括使用最长公共子序列轨迹相似度计算方法,进行归一化处理所述行驶线路与候选公交路线的相似度。在得到候选线路集之后,计算候选集中的公交线路与公交轨迹的轨迹相似度,使用最长公共子序列(lcss)轨迹相似度计算方法,并进行归一化处理,如果超过某个阈值,比如90%,则认为公交车辆运行了该公交线路。其中归一化处理的公式为:
例如,车牌号为b49123的公交车行驶的线路信息如图7所示,具体识别结果为:21路上行,21路下行,315路上行和315路下行。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。