基于隐马尔科夫模型的自适应在线地图匹配方法与流程

文档序号:15631569发布日期:2018-10-12 20:43阅读:310来源:国知局
本发明涉及移动智能交通领域,具体讲,涉及基于隐马尔科夫模型的自适应在线地图匹配方法。
背景技术
::近年来,随着gps(globalpositioningsystem,是全球定位系统的简称)定位设备的发展,大量的gps轨迹数据可以实时的从出租车、智能手机等gps智能设备中获得。利用这些轨迹数据,可以很容易地实现在线路径规划、交通事件检测和旅行时间预测等,即提供在线匹配服务给那些基于位置的应用程序。然而,在采集gps轨迹数据时,往往伴随着测量误差、采样误差以及能耗限制,从而导致这些轨迹数据不能直接被使用。由于gps技术本身的局限性,包括gps数据的测量、传输和接收过程,都会造成gps测量误差。同时,数据存储和传输带宽的要求造成了采样误差。此外,这些基于在线地图匹配的服务通常安装在移动设备上,使得高能耗成为匹配过程中不可忽视的关键问题。因此,如何将这些轨迹点实时地对齐到数字路网上,同时兼顾高精度、低能耗和低输出延迟,成为现在智能交通领域面临的不可回避的核心问题。发明人在实现本发明的过程中,发现现有技术至少存在以下缺点:为了降低电池功耗,现有的方法已经针对离线场景提出了解决方案,即降低轨迹点的采样频率。然而,对于在线场景而言,降低采样数量会使许多有效信息丢失,从而导致匹配精度显著下降。简单的解决方案是增加滑动窗口尺寸,但这又会导致输出延迟的显著增加。因此,如何同时使算法实现高精度、低能耗和低输出延迟,已成为智能交通领域面临的最大挑战之一。为了实现上述目标,本发明提出一种基于隐马尔可夫模型(hiddenmarkovmodel,hmm)的自适应在线地图匹配方法,该方法将充分考虑道路网络的几何结构(几何概率),拓扑结构(拓扑概率)和车辆运行时间/速度信息以保证匹配精度。此外,还提出了自适应滑动窗口策略和自适应采样频率策略,以减少地图匹配的输出延迟和采样数据量。技术实现要素:为克服现有技术的不足,本发明旨在提出一种基于隐马尔可夫模型的自适应在线地图匹配框架,为各类基于轨迹的应用程序提供精确、低延迟和低能耗的在线地图匹配服务,利用地图服务商提供的api进行可视化呈现。为此,本发明采用的技术方案是,基于隐马尔科夫模型的自适应在线地图匹配方法,首先需要采集轨迹信息,然后将这些轨迹序列作为匹配系统的输入参数,接着对轨迹序列依次进行候选分析处理,概率分析处理和自适应匹配处理,最终得到轨迹序列的实时的匹配结果,并将匹配结果作为输出反馈给所需的应用。具体地,首先利用自适应采样频率方法获取轨迹点;然后使用geohash算法计算轨迹点对应的候选集;接着结合道路网络的几何拓扑信息和车辆的时间速度信息,计算转移概率和传递概率;最后,利用在线viterbi算法和自适应滑动窗口方法以获得最佳匹配结果。进一步细化为:1)hmm的应用过程:序列{crsi_1,crsi,…,crsn}表示隐状态,对应于地图匹配中的候选路段;序列{tpi_1,tpi,…,tpn}表示观测状态,对应于地图匹配中轨迹点;ti_1,i表示crsi_1与crsi之间的转移概率,对应于候选路段之间的转移概率;oi(tpi)表示crsi和tpi之间的传递概率,对应于轨迹点匹配在某一候选路段上的概率;2)获取轨迹点的候选集:候选集是指候选路段和候选点,候选路段被定义为那些到轨迹点的距离小于误差半径的路段,轨迹点在其相应候选路段上的投影点称为候选点,具体使用geohash算法,在经纬度区间进行二分法无限逼近,将经纬度坐标转化为字符串的形式,字符串中相同前缀的数量越多,两个gps点之间的距离越近;3)转移概率的计算:使用道路网络的拓扑和速度信息来计算转移概率,具体地,拓扑信息被用于描述轨迹点与路段之间的距离相似度,这种相似性被表示为相邻两个轨迹点之间的真实距离与其候选点之间的最短距离的比值,比值越接近1的时候,说明相似度越高,速度信息被用于计算轨迹点与路段之间的速度相似度,即道路速度限制和相邻轨迹点的平均速度之间的比值;4)传递概率的计算,传递概率被用于计算轨迹点与候选路段之间的距离相似度,这种相似性满足高斯正态分布,即当轨迹点与候选点的之间距离越接近时,对应的传递概率值越大。自适应滑动窗口方法的实现:1)自适应滑动窗口是根据不同的道路状况自动改变滑动窗口的尺寸;2)初始时,窗口尺寸被设置为二,然后,根据窗口中的局部轨迹路径是否可以收敛到最左边的候选点,如果能够收敛,这表示最终的匹配结果将包含该候选点,将此候选点作为匹配结果输出;如果不能收敛,则表示需要继续向右增加窗口尺寸,直到找到收敛点为止;3)如果一直找不到收敛点,将最大窗口大小设置为n。当窗口大小达到n,但仍没有找到收敛点时,则需停止增加窗口尺寸,此时,与最左侧轨迹点对应的拥有最大联合概率的候选点即为匹配点。自适应采样频率方法的实现:1)自适应采样率是车辆在不同的城市道路上能以不同的频率进行采样;2)在固定采样间隔距离的前提下,根据当前车速动态改变采样频率,上述自适应采样频率的确定过程用公式表示:si=h/v,其中,si表示采样频率,v表示车速,h表示自适应采样间隔距离。一个实例中具体步骤如下:(1)首先,利用自适应采样频率算法采集轨迹点,输入参数是车辆速度v,时间戳t,和自适应采样间隔h,输出结果是采样的轨迹点。采样点的获取可以被描述为如下过程:首先,根据第一行的公式si=h/v计算得到自适应采样频率si;接着,判断系统的当前时刻与上一个轨迹点的采样时刻之间的时间间隔是否大于或等于si;如果大于,表示满足采样条件,则进行采样,并将采样点信息返回给系统;如果不大于,则一直比较系统的当前时刻与上一个轨迹点的采样时刻之间的时间间隔,直到此间隔大于或等于为止;(2)在获得轨迹点之后,利用geohash算法计算每一个轨迹点的候选路段,轨迹点p1,p2和p3的geohash编码分别为wa2zdt,wa2zbf,wa2zff,路段e1,e2和e3的geohash编码分别为wa2zbm,wa2zbp,wa2zbd,若误差半径r为5,则p2的候选路段为e1和e3,因为它们都有5个连续相同的字符串wa2zb;同理,p1的候选路段为e1和e2,p3的候选路段e1,置最大候选路段数量为阈值;(3)继续计算轨迹点的候选点,即由轨迹点向候选路段作垂线得到的垂足点,p2在e1上的候选点为在e3上的候选点为p1的候选点为和p3的候选点为(4)转移概率的计算分为:距离相似分析和速度相似分析,dp1-p2表示从p1到p2的真实行驶距离;表示从p1的候选点到p2的候选点之间的最短路径长度,这里有四种组合:两者距离越接近,则距离相似度越高;(5)速度相似分析可以被描述为路段速度限制和车辆平均速度之间的余弦值,这两个速度越相似,则余弦值越接近1;反之,余弦值则越接近0;(6)传递概率被表示为轨迹点到候选路段的距离相似度,这种相似度被假设为正态高斯分布,轨迹点到候选路段的距离越近,则传递概率值越大;(7)为了降低输出延迟,在匹配过程中使用自适应滑动窗口方法,初始时,窗口尺寸被设置为2,接着,判断窗口内的轨迹点是否能收敛:如果能收敛,则收敛点即为匹配结果,p2的候选点有最大概率,p1的候选点有最大概率,且到可达,即收敛到是匹配结果;否则,增大窗口尺寸直至找到收敛点,p3的候选点有最大概率,但到不可达,因此需要扩大窗口尺寸,直到到可达;如果一直找不到收敛点,则设置最大窗口尺寸,并将拥有最大联合概率的候选点作为匹配结果输出;(8)自适应滑动窗口算法的实现:输入参数是窗口内的轨迹序列,输出结果是匹配序列。首先,判断当前的轨迹序列是否能收敛;如果收敛的话,则此时的轨迹序列即为匹配序列,将此序列输出即可;否则,继续增加窗口尺寸,直到窗口内的轨迹序列收敛为止,但窗口的尺寸不能无限制的增大,这将会导致严重的输出延迟。因此,在每次增大窗口尺寸前,还应该判断此时是否已经到达最大窗口尺寸;如果达到最大窗口尺寸,则直接输出窗口内的匹配结果;否则,还可以继续增加窗口尺寸。(9)最后,我们将获取到的转移概率,传递概率封装,并传入在线viterbi的算法首先,构造出初始的滑动窗口;接着,利用上述的自适应滑动窗口方法去寻找收敛序列;如果收敛序列被找到,则直接将此序列输出,然后重复上述步骤继续下一次匹配过程;如果当前序列不收敛,则需要增大窗口尺寸,利用上述的自适应采样方法获得下一个轨迹点,注意,扩大窗口过程中,要判断当前窗口是否已达最大窗口尺寸,如果达到最大窗口尺寸,则直接输出窗口内的匹配结果。本发明的特点及有益效果是:本发明通过改善采样方式和匹配方式,提出一种基于隐马尔可夫模型的自适应在线地图匹配方法。首先利用自适应采样频率方法获取轨迹点;然后使用geohash算法计算轨迹点对应的候选集;接着结合道路网络的几何拓扑信息和车辆的时间速度信息,计算转移概率和传递概率;最后,利用在线viterbi算法和自适应滑动窗口方法以获得最佳匹配结果。各类基于在线地图匹配服务的应用都可以发送请求到该系统,并能快速精确的得到匹配结果,同时最大程度的降低能耗。附图说明:图1为本发明所采用的隐马尔可夫模型在地图匹配中的应用示意图。图2为本发明所述地图匹配方法的总体框架图。图3为本发明所述地图匹配方法详细流程图。图4为本发明所述自适应采样频率方法的编码示意图。图5为本发明所述获取地图匹配结果的示意图。图6为本发明所述自适应滑动窗口实现示意图。图7为本发明所述自适应滑动窗口方法的编码示意图。图8为本发明所述自适应在线地图匹配方法的编码示意图。具体实施方式gps轨迹数据对于各类基于轨迹服务的应用程序起着至关重要的作用。但由于测量误差,采样误差和电池节电要求等诸多因素,导致这些直接获得的轨迹数据并不能精确的匹配到数字地图上。基于此,需要我们能提出一种在线地图匹配方法,使其同时具有高精度,低延迟和节能的特点。为了实现上述要求,本发明需要实现以下三点技术:1)为了保证精度,本发明将同时结合空间道路网的几何信息,拓扑信息以及概率匹配的基本思想,然后利用这些综合信息完成匹配任务;2)本发明提出一种自适应采样频率方法,该方法可以使车辆根据道路状况,自适应的决定采样频率进行采样,从而使算法在保证匹配精度的同时,还可以最大程度的降低能耗;3)本发明还提出一种自适应滑动窗口方法,该方法通过根据实时路况自适应调整窗口大小来平衡精度和输出延迟;4)开发一个可视化原型系统来验证本发明兼顾了有效性、高效性和低能耗这三个特点。本发明提出了一种基于隐马尔科夫模型的自适应在线地图匹配方法,该方法融合了以下观点:1)通过结合道路路网的几何拓扑信息和车辆的时间速度信息来提高地图匹配的精度;2)提出一种自适应采样频率方法来降低能耗;3)提出一种自适应滑动窗口方法来减少输出延迟。通过实现以上观点,使得我们的在线地图匹配方法不仅可以提高匹配精度,同时还可以降低输出延迟和能源消耗。本发明的目的在于提出一种基于隐马尔可夫模型的自适应在线地图匹配框架,为各类基于轨迹的应用程序提供精确、低延迟和低能耗的在线地图匹配服务。在此体系下,各类基于轨迹的应用首先需要采集轨迹信息,然后将这些轨迹序列作为匹配系统的输入参数,接着对轨迹序列依次进行候选分析处理,概率分析处理和自适应匹配处理,最终得到轨迹序列的实时的匹配结果,并将匹配结果作为输出反馈给所需的应用。最后,利用地图服务商提供的api进行可视化呈现。匹配算法的实现:1)隐马尔可夫模型的应用。隐马尔可夫模型是一种统计模型,该模型已被证明可以有效的解决地图匹配问题,图1展示了在地图匹配场景中的隐马尔科夫过程。序列{crsi-1,crsi,…,crsn}表示隐状态,对应于地图匹配中的候选路段;序列{tpi-1,tpi,…,tpn}表示观测状态,对应于地图匹配中轨迹点;ti-1,i表示crsi-1与crsi之间的转移概率,对应于候选路段之间的转移概率;oi(tpi)表示crsi和tpi之间的传递概率,对应于轨迹点匹配在某一候选路段上的概率。2)获取轨迹点的候选集。候选集是指候选路段和候选点。候选路段被定义为那些到轨迹点的距离小于误差半径的路段。轨迹点在其相应候选路段上的投影点称为候选点。为了获得候选集,本文使用geohash算法,其核心思想是在经纬度区间进行二分法无限逼近,将经纬度坐标转化为字符串的形式。字符串中相同前缀的数量越多,两个gps点之间的距离越近。3)转移概率的计算。本发明将使用道路网络的拓扑和速度信息来计算转移概率。具体而言,拓扑信息被用于描述轨迹点与路段之间的距离相似度,这种相似性被表示为相邻两个轨迹点之间的真实距离与其候选点之间的最短距离的比值,比值越接近1的时候,说明相似度越高。速度信息被用于计算轨迹点与路段之间的速度相似度,即道路速度限制和相邻轨迹点的平均速度之间的比值。4)传递概率的计算。传递概率被用于计算轨迹点与候选路段之间的距离相似度。这种相似性满足高斯正态分布,即当轨迹点与候选点的之间距离越接近时,对应的传递概率值越大。自适应滑动窗口方法的实现:1)自适应滑动窗口方法的核心思想是根据不同的道路状况自动改变滑动窗口的尺寸。因此,匹配算法可以在精度和输出延迟之间实现动态平衡。2)初始时,窗口尺寸被设置为二。然后,根据窗口中的局部轨迹路径是否可以收敛到最左边的候选点。我们将考虑以下情况:如果能够收敛,这表示最终的匹配结果将包含该候选点。此时,我们可以将此候选点作为匹配结果输出。如果不能收敛,则表示需要继续向右增加窗口尺寸,直到找到收敛点为止。3)但如果一直找不到收敛点,则会使窗口尺寸无限增大,从而导致输出延迟增加。为了避免这个问题,本发明将最大窗口大小设置为n。当窗口大小达到n,但仍没有找到收敛点时,则需停止增加窗口尺寸。此时,与最左侧轨迹点对应的拥有最大联合概率的候选点即为匹配点。自适应采样频率方法的实现:1)自适应采样率的核心思想是车辆在不同的城市道路上能以不同的频率进行采样。因此,匹配算法可以在保证精度的同时最大限度地降低电池功耗。2)一般来讲,当车辆在城市道路上行驶时,车速通常可以反映出当前的道路情况。当车辆速度较小时,表明车辆可能遇到交通拥堵。此时,即使设定的采样间隔较大,关键信息在车辆行驶过程中也不会被忽略。同时,还能最大限度的保证匹配的准确性。反之,当车辆速度较大时,暗示算法此时可以适当减小采样间隔,从而使相邻两个轨迹点之间有足够的信息以保证匹配精度。3)基于以上观点,算法在固定采样间隔距离的前提下,可以根据当前车速动态改变采样频率。上述自适应采样频率的确定过程可以用公式表示:si=h/v。其中,si表示采样频率,v表示车速,h表示自适应采样间隔距离。发明方法的详细执行流程如下:1)基于轨迹的应用程序向地图匹配服务系统发送请求;2)系统对请求解析,并利用自适应采样频率方法采样合适的轨迹点,然后将获取的轨迹点发送到候选准备模块;3)候选准备模块接受请求,并利用geohash算法计算每个轨迹点的候选点与候选路段,并将原始轨迹点以及所对应候选集封装,转发至概率分析模块;4)概率分析模块接受请求,并利用道路网络的几何、拓扑信息,车辆的时间、速度信息来计算窗口内轨迹点的转移概率和传递概率。最后,将计算结果转发至在线匹配模块;5)在线匹配模块接受请求,利用在线viterbi算法获得最佳匹配序列。在线viterbi算法本质上是利用动态规划的思想去求解隐马尔可夫模型的预测问题,即用动态规划(dynamicprogramming)求概率最大路径(最优路径)。这时一条路径对应着一个状态序列。其中,本发明将在线viterbi算法实现过程中使用自适应滑动窗口方法,从而最大程度的减少输出延迟。最后,将匹配结果返回给发送请求的应用软件。本发明通过改善采样方式和匹配方式,提出一种基于隐马尔可夫模型的自适应在线地图匹配方法。首先利用自适应采样频率方法获取轨迹点;然后使用geohash算法计算轨迹点对应的候选集;接着结合道路网络的几何拓扑信息和车辆的时间速度信息,计算转移概率和传递概率;最后,利用在线viterbi算法和自适应滑动窗口方法以获得最佳匹配结果。各类基于在线地图匹配服务的应用都可以发送请求到该系统,并能快速精确的得到匹配结果,同时最大程度的降低能耗。为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。本发明提出了一种基于隐马尔可夫模型的绿色自适应在线地图匹配方法,总体框架图见图2,总体流程图见图3,详见下文描述(1)首先,利用自适应采样频率算法采集轨迹点,其实现如图4。输入参数是车辆速度v,时间戳t,和自适应采样间隔h。输出结果是采样的轨迹点。第一行用于计算自适应采样频率si,3-7行用于计算满足采样间隔条件的下一个轨迹点。其中,轨迹点数据格式如table1.metadataofrecord表所示,路网数据格式如表table2.metadataofroad所示。table1.metadataofrecordtable2.metadataofroad(2)在获得轨迹点之后,本发明将利用geohash算法计算每一个轨迹点的候选路段,如图5所示。轨迹点p1,p2和p3的geohash编码分别为wa2zdt,wa2zbf,wa2zff。路段e1,e2和e3的geohash编码分别为wa2zbm,wa2zbp,wa2zbd。假设误差半径r为5,则p2的候选路段为e1和e3,因为它们都有5个连续相同的字符串wa2zb。同理,p1的候选路段为e1和e2,p3的候选路段e1。为了避免过多的候选路段而导致的能源浪费现象,在此,我们设置最大候选路段数量为2。(3)接着,继续计算轨迹点的候选点,即由轨迹点向候选路段作垂线得到的垂足点。如图5,p2在e1上的候选点为在e3上的候选点为p1的候选点为c11和c21,p3的候选点为c13。(4)转移概率的计算分为:距离相似分析和速度相似分析。如图5所示,以轨迹点p1和p2为例,dp1-p2表示从p1到p2的真实行驶距离;表示从p1的候选点到p2的候选点之间的最短路径长度,这里有四种组合:两者距离越接近,则距离相似度越高。(5)速度相似分析可以被描述为路段速度限制和车辆平均速度之间的余弦值。这两个速度越相似,则余弦值越接近1;反之,余弦值则越接近0。(6)传递概率被表示为轨迹点到候选路段的距离相似度,这种相似度被假设为正态高斯分布。轨迹点到候选路段的距离越近,则传递概率值越大。(7)为了降低输出延迟,在匹配过程中使用自适应滑动窗口方法,如图6所示:初始时,窗口尺寸被设置为2,如图6(a)所示。接着,判断窗口内的轨迹点是否能收敛:如果能收敛,则收敛点即为匹配结果,如图6(a)所示,p2的候选点有最大概率,p1的候选点有最大概率,且到可达,即收敛到是匹配结果;否则,增大窗口尺寸直至找到收敛点,如图6(b)和8(c),p3的候选点有最大概率,但到不可达,因此需要扩大窗口尺寸,直到到可达;如果一直找不到收敛点,则设置最大窗口尺寸,并将拥有最大联合概率的候选点作为匹配结果输出,如图6(d)所示。(8)自适应滑动窗口算法的实现流程如图7所示:输入参数是窗口内的轨迹序列,输出结果是匹配序列。第1行被用于寻找收敛点;如果收敛点被找到,则执行第12行输出结果;否则,第2-11被执行去增加窗口尺寸。第5-9行被用于判断是否到达最大窗口尺寸;如果达到,第6-7行被执行输出匹配结果;否则,第10行被执行继续增加窗口尺寸。(9)最后,我们将获得的转移概率,传递概率封装,并传入在线viterbi的算法,其实现过程如图8所示。第1-5行被用于构造初始滑动窗口。第6行利用自适应滑动窗口方法寻找收敛点。如果收敛点被找到,则第8-19行被用于继续寻找收敛点,其中,第10-14行被用于确定是否已达最大窗口尺寸,第15-17行被用于增大窗口尺寸。第20行用于输出匹配结果。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1