基于轨迹抽稀的路径相似度匹配方法、设备及存储介质与流程

文档序号:32068548发布日期:2022-11-05 01:32阅读:48来源:国知局
基于轨迹抽稀的路径相似度匹配方法、设备及存储介质与流程

1.本发明涉及一种基于轨迹抽稀的路径相似度匹配方法,属于地图轨迹数据匹配技术领域。


背景技术:

2.在各类交通模型建模过程中,对道路网络的合理简化以及对道路通行能力的精细刻画对于模型运行的效率以及出行者路径行为选择的准确性有至关重要的影响。然而,由于在模型建模过程存在以下问题,容易致使路径行为选择的准确性受到影响,主要体现在:1)相当多数道路经常缺乏真实交通数据的评估,部分关键路段在建模过程中可能被赋予了错误的等级或通行能力,或被不恰当地移除;2)道路阻抗函数未能正确反映交通流特性,从而影响模型对出行路径的搜索结果。因此,在模型验证阶段,起讫点之间采用不同方式的出行路径和现实路径的整体吻合,是交通模型供给网络供给校核的关键和难点。
3.随着移动互联网和定位技术的不断发展,地图导航在日常出行中逐渐普及,在为出行者提供高效和可靠服务的同时,也为交通模型供给网络验证开辟了新的方式。通过验证模型路径和地图导航路径的匹配程度,并结合实际情况对模型进行修正,可以有效提升模型精度,降低后期模型校核阶段的非必要成本。
4.然而,由于国内大中城市道路和公共交通网络规模大,覆盖广,在供给网络验证环节,相对于“点与点”或“点与轨迹”之间的距离度量,轨迹之间的距离度量更加的复杂,需要考虑的因素也更多,例如:轨迹采样率、轨迹的时间信息和噪音等。受限于现有轨迹相似度验证算法繁杂的运算过程,往往只能随机抽取数千或几万个起讫点对来进行路径比较,在时耗方面无法满足供给模型网络及相关参数快速迭代、评估和修正的要求,也无法对模型网络进行真正的“全局诊断”。
5.为此,现有技术提出过基于最长公共子序列的轨迹相似性度量方法,即lcss,其值代表最多可被是为同一点的点数,也就是两条轨迹中满足最小距离阈值限制的轨迹点的对数。lcss算法则可以计算出两个序列之间的最长公共子序列。子序列是有序的,但不一定是连续,例如:序列x = 《b,c,d,b》是序列y =《a,b,c,b,d,a,b》的子序列,对应的下标序列为《2,3,5,7》。在使用lcss进行相似度计算前,首先需要对两组轨迹的全部轨迹点进行编号(可采用上述a\b\c\d形式),计算两个序列全部点对的相对距离,并筛选出距离小于阈值的点对,作为匹配点对,进而对匹配点对的编号进行合并。再应用lcss标准算法计算参考路径(导航路径)和对照路径(模型路径)的最长公共子串长度。lcss算法返回两个轨迹中可以被视作同一点的轨迹点数。最终采用归一化度量结果来表征两条轨迹之间的相似度。然而这种轨迹相似度判定,主要存在的缺点为:1、通过lcss标准算法计算参考路径(导航路径)和对照路径(模型路径)没有识别轨迹特征点,在过程中的各个环节均需要对大量非关键中间点进行处理。计算量大,时耗长。主要体现在:1)需要计算全部点对之间的相对距离(如导航路径中有m个点,模型路径中
有n和点,则共计算m
×
n个点对距离),当路径较长(可能有数百甚至上千个路径点)的情况下,计算量成指数级增长;同时,2)最常公共子串搜索过程所需时间也将呈指数增长。
6.2、采用单一阈值来确定两个邻近轨迹点是否可判定为同一点,在这种情况下,阈值若过大,则可能轨迹相似性评估结果存在较大误差,相似性普遍偏高。若阈值过小则可能忽略了部分局部路径选择点之间的实质近邻特征,度量得到的相似性过小。
7.基于上述陈述,亟需提出一种路径相似度匹配的快速计算方法,以减少路径相似度匹配计算量,提高路径相似度匹配精度。


技术实现要素:

8.本发明为了解决现有交通模型建模过程中,对道路网络路径的相似度匹配计算量大,路径匹配精度低的问题。在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。
9.本发明提供了基于轨迹抽稀的路径相似度匹配方法,包括以下步骤:步骤s1、获取原始轨迹点;步骤s11、从交通模型中抽取全部起讫点路径集合,其中代表起讫点为的模型路径轨迹点的经纬度坐标,t代表全部起讫点集合,分别对应模型起点和终点所在的交通小区中心;步骤s12、采用相同起讫点,利用互联网地图接口获取导航路径集合, 代表起讫点为的导航路径轨迹点的经纬度坐标;采用上述步骤s11和步骤s12并行的方式进行,从而迅速获得全部od点对之间的起讫点路径和导航路径,起讫点路径和导航路径中均包含路径轨迹点的经纬度坐标;步骤s2、投影坐标转换;将步骤s1获得的起讫点路径和导航路径中各路径轨迹点的经纬度坐标批量转换为投影坐标,从而得到投影后的起讫点路径集合和导航路径集合,和对应经过投影后模型以及互联网地图返回的轨迹点坐标;步骤s3、轨迹抽稀;使用douglas-peuker算法抽取每条路径的轨迹特征点,缩减路径轨迹点的数据规模,得到缩减后的起讫点路径数据集和导航路径数据集,和代表缩减后模型路径轨迹和互联网地图路径轨迹;步骤s4、特征点geohash编码;根据geohash的编码规则将二维的经纬度坐标映射为一维的字符串,映射完成后的一维字符串实际对应地理空间上的一个网格,通过字符串前缀匹配,快速索引到同网格或者邻近网格中的其他路径特征点;令轨迹抽稀后输出的路径特征点集合的原有地理坐标为和,其中和分别表示经过抽稀后生成的模型路径和地图路径轨迹,对和进行geohash编码,批量映射到空间栅格中;
步骤s5、相似度计算;结合相同od对之间的路径特征点geohash编码,计算全部od对之间的模型路径和导航路径相似度指标,对一个指定od对的路径相似度具体计算过程如下:步骤s51、以导航地图返回的轨迹特征点为基点集合,以模型路径搜索得到的特征点为匹配集,搜索基点附近潜在的匹配点;令,,为导航地图返回的特征点geohash编码,为模型路径特征点的geohash编码;步骤s52、对中的每一个点,采用字符串匹配的方式在的点中遍历搜索,返回顺序最大相同编码位数c,当c大于给定阈值时,对于不同编码位数,按照给定的评分机制进行评分,获得分值s,当c小于给定阈值时,分值取0;步骤s53、基于获取的全部分值计算平均分,输出最终匹配度m;计算平均分,输出最终匹配度m;,其中m是导航路径特征点和模型路径特征点数量的均值。
10.基于轨迹抽稀的路径相似度匹配设备,包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现所述的基于轨迹抽稀的路径相似度匹配方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现基于轨迹抽稀的路径相似度匹配方法。
12.本发明具有以下有益效果:1.本发明的算法各环节相对独立,不同模块均支持大规模并行计算;2.本发明结合douglas-peuker算法进行路径轨迹抽稀,一方面显著减少了后期相似度匹配所需计算点的数量,另一方面,通过对特征点的单独提取规避了非关键路径中间点的计算对整体相似度评分结果带来的干扰;3.应用geohash对特征点进行编码,在满足匹配精度的前提下,通过字符串形式的快速索引进行相对偏差等级的评定,极大提升了算法匹配和评分过程的效率;4.该算法应用使得对交通模型全局网络的校验能够在更短时间内完成,有潜力发展成为模型搭建过程的下一代标准工具。
附图说明
13.图1是一种基于轨迹抽稀的路径相似度匹配方法的流程图;图2是模型路径轨迹和导航路径轨迹匹配。
具体实施方式
14.为使本发明的目的、技术方案和优点更加清楚明了,下面通过附图中示出的具体实施例来描述本发明。但是应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
15.在实施方式中,为了便于理解本发明的技术实施过程,给出了一些缩略语和关键术语的解释具体如下:douglas-peuker算法:道格拉斯-普克算法,亦称为拉默-道格拉斯-普克算法、迭代适应点算法、分裂与合并算法,是将曲线近似表示为一系列点,并减少点的数量的一种算法,它的优点是具有平移和旋转不变性,给定曲线与阈值后,抽样结果一定。
16.geohash编码:geohash 是一种地址编码,它能把二维的经纬度编码成一维的字符串。是空间索引的一种方式,其基本原理是将地球理解为一个二维平面,通过把二维的空间经纬度数据编码为一个字符串,可以把平面递归分解成更小的子块,每个子块在一定经纬度范围内拥有相同的编码。
17.具体实施方式一:结合图1说明本实施方式,本实施方式提出基于轨迹抽稀的路径相似度匹配方法,包括以下步骤:步骤s1、获取原始轨迹点;步骤s11、从交通模型中抽取全部起讫点路径集合,其中代表起讫点为的模型路径轨迹点的经纬度坐标,t代表全部起讫点集合,分别对应模型起点和终点所在的交通小区中心;步骤s12、采用相同起讫点,利用互联网地图接口获取导航路径集合,其中代表起讫点为的导航路径轨迹点的经纬度坐标,t代表全部起讫点集合;采用上述步骤s11和步骤s12并行的方式进行,从而迅速获得全部od点对之间的起讫点路径和导航路径,起讫点路径和导航路径中均包含路径轨迹点的经纬度坐标;步骤s2、投影坐标转换;将步骤s1获得的起讫点路径和导航路径中各路径轨迹点的经纬度坐标批量转换为投影坐标(默认web-mercator投影,可结合实际城市所在的经纬度范围选择最适合的投影坐标系,从而提高精度),从而得到投影后的起讫点路径集合和导航路径集合,和对应经过投影后模型以及互联网地图返回的轨迹点坐标;步骤s3、轨迹抽稀;使用douglas-peuker算法抽取每条路径的轨迹特征点,缩减路径轨迹点的数据规模,得到缩减后的起讫点路径数据集和导航路径数据集,和代表缩减后模型路径轨迹和互联网地图路径轨迹;轨迹抽稀的重要作用在于提取路径中起到关键作用的特征点,并减少后续geohash编码和相似度计算阶段的数据规模;步骤s4、特征点geohash编码;根据geohash的编码规则将二维的经纬度坐标映射为一维的字符串,映射完成后的一维字符串实际对应地理空间上的一个网格,通过字符串前缀匹配,快速索引到同网格或者邻近网格中的其他路径特征点;令轨迹抽稀后输出的路径特征点集合的原有地理坐标为和
,其中和分别表示经过抽稀后生成的模型路径和地图路径轨迹,对和进行geohash编码,批量映射到空间栅格中(映射到格栅后的效果参考图2所示),可以极大加速相似度计算阶段的运算速度,为保证匹配精度,geohash编码取8位,当geohash编码取8位时,能够实现相似点快速计算,同时可以保证足够的空间匹配精度。
18.步骤s5、相似度计算;结合相同od对之间的路径特征点geohash编码,计算全部od对之间的模型路径和导航路径相似度指标,对一个指定od对的路径相似度具体计算过程如下:步骤s51、以导航地图返回的轨迹特征点为基点集合,以模型路径搜索得到的特征点为匹配集,搜索基点附近潜在的匹配点;令,,为导航地图返回的特征点geohash编码,为模型路径特征点的geohash编码;步骤s52、对中的每一个点,采用字符串匹配的方式在的点中遍历搜索,返回顺序最大相同编码位数c,当c大于给定阈值时,对于不同编码位数,按照给定的评分机制进行评分,获得分值s,当c小于给定阈值时,分值取0;步骤s53、基于获取的全部分值计算平均分,输出最终匹配度m;计算平均分,输出最终匹配度m;,其中m是导航路径特征点和模型路径特征点数量的均值。
19.在本实施例中,如图2所示,虚线部分为模型路径轨迹线路,图中轨迹点采用8位经纬度坐标表示(例如模型轨迹关键点的起始点坐标为:ac39b649,由8位组成),实线部分为导航路径轨迹线路,经整理后,形成下表1路径匹配度计算表:表1、路径匹配度计算表具体实施方式二:本领域内的技术人员通过上述实施例提及的系统及方法,本实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式,模块之间也可根据计算机逻辑结构进行重新组织。而且,本实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
20.根据本实施例的方法、设备(系统)、和计算机程序产品的流程图或方框图来描述
的。应理解可由计算机程序指令实现流程图或方框图中的每一流程或方框、以及流程图或方框图中的流程或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程或方框图一个方框或多个方框中指定的功能的装置。
21.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程或方框图一个方框或多个方框中指定的功能。
22.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程或方框图一个方框或多个方框中指定的功能的步骤。
23.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
24.存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。存储器是计算机可读介质的示例。
25.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
26.本实施方式只是对本专利的示例性说明,并不限定它的保护范围,本领域技术人员还可以对其局部进行改变,只要没有超出本专利的精神实质,都在本专利的保护范围内。
27.本实施方式只是对本专利的示例性说明,并不限定它的保护范围,本领域技术人员还可以对其局部进行改变,只要没有超出本专利的精神实质,都在本专利的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1