一种利用历史gps数据进行地图匹配的方法

文档序号:6248509阅读:287来源:国知局
一种利用历史gps数据进行地图匹配的方法
【专利摘要】本发明公开了一种利用历史GPS数据进行地图匹配的方法,将历史GPS点记录按车辆ID、记录时间、坐标区域组织成轨迹形式,并将轨迹转换成KML文件;将对应区域的路网数据裁剪出来并转换成KML格式文件;将得到的KML文件叠加在一起,利用标记方法为轨迹中的每一个GPS点标记其所在路段ID,此部分标记数据记为数据集A;只需为其补充方向角信息即可作为训练数据,所得标记数据记为数据集B;将得到的数据集A和第四步得到的数据集B合并作为ELM算法的训练数据集,选定部分与数据集A不相交的历史数据集作为测试数据,用寻参算法寻找ELM参数,直至预测精度最高,此时对应的ELM模型即为该区域内的地图匹配模型。
【专利说明】-种利用历史GPS数据进行地图匹配的方法

【技术领域】
[0001] 本发明涉及一种地图匹配方法,涉及一种利用历史GPS数据进行地图匹配的方 法。

【背景技术】
[0002] 在车辆导航系统中,显示在电子地图上的车辆移动轨迹反映了通过GPS测量设备 实时测量的结果。然而,导航效果会受到很多因素的影响,比如设备误差,信号强度,地理环 境,天气等。由于GPS数据不可避免地包含了很多不确定信息,显示在地图上的车辆轨迹可 能与真实轨迹不一致,因此,在进一步挖掘和分析地理信息之前,检测这些误差是很有必要 的。
[0003] 地图匹配就是利用软件方法来识别和纠正GPS采样点到对应空间路网位置的过 程。在过去20年里,地图匹配算法被深入研究,但是仍有提高空间。首先,以往的算法并未 充分利用已有信息,例如车辆方向,地图拓扑信息,历史GPS轨迹;其次,以往算法适应性较 差,有时来自地图的小偏差有可能会对匹配结果产生很大的影响,例如矢量电子地图的坐 标偏移。最后,一些算法的匹配过程很复杂,不太适合实时处理。
[0004] 本质上,地图匹配相当于模式识别过程。通过大量历史GPS轨迹数据的学习能够 总结出模式,当产生新的GPS点时能够简洁地进行匹配。考虑到数量众多的路段(标签) 和历史轨迹(训练集),我们采用极限学习机(ELM)算法来获取较高的匹配精度和较快的 匹配速度。ELM是基于单隐层前馈神经网络(singlehiddenlayerfeedforwardneural network,SLFNs) [1]算法,相比传统的神经网络算法和支持向量机(supportvector machine,SVM),ELM有更快的学习速度。在实验中,利用我们的ELM参数选择算法进行优化, 基于ELM的地图匹配方法显示出明显的优势。


【发明内容】

[0005] 本发明的目的在于克服上述技术存在的缺陷,提供一种利用历史GPS数据进行地 图匹配的方法。
[0006] 其具体技术方案为:
[0007] -种利用历史GPS数据进行地图匹配的方法,包括以下步骤:
[0008] 第一步:将历史GPS点记录按车辆ID、记录时间、坐标区域组织成轨迹形式,并将 轨迹转换成KML文件(能够直观显示在电子地图上即可);
[0009] 第二步:将对应区域的路网数据(一般为GDB格式)裁剪出来并转换成KML格式 文件(与第一步的格式一致);
[0010] 第三步:将第一步和第二步得到的KML文件叠加在一起,利用我们提出的标记方 法为轨迹中的每一个GPS点标记其所在路段ID,此部分标记数据记为数据集A(利用历史 GPS数据得到的带标签数据);
[0011] 第四步:路网数据本身带有很多道路的关键点信息,这些关键点包含坐标信息和 路段ID,只需为其补充方向角信息即可作为我们的训练数据,具体步骤如下:
[0012] 步骤1 :将⑶B格式的路网数据转换成JS0N格式(文本格式即可,方便处理);
[0013] 步骤2 :提取出每一路段内的关键点坐标、路段ID和单双道标记;
[0014] 步骤3 :利用前后关键点的坐标信息计算航向,即方向角。
[0015] 完成上述步骤以后,所得标记数据记为数据集B(利用路网得到的带标签数据);
[0016] 第五步:将第三步得到的数据集A和第四步得到的数据集B合并作为ELM算法的 训练数据集,选定部分与数据集A不相交的历史数据集作为测试数据(不带标签),用我们 的寻参算法寻找ELM参数,直至预测精度最高。此时对应的ELM模型即为该区域内的地图 匹配模型。
[0017] 优选地,所述标记方法具体为:
[0018] 第一步:根据当前标注点邻近点的位置分布粗略地判断当前点的位置,确定轨迹 的移动趋势;
[0019] 第二步:确定标记点的候选路段。在以标记点为圆心,误差距离(与GPS采样芯片 有关,本文为50米)为半径的圆形区域内覆盖的路段为该标记点的候选路段。
[0020] 第三步:根据标记点的方向角属性选择候选路段。假设路段i与正北方向夹角为 a,当标记点的方向角与a的差值的绝对值小于15度时,则标记点所在路段ID记为i。 [0021] 为路网中的关键点补充方向角属性:
[0022] 第一步:将⑶B格式的路网数据转换成JS0N格式(文本格式即可,方便处理);
[0023] 第二步:提取出每一路段内的关键点坐标、路段ID和单双道标记;
[0024] 第三步:利用前后关键点的坐标信息计算航向,即方向角。记当前的经纬度为 CurLongi、CurLatti,单位为度;下一点的经纟韦度为tgtLongi、tgtLatti,单位为度。由平面 几何的知识,计算反正切atan((tgtLongi-CurLongi) / (tgtLatti-CurLatti)),再经过象限 处理,就可得到目标航向,即当前点的方向角。
[0025] ELM寻找参数算法:
[0026]第一步:选择一个较小的隐层节点数(我们选取的是20),将其定义为基数;
[0027] 第二步:设置一个较大的增量,定义为第一增量(我们设置的第一增量为100)。在 第一增量区间内,从基数开始增加隐层节点数直到测试精度开始下降。记录该区间内达到 最大测试精度的节点数,记为4,最后的节点数记为& ;
[0028] 第三步:设置一个比第一增量小的增量,定义为第二增量(我们设置的第二增量 为50)。在第二增量区间内,从&开始增加隐层节点数直到测试精度开始下降或者节点数 超过&。记录该区间内达到最大测试精度的节点数,记为A2,最后节点数记为B2 ;
[0029] 第四步:回到第三步,直到增量为1。
[0030] 与现有技术相比,本发明的有益效果为:
[0031] 本发明是一种基于模式识别的方法来解决地图匹配问题。地图匹配问题可以看做 是多分类问题,通过极限学习机算法完成多分类可以在十分短的时间内达到很高的精度。 为了减少计算时间,我们通过网格划分使得处理过程并行化。另外,我们提出寻找ELM最优 隐层节点数算法优化原始的ELM算法,通过对数据进行归一化操作提高了匹配精度,同时 得到更稳定的结果。

【专利附图】

【附图说明】
[0032] 图1是一条出租车A的轨迹;
[0033] 图2是同一辆车在十天内的轨迹;
[0034] 图3是单隐层前馈神经网络(SLFNs)结构图;
[0035] 图4是一个划分的网格;
[0036] 图5是标签获取过程原理图;
[0037] 图6是某路段上的关键点;
[0038] 图7是ELM的最优参数。

【具体实施方式】
[0039] 下面结合具体附图和实施例对本发明的技术方案作进一步详细地说明。
[0040] 预备
[0041] 1.1 定义
[0042] 定义1 (路段):一个路段r是在两个道理结点间的路径。一个路段通常包括了一 些其他必要的属性,比如r.id表示路段r的id,r.oneway表示路段r是单向道还是双向 道。
[0043] 定义2 (GPS点):GPS点是通过GPS芯片得到的测量点,包括出租车ID,时间戳,出 租车状态,经度,纬度,出租车速度,方向角。方向角指的是出租车行进方向与正北方向的夹 角,这里角度浮动范围在〇到360度,顺时针方向增加,取整数。
[0044] 定义3 (出租车轨迹):一条轨迹包含了同一辆车在一个连续时间段内的连续的 GPS点。一辆出租车在一天内可以有多条轨迹。我们只考虑正常运营出租车的三种状态,分 别是空车(0),载客(1)和泊车(3)。
[0045] 下面两条观察结果有助于设计我们的地图匹配算法。为了避免采用误差的影响, 我们只考虑方向角在对应路段角度上下浮动15度的GPS点。
[0046] 总结1 :在单向道上,车辆只能在一个方向上行驶。在这种类型的道路上,GPS点的 方向角围绕一个定角小范围变化,这个定角由道路形状和道路位置决定。
[0047] 总结2 :在双向道上,车辆允许在两个方向上行驶。对某个道路结点,假设所在路 段与正北方向夹角是a(在0-180度内变化),因此另一个夹角是a+180度。因此,在双向 道上的GPS点的方向角分别在a和a+180周围小范围浮动。
[0048] 1. 2问题描述和精度评估标准
[0049] 假设我们得到出租车A在2012年11月1日的所有轨迹。图1显示了出租车A的 一条轨迹,很明显,很多GPS点并未在路段上。因此,识别和纠正GPS点到路网中对应路段 位置上很关键。
[0050] 通过我们的方法解决上述问题能够得到GPS点所在的路段的ID。我们采用 ACCURACY指标来衡量被正确预测的GPS点数量。CORRECT表示在测试集中被正确匹配的 GPS点,SUM表示测试集中输入的GPS点的总数。ACCURACY指标被定义如下:
[0051] ACCURACY=C0RRECT/SUM(1)
[0052] 1. 3数据集
[0053] 出租车GPS数据集
[0054] 在本研究中,使用的历史GPS数据集是由12000辆北京出租车在2012年11月 (2012年11月1日到2012年11月30日)收集到的数据,基本完整地记录了北京市出租车 的移动情况。该数据集包含了 16730个时间分隔的文本文件,每个文件包含超过20000条 离散的GPS点记录。在每个文本文件中,这些连续的记录并不相关。表1显示了数据集中 "20121110035412.txt"这个文件的部分记录。
[0055] 表1:使用的样本数据

【权利要求】
1. 一种利用历史GPS数据进行地图匹配的方法,其特征在于,包括以下步骤: 第一步:将历史GPS点记录按车辆ID、记录时间、坐标区域组织成轨迹形式,并将轨迹 转换成KML文件; 第二步:将对应区域的路网数据裁剪出来并转换成KML格式文件; 第三步:将第一步和第二步得到的KML文件叠加在一起,利用标记方法为轨迹中的每 一个GPS点标记其所在路段ID,此部分标记数据记为数据集A ; 第四步:路网数据本身带有很多道路的关键点信息,这些关键点包含坐标信息和路段 ID,只需为其补充方向角信息即可作为训练数据,所得标记数据记为数据集B ; 第五步:将第三步得到的数据集A和第四步得到的数据集B合并作为ELM算法的训练 数据集,选定部分与数据集A不相交的历史数据集作为测试数据,用寻参算法寻找ELM参 数,直至预测精度最高,此时对应的ELM模型即为该区域内的地图匹配模型。
2. 根据专利要求1所述的利用历史GPS数据进行地图匹配的方法,其特征在于,所述标 记方法具体为: 第一步:根据当前标注点邻近点的位置分布粗略地判断当前点的位置,确定轨迹的移 动趋势; 第二步:确定标记点的候选路段,在以标记点为圆心,误差距离为半径的圆形区域内覆 盖的路段为该标记点的候选路段; 第三步:根据标记点的方向角属性选择候选路段,假设路段i与正北方向夹角为a,当 标记点的方向角与a的差值的绝对值小于15度时,则标记点所在路段ID记为i。
3. 根据专利要求2所述的利用历史GPS数据进行地图匹配的方法,其特征在于,所述所 述方向角属性确定的步骤为: 第一步:将GDB格式的路网数据转换成JSON格式; 第二步:提取出每一路段内的关键点坐标、路段ID和单双道标记; 第三步:利用前后关键点的坐标信息计算航向,即方向角,记当前的经纬度为 CurLongi、CurLatti,单位为度;下一点的经纟韦度为tgtLongi、tgtLatti,单位为度;由平面 几何的知识,计算反正切 atan ((tgtLongi-CurLongi) / (tgtLatti-CurLatti)),再经过象限 处理,就可得到目标航向,即当前点的方向角。
4. 根据专利要求1所述的利用历史GPS数据进行地图匹配的方法,其特征在于,所述寻 找ELM参数算法具体为: 第一步:选择一个较小的隐层节点数,将其定义为基数; 第二步:设置一个较大的增量,定义为第一增量,在第一增量区间内,从基数开始增加 隐层节点数直到测试精度开始下降,记录该区间内达到最大测试精度的节点数,记为4,最 后的节点数记为&; 第三步:设置一个比第一增量小的增量,定义为第二增量,在第二增量区间内,从4开 始增加隐层节点数直到测试精度开始下降或者节点数超过&,记录该区间内达到最大测试 精度的节点数,记为A3,最后节点数记为B2 ; 第四步:回到第三步,直到增量为1。
【文档编号】G01C21/30GK104330089SQ201410649530
【公开日】2015年2月4日 申请日期:2014年11月17日 优先权日:2014年11月17日
【发明者】吴刚, 李慧琴, 王国仁 申请人:东北大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1