一种道路情报的获取方法及装置与流程

文档序号:12589116阅读:308来源:国知局
一种道路情报的获取方法及装置与流程

本发明涉及导航技术领域,尤其涉及一种道路情报的获取方法及装置。



背景技术:

目前大量手机地图产品以及其衍生品例如导航软件,打车软件等,在运营过程中会积累大量的定位信息,一些地图生产商或者服务提供商利用这类数据进行数据挖掘工作,其中一个重要目的是通过与现有地图数据库差分比较,发现“新增道路”或者“道路发生重大变化”情报,并迅速响应此类情报,及时展开对于此类道路数据的现场采集、编辑入库等更新工作,并及时推送各类地图用户的客户端中。

其中,每条道路情报应当具备的属性信息包括:类型、等级、精确位置与范围、建议值及可靠性。为了解决上述问题,期望的数据处理技术方案需要满足以下条件:

1.能够适应海量数据,即每个省区每日太字节(TB)级数据量;

2.能够适应多种质量的传感器定位数据,具备剔除错误数据,适应低质量数据的能力;

3.能够快速处理数据,即能在远小于数据积累的时间内得到数据处理结果,例如一周收集的数据应该在小于一天内,这样才有可能在一周内更新上一周的“新增道路”数据;

4.数据处理软件系统输出的结果,即情报集合,需要满足可用的要求,即地图生产的下一环节得到情报数量和质量都是可控,并且根据重要性和可靠性筛选后,得到的数目非常有限,才能在有限的时间内进行后续工作。

现有的技术方案中较为典型的两类解决方案如下:

方案一:轨迹线与道路线匹配

第一步,按照一个用户在一个特定时间段内的轨迹点集合建立轨迹线(来 自同一个定位传感器的一系列带有时间戳的有序坐标点);

第二步,将轨迹线与已有道路数据进行“线-线”匹配;

第三步,未匹配的轨迹线,即为潜在的“新增道路线”;

第四步,由于同一路段上,可能会产生很多条轨迹线,因此还需要对第三步得到的轨迹线进行“聚合”,即将可能位于同一路段的轨迹线合并为一条轨迹线,这条合并的结果,就可以作为“新增道路线”。

然而,方案一是一种理论模型较为严谨的方案,对于少量优质的全球定位系统(Global Positioning System,GPS)定位结果数据具有较好的适应性,如高端汽车定位轨迹数据具备高精度,例如平面中误差小于10米且具有惯性导航模块进行校准);高采样频率,例如1赫兹;行为模式固定,例如绝大部分时间以较高速度行驶在铺装公路或街道上。但是对于海量且定位传感器来源不唯一的互联网应用定位数据而言,并不适用,其原因如下:

一方面,方案一无法支持海量数据。例如,典型的互联网应用定位数据量,仅在北京这样的一个城市,每日即产生上10亿条定位数据,“建立轨迹线”需要遍历所有数据并且重新整理存储,耗时并且耗磁盘巨大,仅在这一步就有可能消耗一天时间计算;另一方面,方案一无法支持低采样频率数据,例如即便解决“建立轨迹线”的效率问题,对于“轨迹线”的质量也不能保证,而且由于移动互联网应用定位数据采样频率低,同一用户的采样间隔大部分大于10秒,因此其轨迹线已经与实际道路形状相去甚远,因此,方案一的后续步骤已经毫无意义。

方案二:栅格法

栅格法即将矢量轨迹数据转换为栅格数据,即数字图像,每个像素代表地图上的小网格,例如10米乘10米。对每一个像素进行扫描,若此像素包含在已知道路线,就将此像素内的轨迹点删除。保留下来的像素集合即为“新增道路”的备选,然后对此图像进行“二值化”,“线检测”等图像识别处理,提取出来“线特征”即“新增道路线”。

由此可知,该此方案的优点在于:一方面,高效并可支持海量数据:由于扫描的像素个数是恒定的,而且判断像素是否包含在已知道路上的运算也非常简单,因此效率高度优化,并且可以通过对数据提前分块的策略进行并行分布 式计算,进一步提高其处理性能;另一方面,方案二可借助成熟的图像识别算法进行线提取,并且由于并不需要建立“轨迹线”,因此对数据的采样间隔也没有严格要求。

然而,方案二的缺点也非常致命:一方面,理论模型简陋,不支持存在立体交叉的城市中心区,由于仅仅通过平面位置是否重叠判定某轨迹点是否属于已知道路,因此若“新增道路”与大量“已知道路”密集交叉时,属于此“新增道路”的轨迹点皆被删除,而且在大型城市中心区内,道路立体密集交叉,几乎无法提取出任何有用的“新增道路”线。而对于导航地图来说,最重要的恰恰是城市区域;另一方面,仅能应用于“新增道路探测”场景,对复杂属性变化探测支持不足。



技术实现要素:

为了克服现有技术中存在的上述问题,本发明的方案提供了一种道路情报的获取方法及装置,通过对海量轨迹点数据与道路数据的差分,并通过聚类和降噪算法,发现现有导航地图数据库中的道路数据缺失或缺陷。

为了解决上述技术问题,本发明采用如下技术方案:

依据本发明的一个方面,提供了一种道路情报的获取方法,该方法包括:

实时获取预设区域内的轨迹点数据及道路数据;

获取所需提取的道路情报的情报类型,并根据所述情报类型对所述轨迹点数据和道路数据进行差分运算,获得与所述情报类型匹配且与所述道路数据不匹配的差分轨迹点;

对所述差分轨迹点进行降噪处理和聚类计算,获得包括多个差分轨迹点的聚类点组;

对所述聚类点组进行道路形状特征测试,获得可标识一道路的聚类点组;

根据可标识一道路的聚类点组获得所述预设区域内的道路情报。

其中,所述根据所述情报类型对所述轨迹点数据和道路数据进行差分运算,获得与所述情报类型匹配且与所述道路数据不匹配的差分轨迹点,具体包括:

从所述轨迹点数据中获取轨迹点的平面中误差,并删除平面中误差大于第一预设阈值的轨迹点数据,及与所述情报类型不匹配的轨迹点数据,获得过滤 后的轨迹点数据;

将所述过滤后的轨迹点数据按照地理网络进行分块,获得多个一级分块区域以及每一一级分块区域内的一级分块轨迹点组;

对每一个所述一级分块轨迹点组内的轨迹点数据与所述道路数据进行差分运算,获得一级分块轨迹点组下的差分轨迹点。

其中,当所述情报类型为新增道路时,所述对每一个所述一级分块轨迹点组内的轨迹点数据与所述道路数据进行差分运算,获得一级分块轨迹点组下的差分轨迹点,具体包括:

根据所述道路数据获取位于每一所述一级分块区域内的道路;

判断每一一级分块轨迹点组中的轨迹点到与所述轨迹点属于同一一级分块区域内的每一道路的最小垂线距离是否大于等于第二预设阈值,若判断结果为是,则所述轨迹点为差分轨迹点;或

判断每一一级分块轨迹点组中的轨迹点到与所述轨迹点属于同一一级分块区域内的每一道路的最小垂线距离处的可行驶方向,与所述轨迹点的当前航向之差的绝对值是否大于等于第三预设阈值,若判断结果为是,则所述轨迹点为差分轨迹点。

其中,所述对所述差分轨迹点进行降噪处理和聚类计算,获得包括多个差分轨迹点的聚类点组的步骤,具体包括:

对每一一级分块下的差分轨迹点,按照地理网格进行分块,获得二级分块差分轨迹点组;

判断每一二级差分块轨迹点组下的任意两个差分轨迹点之间的距离是否小于第四预设阈值;

若判断结果为是,则判断所述两个差分轨迹点的航向值之差的绝对值是否小于第五预设阈值,若判断结果为是,则所述两个差分轨迹点互为对方的直接邻居点;

依次遍历所述差分轨迹点,判断每一所述差分轨迹点的直接邻居点个数是否小于第六预设阈值;

若判断结果为是,则删除直接邻居点个数小于第六预设阈值的差分轨迹点,获得二级分块下的降噪后的差分轨迹点;

以每一所述二级分块下的降噪后的差分轨迹点为种子点,依据种子点进行聚类计算,获得一包括多个差分轨迹点的聚类点组;

判断是否存在未进行聚类的所述二级分块下的降噪后的差分轨迹点,若存在,以每一未进行聚类的所述二级分块下的降噪后的差分轨迹点为种子点,依据种子点进行聚类计算,获得一包括多个差分轨迹点的聚类点组,若不存在,停止聚类计算。

其中,依据种子点进行聚类计算,获得一包括多个差分轨迹点的聚类点组的步骤,具体包括:

依据所述种子点建立一聚类点组;

搜索所述种子点的直接邻居点,并判断所述直接邻居点与所述种子点之间的距离是否大于预设容差;

若判断结果为是,则停止对所述直接邻居点进行下一级直接邻居点搜索;

若判断结果为否,则将所述种子点的直接邻居点纳入所述聚类点组,并判断所述种子点的直接邻居点与所述种子点之间的距离是否满足预设搜索的距离条件,当满足时,对所述种子点的直接邻居点进行下一级直接邻居点搜索,直到所述聚类点组中的任意降噪后的两差分轨迹点之间最大的航向差大于所述聚类点组的预设容差,获得一聚类点组。

其中,所述对所述聚类点组进行道路形状特征测试,获得可标识一道路的聚类点组的步骤,具体包括:

判断每一聚类点组内的差分轨迹点的个数是否大于第七预设阈值;

若判断结果为是,以每一个所述聚类点组内的差分轨迹点为圆心,所述第四预设阈值为半径作圆,并合并所述圆,获得与每一个聚类点组对应的缓冲区;

计算所述缓冲区的面积,并判断所述面积是否大于预设面积阈值;

若判断结果为是,则计算每一所述聚类点组内的差分轨迹点的平均航向,并将所述平均航向作为所述缓冲区的长轴所在方向;

依据所述长轴获取与所述长轴相垂直的短轴,并判断所述长轴与所述短轴的长度之比是否大于第八预设阈值,

若判断结果为是,则所述缓冲区的形状在视觉上近似线状;

当所述缓冲区的形状在视觉上近似线状时,判断所述缓冲区的长轴的长度 是否大于第九预设阈值;

若判断结果为是,则所述聚类点组可标识一道路。

其中,当所述道路情报的要素包括类型、等级、位置、建议值和可靠性值时,根据可标识一道路的聚类点组获得所述预设区域内的道路情报,具体包括:

根据所述聚类点组中的差分轨迹点的个数及与所述聚类点组相对应的缓冲区的面积,获取所述道路情报的等级;

获取与所述聚类点组对应的缓冲区的几何中心,并将所述几何中心作为获得所述道路情报的位置;

对所述聚类点组内的差分轨迹点的数据求平均值获得所述道路情报的建议值;

根据所述建议值获取所述道路情报的标准差,并以所述标准差的反比作为所述道路情报的可靠性值。

依据本发明的另一个方面,还提供了一种道路情报的获取装置,包括:

数据输入模块,用于实时获取预设区域内的轨迹点数据及道路数据;

差分模块,用于获取所需提取的道路情报的情报类型,并根据所述情报类型对所述轨迹点数据和道路数据进行差分运算,获得与所述情报类型匹配且与所述道路数据不匹配的差分轨迹点;

聚类模块,对所述差分轨迹点进行降噪处理和聚类计算,获得包括多个差分轨迹点的聚类点组;

测试模块,用于对所述聚类点组进行道路形状特征测试,获得可标识一道路的聚类点组;

情报构建模块,用于根据可标识一道路的聚类点组获得所述预设区域内的道路情报。

其中,所述差分模块包括:

数据过滤单元,用于从所述轨迹点数据中获取轨迹点的平面中误差,并删除平面中误差大于第一预设阈值的轨迹点数据,及与所述情报类型不匹配的轨迹点数据,获得过滤后的轨迹点数据;

一级分块单元,用于将所述过滤后的轨迹点数据按照地理网络进行分块,获得多个一级分块区域以及每一一级分块区域内的一级分块轨迹点组;

差分单元,用于对每一个所述一级分块轨迹点组内的轨迹点数据与所述道路数据进行差分运算,获得一级分块轨迹点组下的差分轨迹点。

其中,当所述情报类型为新增道路时,所述差分单元包括:

第一获取子单元,用于根据所述道路数据获取位于每一所述一级分块区域内的道路;

第一判断子单元,用于判断每一一级分块轨迹点组中的轨迹点到与所述轨迹点属于同一一级分块区域内的每一道路的最小垂线距离是否大于等于第二预设阈值,若判断结果为是,则所述轨迹点为差分轨迹点;或

第二判断子单元,用于判断每一一级分块轨迹点组中的轨迹点到与所述轨迹点属于同一一级分块区域内的每一道路的最小垂线距离处的可行驶方向,与所述轨迹点的当前航向之差的绝对值是否大于等于第三预设阈值,若判断结果为是,则所述轨迹点为差分轨迹点。

其中,所述聚类模块包括:

二级分块单元,用于对每一一级分块下的差分轨迹点,按照地理网格进行分块,获得二级分块差分轨迹点组;

第一判断单元,用于判断每一二级差分块轨迹点组下的任意两个差分轨迹点之间的距离是否小于第四预设阈值;

第二判断单元,用于若判断结果为是,则判断所述两个差分轨迹点的航向值之差的绝对值是否小于第五预设阈值,若判断结果为是,则所述两个差分轨迹点互为对方的直接邻居点;

第三判读单元,用于依次遍历所述差分轨迹点,判断每一所述差分轨迹点的直接邻居点个数是否小于第六预设阈值;

删除单元,用于若判断结果为是,则删除直接邻居点个数小于第六预设阈值的差分轨迹点,获得二级分块下的降噪后的差分轨迹点;

第一聚类单元,用于以每一所述二级分块下的降噪后的差分轨迹点为种子点,依据种子点进行聚类计算,获得一包括多个差分轨迹点的聚类点组;

第二聚类单元,用于判断是否存在未进行聚类的所述二级分块下的降噪后的差分轨迹点,若存在,以每一未进行聚类的所述二级分块下的降噪后的差分轨迹点为种子点,依据种子点进行聚类计算,获得一包括多个差分轨迹点的聚 类点组,若不存在,停止聚类计算。

其中,所述第一聚类单元包括:

创建子单元,用于依据所述种子点建立一聚类点组;

第一搜索子单元,用于搜索所述种子点的直接邻居点,并判断所述直接邻居点与所述种子点之间的距离是否大于预设容差;

第一处理子单元,用于若判断结果为是,则停止对所述直接邻居点进行下一级直接邻居点搜索;

第二处理子单元,用于若判断结果为否,则将所述种子点的直接邻居点纳入所述聚类点组,并判断所述种子点的直接邻居点与所述种子点之间的距离是否满足预设搜索的距离条件,当满足时,并对所述种子点的直接邻居点进行下一级直接邻居点搜索,直到所述聚类点组中的任意降噪后的两差分轨迹点之间最大的航向差大于所述聚类点组的预设容差,获得一聚类点组。

其中,所述测试模块包括:

个数判断子单元,用于判断每一聚类点组内的差分轨迹点的个数是否大于第七预设阈值;

缓冲区获取子单元,用于若判断结果为是,以每一个所述聚类点组内的差分轨迹点为圆心,所述第四预设阈值为半径作圆,并合并所述圆,获得与每一个聚类点组对应的缓冲区;

面积判断子单元,用于计算所述缓冲区的面积,并判断所述面积是否大于预设面积阈值;

长轴计算子单元,用于若判断结果为是,则计算每一所述聚类点组内的差分轨迹点的平均航向,并将所述平均航向作为所述缓冲区的长轴所在方向;

线状判读子单元,用于依据所述长轴获取与所述长轴相垂直的短轴,并判断所述长轴与所述短轴的长度之比是否大于第八预设阈值,若判断结果为是,则所述缓冲区的形状在视觉上近似线状;

长轴判断子单元,用于当所述缓冲区的形状在视觉上近似线状时,判断所述缓冲区的长轴的长度是否大于第九预设阈值;若判断结果为是,则所述聚类点组聚类点组可标识一道路。

其中,所述情报构建模块包括:

等级获取单元,用于根据所述聚类点组中的差分轨迹点的个数及与所述聚类点组相对应的缓冲区的面积,获取所述道路情报的等级;

位置获取单元,用于获取与所述聚类点组对应的缓冲区的几何中心,并将所述几何中心作为获得所述道路情报精确位置;

建议值获取单元,用于对所述聚类点组内的差分轨迹点的数据求平均值获得所述道路情报的建议值;

可靠性获取单元,用于根据所述建议值获取所述道路情报的标准差,并以所述标准差的反比作为所述道路情报的可靠性值。

本发明的有益效果是:

本发明的道路情报的获取方法,通过实时获取海量轨迹点数据和道路数据,将轨迹点数据与道路数据进行差分运算,并通过降噪和聚类算法获得可标识一道路的聚类点组,进而获取道路情报。因此,本发明的道路情报的获取方法,适用于海量且定位传感器来源不一的互联网应用定位数据,并且同样可发现存在立体交叉的城市的中心地区的道路情报。此外,由于采用了轨迹点与道路线矢量匹配的思路,所以不需要建立所谓轨迹线,因此定位数据的采样频率没有要求,进而提升了导航地图更新生产的响应速度。

附图说明

图1表示本发明实施例的道路情报的获取方法的流程图;

图2表示本发明实施例的道路情报的获取装置结构框图;

图3表示本发明实施例的差分模块的结构框图;

图4表示本发明实施例的差分单元的结构框图;

图5表示本发明实施例的聚类模块的结构框图;

图6表示本发明实施例的第一聚类单元的结构框图;

图7表示本发明实施例的测试模块的结构框图;

图8表示本发明实施例的情报构建模块的结构框图;

图9表示本发明实施例的聚类计算的原理示意图;

图10表示本发明实施例的道路情报的获取方法整体原理示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

实施例一

依据本发明实施例的一个方面,提供了一种道路情报的获取方法,该方法首先,实时获取预设区域内的轨迹点数据及道路数据;接着,获取所需提取的道路情报的情报类型,并根据所述情报类型对所述轨迹点数据和道路数据进行差分运算,获得与所述情报类型匹配且与所述道路数据不匹配的差分轨迹点;再次,对所述差分轨迹点进行降噪处理和聚类计算,获得包括多个差分轨迹点的聚类点组;再次,对所述聚类点组进行道路形状特征测试,获得可标识一道路的聚类点组;最后,根据可标识一道路的聚类点组获得所述预设区域内的道路情报。

因此,本发明实施例的道路情报的获取方法,通过大量轨迹点数据与现有道路数据实时差分,并通过降噪和聚类算法提取“新增道路”或者“道路发生重大变化”情报。

如图1所示,该方法包括:

步骤S11、实时获取预设区域内的轨迹点数据及道路数据。

其中,轨迹点数据来自移动互联网应用的用户定位轨迹数据,且每条轨迹点数据一般包含以下要素:

1、用户身份标识号(ID),即匿名标识,用于识别同一用户所产生的轨迹点);

2、时间戳,一般精确到秒;

3、当前平面定位结果,包括经度和纬度;

4、定位的平面中误差;

5、当前速度;

6、当前航向。

此外,在本发明的常见应用场景中,一般为至少1日至1月一个省份的所 有用户定位轨迹数据,常见的数据规模为10亿~300亿条轨迹数据。

对于道路数据,通过从导航地图生产单位维护的最新道路数据库获取,且该数据库一般为大型商用关系型数据库。本发明实施例的道路情报的获取方法中所述的“道路情报”即为了提示现实变化与已知导航道路数据库的差异,通过提取“道路情报”,响应“情报”,目的也是快速地更新此数据库。

此外,道路数据的道路要素为本发明实施例的道路情报的获取方法的核心要素,只有道路要素数据足够新,通过本发明实施例的道路情报的获取方法才能给出最接近现实的引导计算,而且道路要素的主要信息被存储在道路表中,其核心概念模型为,每条道路要素表示为一个有向图的边,连接两个道路交叉点,其重要属性包含:

1、几何表示,多有序形状点表示的点串;

2、通行方向;

3、等级,例如国道、省道、县道;

4、形态,例如快速路、辅路、服务区、匝道、内部道路、隧道;

5、通行速度或速度限制。

上述所述的道路重要属性,将海量轨迹点数据进行差分运算,用于发现海量轨迹点在统计意义上与已知道路属性的显著差异。

步骤S13、获取所需提取的道路情报的情报类型,并根据所述情报类型对所述轨迹点数据和道路数据进行差分运算,获得与所述情报类型匹配且与所述道路数据不匹配的差分轨迹点。

其中,步骤S13具体包括:

从所述轨迹点数据中获取轨迹点的平面中误差,并删除平面中误差大于第一预设阈值的轨迹点数据,及与所述情报类型不匹配的轨迹点数据,获得过滤后的轨迹点数据;

将所述过滤后的轨迹点数据按照地理网络进行分块,获得多个一级分块区域以及每一一级分块区域内的一级分块轨迹点组;

对每一个所述一级分块轨迹点组内的轨迹点数据与所述道路数据进行差分运算,获得一级分块轨迹点组下的差分轨迹点。

由于需要获取不同类型的道路情报,因此在对轨迹点数据和道路数据进行 差分运算的时候,也应具有不同的差分策略或差分方法,例如,当情报类型为新增道路时,所述对每一个所述一级分块轨迹点组内的轨迹点数据与所述道路数据进行差分运算,获得一级分块轨迹点组下的差分轨迹点,具体包括:

根据所述道路数据获取位于每一所述一级分块区域内的道路;

判断每一一级分块轨迹点组中的轨迹点到与所述轨迹点属于同一一级分块区域内的每一道路的最小垂线距离是否大于等于第二预设阈值,若判断结果为是,则所述轨迹点为差分轨迹点;或

判断每一一级分块轨迹点组中的轨迹点到与所述轨迹点属于同一一级分块区域内的每一道路的最小垂线距离处的可行驶方向,与所述轨迹点的当前航向之差的绝对值是否大于等于第三预设阈值,若判断结果为是,则所述轨迹点为差分轨迹点。

其中,若某一道路在拐角处附近存在一轨迹点,则该轨迹点到该道路的垂线距离存在多个,因此,本发明实施例的道路情报的获取方法中,需要获取的是多个垂线距离中最小的一个,当该最小垂线距离大于等于第二预设阈值时,该轨迹点与该道路不匹配,当该轨迹点与同该轨迹点属于同一分块区域内的道路均无法匹配时,该轨迹点为差分轨迹点。

或者,还可通过判断轨迹点对与该轨迹点属于同一分块区域内的每一道路的最小垂线距离处的可行驶方向之差的绝对值是否大于等于第三预设阈值,来判断该轨迹点是否为差分轨迹点。

本发明实施例的道路情报的获取方法中,由于轨迹点数据量大且质量不可控,因此在对轨迹点数据和道路数据的差分运算中,首先需要对轨迹点数据进行数据“过滤”,仅提取与情报类型相匹配的轨迹点数据,过滤明显质量不符合要求的数据,并且可以大幅减少数据量,更有利于后期处理效率提升。

对于其中的“过滤方法”,一方面,将轨迹点数据中平面中误差大于第一预设阈值的轨迹点剔除,例如一般道路的宽度为10米~50米,则若某一轨迹点的中误差大于20米,即可认为此点的定位精度差,可以剔除;另一方面,需要根据情报类型对轨迹点数据进行筛选,例如某次数据处理需要提取的情报类型为“新增公路”,即不关心内部道路,那么可以对轨迹点的“速度”属性进行过滤,小于某个阈值,例如15千米/小时(km/h)的,认为其在统计意义 上位于内部道路,对此类轨迹点应该剔除。

然而,经过数据过滤后,尽管数据量大幅减少,但是仍然属于海量数据,即无法直接读入计算机内存一次性分析处理。因此必须将海量轨迹点分块,分块的数据量大小应以一次性能够载入计算机内存为准。其中,每一个一级分块区域包含轨迹点数据量和已知道路数据。

由于轨迹数据点相互之间距离越近,关系越强,距离越远,关系越弱。因此,常用的分块策略是按照地理网格进行分块。分块越小,降低单次处理的数据量的作用越明显,但如果分块过小,则碎片化严重,会影响后续处理的效果。经过实践总结,一般应用10km*10km至30km*30km的分块大小。

轨迹点数据进行一级分块后,可以忽略块与块之间的关系,单独进行处理,也就是说可以利用映射/归约(Map/Reduce)等大数据架构进行分布式进行处理,从架构上保证海量数据的快速处理。

对于每一个一级分块区域内的一级分块轨迹点组,需要与该分块区域内的道路数据进行差分运算,其中应用的差分算法即为导航应用中常见的“地图匹配”装置的逆向应用。

其中,“地图匹配”介绍如下:

假设A为一轨迹点,其位置为(x,y),而当前地图分块中具有L1,L2,…,Ln等n个道路段,其中,x和y代表轨迹点A的位置坐标值,L1,L2,…,Ln代表不同的道路段。一般性的,若A点满足:

1、A的位置(x,y)距离到某个道路段Li的垂直距离小于第二预设阈值,其中,第二预设阈值一般是道路宽度的二分之一,且i取正整数;

2、A与Li的最近点,即垂足所代表的道路段Li的当前航向,与A点的当前航向值之差绝对值,应小于第三预设阈值,其中,第三预设阈值一般设为30度;

即可认为A点与Li匹配成功。假设A点与当前一级分块区域内的所有道路皆无法匹配,则认为A点为“差分轨迹点”。

因为在进行差分运算之间,在本发明实施例的道路情报的获取方法已经依据情报类型对轨迹点数据进行了筛选,因此每次数据处理执行本发明实施例的方法只能得到特定类型的一类情报。例如,情报类型为“道路通行速度发生显 著改变”,则当前速度应不大于道路段的最大可能通行速度的轨迹点被识别为差分轨迹点,因此由此类轨迹点组合成的点集合,可以用来提取“道路通行速度发生显著改变”的情报。

步骤S15、对所述差分轨迹点进行降噪处理和聚类计算,获得包括多个差分轨迹点的聚类点组。

其中,假设原始轨迹点数据质量非常可靠,定位精度在10米内,那么“差分轨迹点”都将位于“新增道路”或者“道路属性发生重大变化”的路边,但由于移动互联网用户设备的多样性,系统无法准确评估其数据质量,例如“平面定位中误差”本身就是统计估值,也具有不确定性,因此经过差分处理得到的“差分轨迹点”集合包含了大量的噪音,即由于数据质量低而无法成功与道路匹配的轨迹点。因此,本发明实施例的道路情报的获取方法,需要对获得的差分轨迹点进行降噪处理和聚类计算。

其中,步骤S15具体包括:

对每一一级分块下的差分轨迹点,按照地理网格进行分块,获得二级分块差分轨迹点组;

判断每一二级差分块轨迹点组下的任意两个差分轨迹点之间的距离是否小于第四预设阈值;

若判断结果为是,则判断所述两个差分轨迹点的航向值之差的绝对值是否小于第五预设阈值,若判断结果为是,则所述两个差分轨迹点互为对方的直接邻居点;

依次遍历所述差分轨迹点,判断每一所述差分轨迹点的直接邻居点个数是否小于第六预设阈值;

若判断结果为是,则删除直接邻居点个数小于第六预设阈值的差分轨迹点,获得二级分块下的降噪后的差分轨迹点;

以每一所述二级分块下的降噪后的差分轨迹点为种子点,依据种子点进行聚类计算,获得一包括多个差分轨迹点的聚类点组;

判断是否存在未进行聚类的所述二级分块下的降噪后的差分轨迹点,若存在,以每一未进行聚类的所述二级分块下的降噪后的差分轨迹点为种子点,依据种子点进行聚类计算,获得一包括多个差分轨迹点的聚类点组,若不存在, 停止聚类计算。

其中,依据种子点进行聚类计算,获得一包括多个差分轨迹点的聚类点组的步骤,具体包括:

依据所述种子点建立一聚类点组;

搜索所述种子点的直接邻居点,并判断所述直接邻居点与所述种子点之间的距离是否大于预设容差;

若判断结果为是,则停止对所述直接邻居点进行下一级直接邻居点搜索;

若判断结果为否,则将所述种子点的直接邻居点纳入所述聚类点组,并判断所述种子点的直接邻居点与所述种子点之间的距离是否满足预设搜索的距离条件,当满足时,对所述种子点的直接邻居点进行下一级直接邻居点搜索,直到所述聚类点组中的任意降噪后的两差分轨迹点之间最大的航向差大于所述聚类点组的预设容差,获得一聚类点组。

本发明实施例的道路情报的获取方法中,对每一个一级分块区域内的轨迹点数据和道路数据进行差分运算后,获得的每一个一级分块区域内的差分轨迹点的数据规模约为原始数据量的10%,但对于聚类搜索来说,仍然过大。在说明“一级分块”时已经分析了平面分块的可行性,因此,在此处可以进一步进行分块,降低聚类搜索的运算量,称为“二级分块”。二级分块的大小若为一级分块的1/t,则搜索运算量可降低至{(n/3(t^2))}!,其中,n表示一级分块区域内的差分轨迹点的个数,且t为正整数。然而,二级分块也不能过小,假设系统数据处理的设定为小于100米的道路情报不做处理,那么分块的大小就不能小于100米。实践总结,通常设为500米至1千米较为合理。

本发明实施例的道路情报的获取方法中,二级分块之后,对于每一个二级分块区域内的差分轨迹点的降噪处理和聚类计算均是并行处理,而且每一个二级分块区域之间均不相互干扰。

此外,位于二级分块区域内的多个差分轨迹点之间具有一定的关系,例如,任意两个差分轨迹点之间的距离和航向值之差的绝对值满足预设条件,则两个差分轨迹点之间具有直接邻居关系。因此,附近没有“邻居”或者“邻居”很少的差分轨迹点可以被称为“视觉噪点”。视觉噪点很容易被剔除,因此本发明实施例的道路情报的获取方法,通过判断每个差分轨迹点的“直接邻居”个 数,若少于第六预设阈值,则认为是视觉噪点,直接剔除,若超过此阈值,则停止遍历。实践总结,剔除视觉噪点后的差分轨迹点数量通常约是剔除前的1/3,进一步减少了本发明实施例的道路情报的获取方法的运算量,进而提升运算速度。

此外,在直接邻居点的搜索过程中,还可预先设定一个距离条件,例如假设优先递归搜索距离超过5米的点,若二级分块的大小为1千米,则搜索的次数应该是最多不超过200的平方(1千米/5米=200),由于搜索过程中,对航向差值是有约束的,因此搜索延伸的方向应当固定在一个范围,不会出现反复,因此可以认为,时间规模不会超过200的平方(1千米/5米=200)。数学表达式可以归纳为(s/d)^2。其中s为二级分块大小,d为邻居搜索时的深度优先距离,进一步减小了运算量。

为了能够获得道路情报,需要对每一个二级分块下的降噪后的差分轨迹点进行聚类计算,聚类计算的具体原理如图9所示,假设一个二级分块降噪后包括的差分轨迹点为A、B、C、D、B1、B2、C1、C2、D1、D2,其中,字母之间的线段表示两个字母之间是直接邻居关系,且位于同一个圆内的字母代表属于同一聚类点组。

在本发明实施例的道路情报的获取方法中,对如图9所示的多个差分轨迹点进行聚类计算的具体步骤如下:

步骤801:以A~D2每一个点为种子,依次创建10个聚类点组;

步骤802:搜索A的直接邻居点,发现为B和C,并判断B、C分别与A之间的距离是否大于预设容差,发现并不大于,则将B和C纳入第一聚类点组中;

步骤803:搜索B和C的直接邻居点,发现为B1、B2、C1、C2,并依次判断B1、B2、C1、C2与A之间的距离是否超过了预设容差;发现C2超过了,而其他未超过,则将B1、B2、C1纳入第一聚类点组中,并停止搜索,获得一个聚类点组;

步骤804:接着对B点为种子点,搜索其直接邻居,发现搜索到的A,B1,B2已经在步骤802,803的时候,记录到B点的“直接邻居列表”中,因此,没有发现新的直接邻居,则B为种子点的搜索结束,也就是这一个点组无效;

步骤805:接着对B1,B2,C1,C2依次作为种子点,重复步骤804,发现以B1,B2和C1为种子点创建的聚类点组均无效;

步骤806:对D点的直接邻居进行搜索,发现为D1和D2,且D1和D2与A之间的距离未超过容差,则将D1和D2纳入第二聚类点组;

步骤807:发现所有点都已经作为种子点搜索过,则循环停止,最终得到A,D两个聚类点组,即如图8所示的第一聚类点组和第二聚类点组。

步骤S17、对所述聚类点组进行道路形状特征测试,获得可标识一道路的聚类点组。

在步骤S15中获得的聚类点组还不能明确代表一个缺失路段,因此,有必要对聚类点组进行道路形状特征测试,筛选出真正能够代表“缺失道路形状”的聚类点组。

具体地,步骤S17包括:

判断每一聚类点组内的差分轨迹点的个数是否大于第七预设阈值;

若判断结果为是,以每一个所述聚类点组内的差分轨迹点为圆心,所述第四预设阈值为半径作圆,并合并所述圆,获得与每一个聚类点组对应的缓冲区;

计算所述缓冲区的面积,并判断所述面积是否大于预设面积阈值;

若判断结果为是,则计算每一所述聚类点组内的差分轨迹点的平均航向,并将所述平均航向作为所述缓冲区的长轴所在方向;

依据所述长轴获取与所述长轴相垂直的短轴,并判断所述长轴与所述短轴的长度之比是否大于第八预设阈值,若判断结果为是,则所述缓冲区的形状在视觉上近似线状;

当所述缓冲区的形状在视觉上近似线状时,判断所述缓冲区的长轴的长度是否大于第九预设阈值;

若判断结果为是,则所述聚类点组可标识一道路。

对获得的多个聚类点组进行测试完毕后,筛选出了多个真正能够代表“道路形状”的聚类点组。对于多个合格的聚类点组,可采用差分轨迹点聚类分组表的形式进行存储,具体地,如下表所示:

表1:差分轨迹点聚类分组表

因此,可以对差分轨迹点聚类分组表中的对每条记录,根据情报类型来构相应道路情报。由于此表是按照地理信息数据的标准设计的,因此可以通过通用的地图制图软件进行可视化。

步骤S19、根据可标识一道路的聚类点组获得所述预设区域内的道路情报。

其中,步骤S19具体包括:

根据所述聚类点组中的差分轨迹点的个数及与所述聚类点组相对应的缓冲区的面积,获取所述道路情报的等级;

获取与所述聚类点组对应的缓冲区的几何中心,并将所述几何中心作为获得所述道路情报的位置;

对所述聚类点组内的差分轨迹点的数据求平均值获得所述道路情报的建议值;

根据所述建议值获取所述道路情报的标准差,并以所述标准差的反比作为所述道路情报的可靠性值。

根据步骤S17获得的合格的聚类点组,构建并输出“导航地图道路情报表”即相应类型的道路情报,其中,每条情报来自“差分轨迹点聚类分组表”的一条记录,并且需要包含以下要素:

1、类型,如新增道路,道路行驶方向改变等;

2、等级,即重要性:可结合聚类点组中的差分轨迹点个数,缓冲区的面积大小,以及缓冲区的长轴长度,给出一个等级计算函数,与此三个变量正相关:点数越多证明此构建此情报的源数据量大,缓冲区面积越大证明此情报的 覆盖面积大,缓冲区长度越长证明此情报对应的道路长度较长。因此,等级计算函数的设计规则为:等级与差分轨迹点聚类分组表中的PointsOfDiff,Buffer面积,TrackLength皆成正比。

3、位置,如精确位置与范围:即差分轨迹点聚类分组表中的Buffer字段,差分轨迹点聚类分组缓冲多边形面。可以通过对Buffer多边形求几何中心,外接多边形等建立空间索引,便于空间查询。

4、建议值:可以通过对分组内的轨迹点对应属性求平均值得到;例如:情报类型为“行驶方向更新”时,对聚类分组内的“差分轨迹点”的“行驶方向”求平均值,即为情报的“建议值”。

5、可靠性:可靠性是一个统计概念,类似于“置信水平”。可使用标准差结合“建议值”计算来估计,标准差越小,则可靠性越高。

至此,本发明实施例的道路情报的获取方法可获得相应类型的道路情报。根据情报的各个要素,可以进行查询,排序,业务人员可以根据业务需要,进行情报处理的资源调度:例如,按照类型发布给不同单位或者部门,按照位置分派给相关处理人员,按等级、可靠进行优先级排序。整个“情报”的产生和处理过程中,数量、质量、资源,时间皆可控。

综上所述的本发明实施例的道路情报的获取方法的整理原理示意图,如图10所示,通过该方法,可通过采集的海量轨迹点数据快速获取不同类型的道路情报,以便于及时更新导航系统,便于用户使用。

实施例二

依据本发明的另一个方面,还提供了一种道路情报的获取装置,如图2所示,该装置200包括:

数据输入模块201,用于实时获取预设区域内的轨迹点数据及道路数据;

差分模块203,用于获取所需提取的道路情报的情报类型,并根据所述情报类型对所述轨迹点数据和道路数据进行差分运算,获得与所述情报类型匹配且与所述道路数据不匹配的差分轨迹点;

聚类模块205,对所述差分轨迹点进行降噪处理和聚类计算,获得包括多个差分轨迹点的聚类点组;

测试模块207,用于对所述聚类点组进行道路形状特征测试,获得可标识 一道路的聚类点组;

情报构建模块209,用于根据可标识一道路的聚类点组获得所述预设区域内的道路情报。

可选地,如图3所示,所述差分模块203包括:

数据过滤单元2031,用于从所述轨迹点数据中获取轨迹点的平面中误差,并删除平面中误差大于第一预设阈值的轨迹点数据,及与所述情报类型不匹配的轨迹点数据,获得过滤后的轨迹点数据;

一级分块单元2032,用于将所述过滤后的轨迹点数据按照地理网络进行分块,获得多个一级分块区域以及每一一级分块区域内的一级分块轨迹点组;

差分单元2033,用于对每一个所述一级分块轨迹点组内的轨迹点数据与所述道路数据进行差分运算,获得一级分块轨迹点组下的差分轨迹点。

可选地,如图4所示,当所述情报类型为新增道路时,所述差分单元2033包括:

第一获取子单元20331,用于根据所述道路数据获取位于每一所述一级分块区域内的道路;

第一判断子单元20332,用于判断每一一级分块轨迹点组中的轨迹点到与所述轨迹点属于同一一级分块区域内的每一道路的最小垂线距离是否大于等于第二预设阈值,若判断结果为是,则所述轨迹点为差分轨迹点;或

第二判断子单元20333,用于判断每一一级分块轨迹点组中的轨迹点到与所述轨迹点属于同一一级分块区域内的每一道路的最小垂线距离处的可行驶方向,与所述轨迹点的当前航向之差的绝对值是否大于等于第三预设阈值,若判断结果为是,则所述轨迹点为差分轨迹点。

可选地,如图5所示,所述聚类模块205包括:

二级分块单元2051,用于对每一一级分块下的差分轨迹点,按照地理网格进行分块,获得二级分块差分轨迹点组;

第一判断单元2052,用于判断每一二级差分块轨迹点组下的任意两个差分轨迹点之间的距离是否小于第四预设阈值;

第二判断单元2053,用于若判断结果为是,则判断所述两个差分轨迹点的航向值之差的绝对值是否小于第五预设阈值,若判断结果为是,则所述两个 差分轨迹点互为对方的直接邻居点;

第三判读单元2054,用于依次遍历所述差分轨迹点,判断每一所述差分轨迹点的直接邻居点个数是否小于第六预设阈值;

删除单元2055,用于若判断结果为是,则删除直接邻居点个数小于第六预设阈值的差分轨迹点,获得二级分块下的降噪后的差分轨迹点;

第一聚类单元2056,用于以每一所述二级分块下的降噪后的差分轨迹点为种子点,依据种子点进行聚类计算,获得一包括多个差分轨迹点的聚类点组;

第二聚类单元2057,用于判断是否存在未进行聚类的所述二级分块下的降噪后的差分轨迹点,若存在,以每一未进行聚类的所述二级分块下的降噪后的差分轨迹点为种子点,依据种子点进行聚类计算,获得一包括多个差分轨迹点的聚类点组,若不存在,停止聚类计算。

可选地,如图6所示,所述第一聚类单元2056包括:

创建子单元20561,用于依据所述种子点建立一聚类点组;

第一搜索子单元20562,用于搜索所述种子点的直接邻居点,并判断所述直接邻居点与所述种子点之间的距离是否大于预设容差;

第一处理子单元20563,用于若判断结果为是,则停止对所述直接邻居点进行下一级直接邻居点搜索;

第二处理子单元20564,用于若判断结果为否,则将所述种子点的直接邻居点纳入所述聚类点组,并判断所述种子点的直接邻居点与所述种子点之间的距离是否满足预设搜索的距离条件,当满足时,对所述种子点的直接邻居点进行下一级直接邻居点搜索,直到所述聚类点组中的任意降噪后的两差分轨迹点之间最大的航向差大于所述聚类点组的预设容差,获得一聚类点组。

可选地,如图7所示,其特征在于,所述测试模块207包括:

个数判断子单元2071,用于判断每一聚类点组内的差分轨迹点的个数是否大于第七预设阈值;

缓冲区获取子单元2072,用于若判断结果为是,以每一个所述聚类点组内的差分轨迹点为圆心,所述第四预设阈值为半径作圆,并合并所述圆,获得与每一个聚类点组对应的缓冲区;

面积判断子单元2073,用于计算所述缓冲区的面积,并判断所述面积是 否大于预设面积阈值;

长轴计算子单元2074,用于若判断结果为是,则计算每一所述聚类点组内的差分轨迹点的平均航向,并将所述平均航向作为所述缓冲区的长轴所在方向;

线状判读子单元2075,用于依据所述长轴获取与所述长轴相垂直的短轴,并判断所述长轴与所述短轴的长度之比是否大于第八预设阈值,若判断结果为是,则所述缓冲区的形状在视觉上近似线状;

长轴判断子单元2076,用于当所述缓冲区的形状在视觉上近似线状时,判断所述缓冲区的长轴的长度是否大于第九预设阈值;若判断结果为是,则所述聚类点组聚类点组可标识一道路。

可选地,如图8所示,所述情报构建模块209包括:

等级获取单元2091,用于根据所述聚类点组中的差分轨迹点的个数及与所述聚类点组相对应的缓冲区的面积,获取所述道路情报的等级;

位置获取单元2092,用于获取与所述聚类点组对应的缓冲区的几何中心,并将所述几何中心作为获得所述道路情报精确位置;

建议值获取单元2093,用于对所述聚类点组内的差分轨迹点的数据求平均值获得所述道路情报的建议值;

可靠性获取单元2094,用于根据所述建议值获取所述道路情报的标准差,并以所述标准差的反比作为所述道路情报的可靠性值。

以上所述的是本发明的优选实施方式,应当指出对于本技术领域的普通人员来说,在不脱离本发明所述的原理前提下还可以作出若干改进和润饰,这些改进和润饰也在本发明的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1