本发明属于地理要素识别与更新领域,尤其涉及一种结合osm和遥感影像提取人行天桥目标的深度学习方法。
背景技术
人行导航服务(pedestriannavigationservice,pns)需求日益增加,使得人行道路数据的采集越来越重要。人行天桥作为整个人行道路系统不可或缺的一部分,可以缓解车流、人流与城市有限的公共交通空间产生的直接矛盾。快速便捷地获取人行天桥数据,不仅是完善人行导航系统的基础,也有助于相关部门(如基础测绘部门)完成对地理要素的识别与更新。
目前,人行天桥数据的获取主要有两种方式,即利用传统的测绘手段直接采集和从openstreetmap(osm)中提取的方法。传统的测绘手段利用全站仪、gps等测绘仪器对地理要素进行采集,然而,这种方法会耗费大量的人力、物力,时间周期也较长,目前采集的地理空间数据中人行天桥信息相对较少。当前,随着web2.0的到来,使得用户自发贡献各种地理数据成为可能,goodchild将其定义为“自发地理信息”(volunteeredgeographicinformation,vgi),本发明采用的osm数据是vgi中最成功的项目之一。osm更新速度快,数据精细程度高,涵盖了机动车、人行、自行车、铁路等多种交通数据。其中人行数据中包含了大量的人行天桥信息,为人行天桥的识别和提取提供了开放的数据源。为了降低采集成本,提高数据的现势性,以osm为数据源,提出了支持向量机(supportvectormachine,svm)的方法。该方法人工选取osm数据中的部分天桥数据为样本,选取已知样本的方向角、横跨度、主桥长度和道路类别作为特征向量,训练出可以识别主桥的分类模型,然后通过一定的判定规则识别出与主桥相连的附属设施,最终识别出整个人行天桥。但是,该方法在样本和特征向量选取时受人为因素的影响,得到的结果并不能有效识别位于交叉路口处的某些复杂形状的天桥(如圆盘形),也未考虑osm数据的不完整性。
综上分析可以发现,采用现有的人行天桥识别方法难以同时兼顾数据的时效性和完整性,且svm方法中样本数据和特征向量的选取由人为选定,易受主观因素影响,导致提取结果不稳定。
技术实现要素:
针对现有技术存在的缺陷,解决现有的人行天桥识别结果不能同时兼顾数据的现势性和完整性的问题,本发明提供一种结合osm和遥感影像提取人行天桥的深度学习方法。
本发明实施方式提供一种结合osm和遥感影像提取人行天桥的深度学习方法,包括:
s1、根据所述人行天桥在开放街道地图(openstreetmap,osm)数据中的语义信息、拓扑信息和形状信息,从所述osm数据中自动识别与提取所述人行天桥;
s2、基于图像语义分割的深度神经网络模型获取所述人行天桥轮廓;
s3、对所述人行天桥进行结构建模与矢量成图;
s4、更新人行导航系统中的所述人行天桥数据。
进一步,所述步骤s1包括:
s11、根据所述语义信息进行建模;
s12、根据所述拓扑信息进行建模;
s13、根据所述形状信息进行建模。
进一步,所述步骤s2包括:
s21、构建训练样本集;
s22、将所述样本集输入至深度神经网络模型u-net进行训练,得到基于u-net的人行天桥预测网络模型;
s23、输入待检测影像至所述基于u-net的人行天桥预测网络模型,识别出待检测影像中的人行天桥轮廓信息。
s24、利用所述天桥位于主要道路之上的特征,将识别出的所述轮廓信息与所述主要道路的二值图进行叠置分析,相交部分即为人行天桥。
进一步,所述步骤s21还包括:
根据天桥矢量数据的坐标范围,利用其最小包络矩形作为掩膜对遥感影像进行裁剪,得到裁剪后的遥感影像;
对所述天桥矢量数据存图,并做二值化及膨胀处理,生成对应的掩膜图片作为其标签,将所述裁剪后的遥感影像图及对应的标签掩膜图作为所述训练样本集。
进一步,所述步骤s3包括:
对所得到的人行天桥二值图进行细化处理,提取所述人行天桥轮廓的中心线;通过栅格转矢量的操作得到所述人行天桥的矢量数据。
进一步,所述步骤s4包括:
融合osm中和遥感影像中获得的天桥矢量数据,与已有的人行道路数据进行匹配,提取出增量部分,更新步行导航数据。
本发明构建了osm辅助的人行天桥目标分割样本库,osm辅助的人行天桥目标分割样本库,结合osm和遥感影像提取人行天桥,不仅能够自动化识别osm中的人行天桥,降低了现有方法的主观性,并且利用遥感影像数据弥补osm不完整的缺点,能够同时兼顾数据的现势性和完整性,提高识别效率和准确度。
附图说明
图1是本发明实施例提供的结合osm和遥感影像提取人行天桥目标的深度学习方法的流程图;
图2为本发明实施例提供的基于openstreetmap的人行天桥自动识别方法的流程图;
图3是本发明实施例提供的人行天桥主桥部分识别算法的示意图;
图4是本发明实施例提供的osm中人行天桥识别结果示意图;
图5是本发明实施例提供的遥感影像数据中人行天桥语义分割实现方法的流程图;
图6是本发明实施例提供的训练样本集示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
实施例1
图1是根据本发明实施例的一种结合osm和遥感影像提取人行天桥的深度学习方法的流程示意图。参照图1,所述方法包括:
s1、根据所述人行天桥在开放街道地图(openstreetmap,osm)数据中的语义信息、拓扑信息和形状信息,从所述osm数据中自动识别与提取所述人行天桥,具体包括以下步骤:
s11、语义信息建模。osm数据中包含丰富的语义信息,其中就包含道路类别信息和附属信息,人行天桥附属信息为“桥”,道路类别为“人行道路”,因此可以通过osm的语义信息对人行天桥做一个筛选。
s12、拓扑信息建模。人行天桥的功能是为了缓解交通拥堵,给人们安全出行提供便利,一般设置在交通繁忙、行人稠密的快速路、主干路、次干路的路段或道路交叉口处。在osm中道路都以线的方式进行存储,因而在拓扑关系上主桥部分会与上述道路相交。
s13、形状信息建模。根据《城市人行天桥与人行地道技术规范(cjj69-95)》,天桥高度有一个最低限制,这些最小净高中最大值为6.55m,梯道坡度的限制范围一般在1:12到1:2。在施工建设中,考虑到施工成本,人行天桥的净高一般不会超过限高太多,主桥桥身有一定的厚度,基于此,根据简单的几何关系,即可得出梯道范围的最大值。
s2、利用基于图像语义分割的深度神经网络模型获取人行天桥轮廓,主要包括以下步骤:
s21、构建训练样本集。根据天桥矢量数据的坐标范围,其最小包络矩形作为掩膜对遥感影像进行裁剪,得到裁剪后的遥感影像。对每一个天桥的矢量数据存图,并做二值化及膨胀处理,生成对应的掩膜图片作为其标签,裁剪后的遥感影像图及对应的标签掩膜图作为训练样本集。
s22、将样本集输入至深度神经网络模型u-net进行训练,得到适用于该数据集场景的模型,称为基于u-net的人行天桥预测网络模型。
s23、输入待检测影像至基于u-net的人行天桥预测网络模型,识别出待检测影像中的人行天桥轮廓信息。
s24、通过上述步骤得到的人行天桥轮廓,结果中可能包含部分建筑物的轮廓,为了剔除建筑物的轮廓信息,因此利用天桥位于主要道路之上的特征,将识别出的轮廓信息结果与主要道路的二值图进行叠置分析,其相交部分即为人行天桥。
s3、天桥结构建模与矢量成图,具体处理过程如下:
通过对上述步骤得到的人行天桥二值图进行细化处理,提取人行天桥轮廓的中心线;进而,通过栅格转矢量的操作得到人行天桥的矢量数据。
s4、更新人行导航系统中的所述人行天桥数据,具体处理过程如下:
融合osm中和遥感影像中获得的天桥矢量数据,与已有的人行道路数据进行匹配,提取出增量部分,更新步行导航数据。
本发明结合osm和遥感影像提取人行天桥,不仅能够自动化识别osm中的人行天桥,降低了现有方法的主观性,并且利用遥感影像数据弥补osm不完整的缺点,能够同时兼顾数据的现势性和完整性,提高识别效率和准确度。
实施例2
采用2016年4月份的北京市主城区的osm数据和对应的0.2.m高分辨率遥感影像数据对本发明的具体实施进行说明。发明实施例提供的结合osm和遥感影像提取人行天桥目标的深度学习方法,主要包括识别osm数据的人行天桥,实现遥感影像数据中人行天桥语义分割,天桥结构建模与矢量成图和人行导航数据中天桥信息的更新。下面将结合此实例具体说明本发明辅助解决人行天桥识别和更新相关问题的具体实施步骤:
识别osm数据的人行天桥方法流程如图2所示,包括以下步骤:
1)osm数据预处理。首先对osm数据进行预处理,得到主要道路和人行道路候选集。选取osm数据中highway字段取值为trunk,primary,secondary,tertiary,unclassified的道路作为主要道路候选集,人行道路候选集的highway字段取值为footway,steps,path等9种。
2)人行天桥主桥部分识别。根据所述人行天桥在开放街道地图(openstreetmap,osm)数据中的语义信息、拓扑信息和形状信息,从所述osm数据中自动识别与提取所述人行天桥。
主桥部分的识别基于附加信息、道路类别信息和拓扑关系实现。基本思想为利用这些信息逐步对数据集合进行分裂,每个节点上的数据都是同一个类别,直到没有信息可以再用于数据进行分裂时,停止分裂,结构类似于一个树形结构。具体的算法流程如图3所示。
(1)遍历所有的道路,根据标签“bridge=yes”将数据分成两大类。选取含有此标签的道路,作为下一次判别的候选匹配集
(2)根据候选匹配集
(3)遍历
3)人行天桥梯道部分识别。基本思想是基于已识别的主干部分,找到与主干部分相连的人行道路作为梯道的候选匹配集,判断规则为:
式中,
实现遥感影像数据中人行天桥语义分割方法流程如图5所示,包括以下步骤:
1)构建训练样本集。利用人行天桥矢量数据分别裁剪遥感影像和生成对应的掩膜图片作为其标签,具体步骤为:
(1)裁剪遥感影像。获取0.2m高分辨率遥感影像数据,根据人行天桥矢量数据对采集到的遥感影像进行裁剪。本实施例采集到的遥感影像中部分不包含天桥数据,为了减少无关区域的影响,需要对遥感影像进行截取操作,并根据每个人行天桥坐标信息,找到其对应的最小包络矩形的范围,按照这个范围裁剪得到所需的遥感影像。
(2)生成标签文件。按照每一个天桥坐标信息的最小包络矩形的范围,对天桥矢量数据进行裁剪并存图。然后对图片二值化和膨胀处理,得到对应的标签文件。
将裁剪后的遥感影像图及对应的标签掩膜图作为训练样本集,如图6所示。
2)选择基于图像语义分割的深度网络模型。根据实际情况选择适用来进行模型训练的基础网络模型,该类可用于图像语义分割的深度网络模型有segnet、u-net、fcn等及其变形(即能够用于图像语义分割的深度网络模型都可在此步骤中被选择,由于该类深度网络模型的种类多且本领域技术人员可以在原有深度网络模型基础上做进一步调整或改进,在此无法穷尽列举模型种类),在本实施例的场景下选择u-net模型。
3)训练基于u-net的人行天桥预测网络模型。将样本集(包括裁剪后的遥感影像集及对应的掩膜图片)作为上个步骤中确定的深度学习网络结构的输入,训练适用于该数据集场景的预测模型,得到的模型称为基于u-net的人行天桥预测网络模型。
4)输入待检测影像至上个步骤中训练得到的人行天桥预测网络模型进行预测,从模型输出的掩膜图片中得到测试图片中的人行天桥位置以及轮廓。
5)由于输入的遥感影像中有建筑物类别,与人行天桥轮廓特征相似,输出得到的掩膜图片中包含部分建筑物轮廓,因此需要去除建筑物轮廓。具体为将osm中主要道路数据集,存成图片,并做二值化和膨胀处理。进而与上述步骤获取的天桥轮廓数据进行叠置分析,得到的结果即为人行天桥。
6)进一步对上述结果进行细化处理,获得人行天桥轮廓的中心线。
7)对人行天桥轮廓中心线,进行栅格转成矢量操作,从而获得遥感影像中的人行天桥矢量数据。
最后,更新人行道路导航系统数据。首先融合osm中的人行天桥和遥感影像数据中的人行天桥,得到人行天桥数据集。然后将人行天桥数据集和人行道路导航数据进行匹配,进而更新人行道路导航系统。
本发明结合osm和遥感影像提取人行天桥,不仅能够自动化识别osm中的人行天桥,降低了现有方法的主观性,并且利用遥感影像数据弥补osm不完整的缺点,能够同时兼顾数据的现势性和完整性,提高识别效率和准确度。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。