一种基于多边形的城市道路网主干道选取方法

文档序号:10535148阅读:253来源:国知局
一种基于多边形的城市道路网主干道选取方法
【专利摘要】本发明提供了一种基于多边形的城市道路网主干道选取方法,首先以OSM地图数据作为数据源并进行处理生成区要素;利用紧凑度、宽度、复杂度和圆形度这四个形状描述子组成一个四维向量对生成的区要素道路网数据中的多边形进行描述,同时标记出颗粒型多边形并进行提取;使用非线性SVM分类方法将得到的四维向量进行分类,经过分类后提取出对应的多边形。将提取出的颗粒型多边形和SVM分类后的多边形合并为种子多边形。本发明提出了更能有效描述主干道多边形的形状描述子,分别对不同形态特征的主干道多边形进行处理,最后,基于道路网多边形间的拓扑特征对经过支持向量机提取的种子多边形做进一步处理得到最终主干道多边形。
【专利说明】
一种基于多边形的城市道路网主干道选取方法
技术领域
[0001] 本发明涉及一种将人工智能、道路网制图自动综合、城市主干道选取等进行结合 的基于多边形的城市道路网主干道选取方法,属地理信息科学领域。
【背景技术】
[0002] 数字环境下空间数据的自动制图综合是现代地图学研究的核心问题之一。利用大 比例尺数字地图数据生产小比例尺地图以及地理信息系统中空间数据多尺度表达往往是 一个耗时耗力的过程。如何利用自动制图综合方法来实现不同比例尺下的数据自动转换是 当今广泛研究的主题。在道路网选取中,较常见的方法有基于路段链和基于道路网眼这两 类。但这些方法在数据质量较低的情况下表现得不尽人意。所以基于多边形的提取方法被 提出来,且有效解决了以上基于线的提取方法上的不足。但当前基于多边形的方法也存在 一些不足:某些多边形形状描述子在实际应用中可行性较低;在对不同主干道多边形的处 理上没有分开处理,给种子多边形的降噪带来困难;在对种子多边形降噪上方法处理较为 繁琐。

【发明内容】

[0003] 为了克服上述现有技术的不足,本发明提供了一种基于多边形的城市道路网主干 道选取方法,本发明提出更能有效描述主干道多边形的形状描述子,分别对不同形态特征 的主干道多边形进行处理,最后,基于道路网多边形间的拓扑特征对经过支持向量机提取 的种子多边形做进一步处理得到最终主干道多边形。
[0004] 实现本发明上述目的所采用的技术方案为:
[0005] 1、一种基于多边形的城市道路网主干道选取方法,包括以下步骤:(1)、以0SM地图 数据作为数据源,并对数据源进行处理,首先进行投影转换,然后将基于线的要素类的源数 据转换成基于区要素的数据,区要素转换原则是基于多边形的最小闭合原则生成区要素, 区要素道路网数据中主干道多边形表现为:颗粒型、长直型和长弯型多边形;
[0006] (2)、利用紧凑度、宽度、复杂度和圆形度这四个形状描述子组成一个四维向量V: {Compactness,Width,Complexity,Circularity}对生成的区要素道路网数据中的每一个 多边形进行描述,将得到的四维向量V按SVM数据格式导出,同时通过设置面积阈值标记出 颗粒型多边形并进行提取;
[0007] 具体的描述方法如下:(a)多边形的紧凑度:
[0008] _繼縣=叙X纖逸I,"~齡,
[0009] 其中,area(pi,…,pn)为由{pi,…,pn}这n个点围成的多边形面积,!Ul数%:表 示多边形的周长,多边形的紧凑度的值域是(〇,1],圆形的紧凑度最高,其值为1;
[0010] (b)多边形的宽度计算方法如下:
[0011] Width=max(centerlinei,…,centerlinem)/area(pi,…,p n)
[0012] 其中,max(centerlinei,…,centerlinem)表示通过计算多边形的骨架线而获得 的m条中线中最长的作为多边形的中线,多边形宽度的值域为(0,1);
[0013] (c)多边形的复杂度计算方法如下:
[0014] Cw、炫梦!-I你二s-feele故?邊縱名!為總
[0015] 其中,表示多边形中生成的k条骨架线之和,多边形复杂度的值 域为(〇,1 ),多边形复杂度值越小,形状越复杂;
[0016] (d)多边形的圆形度计算方法如下:
[0017] Circularity = area(pi,…,pn)Ar2
[0018] 其中,r表示多边形外接圆的半径,多边形圆形度的值域为(0,1],圆的圆形度最 高,值为1;
[0019] (3)、使用非线性SVM分类方法将步骤(2)中得到的四维向量V进行分类,手动选取 训练数据来产生分类模型,然后根据分类模型从全部数据中提取出目的数据,SVM训练样本 集为{(xi,X2),......,(xi,yi)},其中XiGRn,yiG {1,-1},i = l,? ? ?,n,xi是一个四维输入指 标向量,yi是输出指标;经过上述SVM分类后提取出对应的多边形;
[0020] (4)、将步骤(2)中提取出的颗粒型多边形和步骤(3)中提取出的多边形合并为种 子多边形,首先将种子多边形中重复的多边形进行合并,然后利用主干道多边形的空间拓 扑特征,采用基于主干道多边形间的拓扑特征的方法对种子多边形进行降噪,除去其中的 非主干道多边形,剩下的多边形即为最终的主干道多边形。
[0021]步骤(1)投影转换中的投影坐标系采用等角横切椭圆柱投影并采用米作为长度单 位;所述的线要素转换成区的步骤如下:相交剪断,将相交的线段进行剪断;拓扑差错,将地 图中的线头和单一的线进行删除;拓扑成区;整区抽稀,因为实际操作中由于多边形中含有 大量冗余的点,会加大整个提取过程的计算量,所以要将多边形上冗余的点删除。
[0022]步骤(2)中对主干道多边形进行形态表达时采用复杂度和圆形度两个描述子进一 步描述主干道多边形的特征,弥补紧凑度和宽度描述子对主干道多边形特征表达的不足, 有效地将形状复杂的多边形以及凹多边形和带洞的多边形区分开来;步骤(2-b)中获取多 边形最长中线的方法如下:首先使用Delaunay三角化算法将多边形三角化,然后根据三角 化后多边形的拓扑关系生成多边形骨架线,设骨架线由{segmenti,. . .,segmentn}这n条线 段组成,根据这n条线段求得最长中线,中线的获取方法如下:根据线节点的连接关系,通过 遍历每一个线段及线段间的关系可以求得若干条中线,通过观察可以发现每条中线都代表 多边形的一个走向,计算每条中线长度,取为长度最长的中线为最长中线。
[0023]步骤(3)中使用机器学习理论并借助libsvm包中提供的SVM实现方案来进行分类, 具体的分类方法如下:
[0024] (I)对四维向量V中的形状描述子进行缩放:使用工具包中的svm-scale将所有形 状描述子的值都缩放到(〇,1)范围内,且训练数据和测试数据都使用相同的缩放规则;
[0025] (II)交叉验证求最优参数:确定对错分样本偏离值的惩罚系数C和控制样本高斯 分布宽度的系数S,使用交叉验证的方式获取最优参数C和S;
[0026] (III)根据最优参数获取分类模型:对通过交叉验证获得的最优参数C和S进行微 调,再使用svm-train通过训练数据生成分类模型;
[0027] (IV)根据分类模型将目的数据分类:得到最优分类模型后,就可以使用svm-predict对目的数据进行预测,得到最后的分类结果。
[0028]步骤(4)中降噪处理的方法如下:(a)设通过上述操作获取的种子多边形集合为: Seeds = {pi,p2, . . .,pn-i,pn},依次遍历每一多边形pi,判断pi是否为颗粒型多边形,若是,直 接跳过并遍历下一多边形,若否,则查找每一个与 Pl相邻的多边形W,对于W若为颗粒型多 边形则跳到步骤(c),否则就进入下一步分析两个多边形之间的排列关系;
[0029] (b)分别求出pi和Pj的主方向、长度Li和Lj、宽度Wi和Wj,多边形主方向定义为该多 边形的最小外接矩形的长边方向,其长度为步骤(2-b)中求得的最长中线长度:max (centerlinei,? ? ?,centerlinem),宽度为多边形面积和宽度的比值,并求出pi和pj的公共 边Bij及其长度L b、pi和Pj的夹角Aij、pi和Bij的夹角Aib,其中Bij的方向任取,通过夹角Aij和A ib 判断两个多边形的排序关系,多边形的排列关系分为:纵向、横向和转向三种,其中转向定 义有两种,四种排列关系定义如下:
[0030] 纵向定义:
[0031] 横向定义:
[0032] 转向定义1
[0033] 转向定义2
[0034] (c)对于颗粒型多边形的处理,若多边形的主方向和公共边的夹角为AlbE[3i/4,V 2] U [V2,3V4],则直接将pjPw连接为新的主干道多边形,通常在对源数据进程处理的过 程中在相交剪断的时候具有转向关系的多边形会转化成为由颗粒型多边形Pk和两个长直 型多边形的情况,颗粒型多边形Pk连接着两个长直型多边形;对于非颗粒型多边形,计算 Pl 和Pj连接后的宽度Wij,若宽度Wij小于阈值30m,则将pi和Pj连接为新的主干道多边形,对于 不符合条件的颗粒型和非颗粒型多边形不做处理,继续遍历下一与 Pl相邻的多边形或者遍 历Seeds = {pi,p2,. . .,pn-i,pn集合中的下一多边形直至结束,其中宽度Wij计算规则如下:
[0035] pi 和 pj 纵向排列:Wij= (areai_areaj)/(Li+Lj)
[0036] pi 和 pj 横向排列:Wij= (areai_areaj)/(Li+Lj_Lb)
[0037] pi 和 pj 转向排列 1 :Wij= (areai_areaj)/(Li+Lj+Wj-Lb)
[0038] pi和pj转向排列2:Wij= (areai+areaj)/(Li+Lj+Wi_Lb);
[0039] (4)经过上述处理后的种子多边形,种子多边形会被聚类为多种大大小小的集合, 主干道多边形被聚类成为一个大的集合,最后通过面积阈值的方法将较小的集合进行删 除,剩下的多边形即为最终的提取结果。
[0040]与现有技术相比,本发明具有以下优点:本发明从主干道多边形形态表达出发,摒 弃原方法中的平行度、面积、周长等形状描述子,创造性的提出了利用紧凑度、宽度、复杂度 和圆形度组成一个四维向量V: {Compactness,Width,Comp lex ity,Circularity}对每一个 多边形进行描述。由于现行所采用的单一的形状描述子并不能唯一地表达长直型和长弯型 多边形,比如凹多边形和带洞的多边形与长直型和长弯型具有同样紧凑度,而复杂度和圆 形度描述子则能有效地将多边形形态单一和形态较复杂的多边形区分开来,弥补了紧凑度 的不足;多边形宽度则有效地描述了形态狭长的多边形。本发明分别对颗粒型、长直型和长 弯型的主干道多边形进行处理。将由以上四个形状描述子组成的一个四维向量放入到支持 向量机中进行学习和分类。最后,基于道路网多边形间的拓扑特征对经过支持向量机提取 的种子多边形和采用阈值提取的颗粒型多边形做进一步处理得到最终主干道多边形。
【附图说明】
[0041 ]图1为本发明中Delaunay三角化提取骨架线示意图;
[0042] 图2为低维样本数据向高维转换求最优分类面的过程示意图;
[0043] 图3为交叉验证获取最优参数结果图;
[0044] 图4为种子多边形间的邻接关系图;
[0045] 图5为城市道路网主干道提取结果图。
【具体实施方式】
[0046] 下面结合具体实施例对本发明做详细具体的说明,但是本发明的保护范围并不局 限于以下实施例。
[0047] 本实施例整个过程按如下步骤操作:
[0048] 步骤一:数据预处理;
[0049]本发明是基于OpenStreetMap (简称0SM)地图数据作为数据源进行的研究,并选取 德国慕尼黑的0SM中roads图层作为试验对象。由于原始0SM数据输入没有专业严格的控制, 致使0SM数据质量存在部分问题。比如不同道路等级的线要素存在复杂的交叉现象以及高 等级的道路线要素属性之间缺乏一致性,所以需要我们对这些数据进行特定的处理,以便 能正确的生成区,这里我们采用GIS软件完成,具体操作如下:
[0050] (1)投影转换。投影坐标系采用高斯-克吕格(等角横切椭圆柱)投影,采用米作为 长度单位。
[0051] (2)线转区。本发明采用基于多边形的方式进行主干道提取,而原道路网数据是基 于线要素的数据,所以需要将线要素转换成区。线转区我们基于多边形的最小闭合原则生 成区要素道路网数据。线转区一般需要以下几个操作:相交剪断,将相交的线段进行剪断; 拓扑差错,将地图中的线头和单一的线进行删除;拓扑成区;整区抽稀,因为实际操作中由 于多边形中含有大量冗余的点,会加大整个提取过程的计算量,所以要将多边形上冗余的 点删除。
[0052]步骤二:计算多边形形状描述子
[0053]利用紧凑度、宽度、复杂度和圆形度这四个形状描述子组成一个四维向量V: {Compactness,Width,Complexity,Circularity}对生成的区要素道路网数据中的每一个 多边形进行描述,将得到的四维向量V按SVM数据格式导出,同时通过设置面积阈值标记出 颗粒型多边形并进行提取;本实施例中面积阈值为50m 2。
[0054]具体的描述方法如下:(a)多边形的紧凑度:
[0055] 緣纖?+ = X 縱燃凝徽%^
[0056] 其中,area(pi,…,pn)为由{pi,…,pn}这n个点围成的多边形面积,表 示多边形的周长,多边形的紧凑度的值域是(〇,1],圆形的紧凑度最高,其值为1;紧凑度的 值随着多边形的复杂度增加而减小,且不受多边形的走向,平移,旋转,尺度变换的影响。相 比较其他多边形,大部分主干道多边形具有较小的紧凑度。但是该描述子不能有效识别形 状复杂的多边形,比如凹多边形,带洞的多边形。
[0057] (b)多边形的宽度计算方法如下:
[0058] Width=max(centerlinei,…,centerlinem)/area(pi,…,p n)
[0059] 其中,max(centerlinei,? ? ?,centerlinem)表示取多边形中由骨架线提取的长度 最大m条线段作为多边形的中线,如图1所示虚线表示求得的最长中线。多边形宽度的值域 为(〇,1),主干道多边形大部分表现比较狭窄,假设多边形是一个矩形,那么宽度就是矩形 宽的倒数,也就是说多边形的宽度值(〇,1)越大,多边形表现得越狭窄。相较与长直型和长 弯型多边形,其他多边形具有较小的宽度,且该描述子的值不受多边形的走向,平移,旋转, 尺度变换的影响。
[0060] 获取多边形最长中线的方法如下:首先使用Delaunay三角化算法将多边形三角 化,然后根据三角化后多边形的拓扑关系生成多边形骨架线,设骨架线由{segment!,..., 8叩!11611^}这11条线段组成,根据这n条线段求得最长中线,如图1所示:图中骨架线是由虚线 和三角形中浅灰色实线组成,根据线节点的连接关系,通过遍历每一个线段及线段间的关 系可以求得三条中线:{centerlinei,centerline2,centerline〗}取L=max{centerlinei, centerline2,centerline3}为最长中线,图1中的虚线即是最后获得中线。通常对于简单的 多边形只有一条简单的线段,对于复杂的多边形通常有两条以上的线段。
[0061] (c)多边形的复杂度计算方法如下:
[0062] x
[0063]其中,艺表示组成多边形骨架线的k条线段之和,多边形复杂度的 值域为(〇,1 ),多边形复杂度值越小,形状越复杂;主干道多边形在形态上表现单一,长直型 和长弯型多边形的复杂度值相比其他多边形普遍较小,且该值不受多边形的走向,平移,旋 转,尺度变换的影响。
[0064] (d)多边形的圆形度计算方法如下:
[0065] Circularity = area(pi,…,pn)Ar2
[0066] 其中,r表示多边形外接圆的半径,多边形圆形度的值域为(0,1],圆的圆形度最 高,值为1;对于主干道的长直型和长弯型多边形,相较其他多边形,大部分具有较小的圆形 度。且该指标不受多边形的走向,平移,旋转,尺度变换的影响。
[0067]步骤三:支持向量机分类提取;
[0068] 上述多边形描述子从不同的角度描述了多边形的形态特点,与非主干道多边形相 比大部分主干道多边形通常都具有较大或较小的值。但是,每一个形状描述子都不能完全 准确地描述出主干道多边形,加之道路网多边形的复杂性,使得很难通过设置阈值来对多 边形进行分类。所以本实施例使用支持向量机(Support Vector Machine,SVM)根据形状描 述子通过寻找最优解来对多边形进行分类。SVM是在统计学原理的基础上发展起来的一种 机器学习方法。它具有理论完备、适应性强、全局优化、训练时间短和泛化性能好等优点,与 其他分类回归算法相比它能较好地解决小样本、非线性、高维数和局部极小等实际问题。 SVM需要我们手动选取训练数据来产生分类模型,然后根据分类模型从全部数据中提取出 目的数据。
[0069] SVM可以分为线性支持向量机和非线性支持向量机,线性支持向量机又分为线性 可分支持向量机和线性不可分支持向量机。从分类上来看,SVM可以进行二分类和多分类。 由于本申请中每个多边形描述子之间是相互独立且呈非线性关系,所以,我们使用非线性 支持向量机进行二分类。
[0070] 3\^[训练样本集为{(叉1,叉2),......,(xi,yi)},其中XiGRn,yiG {1,-1},i = l,? ? ?, n,xi是一个四维输入指标向量,yi是输出指标。本申请中数据定义Xi为一个四维输入指标向 量,这四维向量是由四个个多边形描述子构成且呈非线性关系。本发明使用高斯核函数来 实现将样本数据映射到高维甚至无穷维空间后进行线性分类,基本原理如图2所示,因为将 低维向高维转换寻找最优分类面过程,使得计算分类面时不需要显式计算其非线性函数。 另一方面高斯核函数具有较宽的收敛域且能适用各种样本情况,它需要确定的参数只有一 个,模型建立相对较简单,性能较好,适用于非线性关系的样本数据,所以本文选自高斯核 函数作为核函数。
[0071] 对于采用支持向量机进行分类提取,本发明使用libsvm包中提供的实现来进行分 类。具体做法分为四步:
[0072] (1)对形状描述子进行缩放。使用工具包中的svm-scale将所有的值都缩放到(0, 1)范围内,且训练数据和测试数据都使用相同的缩放规则。本试验选取了769个多边形作为 训练数据,为了利于试验分析从慕尼黑道路网中截取了 2426个多边形作为测试数据。
[0073] (2)交叉验证求最优参数。根据训练数据获得最优分类模型需要我们确定对错分 样本偏离值的惩罚系数C和控制样本高斯分布宽度的系数5。所以,需要使用交叉验证的方 式获取最优参数C和8,这里采用grid.py来获取。如图3所示,颜色由浅到深的线条表示通过 不断的迭代并自动搜索高斯核函数中gama系数(即松弛变量S)和惩罚系数C的最优结果的 过程。每一根线条代表不同gama和C取值下的准确度。
[0074] (3)根据最优参数获取分类模型。虽然通过交叉验证获得的参数是相对最优的,但 是在实际操作过程中为了能够得到我们需要的结果还需要我们根据经验进行微调,再使用 svm-train通过训练数据生成分类模型。
[0075] (4)根据分类模型将目的数据分类。得到最优分类模型后,就可以使用svm-predict对目的数据进行预测,得到最后的分类结果。
[0076] 这里我们通过交叉验证获取的最优参数为-c32-g0.5,准确度为98.1795%,如图3 所示,其中有2383个多边形能够被正确的分类。
[0077] 步骤四:基于主干道多边形空间拓扑特征降噪:
[0078] 将步骤(2)中提取出的颗粒型多边形和步骤(3)中提取出的多边形合并为种子多 边形,首先将种子多边形中重复的多边形进行合并,然后利用主干道多边形的空间拓扑特 征,采用基于区域增长的方法对种子多边形进行降噪,除去其中的非主干道多边形,剩下的 多边形即为最终的主干道多边形。
[0079]降噪处理的方法如下:(a)设种子多边形集合为Seeds= {pi,p2, . . .,pn-i,pn},依次 遍历每一多边形Pi,判断Pi是否为颗粒型多边形。若是,直接跳过遍历下一多边形,若否,贝1J 查找每一个与 Pl相邻的多边形W,对于W若为颗粒型多边形则跳到第(3)步,否则就分析两 个多边形之间的排列关系;
[0080] (b)分别求出Pi和Pj的主方向、长度Li和Lj、宽度Wi和Wj,多边形主方向定义为该多 边形的最小外接矩形的长边方向,其长度为步骤(2-b)中求得的最长中线长度:max (centerlinei,? ? ?,centerlinem),宽度为多边形面积和宽度的比值,并求出pi和pj的公共 边Bij及其长度L b、pi和Pj的夹角Aij、pi和Bij的夹角Aib,其中Bij的方向任取,通过夹角Aij和A ib 判断两个多边形的排序关系,多边形的排列关系分为:纵向、横向和转向三种,其中转向定 义有两种,三种排列关系定义如下:
[0081] 纵向定义:
[0082] 横向定义:
[0083] 转向定义1
[0084] 转向定义2
[0085] (c)对于颗粒型多边形的处理,若多边形的主方向和公共边的夹角为AlbG [31/4, V 2] U [V2,3V4],则直接将pjPw连接为新的主干道多边形,通常在对源数据进程处理的过 程中在相交剪断的时候具有转向关系的多边形(图4(c)和(d))会转化成为由颗粒型多边形 Pk和两个长直型多边形的情况,颗粒型多边形pk连接着两个长直型多边形(如图4(e)所示)。 对于非颗粒型多边形,计算Pi和Pj连接后的宽度Wij,若宽度Wij小于阈值30m,则将pi和 Pj连接 为新的主干道多边形,对于不符合条件的颗粒型和非颗粒型多边形不做处理,继续遍历下 一与Pi相邻的多边形或者遍历Seeds= {pi,p2. . .,pn-i,pn}集合中的下一多边形直至结束, 其中宽度计算规则如下:
[0086] pi 和 pj 纵向排列:Wij= (areai+areaj)/(Li+Lj)
[0087] pi 和 pj 横向排列:Wij= (areai+areaj)/(Li+Lj_Lb)
[0088] pi 和 pj 转向排列 1 :Wij= (areai+areaj)/(Li+Lj+Wj_Lb)
[0089] pi和pj转向排列2:Wij= (areai+areaj)/(Li+Lj+Wi_Lb);
[0090] (4)经过上述处理后的种子多边形,种子多边形会被聚类为多个大大小小的集合, 主干道多边形被聚类成为一个大的集合,最后通过面积阈值的方法将较小的集合进行删 除,剩下的多边形即为最终的提取结果,如图5所示,其中灰色部分属于非主干道多边形,深 灰色是通过降噪算法删除的多边形,黑色多边形即为最终提取的主干道多边形。
【主权项】
1. 一种基于多边形的城市道路网主干道选取方法,其特征在于包括以下步骤:(1)、以 OSM地图数据作为数据源,并对数据源进行处理,首先进行投影转换,然后将基于线的要素 类的源数据转换成基于区要素的数据,区要素转换原则是基于多边形的最小闭合原则生成 区要素,区要素道路网数据中主干道多边形表现为:颗粒型、长直型和长弯型多边形; (2) 、利用紧凑度、宽度、复杂度和圆形度这四个形状描述子组成一个四维向量V: {Compactness,Width ,Complexity ,Circularity}对生成的区要素道路网数据中的每一个 多边形进行描述,将得到的四维向量V按SVM数据格式导出,同时通过设置面积阈值标记出 颗粒型多边形并进行提取; 具体的描述方法如下:(a)多边形的紧凑度:其中,area(pi,…,pn)为由{ρι,…,pn}这η个点围成的多边形面积,表示多 边形的周长,多边形的紧凑度的值域是(〇,1],圆形的紧凑度最高,其值为1; (b) 多边形的宽度计算方法如下: width=max(centerlinei,. . . ,centerlinem)/area(pi, . . . ,pn) 其中,max(centerlinei,· · ·,centerlinem)表示通过计算多边形的骨架线而获得的m条 中线中最长的作为多边形的中线,多边形宽度的值域为(〇,1); (c) 多边形的复杂度计筧方法如下:其中,EfL1; W你%表示多边形中生成的k条骨架线之和,多边形复杂度的值域为 (0,1 ),多边形复杂度值越小,形状越复杂; (d) 多边形的圆形度计算方法如下: Circularity = area(pi,. . . ,pn)Ar2 其中,r表示多边形外接圆的半径,多边形圆形度的值域为(0,1],圆的圆形度最高,值 为1; (3) 、使用非线性SVM分类方法将步骤(2)中得到的四维向量V进行分类,手动选取训练 数据来产生分类模型,然后根据分类模型从全部数据中提取出目的数据,SVM训练样本集为 {(χι,χ2),......,(xi,yi)},其中xieRn,yie ,i = l,· · ·,n,xi是一个四维输入指标向 量,yi是输出指标;经过上述SVM分类后提取出对应的多边形; (4) 、将步骤(2)中提取出的颗粒型多边形和步骤(3)中提取出的多边形合并为种子多 边形,首先将种子多边形中重复的多边形进行合并,然后利用主干道多边形的空间拓扑特 征,采用基于主干道多边形间的拓扑特征的方法对种子多边形进行降噪,除去其中的非主 干道多边形,剩下的多边形即为最终的主干道多边形。2. 根据权利要求1所述的基于多边形的城市道路网主干道选取方法,其特征在于:步骤 (1)投影转换中的投影坐标系采用等角横切椭圆柱投影并采用米作为长度单位;所述的线 要素转换成区的步骤如下:相交剪断,将相交的线段进行剪断;拓扑差错,将地图中的线头 和单一的线进行删除;拓扑成区;整区抽稀,因为实际操作中由于多边形中含有大量冗余的 点,会加大整个提取过程的计算量,所以要将多边形上冗余的点删除。3. 根据权利要求1所述的基于多边形的城市道路网主干道选取方法,其特征在于:步骤 (2) 中对主干道多边形进行形态表达时采用复杂度和圆形度两个描述子进一步描述主干道 多边形的特征,弥补紧凑度和宽度描述子对主干道多边形特征表达的不足,有效地将形状 复杂的多边形以及凹多边形和带洞的多边形区分开来;步骤(2-b)中获取多边形最长中线 的方法如下:首先使用Delaunay三角化算法将多边形三角化,然后根据三角化后多边形的 拓扑关系生成多边形骨架线,设骨架线由{segments ...,8%!^拉11}这11条线段组成,根据这 η条线段求得最长中线,中线的获取方法如下:根据线节点的连接关系,通过遍历每一个线 段及线段间的关系可以求得若干条中线,通过观察可以发现每条中线都代表多边形的一个 走向,计算每条中线长度,取为长度最长的中线为最长中线。4. 根据权利要求1所述的基于多边形的城市道路网主干道选取方法,其特征在于:步骤 (3) 中使用机器学习理论并借助Iibsvm包中提供的SVM实现方案来进行分类,具体的分类方 法如下: (I) 对四维向量V中的形状描述子进行缩放:使用工具包中的svm-scale将所有形状描 述子的值都缩放到(〇,1)范围内,且训练数据和测试数据都使用相同的缩放规则; (II) 交叉验证求最优参数:确定对错分样本偏离值的惩罚系数C和控制样本高斯分布 宽度的系数S,使用交叉验证的方式获取最优参数C和δ; (III) 根据最优参数获取分类模型:对通过交叉验证获得的最优参数C和δ进行微调,再 使用svm-train通过训练数据生成分类模型; (IV) 根据分类模型将目的数据分类:得到最优分类模型后,就可以使用svm-predict对 目的数据进行预测,得到最后的分类结果。5. 根据权利要求1所述的基于多边形的城市道路网主干道选取方法,其特征在于:步骤 (4) 中降噪处理的方法如下:(a)设通过上述操作获取的种子多边形集合为deeds= {Pl, P2, . . .,Pn-l,Pn},依次遍历每一多边形Pi,判断Pi是否为颗粒型多边形,若是,直接跳过并遍 历下一多边形,若否,则查找每一个与P 1相邻的多边形W,对于W若为颗粒型多边形则跳到 步骤(C),否则就进入下一步分析两个多边形之间的排列关系; (b) 分别求出Pi和Pj的主方向、长度Li和Lj、宽度Wi和Wj,多边形主方向定义为该多边形 的最小外接矩形的长边方向,其长度为步骤(2-b)中求得的最长中线长度: max(centerlinei,…,centerlinem)宽度为多边形面积和宽度的比值,并求出Pi和Pj的 公共边Bij及其长度Lb、Pi和Pj的夹角Aijji和B ij的夹角Aib,其中Bij的方向任取,通过夹角Aij 和Alb判断两个多边形的排序关系,多边形的排列关系分为:纵向、横向和转向三种,其中转 向定义有两种,四种排列关系定义如下:纵向定」 横向定」 转向定」 转向定」 (c) 对于颗粒型多边形的处理,若多边形的主方向和公共边的夹角为Albe [V4,V2] U [V2,3V4],则直接将?1和仍连接为新的主干道多边形,通常在对源数据进程处理的过程中 在相交剪断的时候具有转向关系的多边形会转化成为由颗粒型多边形Pk和两个长直型多 边形的情况,颗粒型多边形Pk连接着两个长直型多边形;对于非颗粒型多边形,计算PdPpj 连接后的宽度Wij,若宽度Wij小于阈值30m,则将pi和Pj连接为新的主干道多边形,对于不符 合条件的颗粒型和非颗粒型多边形不做处理,继续遍历下一与 ?1相邻的多边形或者遍历 Seeds = {pi,p2,. . .,ρη-ι,ρη}集合中的下一多边形直至结束,其中宽度Wij计算规则如下: Pi 和 Pj 纵向排列:Wij = (areai+areaj)/(Li+Lj) Pi 和 Pj 横向排列:Wij = (areai+areaj)/(Li+Lj_Lb) Pi和Pj转向排列I :Wij = (areai+areaj)/(Li+Lj+Wj_Lb) Pi和Pj转向排列2:Wij = (areai+areaj)/(Li+Lj+Wi_Lb); (4)经过上述处理后的种子多边形,种子多边形会被聚类为多种大大小小的集合,主干 道多边形被聚类成为一个大的集合,最后通过面积阈值的方法将较小的集合进行删除,剩 下的多边形即为最终的提取结果。
【文档编号】G06F17/50GK105893703SQ201610268365
【公开日】2016年8月24日
【申请日】2016年4月27日
【发明人】陈占龙, 谢忠, 吴亮, 胡宗哲, 徐永洋, 龚希, 叶文
【申请人】中国地质大学(武汉)
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1