基于SOM神经网络的建筑物聚类方法与流程

文档序号:15217334发布日期:2018-08-21 17:00阅读:252来源:国知局

本发明涉及计算机地图制图技术领域,尤其涉及一种基于som神经网络的建筑物聚类方法。



背景技术:

大、中比例尺地图中的建筑物要素通常符号化为离散分布的多边形图形。随着地图比例尺的缩小,地图上的要素会变得拥挤而不易辨识。因此,许多建筑物需被删除、合并、化简等等。通过对人工制图综合过程的研究发现,建筑物综合包含两个连贯的步骤:第一步是将建筑物划分为不同的群组,即建筑物聚类;第二步是针对不同的建筑物群组执行不同的制图综合操作。自动建筑物综合就是应用计算机程序模拟这两个步骤。

regnauldls提出了构建和存储邻近图的模型和建筑物群典型化的方法。该方法首先分析每个建筑物群组gestalt参量,这些参量包括建筑物的平均尺寸、建筑物群的密度以及建筑物多边形的形状等,然后建立建筑物典型化的规则和基于约束三角网的空间数据结构,最后通过分割最小生成树(mst)邻近图得到建筑物的聚类结果。

闰浩文按方向voronoi图(directionvoronoidiagram,dvd)、艾廷华和钱海忠首先建立建筑物顶点的delaunay三角网,然后按建筑物与三角网的关系进行建筑群的分割和降维,以及居民地的结构、形态和相互关系的描述。

anders和郭庆胜从原始点群目标生成delaunay三角形(delaunaytriangulation,dt),以及gabriel图(gabrielgraph,gg)、相对邻近图(relativeneighborhoodgraph,rng)、绝对邻近图(nearestneighborhoodgraph,nng)、ug(urquhartgraph)、最小支撑树(minimumspanningtree,mst)等邻近图,在密度、距离和偏差等适应性的约束下,利用邻近图进行点群的层次聚类。

李志林等提取了面状要素的tin和voronoi图,结合城市形态学和gestalt理论提出了基于城市形态学的全局约束和基于gestalt原理的局部约束的建筑物聚类方法。

qi和li依据方向、距离以及相似度等因素对建筑物聚类的影响程度,将约束按照不同的层次引入到建筑物的空间聚类过程中,提出了基于分级约束的建筑物聚类方法。而目前的建筑物聚类方法存在一下缺陷:

(1)缺少智能化的数据模型

制图综合是人脑的创造性思维过程,这个过程是非常复杂、难以定义、很难完全结构化的。用计算机实现手工地图综合的过程,主要依赖于问题的规范化(格式化)水平。在用计算机描述人类生存的现实世界时不可能事无巨细地全部存储到计算机中,必然会有一些信息(如空间关系)丢失,而且信息丢失的程度与采用的制图综合数据模型密切相关。但是现有的数据模型或数据结构还不能完全支持智能化的制图综合方法。

(2)认知理论对自动制图综合的指导作用较低

地图是人类进行信息传输的媒介,制图综合的根本目的就是增强地图的信息传输能力,满足人类对空间地理信息日益增加的需求。人类对大脑思维的具体过程和认知活动还不是完全清楚,自动制图综合的研究中还存在着一种不好的倾向,即“为了综合而综合”。这种对制图综合的理解没有考虑制图综合对象的各种语义信息,仅盲目进行图形变换或者图形处理的方法研究。这样做的最终结果将失去地图要素特征对于制图综合方法的约束,获得的制图综合结果将缺乏相应的地理特征。

到目前为止,居民地要素的自动制图综合研究仍然有诸多问题没有解决,如居民地与其他要素的综合关联不够,居民地的结构化选取结果不是很好。建筑物群的合并以及单个建筑物图形的化简还有很多研究工作需要完成。



技术实现要素:

本发明的目的在于解决上述现有技术存在的缺陷,提供一种主要围绕大比例尺地图的建筑物要素,依托人工神经网络技术,模拟制图专家在进行制图综合时的思维过程,学习制图综合的专家知识和经验,研究建筑物要素的基于som神经网络的建筑物聚类方法。

一种基于som神经网络的建筑物聚类方法,包括以下步骤:

步骤1:利用建筑物多边形图层数据和线状要素图层数据进行建筑物的相关特征参数计算;所述线状要素图层数据包括:道路、水系图层;所述相关特征参数包括:建筑物重心坐标、相邻建筑物之间的最短距离、建筑物与邻近道路等线状要素之间的最短距离、建筑物与邻近道路等线状要素之间的位置关系;

步骤2:根据计算的所述相关特征参数利用som神经网络的kohonen学习算法进行建筑物群的初步聚类,得到初步的建筑物群类簇结果;

步骤3:应用行列扫描方法对初步的类簇结果进行进一步的精细聚类划分,获得建筑物群的最终聚类结果。

进一步地,如上所述的方法,所述步骤2包括以下步骤:

步骤21:som神经网络的初始化,设置som神经网络的输入层神经元数目n=2,竞争层神经元数目m=40×40=1600;设置som神经网络竞争层神经元和输入层神经元之间的连接权向量wj=(w1j,w2j,…,wnj),j=1,2,…,m,wij为[0,1]区间内的随机数,i=1,2,…,n;设置初始邻域半径σ(0)=6.0,初始学习率α(0)=0.1,训练迭代计数t=0;

步骤22:从训练样本集{a1,a2,…,ak,…,ap}中随机选取一个输入模式提供给som神经网络的输入层神经元;

步骤23:寻找获胜神经元:计算ak与wj之间的距离dkj=||ak-wj||,从中选择距离最小的神经元作为获胜神经元c,即

步骤24:调整连接权值:对获胜神经元c邻域内任一个被激活的神经元j的连接权向量wj按照公式进行调整;

步骤25:重复步骤22-24,直至所有的输入模式都提交过一次;

步骤26:训练迭代计数器加1,即t=t+1;更新学习率α(t)以及邻域半径σ(t);

步骤27:重复步骤22-26,直到训练迭代计数t达到预先设定的训练迭代总次数t。

进一步地,如上所述的方法,步骤3中所述行列扫描方法包括以下步骤:

步骤31:以行为主,从左上角的格网单元开始,依次扫描som神经网络竞争层的二维平面网格中每个格网单元来确定格网单元与当前搜索到的网格单元是否属于同一群组,如果是,终止对格网单元的圈层扩张搜索,如果不是,则将新的群组属性赋予格网单元,然后继续扫描下一个格网单元;

步骤32:根据行扫描的结果,建立建筑物群组编号索引,用于记录每个群组中所包含的som神经网络竞争层的格网单元编号;

步骤33:对som神经网络的竞争层平面网格再进行列扫描,即从左下角的格网单元开始,按照以列为主的方式扫描格网单元;当扫描到单元c时,以单元c为中心按照圈层向外扩张搜索,调整每个格网单元的群组属性,得到最终的建筑物群聚类结果。

有益效果:

本申请通过对建筑物聚类综合中的全局和局部约束条件的研究,着重分析了gestalt原理的邻近性、相似性等准则,依据建筑物的位置、面积、形状、朝向,建筑物之间的距离,以及建筑物与其他线状要素(道路、河流等)的空间关系等影响因素,采用建筑物重心、建筑物间的距离、建筑物与邻近线状地物要素间位置关系等参数描述建筑物的特性。建筑物智能聚类分为两步:第一步初步聚类,根据建筑物的描述参数,利用som神经网络的聚类能力,得到建筑物初步聚类的类簇。第二步精细划分,设计了基于行列扫描的建筑物类簇划分算法,对som竞争层的初步聚类结果进行行列扫描,实现建筑物类簇的精确划分,获得满足建筑物聚类的全局和局部约束条件等制图要求的建筑物聚类群组。

基于som的建筑物聚类方法依据建筑物地理位置、相邻建筑物之间距离,以及建筑物与邻近线状要素(道路、河流等)的空间关系等影响因子,研究实现了具有地图认知能力的建筑物智能聚类。在建筑物要素密集而且规则分布的城区,该聚类方法能够在线状要素(如道路)约束下将相邻的建筑物划分在一个群组内。在建筑物零散分布的郊区或农村,缺少道路约束的条件下,该方法也能根据建筑物之间的距离进行聚类,符合制图要求。

附图说明

图1为本发明基于som的建筑物群聚类方法流程图;

图2为本发明建筑物的重心坐标演示图;

图3为本发明建筑物之间的最短距离演示图;

图4为本发明道路与建筑物之间的最短距离演示图;

图5为本发明建筑物与道路之间的位置关系演示图;

图6为本发明行扫描圈层演示图;

图7为本发明som聚类与群组关系图;

图8为本发明列扫描圈层结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本申请主要围绕大比例尺地图的建筑物要素,依托人工神经网络技术,模拟制图专家在进行制图综合时的思维过程,学习制图综合的专家知识和经验,研究建筑物要素的智能化自动综合方法。

基于som神经网络的建筑物智能聚类研究:根据制图综合中建筑物聚类的相关约束准则,利用som神经网络的聚类功能和研究的类簇精细聚类划分方法,实现建筑物的智能聚类。

som神经网络不需要大量的样本数据和人工干预就能够对数据进行自动聚集,智能化程度较高。som神经网络的kohonen学习算法采用仅仅调整获胜神经元邻域内的神经元权值的训练方式,特征相似的输入模式在映射到竞争层时,获胜神经元的位置也是邻近的,这样在对数据进行压缩处理的同时能够保持原始输入数据之间的拓扑关系和度量关系,可以实现制图综合中特征参数相似的建筑物的聚类。并且,som神经网络的自组织、自适应特点不需要预先设计聚类类别数目,聚类的粒度问题可以通过确定竞争层的网格边长得到较好地控制,在不确定建筑物群聚类类别数目的情况下可以对建筑物群实现聚类。

建筑物的综合需要在水系、道路等线状或湖泊等面状要素的约束下进行,避免综合后的多边形与河流、道路等线状或湖泊等面状地物要素发生冲突。同时,大比例尺地图中建筑物要素数量众多,建筑物综合处理时应尽量减小参与处理的建筑物数量。本发明提出的基于som神经网络的建筑物群智能聚类方法,主要包含三个处理步骤,如图1所示,首先是数据预处理阶段,主要计算建筑物聚类时所需的参数,即描述建筑物特征的参数,如建筑物重心坐标、相邻建筑物间的最短距离、建筑物与邻近道路等线状要素的位置关系等。接下来,利用som神经网络的kohonen学习算法进行建筑物群的分类,得到初步的类簇结果。然后,在初步分类的基础上,应用“行列扫描”方法对初步的类簇结果进行进一步的精细聚类划分,获得建筑物群的最终聚类结果。

步骤1:数据预处理

在数据预处理阶段,主要利用建筑物多边形图层数据和线状要素图层(如道路、水系图层)数据进行建筑物的相关特征参数计算。

在基于gestalt理论的局部约束准则中,邻近性、相似性和同向性3个因子与建筑物的空间分布密切相关。其中,邻近性是建筑物聚类的一个重要影响因素,可以用相邻建筑物间的距离来度量。

描述建筑物要素及相关要素关系的参数主要包括:centroid、mindisb2b与locateb2r等,分别表示建筑物重心坐标、相邻建筑物间的最短距离、以及建筑物与邻近道路等线状要素的最短距离、位置关系。

(1)建筑物重心坐标centroid

对于面状要素,其多边形的几何中心就是该要素的重心。为了避免不同地物要素类型的地图冲突,可以认为不同类型的地物要素之间存在着一种相互排斥力。这种排斥力避免了不同类型的要素被聚类合并。在大比例尺地图中建筑物属于面状地物要素,道路、河流等属于线状地物要素。道路、河流等线状要素对建筑物聚类的约束作用就表现为道路等要素对位于其两侧的建筑物要素的排斥力,即建筑物向远离线状要素地物的方向位移。这样可以使道路同侧的建筑物更为集中,不会出现聚类综合后的建筑物跨越道路等线状要素的错误结果,更有利于建筑物群的合理聚类。因此,在计算建筑物的重心坐标参数时,采用道路排斥建筑物处理后的重心坐标。

先计算每个线状要素的缓冲区(即排斥力作用范围),再判断建筑物是否在缓冲区内。如果建筑物位于缓冲区内,则排斥力表现为垂直于线状要素的力,将建筑物向远离线要素的方向移动,直到建筑物移出排斥力的作用范围。计算排斥后建筑物的重心(centroid)坐标,作为建筑物的重心坐标参数,如图2所示。

(2)相邻建筑物之间的最短距离mindisb2b

两个面状要素a1与a2之间的距离通常可以分为三种,即重心距离、最短距离和最大距离。

其中,重心距离是指两个面状要素的质心之间的距离,也称为“中心距离”。

最短距离是指面要素a1(p1,p2,......,pn,p1)与面要素a2(p1,p2,......,pn,p1)的节点和对方轮廓线段之间距离的最小值。假设,建筑物b1的节点pi(i=1,2,......,n)到建筑物b2轮廓线段lj(qj,q(j+1)mod(m))(j=1,2,......,m)的距离为dij,b1的节点pi到b2轮廓线段lj的最短距离为

则b1到b2的最短距离为

同理,b2到b1的最短距离为d21。于是,b1与b2之间的最短距离mindisb2b选取d12与d21中数值较小者。如图3所示。

最大距离则是指面a1和面a2的节点和线段之间距离的最大值。

(3)建筑物与邻近道路等线状要素之间的最短距离

建筑物与邻近道路的最短距离可以取建筑物的节点到邻近道路的最短距离,如图4所示。假设,建筑物a(p1,p2,......,pn,p1)与线l(l1,l2)之间的最短距离为d,建筑物a的节点pi(i=1,2,......,n)到线l(l1,l2)的距离为di,则

(4)建筑物与邻近道路等线状要素之间的位置关系locateb2r

沿线状要素的走向,计算建筑物b(p1,p2,......,pn,p1)位于邻近道路r(r1,r2,......,rm)的左侧或右侧,如图5所示。要判断点pi(x,y)是在线段l(l1,l2)(坐标为l1(x1,y1),l2(x2,y2))的哪一侧时,可以先构造两个向量pil1(x1-x,y1-y)和pil2(x2-x,y2-y),则两者叉乘的(x1y2-x2y1)值大于0,则表示点pi在线段l(l1,l2)的右侧;若小于0,则表示点pi在线段l(l1,l2)的左侧;若等于0,则表示点pi在线段l(l1,l2)上。

另外,建筑物的形状率、面积、方向角、长宽比、建筑物的面积与最小包围盒的面积比等参数也描述了建筑物要素的某些特征。本发明主要针对与空间分布密切相关的建筑物聚类,所以只选择了上述(1)-(4)的相关参数进行讨论。

步骤2:建筑物初步聚类过程

下面首先了解一下建筑物初步聚类的som神经网络,该网络包括som神经网络模型

(1)神经元数目的确定

输入层神经元数目:som神经网络的输入层神经元数目n可以根据描述建筑物特征的相关参数的数目来确定。本发明选取建筑物重心centroid的二维坐标作为som神经网络的输入模式。该输入模式有两个分量,归一化后的x坐标值和y坐标值,所以输入神经元的数目n=2。

竞争层神经元数目:som神经网络的竞争层神经元数目m可以在满足som神经网络模型结构的原则下任意设定。本发明的竞争层神经元数目依据参与聚类的建筑物数目、som神经网络的模型结构以及聚类的粒度等相关影像因素进行设置。经过多次试验,确定竞争层神经元的数目m=40×40。

(2)学习率α(t)的选择

学习率α(t)反映的是神经网络在学习过程中权值向量变化调整的幅度大小,它直接影响着som神经网络的收敛速度和聚类性能。从理论上讲,α(t)越小,经过很长时间训练后,越能获得更佳的聚类结果。但α(t)太小,将会导致训练所花费的时间过长。反之,如果α(t)太大,神经网络在训练的过程中容易产生震荡。为保证网络训练算法的收敛性,学习率α(t)应该满足

因此本发明的学习率函数为

其中,t为总的学习次数,t为当前的迭代计数,α(0)为初始学习率。

初始学习率α(0)的取值一般在(0,1)范围内,本发明选择0.1作为初始学习率。

(3)邻域半径函数σ(t)的选择

邻域半径函数是以学习迭代次数t为变量的递减函数。本发明采用

作为邻域半径函数,其中σ(0)为邻域半径的初始值。

在som神经网络学习的初始阶段,邻域可以包含较大范围,甚至可以覆盖整个竞争层。本发明取初始邻域半径σ(0)=6.0,则在正方形邻域方案中,初始邻域内的神经元有13×13=169个。

(4)邻域函数hc(t)的选择

som神经网络的邻域规定了哪些神经元与获胜神经元c一同进行权值调整。在som神经网络学习的初始阶段,邻域函数hc(t)可以设置为较大的范围,甚至可以包含竞争层的所有神经元。

本发明设计的邻域函数为

其中α(t)为学习率函数,σ(t)为邻域半径函数,dcj表示获胜神经元c与神经元j之间的欧氏范数距离。在不断迭代的训练过程中,邻域半径σ(t)将不断减小,最终将仅包含获胜神经元。

(5)初始权值的确定

som神经网络权向量的初始值以及其后的调整值直接影响着som网络训练的速度和聚类的精度,确定初始权值的方法通常有两种,一是将权向量赋予[0,1]区间内的随机值;二是将所有的连接权向量赋予相同的初始值。本发明采用第一种方法,将竞争层神经元和输入层神经元之间的连接权向量赋予[0,1]区间内的随机值。

(6)总的学习次数的确定

som神经网络在训练学习时,连接权向量被不断调整,当调整量趋于0时,som神经网络则逐步趋于稳定,这时就可以停止网络训练。经过多次试验,本发明将som神经网络的学习次数确定为20000次。

(7)学习样本的设计

当som神经网络的输入模式中各分量的值位于0和1之间时,som网络的计算效果能够达到最佳。如果直接采用建筑物的重心centroid二维坐标作为网络的输入模式,不难发现所有坐标值都很大,并且相互之间的差别却不大,所以采用归一化后的坐标值作为输入数据。som神经网络的训练样本集为{a1,a2,…,ak,…,ap},输入模式为

其中,k=1,2,…,p,p为待聚类的建筑物数目,n为输入层神经元数目,此处n=2,则输入模式为

本发明采用som神经网络进行建筑物群的初步聚类,其具体步骤如下:

步骤21:som神经网络的初始化:设置som神经网络的输入层神经元数目n=2,竞争层神经元数目m=40×40=1600;设置som神经网络竞争层神经元和输入层神经元之间的连接权向量wj=(w1j,w2j,…,wnj),j=1,2,…,m,wij为[0,1]区间内的随机数,i=1,2,…,n;设置初始邻域半径σ(0)=6.0,初始学习率α(0)=0.1,训练迭代计数t=0。

步骤22:从训练样本集{a1,a2,…,ak,…,ap}中随机选取一个输入模式提供给som神经网络的输入层神经元。

步骤23:寻找获胜神经元:计算ak与wj之间的距离

dkj=||ak-wj||(10)

从中选择距离最小的神经元作为获胜神经元c,即

步骤24:调整连接权值:对获胜神经元c邻域内任一个被激活的神经元j的连接权向量wj按照公式

进行调整。其中,邻域函数hcj(t)见公式(4-7),学习率函数α(t)见公式(4-5),t为训练迭代总次数;邻域半径函数σ(t)见公式(4-6)。

步骤25:重复步骤22-24,直至所有的输入模式都提交过一次。

步骤26:训练迭代计数器加1,即t=t+1;更新学习率α(t)以及邻域半径σ(t)。

步骤27:重复步骤22-26,直到训练迭代计数t达到预先设定的训练迭代总次数t。

som神经网络训练结束后,在竞争层得到的建筑物群初步聚类结果,即建筑物群类簇。

步骤3:基于行列扫描的建筑物群精细聚类

理想的som神经网络聚类结果应该是类簇间隔明显,界定分割线清晰的。当分割线不明显时,需要对som神经网络的初步聚类结果进行进一步的处理,完成建筑物群类簇的精细聚类划分。本发明在som神经网络初步聚类结果的基础上,设计了基于“行列扫描”的类簇精细划分方法。

该处理方法的基本思路是:在有道路网等线状要素约束的情况下,根据全局约束和gestalt因素局部约束准则的指导,对som神经网络竞争层的m×m个神经元构成的二维平面网格进行行列扫描,实现对初步聚类结果的划分;在无道路网特别是河流等线状地物要素不构成封闭网络结构(多边形)的区域(尤其是郊区或城镇),仅在gestalt因素约束准则的指导下进行初步聚类结果的精细划分。

具体的“行列扫描”分为三步:

第一步,以行为主,从左上角的格网单元开始,依次扫描som神经网络竞争层的二维平面网格中每个格网单元。当扫描到格网单元a时,以单元a为中心,按照如图6所示的圈层向外扩张搜索。在搜索某一圈层中某个格网单元时,判断单元a与当前搜索的格网单元中聚类的建筑物之间的最短距离mindisb2b是否小于规定的建筑物群组内最短距离阈值,且建筑物与邻近道路等线状要素之间的位置关系locateb2r中建筑物是否在同一个线状要素的同侧。如果是,就可以确定格网单元a与当前搜索到的网格单元属于同一群组,于是终止对格网单元a的圈层扩张搜索,继续扫描下一个格网单元;如果判断条件不满足,则继续圈层的搜索。若在所有圈层搜索完毕后也不能确定格网单元a的群组属性,则将新的群组属性赋予格网单元a,然后继续扫描下一个格网单元。

第二步,根据行扫描的结果,建立建筑物群组编号索引,用于记录每个群组中所包含的som神经网络竞争层的格网单元编号。建筑物群组编号与建筑物的编号关系如图7。例如,编号为bp、bp+q的建筑物聚集在som神经网络竞争层的第cj编号的格网单元中,而且该格网单元属于第gi个群组。

第三步,在此基础上,对som神经网络的竞争层平面网格再进行列扫描,即从左下角的格网单元开始,按照以列为主的方式扫描格网单元。与行扫描类似,当扫描到单元c时,如图8所示,以单元c为中心按照圈层向外扩张搜索,调整每个格网单元的群组属性,得到最终的建筑物群聚类结果。

经过上述的基于som神经网络的初步聚类和基于“行列扫描”的精细聚类两个过程,就可以完成建筑物群的智能聚类。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1